POI读取Excel⽂件(常遇问题)和(常⽤⽅法)
⼀、常遇问题
使⽤new HSSFWorkbook(NEW FileInputStream(excelFile))来读取Workbook,对Excel2003以前(包括2003)的版本没有问
题,但读取Excel2007时发⽣如下异常:
org.apache.poi.poifs.filesystem.OfficeXmlFileException: The supplied DATA appears TO be IN the Office 2007+ XML. You are calling the part of POI that deals WITH OLE2 Office Documents. You need TO CALL a different part of POI TO PROCESS this DATA (eg XSSF instead of HSSF)
该错误意思是说,⽂件中的数据是⽤Office2007+XML保存的,⽽现在却调⽤OLE2 Office⽂档处理,应该使⽤POI不同的部分来处理这些数据,⽐如使⽤XSSF来代替HSSF。
于是按提⽰使⽤XSSF代替HSSF,⽤new XSSFWorkbook(excelFile)来读取Workbook,对Excel2007没有问题了,可是在读取Excel2003以前(包括2003)的版本时却发⽣了如下新异常:
org.apache.ptions.InvalidOperationException: Can't open the specified file: '*.xls'
该错误是说,操作⽆效,不能打开指定的xls⽂件。
下载POI的源码后进⾏单步调试,发现刚开始的时候还是对的,但到ZipFile类后就不到⽂件了,到⽹上查了下,原来是XSSF不能读取Excel2003以前(包括2003)的版本,这样的话,就需要在读取前判断⽂件是2003前的版本还是2007的版本,然后对应调⽤HSSF 或XSSF来读取。
简⽽⾔之:由于HSSFWorkbook只能操作excel2003⼀下版本,XSSFWorkbook只能操作excel2007以上版本,所以利⽤Workbook接⼝创建对应的对象操作excel来处理兼容性
@Test
public void test6() throws Exception{
HSSFWorkbook workbook = new HSSFWorkbook(new FileInputStream( new File("c://123.xls")));
HSSFSheet sheet = SheetAt(0);
HSSFRow row =Row(0);
HSSFCell cell= Cell(0);
System.out.String());
}
@Test
public void test7() throws Exception{
XSSFWorkbook workbook = new XSSFWorkbook(new FileInputStream( new File("c://456.xlsx")));
XSSFSheet sheet = SheetAt(0);
XSSFRow row =Row(0);
XSSFCell cell= Cell(0);
System.out.String());
}
@Test //利⽤Workbook接⼝和判断excel版本创建相应版本HSSFWorkbook/XSSFWorkbook对象
public void test8() throws Exception{
String file = "c://456.xlsx";
boolean isExcel2003 = LowerCase().endsWith("xls")?true:false;
Workbook workbook = null;
if(isExcel2003){
workbook = new HSSFWorkbook(new FileInputStream(new File(file)));
}else{
workbook = new XSSFWorkbook(new FileInputStream(new File(file)));
}
Sheet sheet = SheetAt(0);
Row row =Row(0);
Cell cell= Cell(0);
System.out.String());
}
But:对于xls格式的⽂档,有时会报异常
But:对于xls格式的⽂档,有时会报异常
异常⼀:
Unable to read entire header; 0 bytes read; expected 512 bytes
解决办法:更新pio的包从3.5—final到3.15
异常⼆:
org.apache.poi.poifs.filesystem.NotOLE2FileException: Invalid header signature; read 0x28FBC3A7BBC3D322, expected 0xE11AB1A1E011CFD0 - Your file appears not to be a valid OLE2 document
解决办法:xml格式的⽂件可以⽤excel打开后另存为新的.xls格式就变成标准的.xls格式,另存为后的⽂件可以⽤PIO解析。
So:对于标准的xls 格式的⽂件可以通过上述 通过后缀的⽅式 ⽤POI 去处理,对于格式有问题的xls 建议⽤dom4j来解析
⼆、常⽤⽅法
1、创建 Workbook 对象
Workbook workbook1 = new XSSFWorkbook(inputStream); 2007及以上版本使⽤
Workbook workbook2 = new HSSFWorkbook(inputStream) 2003及以下版本使⽤
2、读取Excel 的 Sheet
for(int numSheet = 0; numSheet < NumberOfSheets(); numSheet++) {
Sheet sheet = workbook1 .getSheetAt( i );
}
sheet⽅法:
getSheetName() 返回此⼯作表的名称
getFirstRowNum() 获取第⼀⾏的⾏标
getLastRowNum() 获取最后⼀⾏(不为空的)⾏标,⽐⾏数⼩1
getPhysicalNumberOfRows() 获取物理定义的⾏数,指有实际数据的⾏数(不是表单中的⾏数)
getRow(int rownum) 返回第⼏⾏,基于0的逻辑⾏(⾮物理⾏)
Tips:
获取有记录的⾏数(getLastRowNum/ getPhysicalNumberOfRows),Excel 没有格式时返回实际⾏数,有格式时返回数据紊乱(所以有必要在上传Excel之前清除格式)
3、读取 ⾏ Row
Cell getCell(int j) 返回⼀个单元格对象
short getFirstCellNum() 是获取第⼀个不为空的列是第⼏个
short getLastCellNum() 是获取最后⼀个不为空的列是第⼏个(中间有空也算)
int getPhysicalNumberOfCells() 获取不为空的列个数(中间有空不算)
4、读取 单元格 Cell
单元格格式:(括号代表对应数值)
CELL_TYPE_NUMERIC(0) 表⽰对⼀个单元的数字数据
CELL_TYPE_STRING (1) 表⽰对⼀个单元串(⽂本)
CELL_TYPE_BLANK (3) 代表空⽩单元格
CELL_TYPE_BOOLEAN(4) 代表布尔单元(true或false)
CELL_TYPE_ERROR (5) 表⽰在单元的误差值
CELL_TYPE_FORMULA(2) 表⽰⼀个单元格公式的结果
单元格的类型:
setCellType(int cellType) 设置单元格的类型(数字,公式或字符串)。
getCellType( ) 返回单元格的类型,为数字,常与单元格格式⼀起使⽤
如:CellType ==XSSFCell.CELL_TYPE_STRING 就代表该单元格格式为字符串类型的单元格的值:
setCellValue(各种类型) 设置单元格的值
读取单元格的内容:(⼀般情况下做个switch判断,根据单元格的类型使⽤对应的⽅法)
String getStringCellValue();
Double getNumericCellValue();
Date getDateCellValue();
Boolean getBooleanCellValue();
byte getErrorCellValue();
单元格的样式:
setCellStyle(CellStyle style) 为单元格设置样式。
dom4j读取xml
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论