用POI读取Excel数据:(版本号:POI3.7)
1、读取Excel
2、Excel数据处理:
Excel存储日期、时间均以数值类型进行存储,读取时POI先判断是是否是数值类型,再进行判断转化
1、数值格式(CELL_TYPE_NUMERIC):
1.纯数值格式:getNumericCellValue() 直接获取数据
2.日期格式:处理yyyy-MM-dd, d/m/yyyy h:mm, HH:mm 等不含文字的日期格式
1).判断是否是日期格式:HSSFDateUtil.isCellDateFormatted(cell)
2).判断是日期或者时间
cell.getCellStyle().getDataFormat() == HSSFDataFormat.getBuiltinFormat("h:mm")
或者: cell.getCellStyle().getDataFormat() == HSSFDataFormat.getBuiltinFormat("yyyy-MM-dd")
3.自定义日期格式:处理yyyy年m月d日,h时mm分,yyyy年m月等含文字的日期格式
判断cell.getCellStyle().getDataFormat()值,解析数值格式
yyyy年m月d日----->31
m月d日---->58
h时mm分--->32
2、字符格式(CELL_TYPE_STRING):直接获取内容
*万能处理方案:
所有日期格式都可以通过getDataFormat()值来判断
yyyy-MM-dd----- 14
yyyy年m月d日--- 31
yyyy年m月------- 57
m月d日 ---------- 58
HH:mm----------- 20
h时mm分 ------- 32
Java 读取Excel表格日期类型数据的时候,读出来的是这样的 13-十二月-2017,而Excel中输入的是 2017/12/13 或 2017-12-13
还有Excel中输入的是整型 5,java 读取出来的是5.0
这可怎么整?
解决方法:
日期转换
import org.apache.poi.ss.usermodel.DateUtil; import org.apache.poi.ss.usermodel.Workbook; import org.apache.poi.ss.usermodel.Sheet; import org.apache.poi.ss.usermodel.Row; import org.apache.poi.ss.usermodel.Cell; Workbook workBook = (Workbook)ModelUtils.getRequestContext().getActionContext().getParameter("excel"); Sheet sheet = workBook.getSheetAt(0); int fr = sheet.getPhysicalNumberOfRows() - 4; for(int i=0;i<fr;i++){ int r = 4+i; org.apache.poi.ss.usermodel.Row rowDetail = sheet.getRow(r); String guarantee_date = ""; Cell dateCell = rowDetail.getCell(2); //判断是否为日期类型 if(0==dateCell.getCellType()){ if(DateUtil.isCellDateFormatted(dateCell)){ //用于转化为日期格式 Date d = dateCell.getDateCellValue(); DateFormat formater = new SimpleDateFormat("yyyy-MM-dd"); guarantee_date = formater.format(d); } } System.out.println(guarantee_date); //------------整型数量格式处理-------------- String countStr = rowDetail.getCell(3).toString(); Integer count = 0; System.out.println("入库数量:"+countStr); if(countStr.indexOf(".")>=0){ System.out.println(". 位数: "+ countStr.indexOf(".")); countStr = countStr.substring(0, countStr.indexOf(".")); count = Integer.valueOf(countStr); } }
Apache poi 版本:3.12
今天在用poi解析excel文件时,碰到一个蛋疼的问题。
在我的excel文件中有一列是日期类型,例如有以下这么一行数据(日期中月份前面的0会自动去掉):
在读取注册日期这个数据时,返回了一串数字,变成了 42149,
断点调试到读取数据的代码,发现poi是正确识别的,但是在读取具体数据时发生了变化:
从上图可以看到,poi把日期数据也归类为 Cell.CELL_TYPE_NUMERIC
数字类型,
并且在cell中是正确读取到了 2015-05-25,但是在使用cell.getNumericCellValue()
方法获取时却发生了变化,返回了42149.0
,
不知道它在里面进行了怎样的处理,但这不是我们想要的结果。
既然如此,我直接用字符串的方式获取可不可以呢?
把代码改为:
case Cell.CELL_TYPE_NUMERIC: value = cell.getStringCellValue(); DecimalFormat df = new DecimalFormat("0"); value = df.format(value); break;
抛出如下异常:
- Caused by: java.lang.IllegalStateException: Cannot get a text value from a numeric cell
- at org.apache.poi.xssf.usermodel.XSSFCell.typeMismatch(XSSFCell.java:888)
- at org.apache.poi.xssf.usermodel.XSSFCell.getRichStringCellValue(XSSFCell.java:310)
- at org.apache.poi.xssf.usermodel.XSSFCell.getStringCellValue(XSSFCell.java:261)
说明不可以把它当作字符串类型来处理,
看方法倒是有个cell.getDateCellValue()
,可是在什么时候进行调用呢,我要怎么能知道它是date类型?
通过查询资料发现,poi在Cell.CELL_TYPE_NUMERIC
中又具体区分了类型,Date
类型就是其中一种,把代码再做处理:
case Cell.CELL_TYPE_NUMERIC: if (HSSFDateUtil.isCellDateFormatted(cell)) { Date date = cell.getDateCellValue(); value = DateFormatUtils.format(date, "yyyy-MM-dd"); } else { value = cell.getNumericCellValue(); DecimalFormat df = new DecimalFormat("0"); value = df.format(value); } break;
成功解决问题。
另外如果日期中有精确到日,精确到秒不同精度的,可以用cell.getCellStyle().getDataFormat()
或cell.getCellStyle().getDataFormatString()
来获取格式。