EasyExcel是一个基于Java的、快速、简洁、解决大文件内存溢出的Excel处理工具。他能让你在不用考虑性能、内存的等因素的情况下,快速完成Excel的读、写等功能。
快速的读取excel中的数据。
映射excel和实体类,让代码变的更加简洁。
在读写大文件的时候使用磁盘做缓存,更加的节约内存。
16M内存23秒读取75M(46W行25列)的Excel(3.2.1+版本)
当然还有极速模式能更快,但是内存占用会在100M多一点。
Java解析、生成Excel比较有名的框架有Apache poi、jxl。但他们都存在一个严重的问题就是非常的耗内存,poi有一套SAX模式的API可以一定程度的解决一些内存溢出的问题,但POI还是有一些缺陷,比如07版Excel解压缩以及解压后存储都是在内存中完成的,内存消耗依然很大。
easyexcel重写了poi对07版Excel的解析,一个3M的excel用POI sax解析依然需要100M左右内存,改用easyexcel可以降低到几M,并且再大的excel也不会出现内存溢出;03版依赖POI的sax模式,在上层做了模型转换的封装,让使用者更加简单方便。
@ExcelProperty
用于匹配excel和实体类的匹配,参数如下:
名称 | 默认值 | 描述 |
---|---|---|
value | 空 | 用于匹配excel中的头,必须全匹配,如果有多行头,会匹配最后一行头 |
order | Integer.MAX_VALUE | 优先级高于value ,会根据order 的顺序来匹配实体和excel中数据的顺序 |
index | -1 | 优先级高于value 和order ,会根据index 直接指定到excel中具体的哪一列 |
converter | 自动选择 | 指定当前字段用什么转换器,默认会自动选择。读的情况下只要实现com.alibaba.excel.converters.Converter#convertToJavaData(com.alibaba.excel.converters.ReadConverterContext>) 方法即可 |
@ExcelIgnore
默认所有字段都会和excel去匹配,加了这个注解会忽略该字段
@ExcelIgnoreUnannotated
默认不加ExcelProperty
的注解的都会参与读写,加了不会参与读写
@DateTimeFormat
日期转换,用String
去接收excel日期格式的数据会调用这个注解,参数如下:
名称 | 默认值 | 描述 |
---|---|---|
value | 空 | 参照java.text.SimpleDateFormat 书写即可 |
use1904windowing | 自动选择 | excel中时间是存储1900年起的一个双精度浮点数,但是有时候默认开始日期是1904,所以设置这个值改成默认1904年开始 |
@NumberFormat
数字转换,用String
去接收excel数字格式的数据会调用这个注解。
名称 | 默认值 | 描述 |
---|---|---|
value | 空 | 参照java.text.DecimalFormat 书写即可 |
roundingMode | RoundingMode.HALF_UP | 格式化的时候设置舍入模 式 |
@ColumnWidth
用于设置表格列的宽度(value = 20);
版本 | poi依赖版本 (支持范围) | jdk版本支持范围 | 备注 |
---|---|---|---|
3.1.0+ | 4.1.2 (4.1.2 - 5.2.2) | jkd8 - jdk17 | 推荐使用,会更新的版本 |
3.0.0-beta1 - 3.0.5 | 4.1.2 (4.1.2 - 5.2.2) | jkd8 - jdk11 | 不推荐项目新引入此版本,除非超级严重bug,否则不再更新 |
2.0.0-beta1-2.2.11 | 3.17 (3.17 - 4.1.2) | jdk6 - jdk11 | 不推荐项目新引入此版本,除非是jdk6否则不推荐使用,除非超级严重bug,否则不再更新 |
1+版本 | 3.17 (3.17 - 4.1.2) | jdk6 - jdk11 | 不推荐项目新引入此版本,超级严重bug,也不再更新 |
对象
-
- @Getter
- @Setter
- @EqualsAndHashCode
- public class DemoData {
- /**
- * 强制读取第三个 这里不建议 index 和 name 同时用,要么一个对象只用index,要么一个对象只用name去匹配
- */
- @ExcelProperty(index = 2)
- private Double doubleData;
-
- /**
- * 用名字去匹配,这里需要注意,如果名字重复,会导致只有一个字段读取到数据
- */
- @ExcelProperty("字符串标题")
- private String string;
-
- @ExcelProperty("日期标题")
- private Date date;
- }
监听器
-
- // 有个很重要的点 DemoDataListener 不能被spring管理,要每次读取excel都要new,然后里面用到spring可以构造方法传进去
- @Slf4j
- public class DemoDataListener implements ReadListener
{ -
- /**
- * 每隔5条存储数据库,实际使用中可以100条,然后清理list ,方便内存回收
- */
- private static final int BATCH_COUNT = 100;
- /**
- * 缓存的数据
- */
- private List
cachedDataList = ListUtils.newArrayListWithExpectedSize(BATCH_COUNT); - /**
- * 假设这个是一个DAO,当然有业务逻辑这个也可以是一个service。当然如果不用存储这个对象没用。
- */
- private DemoDAO demoDAO;
-
- public DemoDataListener() {
- // 这里是demo,所以随便new一个。实际使用如果到了spring,请使用下面的有参构造函数
- demoDAO = new DemoDAO();
- }
-
- /**
- * 如果使用了spring,请使用这个构造方法。每次创建Listener的时候需要把spring管理的类传进来
- *
- * @param demoDAO
- */
- public DemoDataListener(DemoDAO demoDAO) {
- this.demoDAO = demoDAO;
- }
-
- /**
- * 这个每一条数据解析都会来调用
- *
- * @param data one row value. Is is same as {@link AnalysisContext#readRowHolder()}
- * @param context
- */
- @Override
- public void invoke(DemoData data, AnalysisContext context) {
- log.info("解析到一条数据:{}", JSON.toJSONString(data));
- cachedDataList.add(data);
- // 达到BATCH_COUNT了,需要去存储一次数据库,防止数据几万条数据在内存,容易OOM
- if (cachedDataList.size() >= BATCH_COUNT) {
- saveData();
- // 存储完成清理 list
- cachedDataList = ListUtils.newArrayListWithExpectedSize(BATCH_COUNT);
- }
- }
-
- /**
- * 所有数据解析完成了 都会来调用
- *
- * @param context
- */
- @Override
- public void doAfterAllAnalysed(AnalysisContext context) {
- // 这里也要保存数据,确保最后遗留的数据也存储到数据库
- saveData();
- log.info("所有数据解析完成!");
- }
-
- /**
- * 加上存储数据库
- */
- private void saveData() {
- log.info("{}条数据,开始存储数据库!", cachedDataList.size());
- demoDAO.save(cachedDataList);
- log.info("存储数据库成功!");
- }
- }
代码
- /**
- * 指定列的下标或者列名
- *
- *
1. 创建excel对应的实体对象,并使用{@link ExcelProperty}注解. 参照{@link IndexOrNameData}
- *
2. 由于默认一行行的读取excel,所以需要创建excel一行一行的回调监听器,参照{@link IndexOrNameDataListener}
- *
3. 直接读即可
- */
- @Test
- public void indexOrNameRead() {
- String fileName = TestFileUtil.getPath() + "demo" + File.separator + "demo.xlsx";
- // 这里默认读取第一个sheet
- EasyExcel.read(fileName, DemoData.class, new DemoDataListener()).sheet().doRead();
- }
对象
-
- @Getter
- @Setter
- @EqualsAndHashCode
- public class DemoData {
- @ExcelProperty("字符串标题")
- private String string;
- @ExcelProperty("日期标题")
- private Date date;
- @ExcelProperty("数字标题")
- private Double doubleData;
- /**
- * 忽略这个字段
- */
- @ExcelIgnore
- private String ignore;
- }
代码
- /**
- * 最简单的写
- *
- * 1. 创建excel对应的实体对象 参照{@link DemoData}
- *
- * 2. 直接写即可
- */
- @Test
- public void simpleWrite() {
- // 注意 simpleWrite在数据量不大的情况下可以使用(5000以内,具体也要看实际情况),数据量大参照 重复多次写入
-
- // 写法1 JDK8+
- // since: 3.0.0-beta1
- String fileName = TestFileUtil.getPath() + "simpleWrite" + System.currentTimeMillis() + ".xlsx";
- // 这里 需要指定写用哪个class去写,然后写到第一个sheet,名字为模板 然后文件流会自动关闭
- // 如果这里想使用03 则 传入excelType参数即可
- EasyExcel.write(fileName, DemoData.class)
- .sheet("模板")
- .doWrite(() -> {
- // 分页查询数据
- return data();
- });
-
- // 写法2
- fileName = TestFileUtil.getPath() + "simpleWrite" + System.currentTimeMillis() + ".xlsx";
- // 这里 需要指定写用哪个class去写,然后写到第一个sheet,名字为模板 然后文件流会自动关闭
- // 如果这里想使用03 则 传入excelType参数即可
- EasyExcel.write(fileName, DemoData.class).sheet("模板").doWrite(data());
-
- // 写法3
- fileName = TestFileUtil.getPath() + "simpleWrite" + System.currentTimeMillis() + ".xlsx";
- // 这里 需要指定写用哪个class去写
- try (ExcelWriter excelWriter = EasyExcel.write(fileName, DemoData.class).build()) {
- WriteSheet writeSheet = EasyExcel.writerSheet("模板").build();
- excelWriter.write(data(), writeSheet);
- }
- }
3+版本的的easyexcel,使用poi 5+版本时,需要自己引入poi 5+版本的包,且手动排除:poi-ooxml-schemas,例如:
-
com.alibaba -
easyexcel -
3.1.0 -
-
-
poi-ooxml-schemas -
org.apache.poi -
-
不建议跨大版本升级 尤其跨2个大版本
大版本升级后建议相关内容重新测试下
2+ 升级到 3+ ,下面3个地方不兼容:
使用了自定义拦截器去修改样式的会出问题(不会编译报错)
-
- // 以前的写法
- @Override
- protected void setHeadCellStyle(Cell cell, Head head, Integer relativeRowIndex) {
- cell.setCellStyle(style);
- }
-
- // 现在的写法1
- // 这个写完也需要测试下 还是老代码 不管使用了什么拦截器 都可以这么写
- // 这个会导致格式化数据失效
- protected void setHeadCellStyle(CellWriteHandlerContext context) {
- cell.setCellStyle(style);
-
- // 这里要把 WriteCellData的样式清空, 不然后面还有一个拦截器 FillStyleCellWriteHandler 默认会将 WriteCellStyle 设置到
- // cell里面去 会导致自己设置的不一样
- context.getFirstCellData().setWriteCellStyle(null);
- }
-
-
- // 现在的写法2 推荐
- // 这个方案靠谱 以前用 poi的CellStyle 现在用 WriteCellStyle 入参基本都一致
- protected void setHeadCellStyle(CellWriteHandlerContext context) {
- // 第一个单元格
- // 只要不是头 一定会有数据 当然fill的情况 可能要context.getCellDataList() ,这个需要看模板,因为一个单元格会有多个 WriteCellData
- WriteCellData> cellData = context.getFirstCellData();
- // 这里需要去cellData 获取样式
- // 很重要的一个原因是 WriteCellStyle 和 dataFormatData绑定的 简单的说 比如你加了 DateTimeFormat
- // ,已经将writeCellStyle里面的dataFormatData 改了 如果你自己new了一个WriteCellStyle,可能注解的样式就失效了
- // 然后 getOrCreateStyle 用于返回一个样式,如果为空,则创建一个后返回
- WriteCellStyle writeCellStyle = cellData.getOrCreateStyle();
- writeCellStyle.setFillForegroundColor(IndexedColors.RED.getIndex());
- // 这里需要指定 FillPatternType 为FillPatternType.SOLID_FOREGROUND
- writeCellStyle.setFillPatternType(FillPatternType.SOLID_FOREGROUND);
- }
读的时候invoke里面抛出异常,不会再额外封装一层ExcelAnalysisException (不会编译报错)这个捕获异常的时候 不用再getCause了
样式等注解涉及到 boolean or 一些枚举 值的 有变动,新增默认值(会编译报错,注解改就行)这个直接改了就行