• 不开源项目aspose.cells最新版23.10的一些科普


    原本本文是写aspose.cells 23.10的版本的,最近又对aspose.words 23.10的版本进行了实践,所以二者的最新版均作了实践。

    1.基本介绍

    日常工作中我们常常会使用到Excel来做一些事情,也常常需要使用代码程序来解析Excel文件,目前来说对于poi、easypoi、easyexcel、jxls的使用已经非常多了,它们都在一些特定情况下很好的去处理Excel文件,但有些时候我们要解析的Excel不是标准的xls、xlsx格式的文件,但是可以使用Excel或WPS正常打开,特别是WPS兼容的特别好,对于一些html、xml的源文件,只要后缀为xls、xlsx格式,它总是直接打开了,在Office Excel中打开时还会有非标准Excel文件打开时的确认提示框。对于那些非标准格式的Excel文件(可能是业余选手用代码生成的,也有可能是使用Excel另存为html、xml等格式,又手工修改为xls的情况),以前我坚决的对这部分文件选择了不处理。

    上次在编写一个大范围解析Excel文件的功能时,这种不规范的Excel文件实在是多,所以不得不面对这种问题,经过一番尝试发现自己解析html的方式太复杂了,变化多样,而且还不支持另存为xml的格式的文件,于是也在旁边少年的提醒下尝试着使用了`aspose.cells`的试用版本,它在格式转换、生成Excel时会生成多余的一个Sheet页《Evaluation Warning》,参考如下图所示:

    image.png

    所以最终采用的实现就是用它来转换一下格式,实际上它的格式转换代码使用比较简单,功能强大,支持的文件格式有很多中,常见的有:html、xml、csv等多种,参考如下代码将一段html表格页面表格转换为Excel文件,返回Workbook对象:

    1. public static void main(String[] args) throws Exception {
    2. String html =
    3. "" +
    4. "" +
    5. "https://www.chendd.cn" +
    6. "" +
    7. "" +
    8. "" +
    9. "
    10. " +
    11. "
    12. " +
    13. "
    14. 12345
      678910
      "
      +
    15. "" +
    16. "";
    17. System.out.println("aspose.cells version:" + CellsHelper.getVersion());
    18. Workbook workbook = new Workbook(new ByteArrayInputStream(html.getBytes()));
    19. //格式另存
    20. workbook.save("output.csv", SaveFormat.CSV);
    21. workbook.save("output.xls", SaveFormat.EXCEL_97_TO_2003);
    22. workbook.save("output.xlsx", SaveFormat.XLSX);
    23. workbook.save("output.pdf", SaveFormat.PDF);
    24. }

    格式转换后返回的是`Workbook`对象,它不是poi的API中的`Workbook`,实际上save函数可以传递OutputStream流对象,所以后续的解析可以使用poi的Workbook对象来解析OutputStream流即可。

    2.其它说明

    (1)`aspose.cells`不是开源免费的使用,有试用版本,试用的结果就是生成了一些《Evaluation Warning》警告;

    (2)maven中央仓库 https://mvnrepository.com 中只有8.2.1版本的aspose.cells版本,是2015年的版本;

    (3)aspose旗下有许多的产品,都是商业付费版本,常见的还有操作word的,与cells一样不开源,需要商业授权使用,单说cells组件支持不同的开发语言,有Java、C++、.NET等等,除了核心组件外也提供了一个web版本,貌似是用作于浏览器在线版本的Excel处理组件,官方地址:Aspose.Cells | Excel Spreadsheet Processing Java Library

    (4)截至今日2023年10月24,该组件最新 Release 版本为`aspose-cells-23.10.jar`是2023年10月14日发布;

    3.旧版使用

    (1)最新版本才发布俩礼拜,,网络上也没有找到一些激(破)活(解)版,针对于反编译混淆代码的阅读,难度非常大,期待有大佬的出现;

    (2)从gitee上找到了一位大佬的学习实践教程,作者研究了aspose.cells的 20.7 的版本,距离最新版本发布相距 3 年多近 40 个Release版本,可参考:https://gitee.com/evilrule/crack-aspose,有需要旧版的可以移步查阅和实践,确实可以把《Evaluation Warning》警告去除;

    (3)仅供学习,不可用于商业用途,给个gitee上项目的

    截图说明,防止找不到了,尝试了一下setLicense只触发一次即可,通常可以写一个工具类,把调用逻辑放置在static静态块中即可;

    4.新版学习

    学习有许多种,除了可以学习组件的API使用外,也可以学习一下 20.7 版本激活大佬的钻研精神,所以在一系列的失败尝试后,最终终于激活 aspose-cells-23.10.jar 成功,以下是学习过程:

    (1)参考 20.7 版本大佬使用的 javassist 字节码框架,本站有相关的文章示例,曾经略微学习过该框架;

    (2)按照 20.7 版本大佬提供的方向重点关注 `com.aspose.cells.License` 类,里面的方法 isLicenseSet 可以理解为是否设置 License,将其修改为 true;方法 getSubscriptionExpireDate 可以理解为获取过期时间,将其修改为 2099 年;方法 a 可以看到是在转换日期格式,将其修改为当前日期;

    (3)由于使用的是`Workbook`对象的工具类,将其中的对象方法 isLicensed 修改为 true;

    (4)以上的几种尝试均失败,不过最终的结果是成功的,精简后的改动非常非常的小,完全可以不需要调整 License 类,对于这种最新版本的API尝试只是验证了本篇文章所述的示例,即将 html 代码转换为 csv、xls、xlsx、pdf 四种格式;

    (5)本篇文章主要是简单科普一下`aspose.cells`组件的介绍,相关内容请勿用于商业用途,如有带来任何问题,均与本篇文章作者无关(请勿用于商业用途、请勿用于商业用途、请勿用于商业用途)

    (6)欢迎在本站留言交流,最后附上代码运行效果图,参考如下:

    运行效果预览.gif

    (cells最新版精简图)

    运行效果预览-精简

    (words最新版精简图)

    不开源项目aspose.cells的一些科普欢迎来到陈冬冬的个人经验分享平台icon-default.png?t=N7T8https://www.chendd.cn/blog/article/1716713331426598913.html不开源项目aspose.words最新版23.10的一些科普欢迎来到陈冬冬的个人经验分享平台icon-default.png?t=N7T8https://www.chendd.cn/blog/article/1721078374100455426.html如有任何问题请在上述原文里留言。

  • 相关阅读:
    云计算发展的 4 个阶段,终于有人讲明白了
    uni-app医院智能导诊系统源码
    学习在php中将特大数字转成带有千/万/亿为单位的字符串
    BIOS 如何确定引导扇区的位置
    python图像匹配:如何使用Python进行图像匹配
    科技部等6部门发文,推动AI场景创新;『精益副业』教程序员优雅做副业;『可扩展系统』设计全教程;人物动作数据集;前沿论文 | ShowMeAI资讯日报
    微信小程序登录后端
    DirectX11 With Windows SDK--19(Dev) 编译Assimp并加载模型、新的Effects框架
    Day28 单元测试
    MySQL单表查询与多表查询
  • 原文地址:https://blog.csdn.net/haiyangyiba/article/details/134024297