使用Java读取文件夹中的PDF文件,再读取文件中的指定的字体内容,然后将内容写入到Excel文件中,其中包含一些正则判断,可以忽略,字体以Corbel字体为例。
所需要的maven依赖为:
- <dependency>
- <groupId>com.alibabagroupId>
- <artifactId>easyexcelartifactId>
- dependency>
-
- <dependency>
- <groupId>org.apache.pdfboxgroupId>
- <artifactId>pdfboxartifactId>
- <version>2.0.27version>
- dependency>
详细代码如下:
- import com.alibaba.excel.EasyExcel;
- import com.alibaba.excel.ExcelWriter;
- import com.alibaba.excel.write.metadata.WriteSheet;
- import org.apache.pdfbox.pdmodel.PDDocument;
- import org.apache.pdfbox.pdmodel.PDPage