写在前面:近来工作上一直在处理word excel等文档的处理;于是利用新学的python写了一个小工具
1、其实实现起来很简单,主要是利用了pdf2docx这个库来实现
首先安装导入pdf2docx库
pip install pdf2docx
2、代码部分:
话不多说直接上代码:
- import os
- from pdf2docx import Converter
- from loguru import logger
- from tkinter import Tk, filedialog
-
- # 获取到当前路径
- path = os.getcwd()
-
- # 打开文件选择对话框,选择要转换的PDF文件
- def choose_pdf_file():
- root = Tk()
- root.withdraw()
- file_path = filedialog.askopenfilename(filetypes=[("PDF Files", "*.pdf")])
- root.destroy()
- return file_path
-
- def main():
- # 选择要转换的PDF文件
- pdf_file = choose_pdf_file()
-
- if not pdf_file:
- logger.debug("未选择任何PDF文件。")
- return
-
- docx_file = os.path.splitext(pdf_file)[0] + ".docx"
- logger.debug("原始的PDF文件为-------%s" % pdf_file)
-
- cv = Converter(pdf_file)
- cv.convert(docx_file)
- logger.debug("转换之后的DOCX文件为-------%s" % docx_file)
- cv.close()
-
- if __name__ == "__main__":
- main()