• Python自动化办公(一) —— 根据PDF文件批量创建Word文档


    Python自动化办公(一) —— 根据PDF文件批量创建Word文档

    在这里插入图片描述


    在日常办公中,我们经常需要根据现有的PDF文件批量创建Word文档。手动操作不仅费时费力,而且容易出错。幸运的是,使用Python可以轻松实现这个过程。本文将介绍如何使用Python脚本遍历一个文件夹中的PDF文件,并根据每个PDF文件的名字创建对应的Word空白文件。

    安装所需的Python库

    首先,我们需要安装python-docx库来创建和操作Word文档。在终端或命令行中运行以下命令进行安装:

    pip install python-docx
    
    编写Python脚本

    以下是一个完整的Python脚本,演示如何根据PDF文件名创建对应的Word空白文件:

    import os
    from docx import Document
    
    def create_word_from_pdf(pdf_folder, word_folder):
        # 检查保存Word文件的文件夹是否存在,如果不存在则创建
        if not os.path.exists(word_folder):
            os.makedirs(word_folder)
    
        # 遍历PDF文件夹中的所有文件
        for filename in os.listdir(pdf_folder):
            if filename.endswith(".pdf"):
                # 获取文件名(去掉扩展名)
                base_name = os.path.splitext(filename)[0]
                # 创建对应的Word文件名
                word_filename = base_name + ".docx"
                word_path = os.path.join(word_folder, word_filename)
                
                # 创建一个空白的Word文档
                doc = Document()
                # 保存Word文档
                doc.save(word_path)
                print(f"Created: {word_path}")
    
    # 设置PDF文件夹和保存Word文件的文件夹路径
    pdf_folder = 'path/to/pdf_folder'
    word_folder = 'path/to/word_folder'
    
    # 调用函数
    create_word_from_pdf(pdf_folder, word_folder)
    
    详细步骤解释
    1. 导入必要的模块

      • os: 用于文件和目录操作。
      • Documentpython-docx: 用于创建和操作Word文档。
    2. 定义函数 create_word_from_pdf

      • pdf_folder: 存储PDF文件的文件夹路径。
      • word_folder: 将创建的Word文件保存到这个文件夹路径。
    3. 检查和创建Word文件夹

      • 使用 os.makedirs 创建目标文件夹,如果它不存在的话。
    4. 遍历PDF文件夹

      • 使用 os.listdir 列出文件夹中的所有文件,并过滤出以 .pdf 结尾的文件。
    5. 生成Word文件名

      • 使用 os.path.splitext 获取文件名(去掉扩展名),并生成对应的Word文件名。
    6. 创建空白Word文档并保存

      • 使用 Document 创建一个空白的Word文档。
      • 使用 doc.save 保存Word文档到指定路径。
    运行脚本

    将上面的代码保存为一个Python脚本文件(例如 create_word_from_pdf.py),然后在终端或命令行中运行:

    python create_word_from_pdf.py
    

    确保你已经设置了正确的 pdf_folderword_folder 路径。例如:

    pdf_folder = '/path/to/your/pdf_folder'
    word_folder = '/path/to/your/word_folder'
    

    通过这个脚本,你可以根据PDF文件名在指定文件夹中创建对应的Word空白文件。如果你有任何特定需求或问题,请在评论区告诉我!


  • 相关阅读:
    根据先序遍历和中序遍历生成后序遍历
    2‘,7‘-二-(2-羧乙基)-5(6)-羧基荧光素乙酰甲酯,CAS号: 117464-70-7
    特斯拉pre-test (Go)
    day59【单调栈】503.下一个更大元素Ⅱ 42.接雨水 84.柱状图中最大的矩形
    【线性代数】【二】2.7 矩阵的秩
    深度学习中的注意力机制模型及代码实现(SE Attention、CBAM Attention)
    Tomcat的安装与优化
    (29)STM32——PWM DAC实验笔记
    2023年最大规模的IPO正式诞生,Arm市值4700亿
    用 API Factory 产品生成 API 文档
  • 原文地址:https://blog.csdn.net/weixin_56595425/article/details/139703298