在日常办公中,我们经常需要根据现有的PDF文件批量创建Word文档。手动操作不仅费时费力,而且容易出错。幸运的是,使用Python可以轻松实现这个过程。本文将介绍如何使用Python脚本遍历一个文件夹中的PDF文件,并根据每个PDF文件的名字创建对应的Word空白文件。
首先,我们需要安装python-docx
库来创建和操作Word文档。在终端或命令行中运行以下命令进行安装:
pip install python-docx
以下是一个完整的Python脚本,演示如何根据PDF文件名创建对应的Word空白文件:
import os
from docx import Document
def create_word_from_pdf(pdf_folder, word_folder):
# 检查保存Word文件的文件夹是否存在,如果不存在则创建
if not os.path.exists(word_folder):
os.makedirs(word_folder)
# 遍历PDF文件夹中的所有文件
for filename in os.listdir(pdf_folder):
if filename.endswith(".pdf"):
# 获取文件名(去掉扩展名)
base_name = os.path.splitext(filename)[0]
# 创建对应的Word文件名
word_filename = base_name + ".docx"
word_path = os.path.join(word_folder, word_filename)
# 创建一个空白的Word文档
doc = Document()
# 保存Word文档
doc.save(word_path)
print(f"Created: {word_path}")
# 设置PDF文件夹和保存Word文件的文件夹路径
pdf_folder = 'path/to/pdf_folder'
word_folder = 'path/to/word_folder'
# 调用函数
create_word_from_pdf(pdf_folder, word_folder)
导入必要的模块:
os
: 用于文件和目录操作。Document
从 python-docx
: 用于创建和操作Word文档。定义函数 create_word_from_pdf
:
pdf_folder
: 存储PDF文件的文件夹路径。word_folder
: 将创建的Word文件保存到这个文件夹路径。检查和创建Word文件夹:
os.makedirs
创建目标文件夹,如果它不存在的话。遍历PDF文件夹:
os.listdir
列出文件夹中的所有文件,并过滤出以 .pdf
结尾的文件。生成Word文件名:
os.path.splitext
获取文件名(去掉扩展名),并生成对应的Word文件名。创建空白Word文档并保存:
Document
创建一个空白的Word文档。doc.save
保存Word文档到指定路径。将上面的代码保存为一个Python脚本文件(例如 create_word_from_pdf.py
),然后在终端或命令行中运行:
python create_word_from_pdf.py
确保你已经设置了正确的 pdf_folder
和 word_folder
路径。例如:
pdf_folder = '/path/to/your/pdf_folder'
word_folder = '/path/to/your/word_folder'
通过这个脚本,你可以根据PDF文件名在指定文件夹中创建对应的Word空白文件。如果你有任何特定需求或问题,请在评论区告诉我!