pdf2pptx是一个基于Python的命令行工具,可以将PDF格式的演示文稿批量转换为Microsoft Office PowerPoint(.pptx)格式的演示文稿。该项目利用了Python的强大功能和多个第三方库,如PyMuPDF(又称fitz)和python-pptx,以实现高效、准确的转换。
项目功能:
批量转换:用户可以指定一个文件夹,pdf2pptx会自动查找该文件夹中的所有PDF文件,并将它们转换为PPTX格式的演示文稿。
保持布局:pdf2pptx会尽可能保留原文档的布局和元素,包括文本、图片、图表等。
幻灯片分割:根据PDF页面的分隔,自动将PDF转换为相应的幻灯片。
自定义输出:用户可以自定义输出文件夹和文件名,以便更好地组织和管理转换后的演示文稿。
安装方法:
安装Python 3.6及以上版本
使用pip安装依赖库:pip install PyMuPDF python-pptx
下载pdf2pptx源代码并解压
在命令行中进入pdf2pptx文件夹,运行命令:python pdf2pptx.py -h,查看帮助信息
使用方法:
在命令行中进入pdf2pptx文件夹
运行命令:python pdf2pptx.py -i [输入文件夹路径] -o [输出文件夹路径],开始批量转换
from pptx import Presentation
from pdf2image import convert_from_path, convert_from_bytes
from pdf2