• 零代码编程:用ChatGPT多线程批量将PDF文档转换为word格式


    pdf2docx是Python的一个库,可以很方便的将PDF文档转换为word格式,首先安装这个库。

    然后在ChatGPT中输入提示词:

    你是一个Python编程专家,要完成一个文档格式转换的任务,具体步骤如下:

    打开F盘的Books文件夹;

    读取里面的PDF文档,用pdf2docx库将其转换为word文档;

    注意:每一步都要输出相关信息

    使用多线程以加快转换速度;

    源代码如下:

    import os

    from glob import glob

    from pdf2docx import Converter

    from concurrent.futures import ThreadPoolExecutor, as_completed

    # 定义PDF转Word的函数

    def pdf_to_word(pdf_file):

    # 创建输出的Word文件名

    docx_file = pdf_file.rsplit('.', 1)[0] + '.docx'

    # 创建一个转换器对象

    cv = Converter(pdf_file)

    # 将PDF转换为Word

    cv.convert(docx_file, start=0, end=None)

    cv.close()

    print(f'Successfully converted {pdf_file} to {docx_file}.')

    # 获取F盘Books文件夹下的所有PDF文件

    pdf_files = glob('F:/Books/*.pdf')

    # 创建一个线程池

    with ThreadPoolExecutor(max_workers=5) as executor:

    # 使用线程池中的线程来执行转换任务

    futures = {executor.submit(pdf_to_word, pdf_file): pdf_file for pdf_file in pdf_files}

    # 打印转换进度

    for future in as_completed(futures):

    pdf_file = futures[future]

    print(f'Finished processing file: {pdf_file}')

    运行成功:

    图片和表格都成功转换了:

  • 相关阅读:
    uniapp - 微信小程序 - 自定义底部tabbar
    基于javaweb的房屋租赁后台管理系统
    Zabbix 5.0 监控教程(一)
    模板、外观、观察者、建造者
    1990-2020年江苏省全省人口数、户数(常住)
    AI技术在软件测试中的应用和实践
    Redis分布式锁
    SpringBoot数据层解决方案
    大数据:Sqoop 简介与安装
    ardupilot相机拍照控制
  • 原文地址:https://blog.csdn.net/AIGCTribe/article/details/134047306