• 【Python自动化办公】分享几个好用到爆的模块,建议收藏


    今天我来给大家推荐几个在自动化办公领域当中非常好用的 Python 模块,可以帮助大家在工作当中及大地提高效率,避免重复机械化地操作流程。 喜欢记得收藏、关注、点赞 文末有资料惊喜哦

    更多技术交流,文末获取

    Pathlib

    涉及到文件系统操作的时候,相信不少人仍然在使用 Python 当中的 OS 模块,相比较之下, Pathlib 模块有着不少优势,我们来看几个简单的案例

    删除与创建目录

    例如我们可以来创建与删除目录,代码如下

    from pathlib import Path
    
    currentPath = Path.cwd()
    makePath = currentPath / 'pythonPractice'
    makePath.mkdir()

    那么同样的,删除目录的代码为

    currentPath = Path.cwd()
    delPath = currentPath / 'pythonPractice'
    delPath.rmdir()

    获取目录

    例如我们想要获取当前所在的目录的路径,代码如下

    currentPath = Path.cwd()
    print(currentPath)

    以及电脑用户所在的目录

    homePath = Path.home()
    print(homePath)

    路径的拼接

    例如我们想要拼接出桌面的绝对路径,代码如下

    Path(Path.home(), "Desktop")

    也可以是

    Path.join
    path(Path.home(), "Desktop")

    目录文件的判断

    针对指定的路径,我们能够来判断是否是文件夹以及是否是一个文件,代码如下

    input_path = r"指定的路径"
    
    if Path(input_path ).exists():
     if Path(input_path ).is_file():
      print("是文件哦!")
     elif Path(input_path ).is_dir():
      print("是文件夹哦!")
    else:
     print("路径给的不对!")

    Python 当中的 glob 模块主要是用来查找符合特定规则的目录和文件,并将搜索到的结果返回到一个列表当中去。

    由于该模块支持使用正则通配符来进行查找,因此使用起来也是特别的方便,我们来看一下简单的案例,

    path1 = r".\[0-9].jpg"glob.glob(path1)

    outut

    ['.\\1.jpg', '.\\2.jpg', '.\\3.jpg', ......]

    其中经常会用到的通配符有

    • * :匹配0个或者多个字符

    • ** :匹配所有文件、目录,子目录和子目录里面的文件

    • [] :匹配指定范围内的字符,例如 [1-9] 匹配的是1-9以内的字符

    • [!] :匹配不在指定范围内的字符

    我们再来看几个案例,代码如下

    for fname in glob.glob("./*.py"):
        print(fname)

    上面的代码打印出了当前目录下的所有 py 后缀的文件,再来看一下案例

    for fname in glob.glob("./file[!0-9].py"):
        print(fname)

    上面代码则是打印出了以 filename 开头的非数字符号的 py 文件。

    PDF转成Word文档

    最后我们来讲讲如何实现将PDF文档转换成Word格式的文档,用到的模块是 pdf2docx ,我们先用pip命令来将该模块安装一下

    pip install pdf2docx

    我们来实践一下,代码如下

    from pdf2docx import Converter
    
    cv = Converter(r"pdf文档的具体路径")
    cv.convert("test.docx", start=0,end=None)
    cv.close()

    如果是页面元素比较简单的文档, pdf2docx 模块处理一下是完全够用了,但是有些时候 PDF 文档当中个别页面非常的花里胡哨,转换成 Word 格式的文档之后则会显得有点凌乱。

    最后我们还能够针对指定的页数进行转换,例如只是针对文档当中的奇数页进行操作,代码如下

    from pdf2docx import Converter
    
    cv = Converter(r"pdf文档的具体路径")
    cv.convert("test.docx", pages=[1, 3, 5, 7])
    cv.close()

    办公自动化 书籍资料点击领取腾讯文档-在线文档https://docs.qq.com/doc/DT0hJTWFkd3pGbmFU

  • 相关阅读:
    新框架Nue.js以及如何搭建框架(详细介绍)
    vue3注意点
    2024年软件测试面试题大全【答案+文档】
    tyvj 贪心 p1019 配对
    推荐系统笔记(十五):pytorch/tensorflow添加随机均匀噪声
    jquery点击禁用
    单点登录SSO的含义
    浮点数运算以及溢出问题
    个人网页设计成品DW静态网页 HTML网页设计结课作业 web课程设计网页规划与设计 Web大学生个人网页成品 web网页设计期末课程大作业
    大数据毕业设计选题推荐-河长制大数据监测平台-Hadoop-Spark-Hive
  • 原文地址:https://blog.csdn.net/m0_59485658/article/details/126043509