码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • python—如何提取word中指定内容


            假设有一个Word,该Word中存在 “联系人” 关键字,如何将该Word中的联系人所对应的内容提取出来呢?  该Word内容如下所示:       

          
            要在给定的Word文档中提取出与"联系人"关键字对应的内容,可以使用Python的python-docx库。以下是一个示例:

    1. import docx
    2. # 加载Word文档
    3. doc = docx.Document('your_document.docx')
    4. # 存储提取的内容
    5. contacts = []
    6. # 遍历文档中的段落并提取联系人关键字对应的内容
    7. for paragraph in doc.paragraphs:
    8. if '联系人' in paragraph.text:
    9. # 获取关键字后面的内容
    10. contact = paragraph.text.split('联系人', 1)[1]
    11. contacts.append(contact.strip())
    12. # 显示提取的内容
    13. for contact in contacts:
    14. print(contact)

            在上面的代码中,将'your_document.docx'替换为你要读取的Word文档的文件名或路径。

            运行代码后,将会显示与"联系人"关键字对应的内容。请注意,在提取"联系人"关键字的内容时,假设该关键字后面的内容是需要提取的信息。如果情况不符合,可能需要根据具体的Word文档结构和需求进行调整。

            确保已经安装了python-docx库。如果尚未安装,可以使用以下命令进行安装:

    pip install python-docx
            通过以上步骤,你就可以在Python中成功提取Word文档中与"联系人"关键字对应的内容了。

    运行上述代码得到运行结果为:

    1. 联系人:张三
    2. 联系人:李四
    3. 联系人:王五

     若想同时获取联系人及对应的电话,则在遍历部分代码中添加 '电话' 关键字即可,如下所示:

    1. # 遍历文档中的段落并提取指定内容
    2. for paragraph in doc.paragraphs:
    3. if '联系人' in paragraph.text:
    4. target_content.append(paragraph.text)
    5. elif '电话' in paragraph.text:
    6. target_content.append(paragraph.text)

    添加之后程序运行结果: 

    1. 联系人:张三
    2. 电话:153***55899
    3. 联系人:李四
    4. 电话:139***08783
    5. 联系人:王五
    6. 电话:139***52328

  • 相关阅读:
    【编程题】【Scratch二级】2021.12 绘制多边形
    【docker】Linux下查看或配置Docker的DNS服务器
    ConvNext模型复现--CVPR2022
    Apache Linki 1.3.1+DataSphereStudio+正常启动+微服务+端口号
    可编程交易区块为DeFi机器人提供强大动力
    Scala 高阶(九):Scala中的模式匹配
    L52.linux命令每日一练 -- 第八章 Linux磁盘与文件系统管理命令 -- resize2fs和fsck
    2022年浙江省中职组“网络空间安全”赛项模块B--Windows渗透测试
    Linux 中常见目录的作用
    《扫雷》的完善修改
  • 原文地址:https://blog.csdn.net/m0_48241022/article/details/133650788
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号