• python之读写.docx文件实例


    .docx文件是一种由Microsoft Word处理的二进制文件格式,取代了早期版本的.doc格式。它包含文本、图像、表格和其他文档元素,并用于Microsoft Office Word 2007及更高版本。

    .docx文件通常使用Office Open XML标准(ISO/IEC 29500)进行编码,并使用ZIP存档格式进行封装。可以使用Microsoft Word或兼容的第三方应用程序打开和编辑.docx文件。

    1、写入.docx文件文件

    1. from docx import Document
    2. from docx.shared import Pt
    3. from docx.shared import RGBColor
    4. from docx.enum.text import WD_PARAGRAPH_ALIGNMENT
    5. # 创建一个新的文档
    6. doc = Document()
    7. # 添加标题,level为标题等级
    8. doc.add_heading('Document Title', level=0)
    9. # 添加段落
    10. p = doc.add_paragraph('A plain paragraph having some ')
    11. #加粗
    12. p.add_run('bold').bold = True
    13. p.add_run(' and some ')
    14. #斜体
    15. p.add_run('italic.').italic = True
    16. #分页
    17. doc.add_page_break()
    18. # 添加带有样式的段落
    19. styled_para = doc.add_paragraph()
    20. styled_para.add_run('This paragraph has a style.').bold = True
    21. styled_para.alignment = WD_PARAGRAPH_ALIGNMENT.JUSTIFY
    22. # 添加带有图片的段落
    23. doc.add_picture(r'C:\Users\yh\Pictures\rm.png', width=Pt(120))
    24. # 添加表格
    25. table = doc.add_table(rows=3, cols=3)
    26. for i in range(3):
    27. for j in range(3):
    28. table.cell(i, j).text = f'Cell {i + 1}-{j + 1}'
    29. # 添加带有颜色的文本
    30. pcolor=doc.add_paragraph('This text is colored.', style='IntenseQuote')
    31. pcolor.add_run('This text is also colored and in bold.').bold = True
    32. pcolor.add_run('This text is also colored and in italic.').italic = True
    33. pcolor.add_run('This text is also colored and underlined.').underline = True
    34. # 保存文档
    35. doc.save('demo.docx')

    1. import docx
    2. def getText(fileName):
    3. doc = docx.Document(fileName)
    4. TextList = []
    5. for paragraph in doc.paragraphs:
    6. TextList.append(paragraph.text)
    7. return '\n'.join(TextList)
    8. p1='''子曰:“学而时习之,不亦说乎?”'''
    9. p2='''子曰:“温故而知新,可以为师。”'''
    10. p3='''子曰:“学而不思则罔,思而不学则殆。”'''
    11. p4='''子曰:“由,诲女知之乎!知之为知之,不知为不知,是知也”'''
    12. doc = docx.Document()
    13. print(len(doc.paragraphs))
    14. doc.add_paragraph(p1)
    15. doc.add_paragraph(p2)
    16. doc.add_paragraph(p3)
    17. doc.add_paragraph(p4)
    18. doc.add_heading("论语十则",0)
    19. doc.save(r'C:\\Users\\user\\Documents\\1.docx')
    20. print("over!")

    2、读取.docx文件

    1. import docx
    2. import matplotlib.pyplot as plt
    3. import base64
    4. import io
    5. # 打开文档
    6. doc = docx.Document('demo.docx')
    7. # 遍历文档中的段落
    8. for para in doc.paragraphs:
    9. # 打印段落的文本内容
    10. print(para.text)
    11. # 遍历文档中的表格
    12. for table in doc.tables:
    13. # 遍历表格中的行
    14. for row in table.rows:
    15. # 遍历行中的单元格
    16. for cell in row.cells:
    17. # 打印单元格的文本内容
    18. print(cell.text)

    Document Title
    A plain paragraph having some bold and some italic.


    This paragraph has a style.

    This text is colored.This text is also colored and in bold.This text is also colored and in italic.This text is also colored and underlined.
    Cell 1-1
    Cell 1-2
    Cell 1-3
    Cell 2-1
    Cell 2-2
    Cell 2-3
    Cell 3-1
    Cell 3-2
    Cell 3-3

  • 相关阅读:
    (附源码)springboot教学评价 毕业设计 641310
    如何打造一支专业的QA团队,至少要关注这5点
    R语言计算竞争风险数据中累积发生率置信区间并绘图(1)
    Python配置文件使用教程
    【Autosar 存储栈Memery Stack 3.存储读写流程的要求与时序】
    mysql- 主从复制的搭建过程
    vue3-admin-element安装
    Feign远程调用和Getaway网关
    python 线程池与队列简单应用
    Discuz中的关键全局变量`$_G`
  • 原文地址:https://blog.csdn.net/T20151470/article/details/132613431