• 用Python操作PPT的办公自动化教程


    PPT通过其精美的可视化技巧以及良好的演示效果,成为了职场人士的必备技能。PPT的设计是一门大学问,无论是设计技巧,还是操作方法,都衍生出了专门的课程。

    主要介绍Python操作PPT的技巧,编程的优势在于处理速度,对于高大上的PPT设计,还是需要"以人为本,所以该模块的使用场景主要是PPT基本元素的提取和添加,适合大量内容的转化,比如word转PPT, 减少大量繁琐的人工操作,尽管提供了一些基本的样式设计,但是满足日常办公对PPT美观性的要求上还是差点意思。

    安装模块

    Windows用户打开命令行输入:pip install python-pptx

    Mac用户打开终端/Terminal输入:pip3 install python-pptx

    使用windows系统,如果出现无法安装情况,可以在cmd模式下输入网址选择国内清华镜像。

    pip install -i https://pypi.tuna.tsinghua.edu.cn/simple python-pptx

    导入模块:import pptx

    参考文档地址:https://python-pptx.readthedocs.io/en/latest/index.html

    PPT的基本结构介绍

    在该模块中,将ppt拆分为了以下多个元素

    1.presentations, 表示整个ppt文档
    2.sliders. 表示ppt文档的每一页
    3.shapes 方框,在每页幻灯片内插入的方框,可以是形状,也可以是文本框
    4.Run 文字块 一般为较少字符
    5.Paragraph 段落,即Shape中的每一段内容,都称为一个段落

    在这里插入图片描述

    基本使用:

    from pptx import Presentation
    from pptx.enum.shapes import MSO_SHAPE
    from pptx.util import Inches, Pt, Cm
     
    prs = Presentation()    #默认模板
     
    prs = Presentation(mypath)    #使用自己定义的模板
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    获取PPT内容

    from pptx import Presentation
    from pptx.util import Inches
    # 1. 得到幻灯片对象
    prs = Presentation("demo.pptx")
    # 2. 获取prs对象中的每一页PPT
    for slide in prs.slides:
      # 3. 遍历获取每页PPT中的内容
        for shape in slide.shapes: 
          # 4. 打印具体的Shape
            print(shape)
         # 5. 我是一条华丽的分割线,划分不同的slide
        print("——————————————————————————")
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    输出结果:

    在这里插入图片描述

    如果想获取每个Shape里面的文字也可以:

    shape.has_text_frame ----->是否有文字 shape.text_frame ----->获取文字框

    from pptx import Presentation
    from pptx.util import Inches
    # 1. 得到幻灯片对象
    prs = Presentation("demo.pptx")
    # 2. 获取prs对象中的每一页PPT
    for slide in prs.slides:
      # 3. 遍历获取每页PPT中的内容
        for shape in slide.shapes: 
          # 4. 判断是否存在文本
            if shape.has_text_frame:
              # 5. 如果存在则获取内容
                text_frame = shape.text_frame
                print(text_frame.text)
         # 6. 我是一条华丽的分割线,划分不同的slide
        print("——————————————————————————")      
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15

    输出的结果(对比前面的幻灯片):
    在这里插入图片描述

    从shape中找paragraph

    from pptx import Presentation
    from pptx.util import Inches
    # 1. 得到幻灯片对象
    prs = Presentation("demo.pptx")
    # 2. 获取prs对象中的每一页PPT
    for slide in prs.slides:
      # 3. 遍历获取每页PPT中的内容
        for shape in slide.shapes: 
          # 4. 判断是否存在文本
            if shape.has_text_frame:
          # 5. 获取shape中的文本
                text_frame = shape.text_frame
                # 6. 获取text_frame中的段落内容
                for paragraph in text_frame.paragraphs:
                  # 7. 打印段落内容
                   print(paragraph.text)
                   print('----------paragraph------------')
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17

    在这里插入图片描述

    综合应用

    编写一个Python程序,要求

    (1)打开demo.pptx

    (2)按照paragraph分段,转换成为word文档

    (3)保存为demo.docx

    from pptx import Presentation
    from docx import Document
    
    doc = Document()
    prs = Presentation("婚礼策划师的最爱.pptx")
    ls = []
    for slide in prs.slides:
     for shape in slide.shapes:
      if shape.has_text_frame:
       text_frame = shape.text_frame
       for paragraph in text_frame.paragraphs:
        if paragraph.text != '':
         doc.add_paragraph(paragraph.text)
    
    doc.save("demo.docx")
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15

    向PPT写入内容

    首先了解模板和占位符

    Slides_layouts:版式,一个幻灯片母版由多个版式组成,索引从0开始。

    Placeholder:占位符:存在PPT母版里面的幻灯片的某一部件:Placeholder

    在这里插入图片描述

    在创建一页ppt时,需要指定对应的布局,在该模块中, 内置了以下9种布局

    1.Title
    2.Title and Content
    3.Section Header
    4.Two Content
    5.Comparison
    6.Title Only
    7.Blank
    8.Content with Caption
    9.Picture with Caption
    通过数字下标0到9来访问,指定布局添加一页ppt的用法如下:

    创建placeholders

    from pptx import Presentation
    
    prs = Presentation() #初始化一个空pptx文档
    slide = prs.slides.add_slide(prs.slide_layouts[0])  # 用第一个母版生成一页ppt
    for shape in slide.placeholders:         # 获取这一页所有的占位符
        phf = shape.placeholder_format
        print(f'{phf.idx}--{shape.name}--{phf.type}')  # id号--占位符形状名称-占位符的类型
        shape.text = f'{phf.idx}--{shape.name}--{phf.type}'
    prs.save("new_template.pptx")
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9

    在这里插入图片描述

    也可以一次添加多个

    from pptx import Presentation
    
    prs = Presentation() #初始化一个空pptx文档
    i = 0
    while i <= 10:
        slide = prs.slides.add_slide(prs.slide_layouts[i])  
        i = i+1
        for shape in slide.placeholders:         # 获取这一页所有的占位符
            phf = shape.placeholder_format
            print(f'{phf.idx}--{shape.name}--{phf.type}')  # id号--占位符形状名称-占位符的类型
            shape.text = f'{phf.idx}--{shape.name}--{phf.type}'
    prs.save("new_template.pptx")
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    在这里插入图片描述

    向占位符中添加内容

    主要使用:

    shape.text = 字符串
    prs.save(文件路径)

    from pptx import Presentation
    
    prs = Presentation()
    # 用第一个母版生成一页ppt
    slide = prs.slides.add_slide(prs.slide_layouts[1])
    # 获取当前页的标题
    title_shape = slide.shapes.title
    # 向标题中添加文本
    title_shape.text = '宋宋的Python专栏'
    # 获取副标题
    subtitle = slide.shapes.placeholders[1]
    # 副标题中添加文本
    subtitle.text = '宋宋是一个爱美的大女生'
    
    # 副标题中添加新段落
    new_paragraph1 = subtitle.text_frame.add_paragraph()
    # 向段落中添加文本
    new_paragraph1.text = '我是一个专注学习技术的大女生'
    new_paragraph1.level = 1
    
    new_paragraph2 = subtitle.text_frame.add_paragraph()
    new_paragraph2.text = '我是一个认真写文章的大女生哈哈哈'
    new_paragraph2.level = 2
    
    # 保存内容
    prs.save("写入内容1.pptx")
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26

    在这里插入图片描述

    空白的PPT模板中添加文本框和图形

    from pptx import Presentation
    from pptx.util import Cm,Pt,Inches
    from pptx.enum.shapes import MSO_SHAPE
    
    prs = Presentation('写入内容1.pptx')
    slide = prs.slides.add_slide(prs.slide_layouts[6]) # 6的layout中是一个空白的Slider,里面没有占位符
    
    # 单独向里面添加文本框和图片
    left = top = width = height =Cm(3)  # # left,top为相对位置,width,height为文本框大小。满足条件顺序是左>上>右>下
    text_box = slide.shapes.add_textbox(left,top,width,height)
    tf = text_box.text_frame
    tf.text = "欢迎来到宋宋的Python专栏"
    
    p = tf.add_paragraph()
    p.text = "宋宋的Python专栏,有20天学会Python基础,20天学会爬虫,20天学会数据分析,还有干活趣味文章!"
    p.font.bold = True
    p.font.size = Pt(15)
    
    # 添加图形
    
    slide1 = prs.slides.add_slide(prs.slide_layouts[6]) 
    shapes = slide1.shapes
    left = top = width = height = Inches(1.0)
    shape = shapes.add_shape(MSO_SHAPE.ROUNDED_RECTANGLE, left, top, width, height)
    
    prs.save("写入内容1_new.pptx")
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26

    案例

    现有一个公益捐书项目,有很多学生参与了本次活动,为了嘉奖这些学生,决定给每位学生发一张奖状。参与捐赠的学生名单和捐书数量都在students.xlsx中。

    1.读取Excel中的数据
    2.读取做好的PPT模板
    3.将每位同学的姓名和捐书数量设置到PPT上
    4.保存PPT
    模版样式如下:

    在这里插入图片描述

    学生名单信息:
    在这里插入图片描述

    代码如下:

    from pptx import Presentation
    from pptx.util import Cm,Pt,Inches
    from pptx.enum.shapes import MSO_SHAPE
    from datetime import datetime
    
    from openpyxl import load_workbook
    
    # 1. 加载cosmetics.xlsx表格
    workbook = load_workbook(filename= 'students.xlsx')
    # 2. 得到Sheet1工作簿
    sheet = workbook['Sheet1']
    
    # 按照行遍历,一行是一个人的信息
    for row in sheet.iter_rows(min_row=2, max_row=8, min_col= 1,max_col=2):  # 涵盖范围的所有单元格都会显示
     
     prs = Presentation("模版.pptx")
    
     # 2. 获取prs对象中的每一页PPT
     for slide in prs.slides:
       # 3. 遍历获取每页PPT中的内容
      for shape in slide.shapes: 
        # 4. 判断是否存在文本
       if shape.has_text_frame:
           # 5. 获取shape中的文本
        text_frame = shape.text_frame
        # 6. 获取text_frame中的段落内容
        for paragraph in text_frame.paragraphs:
         paragraph.font.size = Pt(24)
         # 7. 打印段落内容
         if paragraph.text=='__':
          paragraph.text=row[0].value
         if paragraph.text=='__册':
          paragraph.text=f'{row[1].value}册'
         if paragraph.text=='日期:':
          paragraph.font.size = Pt(18)
          paragraph.text=str(datetime.now().strftime('%Y年%m月%d日'))
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36

    关于Python的技术储备

    在这里给大家分享一些免费的课程供大家学习,下面是课程里面的截图,扫描最下方的二维码就能全部领取。

    1.Python所有方向的学习路线

    在这里插入图片描述

    2.学习软件

    工欲善其事必先利其器。学习Python常用的开发软件都在这里了,给大家节省了很多时间。
    在这里插入图片描述

    3.学习资料

    在这里插入图片描述

    4.实战资料

    实践是检验真理的唯一标准。这里的压缩包可以让你再闲暇之余帮你提升你的个人能力。
    在这里插入图片描述

    5.视频课程

    在这里插入图片描述

    好啦今天的分享就到这里结束了,快乐的时光总是短暂呢,想学习更多课程的小伙伴不要着急,有更多惊喜哦~在这里插入图片描述

  • 相关阅读:
    产品推荐 - 基于复旦微 JFM7K325T FPGA 的高性能 PCIe 总线数据预处理载板(100%国产化)
    Business eXtreme 5 企业级报表和数据分析工具
    Flutter 中的 ListWheelViewport 小部件:全面指南
    联邦学习综述二
    使用zdppy_api+onlyoffice word文档在线共同编辑,附完整的vue3前端代码和python后端代码
    【教程】微信推文怎么添加附件文档 (如word文档、excel表格、pdf文件)
    LeetCode 1413.逐步求和得到正数的最小值
    Fiddler抓包工具是最强大最好用的 Web 调试工具之一
    查询
    解放计算力:使用并行处理提升python for循环速度
  • 原文地址:https://blog.csdn.net/Everly_/article/details/133581017