• 用Python自动生成 图文并茂的数据分析 报告



    大家好,这里是程序员晚枫。

    上周B站:程序员晚枫后台的一位朋读者私信我,想学习一下Python自动化生成数据分析报告。

    作为有问必答的编程博主,今天我们来一起学习一下~

    reportlab是Python的一个标准库,可以画图、画表格、编辑文字,最后可以输出PDF格式。它的逻辑和编辑一个word文档或者PPT很像。有两种方法:

    1. 建立一个空白文档,然后在上面写文字、画图等;
    2. 建立一个空白list,以填充表格的形式插入各种文本框、图片等,最后生成PDF文档。

    因为需要产生一份给用户看的报告,里面需要插入图片、表格等,所以采用的是第二种方法。

    1、一行命令,安装这个库

    reportlab输入Python的第三方库,使用前需要先安装,

    为了方便大家使用,我已经将这个库集成到Python自动化办公的专用库:pip install python-office中了,

    因此一行命令就可以完成的安装命令如下👇

    pip install -i https://pypi.tuna.tsinghua.edu.cn/simple python-office -U
    
    • 1

    2、核心代码模块导入

    ①提前导入相关内容,并且注册字体。(注册字体前需要先准备好字体文件)

    from reportlab.pdfbase import pdfmetrics   # 注册字体
    from reportlab.pdfbase.ttfonts import TTFont # 字体类
    from reportlab.platypus import Table, SimpleDocTemplate, Paragraph, Image  # 报告内容相关类
    from reportlab.lib.pagesizes import letter  # 页面的标志尺寸(8.5*inch, 11*inch)
    from reportlab.lib.styles import getSampleStyleSheet  # 文本样式
    from reportlab.lib import colors  # 颜色模块
    from reportlab.graphics.charts.barcharts import VerticalBarChart  # 图表类
    from reportlab.graphics.charts.legends import Legend  # 图例类
    from reportlab.graphics.shapes import Drawing  # 绘图工具
    from reportlab.lib.units import cm  # 单位:cm
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10

    ②注册字体

    提前准备好字体文件, 如果同一个文件需要多种字体可以注册多个

    pdfmetrics.registerFont(TTFont('SimSun', 'SimSun.ttf'))
    封装不同内容对应的函数
    创建一个Graphs类,通过不同的静态方法提供不同的报告内容,包括:标题、普通段落、图片、表格和图表。函数中的相关数据目前绝大多数都是固定值,可以根据情况自行设置成相关参数。
    # Graphs类的全部代码,请+v:CoderWanFeng
    
    • 1
    • 2
    • 3
    • 4

    ③生成报告

    if __name__ == '__main__':  
        # 创建内容对应的空列表  
        content = list()  
        
        # 添加标题   
        content.append(Graphs.draw_title('数据分析就业薪资'))   
        
        # 添加图片   
        content.append(Graphs.draw_img('资料全集.jpg'))  
        
        # 添加段落文字  
        content.append(Graphs.draw_text('众所周知,大数据分析师岗位是香饽饽,近几年数据分析热席卷了整个互联网行业,与数据分析的相关的岗位招聘、培训数不胜数。很多人前赴后继,想要参与到这波红利当中。那么数据分析师就业前景到底怎么样呢?需要学习Python + 大数据分析,可以添加我:CoderWanFeng'))   
        
        # 添加小标题  
        content.append(Graphs.draw_title(''))  
        content.append(Graphs.draw_little_title('全网同名:程序员晚枫'))   
        
        # 添加表格   
        data = [    
            ('平台名称', '关注人数', '较上年增长率'),    
            ('公众号', '18.5K', '25%'),     
            ('B站', '25.5K', '14%'),    
            ('微博', '29.3K', '10%') 
        ]  
        content.append(Graphs.draw_table(*data)) 
        
        # 生成图表  
        content.append(Graphs.draw_title(''))  
        content.append(Graphs.draw_little_title('热门城市的就业情况'))  
        b_data = [(25400, 12900, 20100, 20300, 20300, 17400), (15800, 9700, 12982, 9283, 13900, 7623)]  
        ax_data = ['BeiJing', 'ChengDu', 'ShenZhen', 'ShangHai', 'HangZhou', 'NanJing'] 
        leg_items = [(colors.red, '平均薪资'), (colors.green, '招聘量')]   
        content.append(Graphs.draw_bar(b_data, ax_data, leg_items))  
        
        # 生成pdf文件   
        doc = SimpleDocTemplate('report.pdf', pagesize=letter)  
        doc.build(content)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37

    生成报告的结果如下

  • 相关阅读:
    计算机网络-网络安全(二)
    【NoSQL数据库】Redis简介
    BI业务分析思维:供应链生产制造策略(二)推式和拉式优劣势分析
    SegGPT: Segmenting Everything In Context论文笔记
    交易中最佳的建仓时机,fpmarkets一个指标搞定
    java数据结构--阻塞队列
    Centos7.4重启提示gurb2/i386-pc/normal.mod not found
    Android 指纹验证
    开发者配置项、开发者选项自定义
    HBase非关系型数据库
  • 原文地址:https://blog.csdn.net/weixin_42321517/article/details/126244862