• 数据可视化实验一:Panda数据处理及matplotlib绘图初步


    目录​​​​​​​

    2024-6-17

    一、请将所有含有发明家“吴峰”的发明专利的“申请日”打印出来。并将含有“吴峰”的所有发明专利条目保存到Excel中

    1.1 代码实现

    1.2 运行结果

    二、读取文件创建城市、人口、性别比、城镇化率DataFrame对象,计算指标排名,尝试使用plot绘图

    2.1 代码实现

    2.2 绘制结果


    一、请将所有含有发明家“吴峰”的发明专利的“申请日”打印出来。并将含有“吴峰”的所有发明专利条目保存到Excel

    1.1 代码实现

    1. # 实验要求:请将  所有含有发明家“吴峰”的发明专利的“申请日”打印出来。并将含有“吴峰”的所有发明专利条目保存到Excel中
    2. # 导入pandas库
    3. import pandas as pd
    4. # 从 Excel 读取数据
    5. df = pd.read_excel("实验课数据1.xlsx")
    6. # 筛选出含有发明家“吴峰”的发明专利的“申请日”
    7. filed_df = df[df["发明人"].str.contains("吴峰")]
    8. # 打印含有发明家“吴峰”的发明专利的“申请日”
    9. print(filed_df[["申请日"]])
    10. # 保存含有“吴峰”的所有发明专利条目到 Excel 中
    11. filed_df.to_excel("含有‘吴峰’的发明专利.xlsx", index=False)

    1.2 运行结果

    (1)原数据“实验课数据1.xlsx”

    (2)筛选后的结果

    (申请号不一样的原因是系统自动转换的结果)

    (3)打印申请日

    二、读取文件创建城市、人口、性别比、城镇化率DataFrame对象,计算指标排名,尝试使用plot绘图

    2.1 代码实现

    1. # 实验要求:读取文件创建城市、人口、性别比、城镇化率DataFrame对象,计算指标排名,尝试使用plot绘图
    2. import pandas as pd
    3. import matplotlib.pyplot as plt
    4. import matplotlib.font_manager as fm
    5. # 设置字体
    6. plt.rcParams['font.family'] = ['Arial Unicode MS']
    7. # data=pd.read_excel('江西省2021年人口普查.xlsx ', engine='openpyxl')
    8. # 创建包含城市、人口、性别比、城镇化率的 DataFrame,江西省不属于城市,不放入考虑范围
    9. data = {
    10.     '城市': ['南昌市''景德镇市''萍乡市''九江市''新余市''鹰潭市''赣州市''吉安市''宜春市''抚州市''上饶市'],
    11.     '年末常住人口(万人)': [643.75162.06180.59456.07120.21115.5898442.51497.11357.94643.67],
    12.     '总人口性别比(女性=100)': [109.98107.77103.8105.56109.45107.73106.02106.73107.04107.22106.71],
    13.     '常住人口城镇化率(%)': [78.6465.9468.7762.1574.1465.4356.3553.4157.3857.9655.31]
    14. }
    15. df = pd.DataFrame(data)
    16. print(df)
    17. # 计算指标排名
    18. df['人口排名'] = df['年末常住人口(万人)'].rank(ascending=False)
    19. df['性别比排名'] = df['总人口性别比(女性=100)'].rank(ascending=True)
    20. df['城镇化率排名'] = df['常住人口城镇化率(%)'].rank(ascending=False)
    21. # 可视化数据
    22. plt.figure(figsize=(126))
    23. plt.show()
    24. # 每个部分设置不同的颜色
    25. plt.subplot(131)
    26. df[['城市''人口排名']].set_index('城市').plot(kind='bar', color='skyblue')
    27. plt.title('人口排名')
    28. plt.show()
    29. plt.subplot(132)
    30. df[['城市''性别比排名']].set_index('城市').plot(kind='bar', color='salmon')
    31. plt.title('性别比排名')
    32. plt.show()
    33. plt.subplot(133)
    34. df[['城市''城镇化率排名']].set_index('城市').plot(kind='bar', color='lightgreen')
    35. plt.title('城镇化率排名')
    36. plt.tight_layout()
    37. plt.show()

    2.2 绘制结果

    (1)创建的DataFrame对象

    (2)然后进行指标排名,绘图结果如下

    I  按照人口排名

    绘制结果如下,由于是根据人口排名而不是人口数量进行柱状图绘制,因此可以很直观的看出赣州市的人口数量最多;相反,鹰潭市的人口数量最少。

    II 按照性别比排名

    由上述图形可以看出,萍乡市的性别比排名第一,而南昌市则是最后一名。

    III 按照城镇化率排名

    由上图可以看出南昌市的城镇化率是全省最高的,而吉安的城镇化率则居全省末尾。

    --------------------

    期末加油!

  • 相关阅读:
    MySQL——Centos7下环境安装
    Mybatis:ORM
    修复 Windows 上的 PyTorch 1.1 github 模型加载权限错误
    环境规制指数,两种测算方法,整理好的面板数据
    让学前端不再害怕英语单词(三)
    实现单点登录的方式
    修改Grafana自动刷新时间为1s
    【笔记篇】09仓管系统入库管理——之《实战供应链》
    基于NoCode构建简历编辑器
    进销存软件为批发零售商强化标准企业管理流程
  • 原文地址:https://blog.csdn.net/m0_64198455/article/details/139744474