• Python可视化数据分析07、Pandas_CSV文件读写


    Python可视化数据分析07、Pandas_CSV文件读写

    📋前言📋

    💝博客:【红目香薰的博客_CSDN博客-计算机理论,2022年蓝桥杯,MySQL领域博主】💝

    ✍本文由在下【红目香薰】原创,首发于CSDN✍

    🤗2022年最大愿望:【服务百万技术人次】🤗

    💝Python初始环境地址:【Python可视化数据分析01、python环境搭建】💝 


    环境需求

    环境:win10

    开发工具:PyCharm Community Edition 2021.2

    数据库:MySQL5.6

    目录

    Python可视化数据分析07、Pandas_CSV文件读写

    📋前言📋

    环境需求

    CSV文件

    CSV文件操作

    CSV写入

    CSV读取


    CSV文件

    逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。

    CSV文件操作

    在Pandas模块中,使用to_csv()函数将DataFrame对象写入到CSV文件。
    to_csv()函数的参数说明如下:
    path_or_buf:字符串或文件句柄,默认无文件路径或对象,如果没有提供,结果将返回为字符串。可以是URL,可用URL类型包括http、ftp、s3和文件。
    sep:指定分隔符。如果不指定参数,则会尝试使用逗号分隔。

    CSV写入

    1. import pandas as pd
    2. df = pd.DataFrame({"id": [1, 2, 3], "name": ["雷静", "小凤", "春梦"], "age": ["21", "22", "20"]})
    3. print(df)
    4. # 写入到csv文件
    5. df.to_csv("test.csv", index=False, sep=",", encoding="gbk") # 使用gbk在用excel的时候能显示中文

    1. import pandas as pd
    2. df = pd.DataFrame({"id": [1, 2, 3], "name": ["雷静", "小凤", "春梦"], "age": ["21", "22", "20"]})
    3. print(df)
    4. # 写入到csv文件
    5. df.to_csv("test.csv", index=False, sep=",", encoding="utf-8") # 使用gbk在用excel的时候能显示中文

     

     

    CSV读取

    1. import pandas as pd
    2. df = pd.read_csv("test.csv", encoding="utf-8")
    3. print(df)

    1. import pandas as pd
    2. df = pd.read_csv("test.csv", encoding="gbk")
    3. # 基础信息
    4. print(df.info)
    5. # 查看列名
    6. print(df.columns)
    7. # 查看各列数据类型
    8. print(df.dtypes)
    9. # 查看下标
    10. print(df.index)
    11. # 数据浏览前2条
    12. print(df.head(2))
    13. # 查看name到age列
    14. print(df.loc[:, "name":"age"])
    15. # 基本统计
    16. print("最大年龄:", df.age.max())
    17. print("平均年龄:", df.age.mean())
    18. # 查询
    19. print(df[df.name == "春梦"])
    20. # 排序·True正序False倒序
    21. print(df.sort_values(by=["age"], ascending=False))
    22. # 在第二列【下标是1】添加列
    23. df.insert(1, "sex", "女")
    24. print(df)
    25. # 在最后添加列
    26. df["introduce"] = "巾帼"
    27. print(df)
    28. # 删除某行
    29. df = df.drop(1)
    30. print(df)
    31. # 替换
    32. value = pd.Series([1, "女", "雷静静", 20, "大眼姑娘"], index=["id", "sex", "name", "age", "introduce"])
    33. df.loc[0] = value
    34. value = pd.Series([4, "女", "小龙女", 18, "冰山美人"], index=["id", "sex", "name", "age", "introduce"])
    35. df.loc[3] = value
    36. print(df)
    37. # 条数
    38. print(len(df))

     

    0   1   雷静   21
    1   2   小凤   22
    2   3   春梦   20>
    Index(['id', 'name', 'age'], dtype='object')
    id       int64
    name    object
    age      int64
    dtype: object
    RangeIndex(start=0, stop=3, step=1)
       id name  age
    0   1   雷静   21
    1   2   小凤   22
      name  age
    0   雷静   21
    1   小凤   22
    2   春梦   20
    最大年龄: 22
    平均年龄: 21.0
       id name  age
    2   3   春梦   20
       id name  age
    1   2   小凤   22
    0   1   雷静   21
    2   3   春梦   20
       id sex name  age
    0   1   女   雷静   21
    1   2   女   小凤   22
    2   3   女   春梦   20
       id sex name  age introduce
    0   1   女   雷静   21        巾帼
    1   2   女   小凤   22        巾帼
    2   3   女   春梦   20        巾帼
       id sex name  age introduce
    0   1   女   雷静   21        巾帼
    2   3   女   春梦   20        巾帼
       id sex name  age introduce
    0   1   女  雷静静   20      大眼姑娘
    2   3   女   春梦   20        巾帼
    3   4   女  小龙女   18      冰山美人
    3

    Process finished with exit code 0

  • 相关阅读:
    人工智能知识全面讲解:生成对抗网络的应用
    NLP(文本处理技术)在数据分析中的应用实例
    Backbone 网络-ResNet 论文解读
    趣解设计模式之《小王与他的Apple商店》
    【前端知识】Three 学习日志(七)—— 动画渲染循环
    读书笔记-你不知道的js(中卷)
    工业自动化产品抗干扰笔记
    数据结构学习笔记(V):树与二叉树
    MYSQL函数,一篇文章看完!
    python爬虫企业微信打卡数据,写入数据库
  • 原文地址:https://blog.csdn.net/feng8403000/article/details/126021861