• Pandas数据的导入与导出


    Excel格式数据导入
    文件格式读取方法
    Excel文件read_excel()
    CSV文件read_csv()
    txt文件read_table()
    Json文件read_json()
    MySQL文件read_sql_table()
    • 对于上述这些方法,只需要一行代码就可以实现不同格式数据的导入,唯一区别在于他们拥有不同的参数
    read_excel()
    • 不添加任何参数,会默认将Excel表格种的第一行识别为标题行

      df = pd.read_excel("表格.xlsx")
      df
      
      	学号	姓名
      0	1	  张三
      1	2	  李四
      2	3     王五
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
    • sheet_name参数,在一个Excel表格中,可能会有一个或多个Sheet,设置了sheet_name="Sheet1"表示我们想要读取Sheet1这个表格

      df = pd.read_excel('表格.xlsx',sheet_name='Sheet1')
      df
      
      	学号	姓名
      0	1	  张三
      1	2	  李四
      2	3     王五
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
    • index_col参数,指定将Excel表格的第几列当作行索引。设置为0时,表示将Excel表格种的学号列设置为了行索引,原始索引被替换

      df = pd.read_excel("表格.xlsx",index_col=0)
      df
      
      学号	 姓名
      1	  张三
      2	  李四
      3     王五
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
    • header参数,将指定表格的第几行当作标题行

      • 利用read_excel()读取excel表格,总是默认将第一行数据识别为标题行,由于表格Sheet1自带标题行,我们可以不用做任何设置。但是Sheet2表格没有标题行,我们需要设置header=None,告诉Python程序该表格没有标题行
      df = pd.read_excel('表格.xlsx',sheet_name='Sheet1')
      df
      
      	学号	姓名
      0	1	  张三
      1	2	  李四
      2	3     王五
      
      df = pd.read_excel('表格.xlsx',sheet_name='Sheet2',header=None)
      df
      
      	0	   1
      0	1	  张三
      1	2	  李四
      2	3     王五
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
      • 8
      • 9
      • 10
      • 11
      • 12
      • 13
      • 14
      • 15
    • usecols参数,指定导入Excel表格中的哪几列

      df = pd.read_excel("表格.xlsx",usecols=["姓名","语文"])
      df
      
      	姓名	语文
      0	张三	99
      1	李四	88
      2	王五	77
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
    Excel格式数据的导出
    • 在Pandas模块中,利用to_excel()方法可以将数据导出为Excel文件,利用to_csv()方法可以将数据导出为CSV文件

      df = pd.read_excel("表格.xlsx")
      df
      
      	学号	姓名	语文	数学
      0	 1	 张三	  88	99		
      1	 2	 李四	  77	88
      2	 3	 王五	  66	90
      
      df.to_excel(
              excel_writer="导出.xlsx",
              index=False,
              sheet_name="成绩表",
              columns=["姓名","语文","数学"],
              na_rep=0,
              encoding="gbk"
          )
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
      • 8
      • 9
      • 10
      • 11
      • 12
      • 13
      • 14
      • 15
      • 16
      • excel_writer参数用于指明文件的保存路径
      • index参数为False表示隐藏序列号,否则会自动生成一个序列号
      • sheet_name用于设置表格的名称
      • columns参数可以指定导出哪些列
      • **na_rep**参数可以将表格中的缺失值用指定值填充
      • encoding参数用于设置文件编码,一般根据自己的系统环境来设置
  • 相关阅读:
    python基于PHP+MySQL的在线音乐分享网站的设计与实现
    【核心动画-转场动画-CATransition Objective-C语言】
    QT的补充知识
    6100 & 6101 LeetCode刷题
    LINUX 常用命令
    Android事件分发机制源码解析
    服装商城网站风险及优势
    【JAVA】SrpingMVC(上)—— 注解&请求与响应
    python使用鼠标在图片上画框
    为啥小扎一直醉心于元宇宙的布局?
  • 原文地址:https://blog.csdn.net/s_frozen/article/details/125998726