文件格式 | 读取方法 |
---|---|
Excel 文件 | read_excel() |
CSV 文件 | read_csv() |
txt 文件 | read_table() |
Json 文件 | read_json() |
MySQL 文件 | read_sql_table() |
不添加任何参数,会默认将Excel表格种的第一行识别为标题行
df = pd.read_excel("表格.xlsx")
df
学号 姓名
0 1 张三
1 2 李四
2 3 王五
sheet_name参数,在一个Excel表格中,可能会有一个或多个Sheet,设置了sheet_name="Sheet1"
表示我们想要读取Sheet1
这个表格
df = pd.read_excel('表格.xlsx',sheet_name='Sheet1')
df
学号 姓名
0 1 张三
1 2 李四
2 3 王五
index_col参数,指定将Excel表格的第几列当作行索引。设置为0时,表示将Excel表格种的学号列设置为了行索引,原始索引被替换
df = pd.read_excel("表格.xlsx",index_col=0)
df
学号 姓名
1 张三
2 李四
3 王五
header参数,将指定表格的第几行当作标题行
read_excel()
读取excel表格,总是默认将第一行数据识别为标题行,由于表格Sheet1
自带标题行,我们可以不用做任何设置。但是Sheet2
表格没有标题行,我们需要设置header=None
,告诉Python程序该表格没有标题行df = pd.read_excel('表格.xlsx',sheet_name='Sheet1')
df
学号 姓名
0 1 张三
1 2 李四
2 3 王五
df = pd.read_excel('表格.xlsx',sheet_name='Sheet2',header=None)
df
0 1
0 1 张三
1 2 李四
2 3 王五
usecols
参数,指定导入Excel表格中的哪几列
df = pd.read_excel("表格.xlsx",usecols=["姓名","语文"])
df
姓名 语文
0 张三 99
1 李四 88
2 王五 77
在Pandas模块中,利用to_excel()
方法可以将数据导出为Excel文件,利用to_csv()
方法可以将数据导出为CSV
文件
df = pd.read_excel("表格.xlsx")
df
学号 姓名 语文 数学
0 1 张三 88 99
1 2 李四 77 88
2 3 王五 66 90
df.to_excel(
excel_writer="导出.xlsx",
index=False,
sheet_name="成绩表",
columns=["姓名","语文","数学"],
na_rep=0,
encoding="gbk"
)
na_rep
**参数可以将表格中的缺失值用指定值填充