• 官方推荐:6种Pandas读取Excel的方法


    Pandas提供了多种读取Excel文件的方法,以下是官方推荐的6种方法:

    1. 使用pd.read_excel()函数

    这是最常用的方法,可以读取Excel文件,并将其转换为Pandas数据框。可以指定工作表名和列名的行号。

    df = pd.read_excel('data.xlsx', sheet_name='Sheet1', header=0)
    
    • 1
    • 'data.xlsx'是要读取的Excel文件的文件路径。
    • sheet_name='Sheet1'表示要读取的工作表名为’Sheet1’。如果省略该参数,默认读取第一个工作表。
    • header=0表示将文件中的第0行作为列名。如果省略该参数,默认将文件中的第一行作为列名。

    读取完Excel文件后,将其转换为Pandas数据框,并将结果赋值给变量df。可以使用df.head()函数查看前几行数据,或使用其他Pandas函数和方法进行数据处理和分析。

    2. 使用pd.ExcelFile()parse()函数

    先使用pd.ExcelFile()函数创建一个Excel文件对象,然后使用parse()函数读取指定的工作表。

    xlsx = pd.ExcelFile('data.xlsx')
    df = xlsx.parse('Sheet1', header=0)
    
    • 1
    • 2
    • pd.ExcelFile('data.xlsx')创建了一个Excel文件对象xlsx,它代表了整个Excel文件。
    • parse('Sheet1', header=0)函数用于从Excel文件对象xlsx中读取指定的工作表。'Sheet1'表示要读取的工作表名为’Sheet1’,header=0表示将文件中的第0行作为列名。

    读取完Excel文件后,将其转换为Pandas数据框,并将结果赋值给变量df。可以使用df.head()函数查看前几行数据,或使用其他Pandas函数和方法进行数据处理和分析。

    3. 使用pd.read_table()函数

    可以读取Excel中的数据表,并指定分隔符(如制表符或逗号)。

    df = pd.read_table('data.xlsx', sheet_name='Sheet1', delimiter='\t', header=0)
    
    • 1
    • 'data.xlsx'是Excel文件的路径。
    • sheet_name='Sheet1'表示要读取的工作表名为’Sheet1’。
    • delimiter='\t'指定数据表中的分隔符为制表符(‘\t’)。
    • header=0表示将文件中的第0行作为列名。

    读取完Excel文件后,将其转换为Pandas数据框,并将结果赋值给变量df。可以使用df.head()函数查看前几行数据,或使用其他Pandas函数和方法进行数据处理和分析。

    4. 使用pd.read_csv()函数

    可以读取以逗号分隔的Excel文件,可以指定分隔符、工作表名和列名的行号。

    df = pd.read_csv('data.csv', sheet_name='Sheet1', delimiter=',', header=0)
    
    • 1
    • 'data.xlsx'是Excel文件的路径。
    • sheet_name='Sheet1'表示要读取的工作表名为’Sheet1’。

    读取完Excel文件后,将其转换为Pandas数据框,并将结果赋值给变量df。可以使用df.head()函数查看前几行数据,或使用其他Pandas函数和方法进行数据处理和分析。

    5. 使用pd.read_html()函数

    可以读取Excel文件中的HTML表格,并将其转换为Pandas数据框。

    tables = pd.read_html('data.xlsx', sheet_name='Sheet1')
    df = tables[0]
    
    • 1
    • 2
    • 'data.xlsx'是Excel文件的路径。
    • sheet_name='Sheet1'表示要读取的工作表名为’Sheet1’。

    读取完Excel文件后,将其转换为Pandas数据框,并将结果赋值给变量df。可以使用df.head()函数查看前几行数据,或使用其他Pandas函数和方法进行数据处理和分析。

    6. 使用pd.DataFrame.from_records()函数

    可以读取Excel文件中的记录,并将其转换为Pandas数据框。

    data = pd.ExcelFile('data.xlsx').parse('Sheet1').to_records()
    df = pd.DataFrame.from_records(data)
    
    • 1
    • 2
    • 'data.xlsx'是Excel文件的路径。
    • sheet_name='Sheet1'表示要读取的工作表名为’Sheet1’。

    读取完Excel文件后,将其转换为Pandas数据框,并将结果赋值给变量df。可以使用df.head()函数查看前几行数据,或使用其他Pandas函数和方法进行数据处理和分析。

    以上是官方推荐的6种读取Excel文件的方法。根据具体的需求和Excel文件的格式,选择适合的方法来读取数据。

    Pandas提供了读取Excel文件的方法,可以使用read_excel()函数来实现。以下是读取Excel文件的方法:

    首先,需要确保已经安装了Pandas库。可以使用以下命令进行安装:

    pip install pandas
    
    • 1

    接下来,导入Pandas库:

    import pandas as pd
    
    • 1

    使用read_excel()函数来读取Excel文件。该函数的基本语法如下:

    df = pd.read_excel('文件路径', sheet_name='工作表名', header=行号)
    
    • 1
    • '文件路径':Excel文件的路径,可以是相对路径或绝对路径。
    • '工作表名':要读取的工作表的名称。如果未指定,默认读取第一个工作表。
    • header:指定要用作列名的行号。通常,第一行是列名,所以使用0作为行号。如果Excel文件没有行号作为列名,则可以设置为None。

    以下是一个完整的示例:

    import pandas as pd
    
    # 读取Excel文件
    df = pd.read_excel('data.xlsx', sheet_name='Sheet1', header=0)
    
    # 打印数据框前几行
    print(df.head())
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    以上代码将会读取名为"data.xlsx"的Excel文件中的"Sheet1"工作表,并将数据存储在名为"df"的数据框中。然后,通过head()函数打印数据框的前几行。

    通过上述方法,您可以轻松地使用Pandas读取Excel文件并进行数据分析和处理。

  • 相关阅读:
    【单目3D目标检测】FCOS3D + PGD论文解析与代码复现
    c++day5
    图书管理系统的实现
    Cython代码加密, 使用 Cython 将 Python 代码编译为二进制(将整个Django项目编译成功并部署)
    关于LWIP的一点记录(一)
    基于SSM的国学文化网站设计与实现
    C++标准库(第二版,作者_NicolaiMJosuttis)_第5章通用工具5.2.1shared_ptr
    【C++】stack&和queue(stack、queue、priority_queue、deque)
    Linux 网络之netlink 简介
    Git仓库迁移实操(附批量迁移脚本)
  • 原文地址:https://blog.csdn.net/hitpter/article/details/132641204