• Python操作Excel常用方法汇总


    目录

    引言

    一、使用pandas库操作Excel

    1、读取Excel文件

    2、写入Excel文件

    3、处理Excel数据

    二、使用openpyxl库操作Excel

    1、读取Excel文件

    2、写入Excel文件

    3、处理Excel数据

    三、高级功能

    总结


    引言

    Python是一种功能强大的编程语言,它可以用来处理各种类型的数据,包括Excel文件。在Python中,我们可以使用多种库来操作Excel文件,其中最常用的库是pandas和openpyxl。本文将介绍使用这两个库来读取、写入和处理Excel文件的常用方法。

    一、使用pandas库操作Excel

    pandas库是Python中一个流行的数据处理库,它提供了许多方便的方法来读取、写入和处理数据。下面是使用pandas库操作Excel的常用方法:

    1、读取Excel文件

    使用pandas库读取Excel文件非常简单,可以使用read_excel()函数来实现。下面是一个示例代码:

    1. import pandas as pd  
    2.   
    3. # 读取Excel文件  
    4. df = pd.read_excel('example.xlsx')

    在上面的代码中,我们使用pd.read_excel()函数读取了一个名为example.xlsx的Excel文件,并将结果存储在一个DataFrame对象中。

    2、写入Excel文件

    使用pandas库将数据写入Excel文件也非常方便,可以使用to_excel()函数来实现。下面是一个示例代码:

    1. import pandas as pd  
    2.   
    3. # 创建一个DataFrame对象  
    4. data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}  
    5. df = pd.DataFrame(data)  
    6.   
    7. # 将DataFrame对象写入Excel文件  
    8. df.to_excel('output.xlsx', index=False)

    在上面的代码中,我们创建了一个包含姓名和年龄数据的DataFrame对象,并使用to_excel()函数将数据写入了一个名为output.xlsx的Excel文件中。index=False参数表示不将行索引写入Excel文件中。

    3、处理Excel数据

    使用pandas库处理Excel数据非常灵活,可以通过对DataFrame对象进行各种操作来实现。下面是一个示例代码:

    1. import pandas as pd  
    2.   
    3. # 读取Excel文件  
    4. df = pd.read_excel('example.xlsx')  
    5.   
    6. # 对数据进行处理  
    7. df['Age'] = df['Age'].astype(int)  # 将年龄列转换为整数类型  
    8. df = df.dropna()  # 删除包含空值的行  
    9. df = df.sort_values('Age')  # 按年龄排序

    在上面的代码中,我们首先使用pd.read_excel()函数读取了一个Excel文件,并将数据存储在一个DataFrame对象中。然后,我们对数据进行了处理,包括将年龄列转换为整数类型、删除包含空值的行、按年龄排序等操作。

    二、使用openpyxl库操作Excel

    openpyxl是一个专门用于处理Excel文件的库,它支持读取、写入和处理Excel文件的各个部分,包括工作表、单元格等。下面是使用openpyxl库操作Excel的常用方法:

    1、读取Excel文件

    使用openpyxl库读取Excel文件需要打开文件并获取工作簿对象,然后可以访问工作表、单元格等不同部分。下面是一个示例代码:

    1. from openpyxl import load_workbook  
    2.   
    3. # 打开Excel文件并获取工作簿对象  
    4. wb = load_workbook('example.xlsx')  
    5.   
    6. # 获取工作表对象和单元格对象  
    7. ws = wb.active  # 获取活动工作表对象  
    8. cell = ws['A1']  # 获取A1单元格对象

    2、写入Excel文件

    使用openpyxl库写入Excel文件需要创建一个新的工作簿对象,然后添加工作表、单元格等不同部分。下面是一个示例代码:

    1. from openpyxl import Workbook  
    2.   
    3. # 创建一个新的工作簿对象  
    4. wb = Workbook()  
    5.   
    6. # 创建一个新的工作表对象并命名为"Sheet1"  
    7. ws = wb.active  
    8. ws.title = "Sheet1"  
    9.   
    10. # 创建一个单元格对象并设置值为"Hello, World!"  
    11. cell = ws['A1']  
    12. cell.value = "Hello, World!"  
    13.   
    14. # 保存工作簿到文件"output.xlsx"  
    15. wb.save("output.xlsx")

    在上面的代码中,我们首先创建了一个新的工作簿对象,然后添加了一个名为"Sheet1"的工作表对象。接着,我们创建了一个单元格对象并设置其值为"Hello, World!"。最后,我们将工作簿保存到名为"output.xlsx"的文件中。

    3、处理Excel数据

    使用openpyxl库处理Excel数据可以通过访问和修改单元格、工作表等不同部分的数据来实现。下面是一个示例代码:

    1. from openpyxl import load_workbook  
    2.   
    3. # 打开Excel文件并获取工作簿对象  
    4. wb = load_workbook('example.xlsx')  
    5.   
    6. # 获取工作表对象和单元格对象  
    7. ws = wb.active  
    8. cell = ws['A1']  
    9.   
    10. # 处理数据并设置单元格的值  
    11. cell.value = "Hello, World!" + str(cell.value)  
    12.   
    13. # 保存工作簿到文件"output.xlsx"  
    14. wb.save("output.xlsx")

    在上面的代码中,我们首先打开了名为"example.xlsx"的Excel文件并获取了工作簿对象。然后,我们获取了A1单元格对象并访问了其值。接着,我们将字符串"Hello, World!"与单元格的值拼接起来,并将结果赋值给单元格对象。最后,我们将工作簿保存到名为"output.xlsx"的文件中。

    三、高级功能

    除了基本的读取、写入和处理Excel数据,openpyxl库还提供了许多高级功能,例如格式化单元格、添加图表等。下面是一个示例代码,演示了如何使用openpyxl库创建Excel图表:

    1. from openpyxl import Workbook  
    2. from openpyxl.chart import BarChart, Reference  
    3.   
    4. # 创建一个新的工作簿对象  
    5. wb = Workbook()  
    6.   
    7. # 创建一个新的工作表对象并命名为"Sheet1"  
    8. ws = wb.active  
    9. ws.title = "Sheet1"  
    10.   
    11. # 创建一些数据  
    12. data = [  
    13.     ['Country', 'Population'],  
    14.     ['China', 1403500365],  
    15.     ['India', 1363407782],  
    16.     ['United States', 3293302651],  
    17.     ['Indonesia', 276361783],  
    18.     ['Pakistan', 225199937],  
    19. ]  
    20.   
    21. # 将数据写入工作表  
    22. for row in data:  
    23.     ws.append(row)  
    24.   
    25. # 创建一个数据引用对象  
    26. chart_data = Reference(ws, min_col=2, min_row=1, max_col=3, max_row=6)  
    27.   
    28. # 创建一个条形图对象并设置标题和数据引用对象  
    29. chart = BarChart()  
    30. chart.title = "Top 5 Countries by Population"  
    31. chart.add_data(chart_data)  
    32.   
    33. # 将图表添加到工作表中  
    34. ws.add_chart(chart, "E5")  
    35.   
    36. # 保存工作簿到文件"output.xlsx"  
    37. wb.save("output.xlsx")

    在上面的代码中,我们首先创建了一个新的工作簿和工作表对象,并添加了一些数据。然后,我们使用Reference类创建了一个数据引用对象,该对象引用了工作表中的某些列和行。接着,我们创建了一个条形图对象并设置标题和数据引用对象。最后,我们将图表添加到工作表中,并将工作簿保存到名为"output.xlsx"的文件中。

    总结

    在本文中,我们介绍了使用pandas和openpyxl库进行Excel数据操作的方法。通过使用pandas库的read_excel函数,我们可以轻松地读取Excel文件并将数据存储在DataFrame对象中。使用to_excel函数,我们可以将DataFrame对象中的数据写入Excel文件中。此外,我们还介绍了使用openpyxl库来处理Excel数据的各种方法,包括访问和修改单元格、工作表等不同部分的数据,以及创建图表等高级功能。

    总之,使用pandas和openpyxl库可以方便地操作Excel数据,包括读取、写入和处理数据。这些库提供了灵活和高效的方法来处理Excel文件,可以帮助我们更好地分析和利用Excel数据。

  • 相关阅读:
    小白能理解的奈奎斯特采样及延伸出的理论
    JVM【八股文】
    jsp中使用PDF.js实现pdf文件的预览
    生成老年人的声音sox
    微信小程序毕业设计_论文校园活动报名管理系统+后台管理_项目源代码
    Flink作业执行之 2.算子 StreamOperator
    100种思维模型之错误记录思维模型-66
    常见问题-找不到vcruntime140.dll无法继续执行代码解决方案
    事务隔离级别和MVCC
    说说高并发限流策略
  • 原文地址:https://blog.csdn.net/weixin_43856625/article/details/134457206