• pandas处理两表合并


    使用pandas库来处理两个Excel文件,并根据“货号”列中的数字部分合并这两个文件的数据。以下是对这段代码的详细介绍:

    1. 导入必要的库

      • import pandas as pd: 导入pandas库,并给它起一个别名pd。
    2. 读取Excel文件

      • 定义了两个文件路径file_path1file_path2,分别指向两个Excel文件。
      • 使用pd.read_excel()函数读取这两个文件,并将数据加载到两个数据框df1df2中。
    3. 定义提取数字的函数

      • 定义了一个名为extract_numbers的函数,它接受一个字符串s作为输入。
      • 函数内部使用filter()函数和str.isdigit方法来提取字符串中的所有数字,并使用''.join()将它们连接成一个新的字符串。
    4. 处理“货号”列

      • 感觉最容易忽略的就是数据类型的转换,将df1df2中的“货号”列转换为字符串类型(以防万一它们原本是数字或其他类型)。
      • 使用apply()方法和之前定义的extract_numbers函数来处理这两个数据框的“货号”列,提取其中的数字部分。
    5. 合并数据框

      • 使用pd.merge()函数根据处理后的“货号”列合并df1df2
      • on='货号'指定了合并的键。
      • how='right'表示进行右连接合并,即保留df2中的所有行,并根据匹配的“货号”将df1中的数据添加到合并后的数据框中。如果需要保留df1中的所有行,则可以使用how='left'
    6. 查看和保存合并后的数据

      • 使用print(merged_df.head())打印合并后数据框的前几行,以便查看合并结果。
      • 使用merged_df.to_excel()方法将合并后的数据框保存到一个新的Excel文件中。index=False参数表示不将索引保存到Excel文件中。
      • 最后,打印一条消息确认合并和保存操作已完成。
    1. import pandas as pd
    2. # 读取Excel文件
    3. file_path1 = r'C:\Users\admin\Desktop\施华洛世奇531.xlsx'
    4. file_path2 = r'C:\Users\admin\Desktop\s519.xlsx'
    5. df1 = pd.read_excel(file_path1)
    6. df2 = pd.read_excel(file_path2)
    7. # 定义一个函数来提取字符串中的数字部分
    8. def extract_numbers(s):
    9. return ''.join(filter(str.isdigit, s))
    10. # 应用这个函数到两个数据框的“货号”列,并创建新的列来保存提取的数字
    11. df1['货号'] = df1['货号'].astype(str).apply(extract_numbers)
    12. df2['货号'] = df2['货号'].astype(str).apply(extract_numbers)
    13. # 基于新的数字货号列合并df1和df2
    14. merged_df = pd.merge(df1, df2, on='货号', how='right') # 或者使用 how='left' 根据需要调整
    15. # 查看合并后的数据框
    16. print(merged_df.head())
    17. # 保存合并后的数据到新的Excel文件
    18. output_file_path = r'C:\Users\admin\Desktop\s531.xlsx'
    19. merged_df.to_excel(output_file_path, index=False) # 不保存索引到Excel文件中
    20. print("合并完成并保存到Excel文件。")

  • 相关阅读:
    基于 java+springboot+vue 的酒店⺠宿⽹站毕业设计源码250910
    python+vue+elementui高校学生成绩补考通知系统django
    Android12 新特性及适配指南
    3.1版本【HarmonyOS 第一课】正式上线!参与学习赢官方好礼>>
    单片机C语言实例:1、点亮LED的多种方法
    电脑C盘快满了有什么影响
    C语言宏的几种常用语法与示例
    vue 中 Vue.prototype 详解及使用
    [Machine Learning] 稀疏编码和矩阵分解
    Vue3响应系统的实现(一)
  • 原文地址:https://blog.csdn.net/2301_79675943/article/details/139435954