• 极速系列03—python进行数据合并(concat/merge)


    两个表中的数据,要根据关键字段,进行合并。
    Excel中可以使用vlookup的方式,在python中可以使用concat或者是merge的方法。

    1、pd.concat

    pd.concat 函数

    1. 拼接的对象可以是series,还可以是dataframe
    2. 拼接对象的个数不受限
    3. axis 控制拼接方向(既支持上下拼接,也支持左右拼接)
      左右拼接 axis=1,左右拼接的依据是行索引;
      上下拼接 axis =0 ,拼接依据是列名,默认是上下拼接
    4. join 指定拼接方法
      join=“inner” 内联,表示保留两个表共有的行索引
      join=“outer” 外联,表示保留两个表所有的行索引,默认外联
    #导入需要的包
    import pandas as pd
    
    • 1
    • 2
    #创建需要的数据集:产品表
    dict1={"产品编号":["CP13","CP14","CP15","CP16","CP17"],"产品名称":["产品A003","产品A004","产品A005","产品A006","产品A007"]}
    df1 = pd.DataFrame(dict1)
    df1
    
    • 1
    • 2
    • 3
    • 4

    在这里插入图片描述

    #创建需要的数据集:详情表
    dict2={"订单编号":["20220913","20220914","20220915","20220915"],
           "产品编号":["CP13","CP14","CP15","CP16"],
           "产品销量":[13,24,45,32],
           "负责人":["张三","赵六","李八","李八"]}
    df2 = pd.DataFrame(dict2)
    df2
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    在这里插入图片描述

    pd.concat([df1,df2])#默认上下拼接,拼接依据是列名;默认外联,保留两个表都有的索引信息
    
    • 1

    在这里插入图片描述

    pd.concat([df1,df2],ignore_index=True)#重置行索引
    
    • 1

    在这里插入图片描述

    #左右拼接的依据是行索引  axis默认是0上下拼接,1为左右拼接;默认外联(join = 'outer')
    pd.concat([df1,df2],axis=1) 
    
    • 1
    • 2

    在这里插入图片描述

    #join指定了拼接方法,内联,表示保留两个表共有的行索引
    pd.concat([df1,df2],axis=1,join="inner") 
    
    • 1
    • 2

    在这里插入图片描述

    2、 df.append

    和concat上下拼接的结果类似

    df1.append(df2) 
    
    • 1

    在这里插入图片描述

    3、 pd.merge()

    • 拼接对象是dataframe或者series,左表必须是dataframe
    • 拼接的数量只能是两个
    • 拼接方向只能左右拼
    #left_on写左表进行拼接的字段,right_on写右表要进行拼接的字段
    pd.merge(df1,df2,left_on="产品编号",right_on="产品编号",how = 'right')
    
    • 1
    • 2
    #若两表拼接字段名完全一样,可写一个on
    pd.merge(df1,df2,on="产品编号")
    
    • 1
    • 2

    在这里插入图片描述

    4、 df.join

    和concat左右拼接的结果类似

    df1.join(df2, lsuffix='_b', rsuffix='_a')
    
    • 1

    在这里插入图片描述

    总结

    在这里插入图片描述

  • 相关阅读:
    es笔记七之聚合操作之桶聚合和矩阵聚合
    淘宝扭蛋机源码解析:功能实现与技术细节
    五年数据库专家,深入剖析高性能MySQL架构系统,不来后悔一辈子
    unittest前置依赖用例测试失败时跳过当前用例
    7. 反向代理-快速入门
    Spring Initializr私服搭建和定制化模板
    Codeforces Round #797 (Div. 3)个人题解
    【语音识别】基于MFCC和MEL倒频系数实现声纹识别附matlab代码
    聊聊今年测试秋招情况......
    出现问题,你的pin不可用
  • 原文地址:https://blog.csdn.net/one_bird_/article/details/126805418