• Part13:Pandas 的Concat合并【实现Concat合并】


    Pandas实现数据的合并concat

    使用场景:

    批量合并相同格式的Excel、给DataFrame添加行、给DataFrame添加列

    一句话说明concat语法:

    。使用某种合并方式(inner/outer)

    ·沿着某个轴向(axis=0/1)

    ·把多个Pandas对象(DataFrame/Series)合并成一个。

    concat语法: pandas.concat(objs, axis=0, join='outer', ignore_index=False)

    . objs: 一个列表,内容可以是DataFrame或者Series,可以混合

    . axis: 默认是0代表按行合并,如果等于1代表按列合并

    . join:合并的时候索引的对齐方式,默认是outer join,也可以是inner join.

    ignore_index:是否忽略掉原来的数据索引

    append语法: DataFrame.append(other, ignore_index=False)

    append只有按行合并,没有按列合并,相当于concat按行的简写形式.

    other:单个dataframe、series、dict,或者列表

    ignore_index:是否忽略掉原来的数据索引

    1. import pandas as pd
    2. import warnings
    3. warnings.filterwarnings('ignore')

    一、使用pandas.concat合并数据

    1. df1=pd.DataFrame({
    2. 'A':['A0','A1','A2','A3'],
    3. 'B':['B0','B1','B2','B3'],
    4. 'C':['C0','C1','C2','C3'],
    5. 'D':['D0','D1','D2','D3'],
    6. 'E':['E0','E1','E2','E3']
    7. })
    8. df2=pd.DataFrame({
    9. 'A':['A4','A5','A6','A7'],
    10. 'B':['B4','B5','B6','B7'],
    11. 'C':['C4','C5','C6','C7'],
    12. 'D':['D4','D5','D6','D7'],
    13. 'F':['F4','F5','F6','F7']
    14. })
    15. df1

    df2

     1、默认的concat,参数为axis=0、 join=outer、ignore_index=False

    因为默认axis=0,即第二个df2的值默认放在第一个df1内容的下面,即所谓的行合并
    pd.concat([df1,df2])

    1. #因为默认axis=0,即第二个df2的值默认放在第一个df1内容的下面,即所谓的行合并
    2. pd.concat([df1,df2])

    2、使用ignore_index=True可以忽略原来的索引 

    忽略原来的缩影的列,从0,1,2,3........
    pd.concat([df1,df2],ignore_index=True)

    3、使用join=inner过滤掉不匹配的列 

    意思就是只要任意一组没有就进行过滤
    pd.concat([df1,df2],ignore_index=True,join='inner')

    1. #意思就是只要任意一组没有就进行过滤
    2. pd.concat([df1,df2],ignore_index=True,join='inner')

    4、使用axis=1相当于添加新列 

    df1

    A:添加一列Series 

    1. s1=pd.Series(list(range(4)),name='F')
    2. s1
    3. pd.concat([df1,s1],axis=1)

    B:添加多列Series 

    1. s2=df1.apply(lambda x:x["A"]+'_11',axis=1)
    2. s2
    1. s2.name='G'
    2. pd.concat([df1,s1,s2],axis=1)
    1. #列表中可以只有Series
    2. pd.concat([s1,s2],axis=1)
    1. #列表也可以是混合顺序的
    2. pd.concat([s1,df1,s2],axis=1)

     

    二、使用DataFrame.append按行进行合并数据 

    1. df1=pd.DataFrame([[1,2],[3,4]],columns=list('AB'))
    2. df1
    1. df2=pd.DataFrame([[5,6],[7,8]],columns=list('AB'))
    2. df2

     1、给一个dataframe添加另一个dataframe

    df1.append(df2)

     

    2、忽略原来的索引ignore_index=True

    df1.append(df2,ignore_index=True)

     

    3、可以一行行的给DataFrame添加数据

    1. #一个空的df
    2. df=pd.DataFrame(columns=['A'])
    3. df

     

    A:低新能版本

    1. for i in range(5):
    2. #利用这种循环,每次都在复制
    3. df=df.append({'A':i},ignore_index=True)
    4. df

     

    B:高新能版本

    1. #第一个入参的是列表,避免了多次的复制,直接往里面添加就可以了
    2. pd.concat(
    3. [pd.DataFrame([i],columns=['A']) for i in range(5)],
    4. ignore_index=True
    5. )

     

  • 相关阅读:
    【JS Promise】手写实现 promise.all 和promise.race 方法
    基于Kinect 动捕XR直播解决方案 - 硬件篇
    前端面试及答案:css 选择器有哪些?权重是什么样的?
    一篇文章掌握整个JVM,JVM超详细解析!!!
    acwing算法基础之搜索与图论--染色法判断二分图
    Android App启动优化之启动框架
    初识Redis常见基本命令
    JVisualVM工具的使用
    Vue 学习之 axios
    Window下如何对Redis进行开启与关闭
  • 原文地址:https://blog.csdn.net/qq_46044325/article/details/126880990