使用场景:
批量合并相同格式的Excel、给DataFrame添加行、给DataFrame添加列
一句话说明concat语法:
。使用某种合并方式(inner/outer)
·沿着某个轴向(axis=0/1)
·把多个Pandas对象(DataFrame/Series)合并成一个。
concat语法: pandas.concat(objs, axis=0, join='outer', ignore_index=False)
. objs: 一个列表,内容可以是DataFrame或者Series,可以混合
. axis: 默认是0代表按行合并,如果等于1代表按列合并
. join:合并的时候索引的对齐方式,默认是outer join,也可以是inner join.
ignore_index:是否忽略掉原来的数据索引
append语法: DataFrame.append(other, ignore_index=False)
append只有按行合并,没有按列合并,相当于concat按行的简写形式.
other:单个dataframe、series、dict,或者列表
ignore_index:是否忽略掉原来的数据索引
- import pandas as pd
- import warnings
- warnings.filterwarnings('ignore')
- df1=pd.DataFrame({
- 'A':['A0','A1','A2','A3'],
- 'B':['B0','B1','B2','B3'],
- 'C':['C0','C1','C2','C3'],
- 'D':['D0','D1','D2','D3'],
- 'E':['E0','E1','E2','E3']
- })
- df2=pd.DataFrame({
- 'A':['A4','A5','A6','A7'],
- 'B':['B4','B5','B6','B7'],
- 'C':['C4','C5','C6','C7'],
- 'D':['D4','D5','D6','D7'],
- 'F':['F4','F5','F6','F7']
- })
- df1
df2
因为默认axis=0,即第二个df2的值默认放在第一个df1内容的下面,即所谓的行合并
pd.concat([df1,df2])
- #因为默认axis=0,即第二个df2的值默认放在第一个df1内容的下面,即所谓的行合并
- pd.concat([df1,df2])
忽略原来的缩影的列,从0,1,2,3........
pd.concat([df1,df2],ignore_index=True)
意思就是只要任意一组没有就进行过滤
pd.concat([df1,df2],ignore_index=True,join='inner')
- #意思就是只要任意一组没有就进行过滤
- pd.concat([df1,df2],ignore_index=True,join='inner')
df1
- s1=pd.Series(list(range(4)),name='F')
- s1
- pd.concat([df1,s1],axis=1)
- s2=df1.apply(lambda x:x["A"]+'_11',axis=1)
- s2
- s2.name='G'
- pd.concat([df1,s1,s2],axis=1)
- #列表中可以只有Series
- pd.concat([s1,s2],axis=1)
- #列表也可以是混合顺序的
- pd.concat([s1,df1,s2],axis=1)
- df1=pd.DataFrame([[1,2],[3,4]],columns=list('AB'))
- df1
- df2=pd.DataFrame([[5,6],[7,8]],columns=list('AB'))
- df2
df1.append(df2)
df1.append(df2,ignore_index=True)
- #一个空的df
- df=pd.DataFrame(columns=['A'])
- df
- for i in range(5):
- #利用这种循环,每次都在复制
- df=df.append({'A':i},ignore_index=True)
- df
- #第一个入参的是列表,避免了多次的复制,直接往里面添加就可以了
- pd.concat(
- [pd.DataFrame([i],columns=['A']) for i in range(5)],
- ignore_index=True
- )