<1>Series 一维数组
sr = pd.Series([1,2,3,4],index=['a','b','c','d'])
两种索引方式: 下标,标签,支持列表特性与字典特性
整数索引:
sr.loc[2] 标签
sr.iloc[2] 下标
Series数据对齐:
当两个数组计算时,按照索引对齐再进行计算
sr1.add(sr2,fill_value=0)
sr,isnull()
sr.notnull()
sr.dropna()
sr.fillna()
<2>DataFrame 二维数组
创建方式:
pd.DataFrame({'one':[1,2,3],'two':[4,5,6]},index=['a','b','c'])
pd.DataFrame({'one':pd.Series([1,2,3],index=['a','b','c']),'two':pd.Series([1,2,3,4],index=['b','a','c','d'])})
常用属性:
index 行
columns 列
values 值
T 行列转置
describe 描述
DataFrame索引和切片:
a = pd.DataFrame({'one':pd.Series([1,2,3],index=['a','b','c']),'two':pd.Series([1,2,3,4],index=['b','a','c','d'])})
a['one']['a']
a.loc['a','one']
a.loc['a':'c','one']
数据对齐:
fillna()
dropna(how='all') 有一行所有的数据为空时,才会删除
dropna(how='any')
isnull()
notnull()
常见函数:
mean() 求均值,按列
mean(axis=1) ,求均值,按行
sum() sum(axis=1)
排序:
df.sort_values(by='two')
df.sort_values(by='two',ascending=False)
按列排序, by指定列,ascending 指定升降序
df.sort_values(by='a',ascending=False,axis=1)
按行排序,by指定行,ascending指定升降序,axis指定轴
df.sort_index(ascending=False)
df.sort_index(ascending=False,axis=1)
按索引排序