# 创建一个数据框
import numpy as np
np.arange(16)
array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15])
data=np.arange(16).reshape((4,4))
data
array([[ 0, 1, 2, 3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11],
[12, 13, 14, 15]])
df=DataFrame(data=data,index=['a','b','c','d'],
columns=['one','two','three','four'])
df
#丢弃指定轴上的项
df.drop('b')#删除b行
df.drop("two",axis=1)#axis=1表示按列来执行
#(2)索引
#查找列four值为7的记录
df["four"]=7
#(3)唯一值unique
obj=Series([1,2,3,4,5,6,7,5,5,5,5])
obj
obj.unique()
#(4)频率统计value_counts
obj.value_counts()
obj.value_counts(sort=False)
#describe描述性统计分析
df.describe()
#求和 sum()
df.sum()
# 求平均mean()
df.mean()
#累计求和 cumsum
df.cumsum()