# 创建一个数据框
import numpy as np
np.arange(16)
array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15])
data=np.arange(16).reshape((4,4))
data
array([[ 0, 1, 2, 3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11],
[12, 13, 14, 15]])
df=DataFrame(data=data,index=['a','b','c','d'],
columns=['one','two','three','four'])
df

#丢弃指定轴上的项
df.drop('b')#删除b行

df.drop("two",axis=1)#axis=1表示按列来执行

#(2)索引
#查找列four值为7的记录
df["four"]=7
#(3)唯一值unique
obj=Series([1,2,3,4,5,6,7,5,5,5,5])
obj

obj.unique()

#(4)频率统计value_counts
obj.value_counts()

obj.value_counts(sort=False)

#describe描述性统计分析
df.describe()

#求和 sum()
df.sum()

# 求平均mean()
df.mean()

#累计求和 cumsum
df.cumsum()
