Series - 数据系列 - 一维数据
DataFrame - 数据窗、数据框、数据表 - 二维数据
Index - 索引 - 为Series和DataFrame提供索引服务
scores = np.random.randint(60, 101, (5, 3))
scores
array([[ 62, 80, 78],
[ 91, 71, 77],
[ 99, 71, 100],
[ 96, 77, 84],
[ 73, 94, 99]])
df1 = pd.DataFrame(
data=scores,
columns=['Verbal', 'Math', 'English'],
index=np.arange(1001, 1006)
)
df1
Verbal Math English
1001 62 80 78
1002 91 71 77
1003 99 71 100
1004 96 77 84
1005 73 94 99
data = {
'Verbal': scores[:, 0],
'Math': scores[:, 1],
'English': scores[:, 2]
}
data
{
'Verbal': array([62, 91, 99, 96, 73]),
'Math': array([80, 71, 71, 77, 94]),
'English': array([ 78, 77, 100, 84, 99])}
df2 = pd.DataFrame(data=data, index=np.arange(1001, 1006))
df2
Verbal Math English
1001 62 80 78
1002 91 71 77
1003 99 71 100
1004 96 77 84
1005 73 94 99
import sys
sys.getdefaultencoding()
'utf-8'
df3 = pd.read_csv(
'2018年北京积分落户数据.csv',
index_col='id', # 设置索引列(哪个列充当索引)
# encoding='utf-8', # 设置字符编码方式
# usecols=['id', 'name', 'company', 'score'], # 设置需要加载的列
# nrows=20, # 设置加载的行数