1.Series
2.DataFrame
3.从DataFrame中查询出Series
- import pandas as pd
- import numpy as np
Series是一种类似于一维数组的对象,它由一组数据〈不同数据类型)以及一组与之相关的数据标签(即索引)组成。
左侧为索引,右侧为数据
- s1=pd.Series([1,'x',5.7,7])
- #左侧为索引,右侧为数据
- s1
获取索引
s1.index
- 获取索引
- s1.index
获取数据
s1.values
- #获取数据
- s1.values
- s2=pd.Series([1,'x',5.7,7],index=['d','b','a','c'])
- s2
- s2.index
python字典和seires有着密不可分的关系
- sdata={'apple':35,'tex':40,'bananan':20,'pearl':30}
- s3=pd.Series(sdata)
- s3
----类似pthon的字典dict
- s2
- s2['a']
查一个数据得到是python原生的数据类型
- #查一个数据得到是python原生的数据类型
- type(s2['a'])
- s2[['b','a']]
查询Series的类型 type(s2[['b','a']])
- #查询Series的类型
- type(s2[['b','a']])
DataFrame是一个表格型的数据结构¶
①每列可以是不同的值类型(数值、字符串、布尔值等)
②既有行索引index,也有列索引columns
③可以被看做由Series组成的字典
④创建dataframe最常用的方法,见读取纯文本文件、excel、mysql数据库
列表中每个值的个数都必须相同
- #列表中每个值都必须相同
- data={
- 'state':['apple','tex','txt','banana','cxv'],
- 'year':[2000,1999,1998,1997,1996],
- 'pop':[1.1,1.2,1.3,1.4,1.5]
- }
- df=pd.DataFrame(data)
- df
- df.dtypes
- df.columns
- df.index
如果只查询一列,一行,返回的是pd.Series
如果查询多行、多列,返回的是pd.DataFrame
df
- df['state']
- type(df['year'])
- df[['pop','year']]
- type(df[['pop','year']])
loc(1)代表查询一行
- df.loc[1]
- type(df.loc[1])
列表中切片的操作方法去取,但是在Pandas中包括末尾元素
- #列表中切片的操作方法去取,但是在Pandas中包括末尾元素
- df.loc[1:3]
- type(df.loc[1:3])
总结: