• Pandas简单使用Series和DataFrame


    Series的创建方式
    • 通过标量来创建Series

      x=22
      s1=pd.Series(x)
      s1
      
      0	22
      dype:int64
      
      s2=pd.Series(x,index=list(range(3)))
      s2
      
      0	22
      1	22
      2	22
      dtype:int64
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
      • 8
      • 9
      • 10
      • 11
      • 12
      • 13
      • 14
    • 通过可迭代对象创建Series

      x=range(1,7)
      s1=pd.Series(x)
      s1
      
      0	1
      1	2
      2	3
      3	4
      4	5
      5	6
      dtype:int64
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
      • 8
      • 9
      • 10
      • 11
    • 通过列表创建Series

      x=[1,2,3,4,5]
      s1 = pd.Series(x)
      s1
      0	1
      1	2
      2	3
      3	4
      4	5
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
      • 8
    • 通过字典创建Series

      x=dict(a=22,b=18,c=36)
      x
      {"a":22,"b":18,"c":36}
      
      s1=pd.Series(x)
      s1
      a	22
      b	18
      c	36
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
      • 8
      • 9
    Series的6个常用属性
    • ndim:返回Series的维数

    • shape:返回Series的行列数

    • size:返回Series元素的个数

    • dtype:返回Series元素的数据类型

    • index:返回Series的索引,得到的只是一个索引对象,我们可以利用list()函数将他们转换为索引列表

    • values:返回Series的数值

      x = [1,3,5,7,9]
      s = pd.Series(x)
      s
      	
      0	1
      1	3
      2	5	
      3	7
      4	9
      dtype: int64
      
      s.ndim
      1
      
      s.shape
      (5,)
      
      s.size
      5
      
      s.dtypes
      dtype("int64")
      
      list(s.index)
      [0,1,2,3,4]
      
      s.values
      array([1,3,5,7,9],dtype=int64)
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
      • 8
      • 9
      • 10
      • 11
      • 12
      • 13
      • 14
      • 15
      • 16
      • 17
      • 18
      • 19
      • 20
      • 21
      • 22
      • 23
      • 24
      • 25
      • 26
      • 27
      • 28
    DataFrame的4种创建方式(最外层为字典则是竖着,最外层为列表则是横着)
    • 通过列表组成的列表创建DateFrame

      x=[
      	[1,2,3,4],
      	[5,6,7,8],
      	[9,10,11,12]
      ]
      df1=pd.DataFrame(x)
      df1
      
      	0	1	2	3
      0	1	2	3	4
      1	5	6	7	8
      2	9	10	11	12
      
      df2=pd.DataFrame(x,index=['aa','bb','cc'],columns=list('abcd'))
      df2
      
      	a	b	c	d
      aa	1	2	3	4
      bb	5	6	7	8
      cc	9	10	11	12
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
      • 8
      • 9
      • 10
      • 11
      • 12
      • 13
      • 14
      • 15
      • 16
      • 17
      • 18
      • 19
      • 20
    • 通过列表组成的字典创建DataFrame

      x = {
      	"name":['张三','李四','王五'],
      	"age":[18,22,20],
      	"sex":["男","女","男"]
      }
      df=pd.DataFrame(x)
      df
      
      	name age sex
      0	张三	18	男 
      1	李四	22	女
      2	王五	20	男
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
      • 8
      • 9
      • 10
      • 11
      • 12
    • 通过字典组成的列表创建DataFrame

      x=[
      	{'one':1,'two':2,'three':3},
      	{'one':11,'two':22,'three':33}
      ]
      df=pd.DataFrame(x)
      df
      
      	one	two	three
      0	1	2	3
      1	11	22	33
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
      • 8
      • 9
      • 10
    • 通过字典组成的字典创建DataFrame

      x = {
      	"张三":{'mysql':88,'python':77,'hive':66},
      	"李四":{'mysql':11,'python':22,'hive':33}
      }
      df=pd.DataFrame(x)
      df
      
      		张三	李四
      mysql	88	  11
      python	77	  22
      hive	66	  33
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
      • 8
      • 9
      • 10
      • 11
    DataFrame的7个常用属性
    • ndim:返回DataFrame的维数

    • shape:返回DataFrame的行列数

    • size:返回DataFrame元素的个数

    • dtypes:返回DataFrame每一列元素的数据类型

    • index:返回DataFrame的行索引

    • columns:返回DataFrame的列索引

    • values:返回DataFrame的数值

      x = {
      	"name":["张三","李四","王五"],
      	"age":[18,20,19],
      	"sex":["男","女","男"]
      }
      df=pd.DataFrame(x)
      df
      
      	name  age  sex
      0	张三	 18	  男
      1	李四	 20	  女
      2	王五	 19	  男
      
      df.ndim
      2
      
      df.shape
      (3,3)		##(列,行)
      
      df.size
      9			##一共有9个元素
      
      df.dtypes
      name	object
      age		int64
      sex		object
      
      list(df.index)
      [0,1,2]
      
      list(df.columns)
      ['name','age','sex']
      
      df.values						###numpy的二维数组
      array([
      		['张三','李四','王五'],
      		[18,20,19],
      		["男","女","男"]
      	],dtype=object)
      
      df.values.tolist()
      [['张三', 18, '男'], ['李四', 20, '女'], ['王五', 19, '男']]
      
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
      • 8
      • 9
      • 10
      • 11
      • 12
      • 13
      • 14
      • 15
      • 16
      • 17
      • 18
      • 19
      • 20
      • 21
      • 22
      • 23
      • 24
      • 25
      • 26
      • 27
      • 28
      • 29
      • 30
      • 31
      • 32
      • 33
      • 34
      • 35
      • 36
      • 37
      • 38
      • 39
      • 40
      • 41
      • 42
  • 相关阅读:
    记一次进程阻塞诊断
    linux文件压缩、解压缩以及归档
    Windows平台Qt6中UTF8与GBK文本编码互相转换、理解文本编码本质
    JAVA基础知识总结三
    Tomcat-8.5_Apr-1.7构建
    Map集合(超详解)
    基于SSM的社区疫情居民信息登记系统
    IOS OpenGL ES GPUImage 图像缩放 GPUImageTransformFilter
    使用kubeadm部署kubernetes集群
    腾讯云COS+Picgo+Typora图床搭建
  • 原文地址:https://blog.csdn.net/s_frozen/article/details/125998691