• Pandas介绍


    Pandas

    Pandas 是 Python 语言的一个扩展程序库,用于数据分析。

    Pandas 是一个开放源码、BSD 许可的库,提供高性能、易于使用的数据结构和数据分析工具。

    Pandas 应用

    Pandas 的主要数据结构是 Series (一维数据)与 DataFrame(二维数据),这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。

    数据结构

    Series 是一种类似于一维数组的对象,它由一组数据(各种Numpy数据类型)以及一组与之相关的数据标签(即索引)组成。

    DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。

    安装

    使用 pip 安装 pandas:

    pip install pandas
    
    • 1

    简单测试

    import pandas as pd
    
    mydataset = {
      'sites': ["Google", "Runoob", "Wiki"],
      'number': [1, 2, 3]
    }
    
    myvar = pd.DataFrame(mydataset)
    
    print(myvar)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10

    输出结果为:

    image-20221112101110982

    对比Numpy

    Pandas是针对Numpy中一维数组和二维数组的功能拓展,展示时可以更加清除明确定义:

    # 对比Numpy
    import numpy as np
    a = np.array([[2,2,2],[1, 2, 3]])
    print(a)
    
    • 1
    • 2
    • 3
    • 4

    输出结果为:

    [[2 2 2]
    [1 2 3]]

     测试pandas
    import pandas as pd
    import numpy as np
    a = np.array([[2,2,2],[1, 2, 3]])
    
    myvar = pd.DataFrame(a,index=['first','second'],columns=['1st','2ed','3rd'])
    
    print(myvar)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8

    输出结果为:

       ​                1st  2ed  3rd
       first          2    2    2
       second    1    2    3
    
    • 1
    • 2
    • 3

    Pandas在一二维数组表示上更加清除明了

    并且支持JSONCSV格式文件的直接导入与处理

  • 相关阅读:
    【图像配准】基于SURF特征实现印刷体汉字配准附matlab代码
    解救Kubernetes混乱:Descheduler快速实现资源平衡
    杭电oj--数列有序
    一文读懂VR数字展览会,从沉浸式体验到市场竞争力的全方位提升
    Python中对字典的几个处理
    腾讯云COS+PicGo+Typora十分钟搭建自己的图床
    Eureka注册中心
    Linux Shell脚本练习(一)
    HBase之Compaction
    栈的实现.
  • 原文地址:https://blog.csdn.net/weixin_66261421/article/details/127822471