深度之眼（二十）——Python：Pandas库

零、导读

在这里插入图片描述

Numpy在向量化的数值计算中表现优异
但是在处理更灵活、复杂的数据任务:
如为数据添加标签、处理缺失值、分组和透视表等方面
Numpy显得力不从心

而基于Numpy构建的Pandas库，提供了使得数据分析变得更快更简单的高级数据结构和操作工具

通用结构

import pandas as pd

data = pd.Series([1.5,3,4.5,6])
data
1
2
3
4

在这里插入图片描述

data = pd.Series([5,6,7,8],index=["a","b","c","d"],dtype = "float")
data
1
2

在这里插入图片描述

data["a"]
1

在这里插入图片描述
2、用一维numpy数组创建

import numpy as np

x = np.arange(5)
pd.Series(x)
1
2
3
4

在这里插入图片描述
3.用字典创建
.默认以键为index值为data

●字典创建，如果指定index，则会到字典的键中筛选，找不到的，值设为NaN
在这里插入图片描述
4、data为标量的情况

pd.Series(5,[100,200,300])
1

在这里插入图片描述

DataFrame是带标签数据的多维数组
DataFrame对象的创建

通用结构pd .DataFrame(data, index=index, columns=columns)
data:数据，可以是列表，字典或Numpy数组
index:索引，为可选参数
columns:列标签，为可选参数

p_d = {
    "a":1,
    "b":5,
    "c":7,
    "d":6
}
p = pd.Series(p_d)
pd.DataFrame(p)
1
2
3
4
5
6
7
8

在这里插入图片描述
2.通过Series对象字典创建

3.通过宇典列表对象创建

●不存在的键，会默认值为NaN

4、通过Numpy二维数组创建

在这里插入图片描述

在这里插入图片描述

3、切片

在这里插入图片描述
2、Numpy通用函数同样适用于Pandas

一般来说，纯粹的计算在Numpy里执行的更快
Numpy更侧重于计算，Pandas更侧重于数据处理
（广播）

在这里插入图片描述

（2）统计相关

在这里插入图片描述

在这里插入图片描述

3、填充缺失值
在这里插入图片描述

在这里插入图片描述
垂直合并

在这里插入图片描述

在这里插入图片描述

相关阅读:
Python语言学习：Python语言学习之列表/元祖/字典/集合的简介、案例应用之详细攻略
【广州华锐互动】VR虚拟党建云展馆：带你沉浸式领略红色文化
Web应用防火墙的性能优化技术
Java后端模拟面试，题集①
微服务学习（九）：安装OpenOffice
SpringCloud——Hystrix（手写断路器思路、测试与优化）
系统架构设计师-数据库系统（1）
【JS函数】JS函数之高阶函数、组合函数、函数柯里化
能源计量器具的种类划分
基础题——数组

原文地址：https://blog.csdn.net/m0_52592798/article/details/126186948