Part 5:Pandas 数据统计函数【汇总类统计、唯一去重和按值计数、相关系数和协方差】

Part 5:Pandas 数据统计函数【汇总类统计、唯一去重和按值计数、相关系数和协方差】
Pandas 数据统计函数

1、汇总类统计

2、唯一去重和按值计数

3、相关系数和协方差
```
import pandas as pd
```
1、预备步骤，对数据进行读取和预处理（将温度都改为Int类型）
```
fpath='./datas/beijing_tianqi/beijing_tianqi_2018.csv' 
df=pd.read_csv(fpath)
df.head()
```
```
df.loc[:,'bWendu']=df['bWendu'].str.replace('℃','').astype('int32')
df.loc[:,'yWendu']=df['yWendu'].str.replace('℃','').astype('int32')
df.head()
```
2、对数据进行汇总类统计
```
#提取出所有数字列统计结果
df.describe()
```
查看单个Series的数据---最高温度的平均值---df['bWendu'].mean()
```
# 查看单个Series的数据---最高温度的平均值
df['bWendu'].mean()
```
查看最高温度----df['bWendu'].max()
```
#查看最高温度
df['bWendu'].max()
```
最低温度----df['yWendu'].min()
```
#最低温度
df['yWendu'].min()
```
3、唯一去重和按值计算

3.1唯一去重性

一般不用于数值列，而是枚举，分类列-----df[“ ” ].unique()
```
df['fengxiang'].unique()
df['tianqi'].unique()
df['fengli'].unique()
```
4.2 按值计数（对数据探索十分有用）
```
df['fengxiang'].value_counts()
df['tianqi'].value_counts()
df['fengli'].value_counts()
```
5、相关系数和协方差用途（超级厉害)︰

1.两只股票，是不是同涨同跌?程度多大?正相关还是负相关?

2.产品销量的波动，跟哪些因素正相关、负相关，程度有多大?

对于两个变量X、Y:

1.协方差︰衡量同向反向程度，如果协方差为正，说明X，Y同向变化，协方差越大说明同向程度越高;如果协方差为负，说明×，Y反向运动，协方差越小说明反向程度越高。

2.相关系数:衡量相似度程度，当他们的相关系数为1时，说明两个变量变化时的正向相似度最大，当相关系数为- 1时，说明两个变量变化的反向相似度最大¶

协方差矩阵-----df.cov()
```
#协方差矩阵
df.cov()
```
相关系数矩阵----df.corr()
```
#相关系数矩阵
df.corr()
```
单独查看空气质量和最高温度的相关系数----df['aqi'].corr(df['bWendu'])
```
#单独查看空气质量和最高温度的相关系数
df['aqi'].corr(df['bWendu'])
df['aqi'].corr(df['yWendu'])
```
检测空气质量和温差的相关系数----df['aqi'].corr(df['bWendu']-df['yWendu'])
```
#检测空气质量和温差的相关系数
df['aqi'].corr(df['bWendu']-df['yWendu'])
```
以上就是特征方程对于机器学习重要性的一个例子

注：什么是特征方程？

特征方程是为研究相应的数学对象而引入的一些等式，它因数学对象不同而不同，包括数列特征方程、矩阵特征方程、微分方程特征方程、积分方程特征方程等等。

下面所介绍的仅仅是数列的特征方程。

一个数列:

设有r，s使

所以

得

消去s就导出特征方程式
相关阅读:
《HelloGitHub》第 88 期
 【Lodash】 Filter 与Map 的结合使用
 10、SpringBoot_测试用例
 Java学习笔记1—JVM虚拟机—1.3参数调优
 Pandas 使用教程 CSV
分布式进化算法
 Java学习笔记 --- 内部类
 校园‘‘跑腿经济’’
java计算机毕业设计ssm+vue工商学院办公用品管理信息系统
 设计模式之工厂方法模式
原文地址：https://blog.csdn.net/qq_46044325/article/details/126808110

Pandas 数据统计函数

1、预备步骤，对数据进行读取和预处理（将温度都改为Int类型）

2、对数据进行汇总类统计

3、唯一去重和按值计算

3.1唯一去重性

4.2 按值计数（对数据探索十分有用）

5、相关系数和协方差用途（超级厉害)︰