1 方差
1.1 先要搞清楚:谁的方差
- 一组数据的方差,没有加权信息,一般认为是 等概率的,按个数进行平均算方差
- 随机变量的方差,因为有概率作为权重,需要按概率算方差
1.2 有问题的常见说法(需要指明,对于随机变量才是这样)
常见说法,说到方差,一般把期望和方差成对出现一起说
- 什么是期望? 期望是一种平均值,出自赌博,是用概率做权重,随机变量的特殊平均值。
- 什么是方差? 方差是用来衡量数据的集中/离散程度的指标
- 这两种说法,有一个前提,就是默认指的是随机变量
- 只有随机变量才有期望,随机变量的方差公式和普通的数列方差并不一样
- 随机变量的,方差和期望是存在关系的 D(x)=E(x^2)-[E(x)]^2
1.3 非随机变量也有方差,这个更普遍
- 如果只是一组数据,虽然没有数学期望,但是有平均值
- 如果只是一组数据,也是有方差的
- 平均值,是衡量这组数据集中趋势,算出来结果是样本数集中较多的某个处于某种中心数值衡量值。(可能需要用算术/几何/调和等各种平均数选1处理)
- 什么是方差? 方差是用来衡量随机变量的集中/离散程度的指标
2.1 协方差,方差,协方差矩阵
协方差和方差的意义,完全不同
- 协方差是查看2个变量的相关性
- 方差是反映1个随机变量的离散程度
- 协方差矩阵,是反映3个或以上变量的相关性
2.2 方差和协方差
2.2.1 某个角度可以说,方差是协方差的特例
- 某个角度可以说,方差是协方差的特例
- 但是协方差的公式,其实早就存在方差公式的衍生相关里
cov(X,Y) =E(X-E(X))*(Y-E(Y))
当 X=Y时,cov(X,Y) = var(X)
cov(X,X) =E(X-E(X))*(X-E(X)) =E(X^2)-E(X)^2 -E(X*E(X)) + E(X*E(X)) =E(X^2)-E(X)^2
2.2.2 可以用计算 X, Y 方差公式的方法,包含了协方差
2.3 协方差的意义
协方差就是用来衡量两个样本之间的相关性有多少
也就是一个样本的值的偏离程度,会对另外一个样本的值偏离产生多大的影响
- 当 cov(X, Y)>0时,表明 X与Y 正相关;
- 当 cov(X, Y)<0时,表明X与Y负相关;
- 当 cov(X, Y)=0时,表明X与Y不相关。
2.4 协方差矩阵的意义
3 协方差的意义---相关系数