• 概率论的学习和整理13--方差和协方差(未完成)


    1 方差

    1.1 先要搞清楚:谁的方差

    • 一组数据的方差,没有加权信息,一般认为是 等概率的,按个数进行平均算方差
    • 随机变量的方差,因为有概率作为权重,需要按概率算方差

    1.2 有问题的常见说法(需要指明,对于随机变量才是这样)

    常见说法,说到方差,一般把期望和方差成对出现一起说

    • 什么是期望? 期望是一种平均值,出自赌博,是用概率做权重,随机变量的特殊平均值。
    • 什么是方差? 方差是用来衡量数据的集中/离散程度的指标
    • 这两种说法,有一个前提,就是默认指的是随机变量
    • 只有随机变量才有期望,随机变量的方差公式和普通的数列方差并不一样

    • 随机变量的,方差和期望是存在关系的  D(x)=E(x^2)-[E(x)]^2

    1.3  非随机变量也有方差,这个更普遍

    • 如果只是一组数据,虽然没有数学期望,但是有平均值
    • 如果只是一组数据,也是有方差的
    • 平均值,是衡量这组数据集中趋势,算出来结果是样本数集中较多的某个处于某种中心数值衡量值。(可能需要用算术/几何/调和等各种平均数选1处理)
    • 什么是方差? 方差是用来衡量随机变量的集中/离散程度的指标

    2 协方差

    2.1 协方差,方差,协方差矩阵

    协方差和方差的意义,完全不同

    • 协方差是查看2个变量的相关性
    • 方差是反映1个随机变量的离散程度
    • 协方差矩阵,是反映3个或以上变量的相关性

    2.2 方差和协方差

    2.2.1 某个角度可以说,方差是协方差的特例

    • 某个角度可以说,方差是协方差的特例
    • 但是协方差的公式,其实早就存在方差公式的衍生相关里

    cov(X,Y) =E(X-E(X))*(Y-E(Y))

    当 X=Y时,cov(X,Y) = var(X)

    cov(X,X) =E(X-E(X))*(X-E(X)) =E(X^2)-E(X)^2 -E(X*E(X)) + E(X*E(X)) =E(X^2)-E(X)^2

    2.2.2 可以用计算 X, Y  方差公式的方法,包含了协方差 

    2.3 协方差的意义

    协方差就是用来衡量两个样本之间的相关性有多少

    也就是一个样本的值的偏离程度,会对另外一个样本的值偏离产生多大的影响

    • 当 cov(X, Y)>0时,表明 X与Y 正相关;
    • 当 cov(X, Y)<0时,表明X与Y负相关;
    • 当 cov(X, Y)=0时,表明X与Y不相关。

    2.4 协方差矩阵的意义

    • 3个或以上变量的相关离散性

    3 协方差的意义---相关系数

    • 协方差,主要就是用来看相关性的
    • 协方差与相关系数

  • 相关阅读:
    这些年写过的花式sql - 第1句 删除重复无效的记录
    JVM 内存和 GC 算法
    C++:超越C语言的独特魅力
    axios、vue-axios请求模块
    WPF学习笔记-FlowDocument流文档基础知识和基本操作
    【单链表】实现链表逆置
    C语言-自定义类型结构体详细讲解
    Python算法——树的直径
    在 Mac 客户端应用程序中使用 breakpad
    MySQL-大小写规范及sql_mode设置
  • 原文地址:https://blog.csdn.net/xuemanqianshan/article/details/126593003