• 数学小抄:线性回归与协方差


    前言

    最近在阅读论文时,有一篇论文提到了一个广义的线性回归.在介绍中,它提到了线性回归的斜率与协方差的关系. 下面简单推导一下, 加深理解.

    正文
    1. 线性回归: 寻找一条直线 y = x β + α y=x\beta+\alpha y=xβ+α 满足数据之间的误差平方最小
      ( α ^ , β ^ ) = a r g m i n ( α , β ) ∑ n = 1 N ∣ ∣ y i − α − x i β ∣ ∣ 2 (\hat{\alpha},\hat{\beta})=\underset{ (\alpha,\beta)}{\rm{argmin}} \sum^{N}_{n=1}||y_i-\alpha-x_i\beta||^2 (α^,β^)=(α,β)argminn=1N∣∣yiαxiβ2

    2. 右边式展开以及求偏导
      = ∑ n = 1 N y i 2 − ∑ n = 1 N 2 α y i − ∑ n = 1 N 2 β y i x i + ∑ n = 1 N 2 α β x i + ∑ n = 1 N β 2 x i 2 + ∑ n = 1 N α 2 = N y 2 ˉ − N 2 α y ˉ − 2 β N y x ˉ + 2 α β N x ˉ + β 2 N x 2 ˉ + N α 2

      =n=1Nyi2n=1N2αyin=1N2βyixi+n=1N2αβxi+n=1Nβ2xi2+n=1Nα2=Ny2¯N2αy¯2βNyx¯+2αβNx¯+β2Nx2¯+Nα2" role="presentation">=n=1Nyi2n=1N2αyin=1N2βyixi+n=1N2αβxi+n=1Nβ2xi2+n=1Nα2=Ny2¯N2αy¯2βNyx¯+2αβNx¯+β2Nx2¯+Nα2
      =n=1Nyi2n=1N2αyin=1N2βyixi+n=1N2αβxi+n=1Nβ2xi2+n=1Nα2=Ny2ˉN2αyˉ2βNyxˉ+2αβNxˉ+β2Nx2ˉ+Nα2
      β \beta β求偏导并令其为0有(1):
      − y x ˉ + α x ˉ + β x 2 ˉ = 0 -\bar{yx}+\alpha\bar{x}+\beta\bar{x^2} = 0 yxˉ+αxˉ+βx2ˉ=0
      α \alpha α求偏导并令其为0有(2):
      − y ˉ + β x ˉ + α = 0 -\bar{y}+\beta\bar{x}+\alpha=0 yˉ+βxˉ+α=0
      (2)代入(1)有:
      β = y x ˉ − y ˉ x ˉ x 2 ˉ − x ˉ 2 \beta = \frac{\bar{yx}-\bar{y}\bar{x}}{\bar{x^2}-\bar{x}^2} β=x2ˉxˉ2yxˉyˉxˉ
      α = y ˉ − β x ˉ \alpha=\bar{y}-\beta\bar{x} α=yˉβxˉ

    3. 协方差公式:
      C o v ( X , Y ) = E [ ( X − E ( X ) ) ( Y − E ( Y ) ) ] = E [ X Y − X E ( Y ) − Y E ( X ) + E ( X ) E ( Y ) ] Cov(X,Y)= E[(X-E(X))(Y-E(Y))]=E[XY-XE(Y)-YE(X)+E(X)E(Y)] Cov(X,Y)=E[(XE(X))(YE(Y))]=E[XYXE(Y)YE(X)+E(X)E(Y)]
      C o v ( X , Y ) = E [ X Y ] − E [ X ] E [ Y ] − E [ Y ] E [ X ] + E ( X ) E ( Y ) = E [ X Y ] − E [ X ] E [ Y ] Cov(X,Y)=E[XY]-E[X]E[Y]-E[Y]E[X]+E(X)E(Y)=E[XY]-E[X]E[Y] Cov(X,Y)=E[XY]E[X]E[Y]E[Y]E[X]+E(X)E(Y)=E[XY]E[X]E[Y]

    4. 代入 β \beta β式中

      β = C o v ( X , Y ) V a r ( x ) \beta = \frac{Cov(X,Y)}{Var(x)} β=Var(x)Cov(X,Y)

  • 相关阅读:
    NL2SQL进阶系列(1):DB-GPT-Hub、SQLcoder、Text2SQL开源应用实践详解
    软件评测师之流水线
    一般人我劝你还是要不自学软件测试.....
    “无法为保留分区分配驱动器号”的解决
    040:mapboxGL鼠标hover更换选中feature颜色
    IE11 使用的 DOM API (MutationObserver)
    IntelliJ IDEA 2022.2正式发布,支持Spring Boot 3和Spring 6
    一阶微分形式不变性习题
    医院PACS系统:三维多平面重建操作使用
    【无标题】
  • 原文地址:https://blog.csdn.net/nkc555/article/details/127610044