最近在阅读论文时,有一篇论文提到了一个广义的线性回归.在介绍中,它提到了线性回归的斜率与协方差的关系. 下面简单推导一下, 加深理解.
线性回归: 寻找一条直线
y
=
x
β
+
α
y=x\beta+\alpha
y=xβ+α 满足数据之间的误差平方最小
(
α
^
,
β
^
)
=
a
r
g
m
i
n
(
α
,
β
)
∑
n
=
1
N
∣
∣
y
i
−
α
−
x
i
β
∣
∣
2
(\hat{\alpha},\hat{\beta})=\underset{ (\alpha,\beta)}{\rm{argmin}} \sum^{N}_{n=1}||y_i-\alpha-x_i\beta||^2
(α^,β^)=(α,β)argminn=1∑N∣∣yi−α−xiβ∣∣2
右边式展开以及求偏导
=
∑
n
=
1
N
y
i
2
−
∑
n
=
1
N
2
α
y
i
−
∑
n
=
1
N
2
β
y
i
x
i
+
∑
n
=
1
N
2
α
β
x
i
+
∑
n
=
1
N
β
2
x
i
2
+
∑
n
=
1
N
α
2
=
N
y
2
ˉ
−
N
2
α
y
ˉ
−
2
β
N
y
x
ˉ
+
2
α
β
N
x
ˉ
+
β
2
N
x
2
ˉ
+
N
α
2
对
β
\beta
β求偏导并令其为0有(1):
−
y
x
ˉ
+
α
x
ˉ
+
β
x
2
ˉ
=
0
-\bar{yx}+\alpha\bar{x}+\beta\bar{x^2} = 0
−yxˉ+αxˉ+βx2ˉ=0
对
α
\alpha
α求偏导并令其为0有(2):
−
y
ˉ
+
β
x
ˉ
+
α
=
0
-\bar{y}+\beta\bar{x}+\alpha=0
−yˉ+βxˉ+α=0
(2)代入(1)有:
β
=
y
x
ˉ
−
y
ˉ
x
ˉ
x
2
ˉ
−
x
ˉ
2
\beta = \frac{\bar{yx}-\bar{y}\bar{x}}{\bar{x^2}-\bar{x}^2}
β=x2ˉ−xˉ2yxˉ−yˉxˉ
α
=
y
ˉ
−
β
x
ˉ
\alpha=\bar{y}-\beta\bar{x}
α=yˉ−βxˉ
协方差公式:
C
o
v
(
X
,
Y
)
=
E
[
(
X
−
E
(
X
)
)
(
Y
−
E
(
Y
)
)
]
=
E
[
X
Y
−
X
E
(
Y
)
−
Y
E
(
X
)
+
E
(
X
)
E
(
Y
)
]
Cov(X,Y)= E[(X-E(X))(Y-E(Y))]=E[XY-XE(Y)-YE(X)+E(X)E(Y)]
Cov(X,Y)=E[(X−E(X))(Y−E(Y))]=E[XY−XE(Y)−YE(X)+E(X)E(Y)]
C
o
v
(
X
,
Y
)
=
E
[
X
Y
]
−
E
[
X
]
E
[
Y
]
−
E
[
Y
]
E
[
X
]
+
E
(
X
)
E
(
Y
)
=
E
[
X
Y
]
−
E
[
X
]
E
[
Y
]
Cov(X,Y)=E[XY]-E[X]E[Y]-E[Y]E[X]+E(X)E(Y)=E[XY]-E[X]E[Y]
Cov(X,Y)=E[XY]−E[X]E[Y]−E[Y]E[X]+E(X)E(Y)=E[XY]−E[X]E[Y]
代入 β \beta β式中
β = C o v ( X , Y ) V a r ( x ) \beta = \frac{Cov(X,Y)}{Var(x)} β=Var(x)Cov(X,Y)