线性回归模型（OLS）2

线性回归模型（OLS）2
本系列文章基于R语言中lm函数的输出，介绍线性回归模型的例子和原理。

本文是系列文章的第二篇，将介绍线性回归模型中的一些常见假设以及基于这些假设对回归系数的检验。

本文包括以下4个小节：
1. 常见假设
2. 示例：mtcars数据集
3. 模型推导
4. 附录代码

以下内容为免费试读部分，完整文章可到公号“生信了”付费阅读

1. 常见假设

在前文《线性回归模型（OLS）1》中我们已经介绍过线性回归模型的定义以及基于普通最小二乘（OLS）求解回归系数的方法。在此我们作简要回顾：

假设我们观察到一些数据 $\{\mathbf{x}_i, y_i\}_{i=1}^n$ ，其中 $\mathbf{x}_i=(x_{i1},x_{i2},\ldots,x_{ip})^\mathsf{T}$ ，线性回归模型研究因变量 $y_i$ 和自变量 $\mathbf{x}_i$ 之间的关系：

$\begin{aligned} y_{i} & = β_{0} + β_{1} x_{i 1} + β_{2} x_{i 2} + \dots + β_{p} x_{i p} + ϵ_{i} \\ = \sum_{j = 0}^{p} β_{j} x_{i j} + ϵ_{i}, (x_{i 0} = 1) \end{aligned}$
yi=β0+β1xi1+β2xi2+⋯+βpxip+ϵi=j=0∑pβjxij+ϵi,(xi0=1)

其中 $\beta_j$ 是回归系数，而 $\epsilon_i$ 是误差项。上面的式子用矩阵表示就是：

$\begin{matrix} (2.1) & y = X β + ϵ \end{matrix}$
y=Xβ+ϵ(2.1)

OLS要求最优的回归系数 $\hat{\boldsymbol{\beta}}$ 应该让所有观测数据的误差项平方的和最小，即

$\begin{aligned} (2.2) & \hat{β} & = \arg min_{β} ‖ y - X β ‖^{2} \end{aligned}$
β^=argβmin∥y−Xβ∥2(2.2)

据此得到其解析解，作为OLS方法下得到的回归系数的估计值：

$\begin{matrix} (2.3) & \hat{β} = (X^{T} X)^{- 1} X^{T} y \end{matrix}$
β^=(XTX)−1XTy(2.3)

实际上，当我们对数据和模型添加一些假设后，我们可以对模型进行更详尽的分析。对OLS而言，除了基础假设“因变量与自变量之间是线形关系”之外，常用的假设包括：
1. 误差项与自变量无关，即自变量是“外生“（exogenous）的：
$\begin{matrix} (2.4) & E [ϵ | X] = 0 \end{matrix}$
E[ϵ∣X]=0(2.4)
1. 误差项互相独立且同方差，即：
$\begin{matrix} (2.5) & var [ϵ | X] = σ^{2} I_{n} \end{matrix}$
var[ϵ∣X]=σ2In(2.5)
1. 误差项符合多元正态分布，且：
$\begin{matrix} (2.6) & ϵ \sim N (0, σ^{2} I_{n}) \end{matrix}$
ϵ∼N(0,σ2In)(2.6)
1. 自变量之间不是线性相关的，即
$\begin{matrix} (2.7) & rank (X) = p + 1 \end{matrix}$
rank(X)=p+1(2.7)

在上述几个前提条件下，我们可以证明：

$\begin{matrix} (2.8) & E [\hat{β}] = β \end{matrix}$
E[β^]=β(2.8)

$\begin{matrix} (2.9) & var [\hat{β}] = σ^{2} (X^{T} X)^{- 1} \end{matrix}$
var[β^]=σ2(XTX)−1(2.9)

$\begin{matrix} (2.10) & \hat{β} \sim N (β, σ^{2} (X^{T} X)^{- 1}) \end{matrix}$
β^∼N(β,σ2(XTX)−1)(2.10)

在对回归系数估计值作假设检验时，一般零假设（null hypothesis）为 $\beta_j = 0$ 。我们可以证明（见下文）在此零假设条件下，我们可以构建一个统计量 $T_j$ 符合 $t$ 分布（注意到 $\mathbf{X}$ 是一个 $\times (p+1)$ 的矩阵）：

$\begin{matrix} (2.11) & T_{j} = \frac{{\hat{β}}_{j}}{\hat{s . e .} ({\hat{β}}_{j})} \sim t_{n - p - 1}, j = 0, 1, \dots, p \end{matrix}$
Tj=s.e. (β^j)β^j∼tn−p−1,j=0,1,…,p(2.11)

其中 $\hat{\beta}_j$ 的“标准差” $\widehat{\mathrm{s.e.}}(\hat{\beta}_j)$ 为：

$\begin{matrix} (2.12) & \hat{s . e .} ({\hat{β}}_{j}) = \sqrt{s^{2} (X^{T} X)_{j j}^{- 1}} \end{matrix}$
s.e. (β^j)=s2(XTX)jj−1 (2.12)

而

$\begin{matrix} (2.13) & s^{2} = \frac{(y - X \hat{β})^{T} (y - X \hat{β})}{n - p - 1} \end{matrix}$
s2=n−p−1(y−Xβ^)T(y−Xβ^)(2.13)

我们可以证明，上式中 $s^2$ 是 $\sigma^2$ 的一个无偏估计，即

$\begin{matrix} (2.14) & E [s^{2}] = σ^{2} \end{matrix}$
E[s2]=σ2(2.14)

并且 $(n-p-1)s^2/\sigma^2$ 符合自由度是 $n - p - 1$ 的卡方分布。

$\begin{matrix} (2.15) & (n - p - 1) \frac{s^{2}}{σ^{2}} \sim χ_{n - p - 1}^{2} \end{matrix}$
(n−p−1)σ2s2∼χn−p−12(2.15)

我们会在“模型推导”小节中给出证明过程。

下文首先给出一个R语言中线性回归模型的例子，然后介绍其背后的原理。

2. 示例：mtcars数据集
相关阅读:
搭建 socket 服务端环境
 Nginx入门指南：轻松掌握Web服务器技术
 【云原生】Docker Compose初窥门径
 搜索引擎ElasticSearch详解
 Nautilus Chain全球行分享会，上海站圆满举办
 记录Mac中使用zsh配置多开发环境与常用命令
 【面试刷题】——函数指针和指针函数
 Sui与数据平台ZettaBlock达成合作，为其公测提供数据
 jsp相关知识点
 锂电回收行业硫酸镍溶液除硅
原文地址：https://blog.csdn.net/biocity/article/details/126165204

1. 常见假设

2. 示例：mtcars数据集