最小二乘（Least Square）与多项式拟合（fitted polynomial）的理解

多项式：
$f(x_i)=\theta_0+\theta_1x_i+\theta_2{x_i}^2+\cdots+{\theta_n}{x_i}^n$

存在样本：
$(x_1,y_1),(x_2,y_2),\cdots,(x_m,y_m)$

样本值代入多项式得方程组：
$\begin{dcases} \theta_0 + \theta_1x_1+\theta_2{x_1}^2+\cdots+\theta_n{x_1}^n=y_1 \\ \theta_0 + \theta_1x_2+\theta_2{x_2}^2+\cdots+\theta_n{x_2}^n=y_2 \\ \vdots \\ \theta_0 + \theta_1x_m+\theta_2{x_m}^2+\cdots+\theta_n{x_m}^n=y_m \end{dcases}$

\begin{dcases} \theta_0 + \theta_1x_1+\theta_2{x_1}^2+\cdots+\theta_n{x_1}^n=y_1 \\ \theta_0 + \theta_1x_2+\theta_2{x_2}^2+\cdots+\theta_n{x_2}^n=y_2 \\ \vdots \\ \theta_0 + \theta_1x_m+\theta_2{x_m}^2+\cdots+\theta_n{x_m}^n=y_m \end{dcases}

⎩ ⎨ ⎧ θ_{0} + θ_{1} x_{1} + θ_{2} x_{1}^{2} + \dots + θ_{n} x_{1}^{n} = y_{1} θ_{0} + θ_{1} x_{2} + θ_{2} x_{2}^{2} + \dots + θ_{n} x_{2}^{n} = y_{2} ⋮ θ_{0} + θ_{1} x_{m} + θ_{2} x_{m}^{2} + \dots + θ_{n} x_{m}^{n} = y_{m}

$令$
$\theta = [θ0θ1θ2⋯θn]$

[θ 0 θ 1 θ 2 \dots θ n]

^T

θ = [θ_{0} θ_{1} θ_{2} \dots θ_{n}]^{T}

A_i=[1xix2i⋯xmi][1xix2i⋯xmi]

b_i=y_i

i=1，\cdots，m

$则方程组变换为：$
$\begin{dcases} A_1\theta=b_1 \\ A_2\theta=b_2 \\ \vdots \\ A_m\theta=b_m \\ \end{dcases}$

\begin{dcases} A_1\theta=b_1 \\ A_2\theta=b_2 \\ \vdots \\ A_m\theta=b_m \\ \end{dcases}

⎩ ⎨ ⎧ A_{1} θ = b_{1} A_{2} θ = b_{2} ⋮ A_{m} θ = b_{m}

$令$

A = ⎣ ⎡ A_{1} A_{2} A_{3} ⋮ A_{m} ⎦ ⎤

b = ⎣ ⎡ b_{1} b_{2} b_{3} ⋮ b_{m} ⎦ ⎤

方程组变换为矩阵方程式：
$A\theta=b$

=

, \theta=

, b=

A = [a_{1} a_{2} a_{3} \dots a_{n}] = ⎣ ⎡ 11 ⋮ 1 x_{1} x_{2} ⋮ x_{m} x_{1}^{2} x_{2}^{2} ⋮ x_{m}^{2} \dots \dots ⋱ \dots x_{1}^{n} x_{2}^{n} ⋮ x_{m}^{n} ⎦ ⎤, θ = ⎣ ⎡ θ_{0} θ_{1} θ_{2} ⋮ θ_{n} ⎦ ⎤, b = ⎣ ⎡ y_{0} y_{1} y_{2} ⋮ y_{m} ⎦ ⎤

$考虑A\theta=b无解，需要从A的列空间中找出最接近b的向量p（p可以理解为b在A的列空间中的投影，理解如下图所示：）$

在这里插入图片描述

列空间中的投影。

如上图所示， p 是 b 在 [a_{1} a_{2}] 列空间中的投影。

令e=b-p，最小二乘就是找到\parallel e \parallel^2最小的点，最小二乘就是指向量长度的最小平方。

$由上可知， p 位于 A 的列空间中，即 p 是 A 的各列的线性组合：$
$p=a_1\tilde{\theta_1} + a_2\tilde{\theta_2} + \cdots + a_n\tilde{\theta_n}$
$即A\tilde{\theta}=p有解。$

$e=b-p=b-A\tilde{\theta}$
$e 正交于 A 的列空间，存在：$
$\perp a_1,e \perp a_2,\cdots,e \perp a_n$

$\Rarr \begin{dcases} a_1^T(b-A\tilde{\theta})=0 \\ a_2^T(b-A\tilde{\theta})=0 \\ \vdots \\ a_n^T(b-A\tilde{\theta})=0 \end{dcases}$

\Rightarrow ⎩ ⎨ ⎧ a_{1}^{T} (b - A \tilde{θ}) = 0 a_{2}^{T} (b - A \tilde{θ}) = 0 ⋮ a_{n}^{T} (b - A \tilde{θ}) = 0

$\Rarr [aT1aT2aT3⋮aTn]$

(b-A\tilde{\theta})=

\Rightarrow ⎣ ⎡ a_{1}^{T} a_{2}^{T} a_{3}^{T} ⋮ a_{n}^{T} ⎦ ⎤ (b - A \tilde{θ}) = ⎣ ⎡ 000 ⋮ 0 ⎦ ⎤

$\Rarr A^T(b-A\tilde{\theta})=0$
$\Rarr A^TA\tilde{\theta}=A^Tb$
$\Rarr \tilde{\theta}=(A^TA)^{-1}A^Tb$

$上述式子是\fcolorbox{red}{aqua}{矩阵法}求解推导公式。$
$此外还有\fcolorbox{red}{aqua}{正规方程法}，\fcolorbox{red}{aqua}{householderQr 分解法}，\fcolorbox{red}{aqua}{bdcSvd分解法}。$
针对最小二乘几个方法的应用情况：
Eigen 官网在 Solving linear least squares systems 章节中讨论了 SVD 分解、QR 分解和正规方程（即使用 LDLT 解法）三种方法在求解线性最小二乘问题上的差异，并指出：SVD 分解通常精度最高但速度最慢，正规方程速度最快但精度最差，QR 分解性能介于两种方法之间。相比 SVD 分解和 QR 分解，当矩阵病态时，正规方程解法所得结果将损失两倍精度。

参考：
1、https://zhuanlan.zhihu.com/p/268884807

相关阅读:
抖音店铺列表接口h5
自学黑客（网络安全），一般人我劝你还是算了吧
react 使用useRoutes遇到的问题
C#学习 - 表达式、语句
分布式session解决方案 — — JWT（生成token）
C语言中动态内存管理
ACMG 2.0 支持零信任网络模式
FPGA实战小项目2
开学季征文|卷生卷死之新学期大学生自救指南！！！
flutter plugins插件【二】【FlutterAssetsGenerator】

原文地址：https://blog.csdn.net/xys206006/article/details/126847087