线性代数学习笔记7-2：矩阵对角化、求矩阵的幂、求一阶差分方程和Fibonacci数列（特征值的应用）

知道如何求解特征值后，下面介绍特征值的具体应用

类似消元法的LU分解、施密特正交化的QR分解，特征值部分可以引出对角化分解，但注意对角化的前提在于，矩阵A必须具有n个线性无关的特征向量（可能有/没有重复的特征值，没有重根 $\Rightarrow$ n个线性无关的特征向量，必要不充分条件）

ps. 当矩阵不具有n个线性无关的特征向量，则无法对角化，但可以三角化

矩阵对角化

假设已经找到所有特征向量，将它们作为列向量构成矩阵 $\boldsymbol{S}=\left[$

\begin{array}{llll} x_{1} & x_{2} & \dots & x_{n} \end{array}

\right]

S = [x_{1} x_{2} \dots x_{n}]

那么，根据特征值的特点，有

\begin{aligned} A S & = A [\begin{array}{llll} x_{1} & x_{2} & \dots & x_{n} \end{array}] \\ = [\begin{array}{lllll} λ_{1} x_{1} & λ_{2} x_{2} & \dots & λ_{n} x_{n} \end{array}] \\ = [\begin{array}{llll} x_{1} & x_{2} & \dots & x_{n} \end{array}] [\begin{array}{cccc} λ_{1} & 0 & \dots & 0 \\ 0 & λ_{2} & 0 \\ ⋮ & ⋱ & ⋮ \\ 0 & \dots & 0 & λ_{n} \end{array}] \\ = S Λ \end{aligned}

其中，所有特征值作为对角元，组成矩阵

\begin{array}{cccc} λ_{1} & 0 & \dots & 0 \\ 0 & λ_{2} & 0 \\ ⋮ & ⋱ & ⋮ \\ 0 & \dots & 0 & λ_{n} \end{array}

再次强调，上述操作的前提是，矩阵A必须具有n个线性无关的特征向量，这样才保证 $\boldsymbol S$ 可逆
最终，矩阵对角化表示为 $\boldsymbol{A}=\boldsymbol{S}\boldsymbol{\Lambda}\boldsymbol{S}^{-1}$

之前说过，若矩阵 $\mathbf A$ 经过初等变换能得到矩阵 $\mathbf B$ ，则 $\mathbf A$ 与 $\mathbf B$ 等价（相抵），记为 $\mathbf A \cong \mathbf B$
任何矩阵，有唯一的相抵标准形 $\mathbf A\cong\left($
$\begin{array}{cc} Ir & 0 \\ 0 & 0 \end{array}$ \right) $A ≅ (I r 0 00)$ ，从而行秩=列秩
消元和列操作能得到“相抵标准型”（只保留了最内核的秩信息），而这里得到“相似标准形”（保有矩阵操作的基本性质——特征值）

可以相似对角化的前提条件：

$n阶方阵\mathbf A\sim 对角矩阵\iff \mathbf A有n个线性无关的特征向量$ （这条是可相似对角化的本质核心，后面都是推论）
$n阶方阵\mathbf A\sim 对角矩阵diag(\lambda_1,\lambda_2,...,\lambda_n)\Rightarrow \lambda_1,\lambda_2,...,\lambda_n就是\mathbf A的全部特征值$
上两条的推论： $n阶方阵\mathbf A\sim 对角矩阵\iff \\ \mathbf A的每个k_i重特征值的特征子空间维数都为k_i\iff \\ \mathbf A的每个k_i重特征值都对应k_i个线性无关的特征向量\iff \\ \mathbf A的每个k_i重特征值\lambda_i都满足Rank\mathbf{(\lambda_i I-A})=k_i$
$n阶方阵\mathbf A的特征值都不相同/都是单根\Rightarrow A\sim 对角矩阵$
(相当于所有特征向量都线性无关)
一个特别的情况：
$n阶方阵\mathbf A是实对称矩阵\Rightarrow A\sim 对角矩阵$

另外，方阵 $\mathbf A$ 为实对称矩阵的情况下，其特性带来一些特殊的性质：

n阶实对称矩阵 $\mathbf A$ 的特征值都是实数，且不同特征值对应的特征向量相互正交（实对称矩阵一定有 $n$ 个无关正交向量）
实对称矩阵正交相似于对角矩阵：n阶实对称矩阵 $\mathbf A$ 在相似对角化时，一定存在一个正交矩阵 $\mathbf C$ ，可以用于“变换坐标系”，即 $\mathbf {C^{-1}AC}=diag(\lambda_1,\lambda_2,...,\lambda_n)$

应用：矩阵的幂

对角化的应用之一，就是为我们提供了新的视角来看待矩阵的幂（前提：矩阵A具有n个线性无关的特征向量）
由于 $\boldsymbol{A}=\boldsymbol{S}\boldsymbol{\Lambda}\boldsymbol{S}^{-1}$ ，我们都能轻易得到 $\boldsymbol{A}$ 的 $k$ 次幂的 $\boldsymbol{A}^k$ 的信息： $\boldsymbol{A}^k=(\boldsymbol{S}\boldsymbol{\Lambda}\boldsymbol{S}^{-1})(\boldsymbol{S}\boldsymbol{\Lambda}\boldsymbol{S}^{-1})...(\boldsymbol{S}\boldsymbol{\Lambda}\boldsymbol{S}^{-1})=\boldsymbol{S}\boldsymbol{\Lambda}^k\boldsymbol{S}^{-1}$ 这就是说：

$\boldsymbol{A}^k$ 的特征向量与 $\boldsymbol{A}$ 相同，而对应的特征值变为 $\boldsymbol{\Lambda}$ 的幂次 $\boldsymbol{\Lambda}^k$
矩阵的幂乘以向量 $\boldsymbol{A}^k \mathbf{u}_{0}$ ，可以简化表示为通式 $\boldsymbol{A}^k \mathbf{u}_{0}=\boldsymbol{S}\boldsymbol{\Lambda}^k\boldsymbol{S}^{-1}\boldsymbol{S} \mathbf{c}=\boldsymbol{S}\boldsymbol{\Lambda}^k\mathbf{c}=c_{1} \lambda_{1}^{k} \mathbf{x}_{1}+c_{2} \lambda_{2}^{k} \mathbf{x}_{2}+\ldots+c_{n} \lambda_{n}^{k} \mathbf{x}_{n}$
其中需要将 $\mathbf{u}_{0}$ 表示为特征向量的线性组合 $\mathbf{u}_{0}=\boldsymbol{S} \mathbf{c}$ ，并且注意前提是需要一整套线性无关的特征向量/或者说特征向量矩阵 $\boldsymbol{S}$ 可逆（否则无法保证任意 $\mathbf{u}_{0}$ 都可以被拆解）
具体细节后文会介绍

推论：

若矩阵A具有n个线性无关的特征向量，如果其所有特征值 $|\lambda_i|<1$ ，则 $k\rightarrow \infty时\boldsymbol{A}^k\rightarrow 0$ （因为 $\boldsymbol{\Lambda}^k\rightarrow 0$ ，故 $\boldsymbol{A}^k=\boldsymbol{S}\boldsymbol{\Lambda}^k\boldsymbol{S}^{-1}\rightarrow 0$ ）

应用：求差分方程

对于一个一阶差分方程（ $\mathbf{u}_{k}$ 为向量， $\boldsymbol{A}$ 为系数矩阵） $\mathbf{u}_{k+1}=\boldsymbol{A} \mathbf{u}_{k}$ 后一项由前一项 $\mathbf{u}_{k}$ 给出，已知条件是初始的 $\mathbf{u}_{0}$ ，现在希望求 $\mathbf{u}_{k}$

首先，很容易求解得到 $\mathbf{u}_{k}=\boldsymbol{A}^k \mathbf{u}_{0}$ ，然而这样形式的解没有实际意义（仍需要计算大量矩阵的幂）

注意这里再次出现「矩阵的幂」，那么容易想到进行对角化，向特征值和特征向量上靠拢
具体而言，求解过程是：

求出 $\boldsymbol{A}$ 的所有特征向量，（假设具有n个线性无关的特征向量，才能继续）则所有特征向量张成整个空间，从而将 $\mathbf{u}_{0}$ 表示为特征向量的线性组合 $\mathbf{u}_{0}=c_{1} \mathbf{x}_{1}+c_{2} \mathbf{x}_{2}+\ldots+c_{n} \mathbf{x}_{n}=\boldsymbol{S} \mathbf{c}$ 其中，列向量 $\mathbf{c}$ 保存了各个特征向量的系数
对角化得到 $\boldsymbol{A}=\boldsymbol{S}\boldsymbol{\Lambda}\boldsymbol{S}^{-1}$ ，则第 $k$ 项 $\mathbf{u}_{k}$ 为 $\boldsymbol{A}^k \mathbf{u}_{0}=\boldsymbol{S}\boldsymbol{\Lambda}^k\boldsymbol{S}^{-1}\boldsymbol{S} \mathbf{c}=\boldsymbol{S}\boldsymbol{\Lambda}^k\mathbf{c}=c_{1} \lambda_{1}^{k} \mathbf{x}_{1}+c_{2} \lambda_{2}^{k} \mathbf{x}_{2}+\ldots+c_{n} \lambda_{n}^{k} \mathbf{x}_{n}$

直观理解：找到特征向量，则不论多少次矩阵幂，始终都是对于特征向量进行缩放，则容易获得 $\boldsymbol{A} \mathbf{u}_{0}=c_{1} \lambda_{1} \mathbf{x}_{1}+c_{2} \lambda_{2} \mathbf{x}_{2}+\ldots+c_{n} \lambda_{n} \mathbf{x}_{n}$ $\boldsymbol{A}^{k} \mathbf{u}_{0}=c_{1} \lambda_{1}^{k} \mathbf{x}_{1}+c_{2} \lambda_{2}^{k} \mathbf{x}_{2}+\ldots+c_{n} \lambda_{n}^{k} \mathbf{x}_{n}$

关于“稳态”：

对于实数特征值，征值 $|\lambda_i|<1$ 的项最终会消失，特征值 $|\lambda_i|=1$ 的项恒定，特征值 $|\lambda_i|>1$ 的项最终不断增长
对于复数特征值，虚部引入了复平面上的“旋转”，故特征值的幅值仍然确定稳态，而相位则对应了每次做矩阵乘法时特征向量的旋转角度
详见线性代数学习笔记7-5：复习——正交、投影、特征值、差分/微分方程
那么，方程的解就是 $\mathbf{u}_{k}=\boldsymbol{A}^{k} \mathbf{u}_{0}=\boldsymbol{S}\boldsymbol{\Lambda}^k\mathbf{c}$

举例：求Fibonacci数列

斐波那契数列为0,1,1,2,3,5,8,13，其通项公式为 $F_{k+2}=F_{k+1}+F_{k}$ ，需要求 $F_{100}$

首先要寻找/构造差分方程，由于通项公式给出的是二阶差分方程（同时出现了前后三项），我们可以额外增加一个方程，得到一个方程组（可表示为矩阵向量乘法），从而构造一阶的差分方程 $\left\{$

\begin{matrix} F_{k + 2} = F_{k + 1} + F_{k} \\ F_{k + 1} = F_{k + 1} \end{matrix}

\right.

{F_{k + 2} = F_{k + 1} + F_{k} F_{k + 1} = F_{k + 1}

其中，将前后两项组成的列向量视为一个整体，即令

\begin{array}{l} F_{k + 1} \\ F_{k} \end{array}

，则出现一阶的差分方程

\begin{array}{ll} 1 & 1 \\ 1 & 0 \end{array}

至此，转化为上面的问题

\mathbf{u}_{k+1}=\boldsymbol{A} \mathbf{u}_{k}

，其中

\begin{array}{ll} 1 & 1 \\ 1 & 0 \end{array}

，给出初始的

\mathbf{u}_{0}

，现在希望求

\mathbf{u}_{100}

$\boldsymbol{A}$ 为对称阵，特征值必为实数，且对称矩阵的特征向量正交，可以求出 $\begin{matrix} λ_{1} \\ 1 \end{matrix}$ $\begin{matrix} λ_{2} \\ 1 \end{matrix}$
分解 $\mathbf u_0$ 得到 $\begin{array}{l} F_{1} \\ F_{0} \end{array}$

这里求解特征向量时有一定技巧：
求解 $\left[$
$\begin{array}{ll} 1 - λ & 1 \\ 1 & - λ \end{array}$ \right]\boldsymbol x=0 $[1 - λ 1 1 - λ] x = 0$ ，由于 $\mathbf{( A-\lambda I)}=0$ ，则矩阵 $\begin{array}{ll} 1 - λ & 1 \\ 1 & - λ \end{array}$ 必然是二阶的不可逆矩阵，从而方程的两行一定线性相关，解这个方程只需满足其中任意一行即可（必然同时满足另一行），由此，我们直接从第二行得到方程的解，即特征向量 $\begin{matrix} λ \\ 1 \end{matrix}$
最后可以验证，对于第一行就是特征多项式 $\begin{array}{cc} 1 - λ & 1 \\ 1 & - λ \end{array}$

由上，有 $\mathbf{u}_{k}=\boldsymbol{A}^k \mathbf{u}_{0}=\boldsymbol{S}\boldsymbol{\Lambda}^k\mathbf{c}=c_{1} \lambda_{1}^{k} \mathbf{x}_{1}+c_{2} \lambda_{2}^{k} \mathbf{x}_{2}$ 带入数据，可以得到 $\begin{matrix} F_{100} \\ F_{99} \end{matrix}$

分析：
由于 $|\lambda_2|\approx 0.618<1$ ，则 $k\rightarrow \infty时\lambda_2^k\rightarrow 0$ ；
而 $|\lambda_1|\approx 1.618>1$ ，故 $\lambda_1$ 控制着Fibonacci数列的增长；
总体上，这个数列不断增长（不稳定），增长的速度由特征值决定

最终可得， $F_{100}=c_{1} \lambda_{1}^{100}+c_{2} \lambda_{2}{ }^{100}\approx c_{1} \lambda_{1}^{100}$

相关阅读:
结合Navigation组件实现JetPack Compose的界面导航
关于分布式一致性
Excel文件带有密码的只读模式，如何设置？
【Linux】Linux常用命令
【金九银十必问面试题】这应该是面试官最想听到的回答，Mysql如何解决幻读问题？
jvm学习笔记
转行要趁早！盘点网络安全的岗位汇总！
How to create new user for ORACLE 19c (CDB & PDB)
NUMA架构详解
ISL1208时钟芯片 Linux下 i2c 读写示例。

原文地址：https://blog.csdn.net/Insomnia_X/article/details/126326877