[矩阵论] Unit 3. 矩阵的分解 - 知识点整理

注: 以下内容均由个人整理, 不保证完全准确, 如有纰漏, 欢迎交流讨论
参考: 杨明, 刘先忠. 矩阵论(第二版)[M]. 武汉: 华中科技大学出版社, 2005

3 矩阵的分解

3.1 常见的矩阵标准形与分解

常见标准形

等价标准形: $P, Q$ 可逆
$[\begin{matrix} I_{r} & 0 \\ 0 & 0 \end{matrix}]$
相似标准形: $P$ 可逆
$A_{n\times n}=PJ_AP^{-1}$

LU 和 LDV 分解

LU 分解: $A\in F^{n\times n}$ , 有下三角形矩阵 $L$ , 上三角形矩阵 $U$ , 使得 $A = L U$ .
LDV 分解: $A\in F^{n\times n}$ , $L, V$ 分别是主对角线元素为 1 的下三角形和上三角形矩阵, $D$ 为对角矩阵, 使得 $A = L D V$

Th 3.1 矩阵的 $k$ 阶顺主子式: 取矩阵的前 $k$ 行、前 $k$ 列得到的行列式.
Th 3.1: $A\in F^{n\times n}$ 有唯一 LDV 分解 ⟺ $A$ 的顺主子式 $|A_k|\neq 0, k=1,2,...,n-1$ , $A_0|=1$ . 其中 $diag(d_1,d_2,…,d_n), d_k = \frac{|A_k|}{|A_{k-1}|}, k=1, …, n$ .

LU 和 LDV 分解分解方法

LU 分解:

构造增广矩阵 $(A ∣ I)$
使用第 $i$ 行乘数 $k$ 加到第 $j$ 行( $i ＜ j$ )型(不能交换两行, 也不能对一行本身乘或除一系数)行初等变换将增广矩阵 $(A ∣ I)$ 中 $A$ 变为上三角矩阵, 此时增广矩阵为 $U|L^{-1})$ .
$\pmb{(A|I)\stackrel{非交换两行}{\longrightarrow}(U|L^{-1})}$
根据增广矩阵得到的 $L^{-1}$ 求逆得 $L$ .

最终得到 $A = L U$ .

LDV 分解:

进行 LU 分解得到 $L, U$
从 $U$ 矩阵每行提取对角线元素的值得到矩阵 $D$
$[\begin{matrix} d_{1} & u_{12} & \dots & u_{1 n} \\ d_{2} & \dots & u_{2 n} \\ ⋱ & ⋮ \\ d_{n} \end{matrix}]$

LU 和 LDV 求解 AX=b

$AX=b\Rightarrow$

{\begin{cases} L Y = b \\ U X = Y \end{cases}

A X = b \Rightarrow {L Y = b U X = Y

{\begin{cases} L Z = b \\ D Y = Z \\ V X = Y \end{cases}

满秩分解

Def 3.2: 设 $A\in F^{m\times n}, rank(A)=r$ , 若存在秩为 $r$ 的矩阵 $B\in F^{m\times r}$ (列满秩, 瘦高矩阵), $C\in F^{r\times n}$ (行满秩, 矮胖矩阵), 使得 $A = B C$ , 则称此式为 $A$ 的满秩分解.

Th 3.3 任何非零矩阵 $A\in F^{m\times n}$ 都有满秩分解.

满秩分解方法

求矩阵列的极大无关组

对矩阵 $A$ 进行行初等变换得到最简形矩阵, 取最简形矩阵前 $r a n k (A)$ 行得到矩阵 $C$ .
依次选择矩阵 $C$ 中每一行最左侧的 “1” 所在的列对应的 “ $A$ 的列” 构成矩阵 $B$ .

举例:

[\begin{matrix} 1 & 1 & 2 \\ 0 & 2 & 2 \\ 1 & 0 & 1 \end{matrix}]

\rightarrow

[\begin{matrix} 1 & 0 & 1 \\ 0 & 1 & 1 \\ 0 & 0 & 0 \end{matrix}]

A = ⎣ ⎡ 101120221 ⎦ ⎤ \to ⎣ ⎡ 100010110 ⎦ ⎤

[\begin{matrix} 1 & 0 & 1 \\ 0 & 1 & 1 \end{matrix}]

可对角化矩阵的谱分解

矩阵的谱: 矩阵 $A$ 互异的特征值的集合 $\{\lambda_1,\lambda_2,...,\lambda_s\}$ .

矩阵的谱分解:

\begin{aligned} A & = P (λ_{1} [\begin{matrix} I_{r_{1}} \\ 0 \\ ⋱ \\ 0 \end{matrix}] + λ_{2} [\begin{matrix} 0 \\ I_{r_{2}} \\ ⋱ \\ 0 \end{matrix}] + \dots + λ_{s} [\begin{matrix} 0 \\ 0 \\ ⋱ \\ λ_{s} \end{matrix}]) P^{- 1} \\ = P (λ_{1} Q_{1} + λ_{2} Q_{2} + \dots + λ_{s} Q_{s}) P^{- 1} \\ = P (\sum_{i = 1}^{s} λ_{i} Q_{i}) P^{- 1} = \sum_{i = 1}^{s} λ_{i} P Q_{i} P^{- 1} \\ \overset{d e f P_{i} = P Q_{i} P^{- 1}}{= = = = = = = =} \sum_{i = 1}^{s} λ_{i} P_{i} \end{aligned}

A = P (λ_{1} ⎣ ⎢ ⎢ ⎡ I_{r_{1}} 0 ⋱ 0 ⎦ ⎥ ⎥ ⎤ + λ_{2} ⎣ ⎢ ⎢ ⎡ 0 I_{r_{2}} ⋱ 0 ⎦ ⎥ ⎥ ⎤ + \dots + λ_{s} ⎣ ⎢ ⎢ ⎡ 00 ⋱ λ_{s} ⎦ ⎥ ⎥ ⎤) P^{- 1} = P (λ_{1} Q_{1} + λ_{2} Q_{2} + \dots + λ_{s} Q_{s}) P^{- 1} = P (i = 1 \sum s λ_{i} Q_{i}) P^{- 1} = i = 1 \sum s λ_{i} P Q_{i} P^{- 1} = = = = = = = = d e f P_{i} = P Q_{i} P^{- 1} i = 1 \sum s λ_{i} P_{i}

$Q_i,P_i$ 性质:

$\sum_{i=1}^sQ_i=\sum_{i=1}^sP_i=I_n$
$Q_i^2=Q_i,P_i^2=P_i,i=1,2,...,s$ 幂等矩阵
$Q_iQ_j=0,P_iP_j=0,i\neq j$

Th 3.5: 矩阵可对角化 ⟺ 矩阵有谱分解 $A=\sum_{i=1}^s\lambda_iP_i$ , 其中 $P_i$ 满足上述 3 条性质.

幂等矩阵性质: $P\in F^{n\times n},P^2=P$

$P^H,(I-P)$ 仍为幂等矩阵
$P$ 的谱/特征值 $\subseteq\{0,1\}$ , $P$ 相似于对角矩阵
$F^n=N(P)\oplus R(P)$ , 零空间 $N(P)=V_{\lambda=0}$ , 列空间 $R(P)=V_{\lambda=1}$

3.2 Schur 分解与正规矩阵

对角形矩阵

欧式空间: 实对称矩阵 $A(A^T=A)$ 相似于对角矩阵. 存在正交矩阵 $C\ (CC^T=C^TC=I)$ :
$C^TAC=C^{-1}AC=$

[\begin{matrix} λ_{1} \\ λ_{2} \\ ⋱ \\ λ_{n} \end{matrix}]

C^{T} A C = C^{- 1} A C = ⎣ ⎢ ⎢ ⎡ λ_{1} λ_{2} ⋱ λ_{n} ⎦ ⎥ ⎥ ⎤

酉空间: Hermite 矩阵 $A(A^H=A)$ 相似于对角矩阵. 存在酉矩阵 $U\ (UU^H=U^HU=I)$ :
$U^HAU=U^{-1}AU=$

[\begin{matrix} λ_{1} \\ λ_{2} \\ ⋱ \\ λ_{n} \end{matrix}]

U^{H} A U = U^{- 1} A U = ⎣ ⎢ ⎢ ⎡ λ_{1} λ_{2} ⋱ λ_{n} ⎦ ⎥ ⎥ ⎤

UR 和 QR 分解

Th 3.7 可逆矩阵的 UR (酉)分解:
$A\in C^{n\times n}$ 为可逆矩阵, 则存在酉矩阵(正交矩阵) $U$ 和主对角线上元素皆正的上三角矩阵 $R$ , 使得 $A = U R$ .

Th 3.8 列满秩矩阵(列线性无关, 瘦高矩阵)的 QR 分解:
矩阵 $A\in C^{n\times r}$ 是列满秩的矩阵, 则矩阵 $A$ 可以分解为 $A = Q R$ , 其中 $Q\in C^{n\times r}$ 的列向量是标准正交的向量组, $R\in C^{r\times r}$ 是主对角线上元素皆正的上三角形矩阵.

UR 和 QR 分解方法

思路: 将矩阵 $A$ 的列向量(均线性无关)视作矩阵列空间中的一组基 $A=(\alpha_1,...,\alpha_r)$ , 使用 Schmidt 正交化方法对其求标准正交基.
$(\alpha_1,\alpha_2,...,\alpha_r)=(\epsilon_1,\epsilon_2...,\epsilon_r)$

[\begin{matrix} | | β_{1} | | & (α_{2}, ϵ_{1}) & \dots & (α_{r}, ϵ_{1}) \\ | | β_{2} | | & \dots & (α_{r}, ϵ_{2}) \\ ⋱ & ⋮ \\ | | β_{r} | | \end{matrix}]

(α_{1}, α_{2}, . . ., α_{r}) = (ϵ_{1}, ϵ_{2} . . ., ϵ_{r}) ⎣ ⎢ ⎢ ⎢ ⎡ ∣ ∣ β_{1} ∣ ∣ (α_{2}, ϵ_{1}) ∣ ∣ β_{2} ∣ ∣ \dots \dots ⋱ (α_{r}, ϵ_{1}) (α_{r}, ϵ_{2}) ⋮ ∣ ∣ β_{r} ∣ ∣ ⎦ ⎥ ⎥ ⎥ ⎤

$U$ / $Q$ : 标准正交基 $(\epsilon_1,\epsilon_2...,\epsilon_r)$
$R$ : $[\begin{matrix} | | β_{1} | | & (α_{2}, ϵ_{1}) & \dots & (α_{r}, ϵ_{1}) \\ | | β_{2} | | & \dots & (α_{r}, ϵ_{2}) \\ ⋱ & ⋮ \\ | | β_{r} | | \end{matrix}]$

Schur 分解

Th 3.9 Schur 分解: 对矩阵 $A\in C^{n\times n}$ , 存在酉矩阵 $U$ 和上三角矩阵 $T$ , 使得:
$U^HAU=T=$

[\begin{matrix} λ_{1} & * & * & * \\ λ_{2} & ⋱ & * \\ ⋱ & * \\ λ_{n} \end{matrix}]

U^{H} A U = T = ⎣ ⎢ ⎢ ⎡ λ_{1} * λ_{2} * ⋱ ⋱ * * * λ_{n} ⎦ ⎥ ⎥ ⎤

正规矩阵酉相似

Def’ 3.3: 方阵 $A$ 是正规矩阵 ⟺ $A^HA=AA^H$

常见的正规矩阵:

对角矩阵
实对称和反对称矩阵: $A^T=A$ , $A^T=–A$
Hermite 矩阵和反 Hermite 矩阵: $A^H=A$ , $A^H=–A$
正交矩阵和酉矩阵: $A^TA=AA^T=I$ , $A^HA=AA^H=I$

正规矩阵特性:
Th 3.10: $A\in C^{n\times n}$ 是正规矩阵 ⟺ $A$ 酉相似于对角矩阵 ("正规"是"酉相似"的不变性质).
⟺ $A$ 有 $n$ 个标准正交的特征向量.
⟺ (推论) $A$ 有 $n$ 个标准正交的特征向量构成空间 $C^n$ 的标准正交基. 即
理解: 正规矩阵关键在"酉相似于"对角矩阵. "相似"是线性变换从一组基到另一组基的坐标变换; 而"酉相似"是线性变换从一组标准正交基到另一组标准正交基的坐标变换.
⟺ $A$ 有谱分解: $A=\sum_{i=1}^s\lambda_iP_i$ . $P$ 满足: $P_i^2=P_i,P_i^H=P_i$ ; $P_iP_j=0,i\neq j$ ; $\sum_{i=1}^sP_i=I$ . (即满足谱分解矩阵 $P_i$ 的性质外还需要满足 Hermite 性, $P_i=PQ_iP^{-1}\overset{正规矩阵}{\longrightarrow}P_i=UQ_iU^H$ )

Hermite 矩阵

Hermite 矩阵: $A^H=A$

基本性质:

Hermite 矩阵的特征值为实数, 且不同特征值对应的特征向量正交.
$\forall A \text{ is Hermite},\exists U,UU^H=U^HU=I$ : $A=U\ diag(\lambda_1,...,\lambda_n)\ U^H$ (任一 Hermite 阵 A 存在酉矩阵 U 使得 A 酉相似于对角阵)
半正定(正定)Hermite 阵的特征值非负(为正)
半正定矩阵: 任意的实非零列向量 $x$ 有 $x^TAx≥0$
正定矩阵: 任何非零向量 $x$ 有 $x^TAx>0$

Hermite 矩阵谱分解:
设 $A\in F^{n\times n}$ 是秩为 $k$ 的半正定的 Hermite 矩阵, 则 $A$ 可以分解为下列半正定矩阵的和:
$A=v_1v_1^H+v_2v_2^H+...+v_kv_k^H$
其中, ${v_1, v_2, …,v_k\}$ 是 $F^n$ 中的正交向量组, 且秩为 1.

3.3 矩阵的奇异值分解

矩阵 $A^HA$ 和 $AA^H$

$A\in C^{m\times n}$ , $A^HA\in C^{n\times n},AA^H\in C^{m\times m}$ 为 Hermite 矩阵, 从而也为正规矩阵.

Th 3.12

$rank(A)=rank(A^HA)=rank(AA^H)$
$A^HA$ 和 $AA^H$ 的非零特征值相等
$A^HA$ 和 $AA^H$ 半正定.
$r (A) = n$ 时, $A^HA\in C^{n\times n}$ 正定
$r (A) = m$ 时, $AA^H\in C^{m\times m}$ 正定
⇒ $A^HA$ 和 $AA^H$ 的特征值是非负实数: $\lambda_1\geq\lambda_2\geq...\geq\lambda_n\geq0$

奇异值

Def’ 3.4: $A\in C^{m\times n}, rank(A) = r$ , 设 $A^HA$ 的特征值 $\lambda_1\geq\lambda_2\geq...\geq\lambda_r > 0, \lambda_{r+1}=...=\lambda_n=0$ , 则矩阵 $A$ 的奇异值:
$\sigma_i=\sqrt{\lambda_i},i=1,2,...,r$
注: 此处的 $\lambda_i$ 是矩阵 $A^HA$ 的特征值, 奇异值为正(实)数

Th 3.13 奇异值性质:

正规矩阵 $A$ 的奇异值等于 $A$ 的(非零)特征值的模 $|\lambda_i|,i=1,2,...,n$
(正规矩阵 $A^HA=AA^H=U\ diag(\lambda_n\overline{\lambda_n},...,\lambda_1\overline{\lambda_1})\ U^H$ , 所以特征值 $\sigma_i=|\lambda_i|$ )
正定的 Hermite 矩阵 $A$ 的奇异值就是 $A$ 的特征值 $\sigma_i=\lambda_i$
若 $\exists U\in C^{m\times m},V\in C^{n\times n}$ 均为酉矩阵, $\exists B\in C^{m\times n}$ : $U A V ＝ B$ , 则称 $A$ 和 $B$ 酉等价 (等价是要求 $P, Q$ 可逆).
酉等价的矩阵有相同的奇异值 ("奇异值"是"酉等价"的不变性质).

奇异值分解

Th 3.14 奇异值分解: 设矩阵 $A\in C^{m\times n}, rank(A)=r$ . $\sigma_1\geq\sigma_2\geq...\geq\sigma_r > 0$ 是矩阵 $A$ 的奇异值, 则存在酉矩阵 $U\in C^{m\times m}, V\in C^{n\times n}$ , 分块矩阵 $\Sigma=$

[\begin{matrix} Δ & 0 \\ 0 & 0 \end{matrix}]

\in C^{m\times n}

Σ = [Δ 0 00] \in C^{m \times n}

, 使

[\begin{matrix} Δ & 0 \\ 0 & 0 \end{matrix}]

其中,

\Delta=diag(\sigma_1,\sigma_2,...,\sigma_r)

奇异值分解方法

目标: 求矩阵 $A_{m\times n}$ 的奇异值分解 $U\Sigma V^H$

求 $A^HA$ 的特征值. 由非零特征值降序排序得到奇异值. $\Delta=diag(\sigma_1,\sigma_2,...,\sigma_r)$ , 进而得到矩阵 $\Sigma_{m\times n}$ .
分别求 $A^HA$ 特征值对应的特征向量 $\alpha_1,...,\alpha_n$ , 分别将其标准化得到矩阵 $V_{n\times n}$
$V=(v_1,v_2,...,v_n)=(\frac{\alpha_1}{||\alpha_2||},\frac{\alpha_2}{||\alpha_1||},...,\frac{\alpha_n}{||\alpha_n||})$
利用公式 $\pmb{u_i=\frac{Av_i}{\sigma_i}}$ 求矩阵 $U_{m\times m}=(u_1,u_2,...,u_m)$ 的每一列 $u_i$ .
当 $\sigma_i=0$ 时, 需要自行扩充向量 $u_i: \forall jui:∀j<i,ui⊥uj$

左右奇异值向量奇异值展开式

$A^{m\times n},rank(A)=r$
$V=(v_1,...,v_r|v_{r+1},...,v_n)=(V_1|V_2)$ , $v_i$ 为右奇异向量
$U=(u_1,...,u_r|u_{r+1},...,u_m)=(U_1|U_2)$ , $u_i$ 为左奇异向量

$V_2$ 的列向量是空间 $N (A)$ 的标准正交基 ( $AV_2=0$ )
$V_1$ 的列向量是空间 $N^\perp(A)$ 的标准正交基 ( $V_1^HV_2=0$ )
$U_1$ 的列向量是 $R (A)$ 的标准正交基 ( $A=U_1\Delta_rV_1^H$ )
$U_2$ 的列向量是 $R^\perp(A)$ 的标准正交基 ( $U_1^HU_2=0$ )

奇异值展开式:
$A=\sigma_1u_1v_1^H+\sigma_2u_2v_2^H+...+\sigma_ru_rv_r^H$

奇异值分解与线性变换

矩阵 $A\in C^{m\times n}$ 可定义线性变换 $T_A:C^n\rightarrow C^m$ .
$A$ 有奇异值分解 $A=U\Sigma V^H$ , 取 $U$ 和 $V$ 的列向量分别作 $C^n$ 和 $C^m$ 的标准正交基, 则线性变换 $T_A$ 对应的变换矩阵为 $\Sigma$ .

$\forall\alpha=VX\in C^n$ :
$T_A(\alpha)=A\alpha=(U\Sigma V^H)VX=U(\Sigma X)=U$

[\begin{matrix} σ_{1} x_{1} \\ ⋮ \\ σ_{r} x_{r} \\ 0 \\ ⋮ \\ 0 \end{matrix}]

T_{A} (α) = A α = (U Σ V^{H}) V X = U (Σ X) = U ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎡ σ_{1} x_{1} ⋮ σ_{r} x_{r} 0 ⋮ 0 ⎦ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎤

即原像

\alpha

的像在基

{u_1,...,u_m\}

的坐标为

(\sigma_1x_1,...,\sigma_rx_r,0,...,0)^T

.

Th 3.16 对实矩阵 $A_{m\times n}$ , $R_n$ 中单位球面在线性变换 $T_A$ 下像的集合是 $R^m$ :

球面( $r = n$ )
椭球体( $r < n$ )

方阵极分解

$A\in C^{n\times n}, rank(A)=r$ , $A$ 有极分解:
$A=PQ=(U\Sigma U^H)(UV^H)$
其中:

$P=U\Sigma U^H\in C^{n\times n},rank(P)=r$ 是半正定 Hermite 矩阵( $r = n$ 为正定矩阵), 对应在 $u_i$ 方向进行拉伸变换
$Q=UV^H\in C^{n\times n}$ 是酉矩阵, 对应旋转变换

相关阅读:
10. 查询没学过“张三”老师教授的任一门课程的学生姓名
国庆发生的那些事儿------编写了炫酷的HTML动态鼠标特效，超级炫酷酷酷！
Java在编译到执行过程的编码问题
用户订阅付费如何拆解分析？看这篇就够了
改变世界的物理学方程
南京邮电大学计算机考研资料汇总
Vue05/Vue组件子传父、props校验、Vue父子组件传值总结
String字符串性能优化的几种方案
SpringBoot-29-springSecurity记住我及首页定制
抖音小店怎么做自然流量？

原文地址：https://blog.csdn.net/LostUnravel/article/details/128181212