线性代数学习笔记10-3：奇异值分解SVD（从四个子空间角度理解）

从四个子空间角度理解SVD

$\mathbf {A =U_{m \times m}\Sigma_{m \times n}V_{n \times n}^H}$
在这里插入图片描述
将 $\mathbf {A}$ 视为线性变换，并将整个 $\mathbf R^n$ 空间拆分为两部分，即 $\mathbf {A}$ 的行空间（维数 $r$ ）和零空间（维数 $n - r$ ，行空间的正交补）：

$\mathbf {A}$ 的行空间中，存在第一部分标准正交基 $\mathbf{v}_{i}(i=1,2,...,r)$
$\mathbf A$ 对应的线性变换将行空间中的 $\mathbf{v}_{i}$ 映射为 $\mathbf A$ 的列空间中的一个非零向量 $\sigma_i\mathbf u_i=\mathbf A\mathbf{v}_{i}$ （视为对 $\mathbf A$ 的列向量的线性组合）；
$\begin{aligned} A [\begin{array}{llll} v_{1} & v_{2} & \dots & v_{r} \end{array}] & = [\begin{array}{lllll} σ_{1} u_{1} & σ_{2} u_{2} & \dots & σ_{r} u_{r} \end{array}] \\ = [\begin{array}{lllll} u_{1} & u_{2} & \dots & u_{r} \end{array}] [\begin{array}{llll} σ_{1} \\ σ_{2} \\ ⋱ \\ σ_{r} \end{array}] \end{aligned}$
此即 $\mathbf U_{m\times n}\hat{\mathbf V}_{n\times r}=\hat{\mathbf U}_{m\times r}\hat{\mathbf \Sigma}_{r\times r}$ ，对应下图中的红色边框部分

注意， $\mathbf A$ 的行空间中的向量 $\mathbf x$ 到列空间中的向量 $\mathbf A\mathbf x$ 映射，为一一映射
也就是说对于行空间中的向量 $\mathbf x\neq\mathbf y$ ，则必有列空间中的向量 $\mathbf A\mathbf x\neq\mathbf A\mathbf y$
证明：
反证法：对于行空间的向量 $\mathbf x\neq\mathbf y$ ，假设有 $\mathbf A\mathbf x=\mathbf A\mathbf y$
则 $\mathbf A(\mathbf x-\mathbf y)=\mathbf 0$ ，这就是说，向量 $(\mathbf x-\mathbf y)$ 在零空间中；
另一方面，向量 $(\mathbf x-\mathbf y)$ 一定在行空间中（两个行空间中的向量的线性组合）
向量 $(\mathbf x-\mathbf y)$ 不可能既在行空间中，又在零空间中，因此假设不成立

在这里插入图片描述

$\mathbf A$ 的零空间中，有第二部分标准正交基 $\mathbf v_i(i=r+1,r+2,...,n)$
$\mathbf A$ 对应的线性变换将 $\mathbf v_i$ 映射为零向量，满足 $\mathbf {A}\mathbf v_i=0$ ；
体现在 $\boldsymbol{\Sigma}_{m\times n}$ 中，就是其右下角的0元素，对应上图蓝色边框部分

上面是从 $\mathbf {A =U\Sigma V^H}\Rightarrow \mathbf {A V =U\Sigma}$ 的角度出发；
从 $\mathbf {A^H =V\Sigma^HU^H}\Rightarrow \mathbf {A^HU =V\Sigma^H}$ 的角度同理可知： $\mathbf U$ 给出了 $\mathbf A^H$ 的行空间和零空间的标准正交基

结论

我们在 $\boldsymbol{A}$ 的四个子空间中，寻找了两组合适的基：

第一组是 $\mathbb C^{n\times n}$ 空间中的标准正交基，由两部分构成：
$\mathbf{v}_{i}(i=1,2,...,r)$ 为行空间中的 $r$ 个标准正交基
$\mathbf{v}_{i}(i=r+1,r+2,...,n)$ 为零空间中的标准正交基
第二组是 $\mathbb C^{m\times m}$ 空间中的标准正交基，由两部分构成：
$\mathbf{u}_{i}(i=1,2,...,r)$ 为列空间中的 $r$ 个标标准正交基
$\mathbf{u}_{i}(i=r+1,r+2,...,m)$ 为左零空间中的标准正交基

瘦奇异值分解（thin SVD）

$\mathbb V^m$ 空间的一组正交基是
$[\begin{matrix} U_{r} & U_{m - r} \end{matrix}]$ = $[\begin{matrix} u_{1} & \dots & u_{r} | u_{r + 1} & \dots & u_{m} \end{matrix}]$ $U = [U_{r} U_{m - r}] = [u_{1} \dots u_{r} ∣ u_{r + 1} \dots u_{m}]$
$\mathbb V^n$ 空间的一组正交基是 $[\begin{matrix} V_{r} & V_{n - r} \end{matrix}]$
对应了四个子空间：
$\begin{aligned} A v_{i} & = σ_{i} u_{i}, i = 1, \dots, r \\ A v_{i} & = 0_{i}, i = r + 1, \dots, n \\ A^{H} u_{i} & = σ_{i} v_{i}, i = 1, \dots, r \\ A^{H} u_{i} & = 0, i = r + 1, \dots, m, \end{aligned}$

实际上其中的 $n - r$ 个 $\mathbf{v}_i$ 和 $m - r$ 个 $\mathbf{u}_i$ 是“多余”的
因为只要求它们被映射为零向量（而不要求有 $\mathbf A\mathbf{v}_i=\sigma_i\mathbf{u}_i$ 的一一映射关系），或者说线性变换 $\mathbf A$ 并未对这些向量进行实质性的操作（ $\mathbf A$ 将多余的 $\mathbf{v}_i$ 降维压缩为零向量，而 $\mathbf{u}_i$ 则是那些线性变换后的新空间中与变换本身无关的多余维度）

从关注线性变换 $\mathbf A$ 的本质的角度，我们完全可以忽略零空间和左零空间，只关注行空间和列空间之间的一一映射
那么，有 $A$ 的瘦奇异值分解（thin SVD）如下：

\begin{aligned} A & = [\begin{matrix} U_{r} & U_{m - r} \end{matrix}] [\begin{matrix} D & 0 \\ 0 & 0 \end{matrix}] [\begin{matrix} V_{r}^{H} \\ V_{n - r}^{H} \end{matrix}] = U_{r} D V_{r}^{H} \\ = [\begin{matrix} u_{1} & \dots & u_{r} \end{matrix}] [\begin{matrix} σ_{1} \\ ⋱ \\ σ_{r} \end{matrix}] [\begin{matrix} v_{1}^{H} \\ ⋮ \\ v_{r}^{H} \end{matrix}] \\ = σ_{1} u_{1} v_{1}^{H} + \dots + σ_{r} u_{r} v_{r}^{H}, \end{aligned}

A = [U_{r} U_{m - r}] [D 0 00] [V_{r}^{H} V_{n - r}^{H}] = U_{r} D V_{r}^{H} = [u_{1} \dots u_{r}] σ_{1} ⋱ σ_{r} v_{1}^{H} ⋮ v_{r}^{H} = σ_{1} u_{1} v_{1}^{H} + \dots + σ_{r} u_{r} v_{r}^{H},

理论的统一

前面笔记10-1说过，SVD（ $\boldsymbol{A} =\boldsymbol{U} \boldsymbol{\Sigma} \boldsymbol{V}^{T}$ ）中， $\boldsymbol{\Sigma}$ 奇异值 $\sigma\geq 0$ ；

若 $\boldsymbol{A}$ 为可逆矩阵 $r = n$ ，没有0特征值，
则 $\boldsymbol{A}^{T} \boldsymbol{A}$ 和 $\boldsymbol{A}\boldsymbol{A}^{T}$ 特征值全为正，为正定矩阵，对应 $\boldsymbol{A}$ 奇异值全为正；
若 $\boldsymbol{A}$ 为不可逆矩阵 $r < n r，有0特征值，则 A T A \boldsymbol{A}^{T} \boldsymbol{A} 和 A A T \boldsymbol{A}\boldsymbol{A}^{T} 特征值正数和0，为半正定矩阵，对应 A \boldsymbol{A} 奇异值为正数和0$

因此有：
$\boldsymbol{A}$ 不可逆（ $r < n r） ⟺ \iff Σ \boldsymbol{\Sigma} 对角元为正数和0（存在奇异值为0） ⟺ \iff A \boldsymbol{A} 存在零空间（维度 n − r > 0 n-r>0 ），零空间中的一部分向量 v i \mathbf v_i 被线性变换 A \boldsymbol{A} 映射为零向量（ A v i = 0 \boldsymbol{A}\mathbf v_i=0 ） ⟺ \iff A x = 0 \bold{Ax=0} 有非零解 ⟺ \iff A \boldsymbol{A} 的列向量组线性相关$

相关阅读:
【js】日时分秒倒计时
KUKA机器人中断编程2—中断相关的指令
Docker Nginx安装使用以及踩坑点总结
《QT从基础到进阶·二十五》界面假死处理
Shell 一键替换当前目录下所有文件的指定内容
从工程师到系统架构设计师【成长之路】
Python（PySpark案例实战）
如何在移动钱包中搭建一个小程序应用商店
3.程序控制
day10-内核实验项目概述与内核信号

原文地址：https://blog.csdn.net/Insomnia_X/article/details/128113516