• [矩阵论] Unit 3. 矩阵的分解 - 知识点整理


    • 注: 以下内容均由个人整理, 不保证完全准确, 如有纰漏, 欢迎交流讨论
    • 参考: 杨明, 刘先忠. 矩阵论(第二版)[M]. 武汉: 华中科技大学出版社, 2005

    3 矩阵的分解

    3.1 常见的矩阵标准形与分解

    常见标准形

    • 等价标准形: P , Q P, Q P,Q 可逆
      A m × n = P m × m [ I r 0 0 0 ] Q n × n A_{m\times n}=P_{m\times m}
      [Ir000]" role="presentation" style="position: relative;">[Ir000]
      Q_{n\times n}
      Am×n=Pm×m[Ir000]Qn×n
    • 相似标准形: P P P 可逆
      A n × n = P J A P − 1 A_{n\times n}=PJ_AP^{-1} An×n=PJAP1

    LU 和 LDV 分解

    • LU 分解: A ∈ F n × n A\in F^{n\times n} AFn×n, 有下三角形矩阵 L L L, 上三角形矩阵 U U U, 使得 A = L U A = LU A=LU.
    • LDV 分解: A ∈ F n × n A\in F^{n\times n} AFn×n, L , V L, V L,V 分别是主对角线元素为 1 的下三角形和上三角形矩阵, D D D对角矩阵, 使得 A = L D V A = LDV A=LDV

    Th 3.1 矩阵的 k k k 阶顺主子式: 取矩阵的前 k k k 行、前 k k k 列得到的行列式.
    Th 3.1: A ∈ F n × n A\in F^{n\times n} AFn×n 有唯一 LDV 分解 ⟺ A A A 的顺主子式 ∣ A k ∣ ≠ 0 , k = 1 , 2 , . . . , n − 1 |A_k|\neq 0, k=1,2,...,n-1 Ak=0,k=1,2,...,n1, ∣ A 0 ∣ = 1 |A_0|=1 A0=1. 其中 D = d i a g ( d 1 , d 2 , … , d n ) , d k = ∣ A k ∣ ∣ A k − 1 ∣ , k = 1 , … , n D = diag(d_1,d_2,…,d_n), d_k = \frac{|A_k|}{|A_{k-1}|}, k=1, …, n D=diag(d1,d2,,dn),dk=Ak1Ak,k=1,,n.

    LU 和 LDV 分解分解方法

    LU 分解:

    1. 构造增广矩阵 ( A ∣ I ) (A|I) (AI)
    2. 使用第 i i i 行乘数 k k k 加到第 j j j 行( i < j i<j ij)型(不能交换两行, 也不能对一行本身乘或除一系数)行初等变换将增广矩阵 ( A ∣ I ) (A|I) (AI) A A A 变为上三角矩阵, 此时增广矩阵为 ( U ∣ L − 1 ) (U|L^{-1}) (UL1).
      ( A ∣ I ) ⟶ 非 交 换 两 行 ( U ∣ L − 1 ) \pmb{(A|I)\stackrel{非交换两行}{\longrightarrow}(U|L^{-1})} (AI)(UL1)(AI)(UL1)(AI)(UL1)
    3. 根据增广矩阵得到的 L − 1 L^{-1} L1 求逆得 L L L.
    • 最终得到 A = L U A=LU A=LU.

    LDV 分解:

    1. 进行 LU 分解得到 L , U L,U L,U
    2. U U U 矩阵每行提取对角线元素的值得到矩阵 D D D
      U = [ d 1 u 12 ⋯ u 1 n d 2 ⋯ u 2 n ⋱ ⋮ d n ] ⟶ D = [ d 1 d 2 ⋱   d n ] , V = [ 1 u 12 d 1 ⋯ u 1 n d 1 1 ⋯ u 2 n d 2 ⋱ ⋮ 1 ] U=
      [d1u12u1nd2u2ndn]" role="presentation">[d1u12u1nd2u2ndn]
      \longrightarrow D=
      [d1d2 dn]" role="presentation">[d1d2 dn]
      ,V=
      [1u12d1u1nd11u2nd21]" role="presentation">[1u12d1u1nd11u2nd21]
      U=d1u12d2u1nu2ndnD=d1d2 dn,V=1d1u121d1u1nd2u2n1

    LU 和 LDV 求解 AX=b

    A X = b ⇒ { L Y = b U X = Y AX=b\Rightarrow

    {LY=bUX=Y" role="presentation">{LY=bUX=Y
    AX=b{LY=bUX=Y
    A X = b ⇒ { L Z = b D Y = Z V X = Y AX=b\Rightarrow
    {LZ=bDY=ZVX=Y" role="presentation">{LZ=bDY=ZVX=Y
    AX=bLZ=bDY=ZVX=Y

    满秩分解

    Def 3.2: 设 A ∈ F m × n , r a n k ( A ) = r A\in F^{m\times n}, rank(A)=r AFm×n,rank(A)=r, 若存在秩为 r r r 的矩阵 B ∈ F m × r B\in F^{m\times r} BFm×r(列满秩, 瘦高矩阵), C ∈ F r × n C\in F^{r\times n} CFr×n(行满秩, 矮胖矩阵), 使得 A = B C A=BC A=BC, 则称此式为 A A A 的满秩分解.

    Th 3.3 任何非零矩阵 A ∈ F m × n A\in F^{m\times n} AFm×n 都有满秩分解.

    满秩分解方法

    求矩阵列的极大无关组

    1. 对矩阵 A A A 进行初等变换得到最简形矩阵, 取最简形矩阵前 r a n k ( A ) rank(A) rank(A) 行得到矩阵 C C C.
    2. 依次选择矩阵 C C C 中每一行最左侧的 “1” 所在的列对应的 “ A A A 的列” 构成矩阵 B B B.

    举例:
    A = [ 1 1 2 0 2 2 1 0 1 ] → [ 1 0 1 0 1 1 0 0 0 ] A=

    [112022101]" role="presentation">[112022101]
    \rightarrow
    [101011000]" role="presentation">[101011000]
    A=101120221100010110
    C = [ 1 0 1 0 1 1 ] , B = [ 1 1 0 2 1 0 ] C=
    [101011]" role="presentation">[101011]
    , B=
    [110210]" role="presentation">[110210]
    C=[100111],B=101120

    可对角化矩阵的谱分解

    矩阵的谱: 矩阵 A A A 互异的特征值的集合 { λ 1 , λ 2 , . . . , λ s } \{\lambda_1,\lambda_2,...,\lambda_s\} {λ1,λ2,...,λs}.

    矩阵的谱分解:
    A = P ( λ 1 [ I r 1 0 ⋱ 0 ] + λ 2 [ 0 I r 2 ⋱ 0 ] + ⋯ + λ s [ 0 0 ⋱ λ s ] ) P − 1 = P ( λ 1 Q 1 + λ 2 Q 2 + ⋯ + λ s Q s ) P − 1 = P ( ∑ i = 1 s λ i Q i ) P − 1 = ∑ i = 1 s λ i P Q i P − 1 =  ⁣ =  ⁣ =  ⁣ =  ⁣ =  ⁣ =  ⁣ =  ⁣ = d e f   P i = P Q i P − 1 ∑ i = 1 s λ i P i

    A=P(λ1[Ir100]+λ2[0Ir20]++λs[00λs])P1=P(λ1Q1+λ2Q2++λsQs)P1=P(i=1sλiQi)P1=i=1sλiPQiP1========def Pi=PQiP1i=1sλiPi" role="presentation">A=P(λ1[Ir100]+λ2[0Ir20]++λs[00λs])P1=P(λ1Q1+λ2Q2++λsQs)P1=P(i=1sλiQi)P1=i=1sλiPQiP1========def Pi=PQiP1i=1sλiPi
    A=P(λ1Ir100+λ20Ir20++λs00λs)P1=P(λ1Q1+λ2Q2++λsQs)P1=P(i=1sλiQi)P1=i=1sλiPQiP1========def Pi=PQiP1i=1sλiPi

    Q i , P i Q_i,P_i Qi,Pi 性质:

    • ∑ i = 1 s Q i = ∑ i = 1 s P i = I n \sum_{i=1}^sQ_i=\sum_{i=1}^sP_i=I_n i=1sQi=i=1sPi=In
    • Q i 2 = Q i , P i 2 = P i , i = 1 , 2 , . . . , s Q_i^2=Q_i,P_i^2=P_i,i=1,2,...,s Qi2=Qi,Pi2=Pi,i=1,2,...,s 幂等矩阵
    • Q i Q j = 0 , P i P j = 0 , i ≠ j Q_iQ_j=0,P_iP_j=0,i\neq j QiQj=0,PiPj=0,i=j

    Th 3.5: 矩阵可对角化 ⟺ 矩阵有谱分解 A = ∑ i = 1 s λ i P i A=\sum_{i=1}^s\lambda_iP_i A=i=1sλiPi, 其中 P i P_i Pi 满足上述 3 条性质.

    幂等矩阵性质: P ∈ F n × n , P 2 = P P\in F^{n\times n},P^2=P PFn×n,P2=P

    • P H , ( I − P ) P^H,(I-P) PH,(IP) 仍为幂等矩阵
    • P P P 的谱/特征值 ⊆ { 0 , 1 } \subseteq\{0,1\} {0,1}, P P P 相似于对角矩阵
    • F n = N ( P ) ⊕ R ( P ) F^n=N(P)\oplus R(P) Fn=N(P)R(P), 零空间 N ( P ) = V λ = 0 N(P)=V_{\lambda=0} N(P)=Vλ=0, 列空间 R ( P ) = V λ = 1 R(P)=V_{\lambda=1} R(P)=Vλ=1

    3.2 Schur 分解与正规矩阵

    对角形矩阵

    欧式空间: 实对称矩阵 A ( A T = A ) A(A^T=A) A(AT=A) 相似于对角矩阵. 存在正交矩阵 C   ( C C T = C T C = I ) C\ (CC^T=C^TC=I) C (CCT=CTC=I):
    C T A C = C − 1 A C = [ λ 1 λ 2 ⋱ λ n ] C^TAC=C^{-1}AC=

    [λ1λ2λn]" role="presentation">[λ1λ2λn]
    CTAC=C1AC=λ1λ2λn

    酉空间: Hermite 矩阵 A ( A H = A ) A(A^H=A) A(AH=A) 相似于对角矩阵. 存在矩阵 U   ( U U H = U H U = I ) U\ (UU^H=U^HU=I) U (UUH=UHU=I):
    U H A U = U − 1 A U = [ λ 1 λ 2 ⋱ λ n ] U^HAU=U^{-1}AU=

    [λ1λ2λn]" role="presentation">[λ1λ2λn]
    UHAU=U1AU=λ1λ2λn

    UR 和 QR 分解

    Th 3.7 可逆矩阵的 UR (酉)分解:
    A ∈ C n × n A\in C^{n\times n} ACn×n 为可逆矩阵, 则存在酉矩阵(正交矩阵) U U U 和主对角线上元素皆正的上三角矩阵 R R R, 使得 A = U R A=UR A=UR.

    Th 3.8 列满秩矩阵(列线性无关, 瘦高矩阵)的 QR 分解:
    矩阵 A ∈ C n × r A\in C^{n\times r} ACn×r 是列满秩的矩阵, 则矩阵 A A A 可以分解为 A = Q R A=QR A=QR, 其中 Q ∈ C n × r Q\in C^{n\times r} QCn×r列向量是标准正交的向量组, R ∈ C r × r R\in C^{r\times r} RCr×r 是主对角线上元素皆正的上三角形矩阵.

    UR 和 QR 分解方法

    思路: 将矩阵 A A A列向量(均线性无关)视作矩阵列空间中的一组基 A = ( α 1 , . . . , α r ) A=(\alpha_1,...,\alpha_r) A=(α1,...,αr), 使用 Schmidt 正交化方法对其求标准正交基.
    ( α 1 , α 2 , . . . , α r ) = ( ϵ 1 , ϵ 2 . . . , ϵ r ) [ ∣ ∣ β 1 ∣ ∣ ( α 2 , ϵ 1 ) ⋯ ( α r , ϵ 1 ) ∣ ∣ β 2 ∣ ∣ ⋯ ( α r , ϵ 2 ) ⋱ ⋮ ∣ ∣ β r ∣ ∣ ] (\alpha_1,\alpha_2,...,\alpha_r)=(\epsilon_1,\epsilon_2...,\epsilon_r)

    [||β1||(α2,ϵ1)(αr,ϵ1)||β2||(αr,ϵ2)||βr||]" role="presentation">[||β1||(α2,ϵ1)(αr,ϵ1)||β2||(αr,ϵ2)||βr||]
    (α1,α2,...,αr)=(ϵ1,ϵ2...,ϵr)β1(α2,ϵ1)β2(αr,ϵ1)(αr,ϵ2)βr

    • U U U/ Q Q Q: 标准正交基 ( ϵ 1 , ϵ 2 . . . , ϵ r ) (\epsilon_1,\epsilon_2...,\epsilon_r) (ϵ1,ϵ2...,ϵr)
    • R R R: [ ∣ ∣ β 1 ∣ ∣ ( α 2 , ϵ 1 ) ⋯ ( α r , ϵ 1 ) ∣ ∣ β 2 ∣ ∣ ⋯ ( α r , ϵ 2 ) ⋱ ⋮ ∣ ∣ β r ∣ ∣ ]
      [||β1||(α2,ϵ1)(αr,ϵ1)||β2||(αr,ϵ2)||βr||]" role="presentation">[||β1||(α2,ϵ1)(αr,ϵ1)||β2||(αr,ϵ2)||βr||]
      β1(α2,ϵ1)β2(αr,ϵ1)(αr,ϵ2)βr

    Schur 分解

    Th 3.9 Schur 分解: 对矩阵 A ∈ C n × n A\in C^{n\times n} ACn×n, 存在酉矩阵 U U U 和上三角矩阵 T T T, 使得:
    U H A U = T = [ λ 1 ∗ ∗ ∗ λ 2 ⋱ ∗ ⋱ ∗ λ n ] U^HAU=T=

    [λ1λ2λn]" role="presentation">[λ1λ2λn]
    UHAU=T=λ1λ2λn

    正规矩阵 酉相似

    Def’ 3.3: 方阵 A A A 是正规矩阵 ⟺ A H A = A A H A^HA=AA^H AHA=AAH

    常见的正规矩阵:

    • 对角矩阵
    • 实对称和反对称矩阵: A T = A A^T=A AT=A, A T = – A A^T=–A AT=A
    • Hermite 矩阵和反 Hermite 矩阵: A H = A A^H=A AH=A, A H = – A A^H=–A AH=A
    • 正交矩阵和酉矩阵: A T A = A A T = I A^TA=AA^T=I ATA=AAT=I, A H A = A A H = I A^HA=AA^H=I AHA=AAH=I

    正规矩阵特性:
    Th 3.10: A ∈ C n × n A\in C^{n\times n} ACn×n 是正规矩阵 ⟺ A A A 酉相似于对角矩阵 ("正规"是"酉相似"的不变性质).
    A A A n n n标准正交的特征向量.
    ⟺ (推论) A A A n n n 个标准正交的特征向量构成空间 C n C^n Cn 的标准正交基. 即
    理解: 正规矩阵关键在"酉相似于"对角矩阵. "相似"是线性变换从一组基到另一组基的坐标变换; 而"酉相似"是线性变换从一组标准正交基到另一组标准正交基的坐标变换.
    A A A 有谱分解: A = ∑ i = 1 s λ i P i A=\sum_{i=1}^s\lambda_iP_i A=i=1sλiPi. P P P 满足: P i 2 = P i , P i H = P i P_i^2=P_i,P_i^H=P_i Pi2=Pi,PiH=Pi; P i P j = 0 , i ≠ j P_iP_j=0,i\neq j PiPj=0,i=j; ∑ i = 1 s P i = I \sum_{i=1}^sP_i=I i=1sPi=I. (即满足谱分解矩阵 P i P_i Pi 的性质外还需要满足 Hermite 性, P i = P Q i P − 1 ⟶ 正 规 矩 阵 P i = U Q i U H P_i=PQ_iP^{-1}\overset{正规矩阵}{\longrightarrow}P_i=UQ_iU^H Pi=PQiP1Pi=UQiUH)

    Hermite 矩阵

    Hermite 矩阵: A H = A A^H=A AH=A

    基本性质:

    • Hermite 矩阵的特征值为实数, 且不同特征值对应的特征向量正交.
    • ∀ A  is Hermite , ∃ U , U U H = U H U = I \forall A \text{ is Hermite},\exists U,UU^H=U^HU=I A is Hermite,U,UUH=UHU=I: A = U   d i a g ( λ 1 , . . . , λ n )   U H A=U\ diag(\lambda_1,...,\lambda_n)\ U^H A=U diag(λ1,...,λn) UH (任一 Hermite 阵 A 存在酉矩阵 U 使得 A 酉相似于对角阵)
    • 半正定(正定)Hermite 阵的特征值非负(为正)
      半正定矩阵: 任意的实非零列向量 x x x x T A x ≥ 0 x^TAx≥0 xTAx0
      正定矩阵: 任何非零向量 x x x x T A x > 0 x^TAx>0 xTAx>0

    Hermite 矩阵谱分解:
    A ∈ F n × n A\in F^{n\times n} AFn×n 是秩为 k k k 的半正定的 Hermite 矩阵, 则 A A A 可以分解为下列半正定矩阵的和:
    A = v 1 v 1 H + v 2 v 2 H + . . . + v k v k H A=v_1v_1^H+v_2v_2^H+...+v_kv_k^H A=v1v1H+v2v2H+...+vkvkH
    其中, { v 1 , v 2 , … , v k } \{v_1, v_2, …,v_k\} {v1,v2,,vk} F n F^n Fn 中的正交向量组, 且秩为 1.

    3.3 矩阵的奇异值分解

    矩阵 A H A A^HA AHA A A H AA^H AAH

    A ∈ C m × n A\in C^{m\times n} ACm×n, A H A ∈ C n × n , A A H ∈ C m × m A^HA\in C^{n\times n},AA^H\in C^{m\times m} AHACn×n,AAHCm×m 为 Hermite 矩阵, 从而也为正规矩阵.

    Th 3.12

    • r a n k ( A ) = r a n k ( A H A ) = r a n k ( A A H ) rank(A)=rank(A^HA)=rank(AA^H) rank(A)=rank(AHA)=rank(AAH)
    • A H A A^HA AHA A A H AA^H AAH 的非零特征值相等
    • A H A A^HA AHA A A H AA^H AAH 半正定.
      r ( A ) = n r(A) = n r(A)=n时, A H A ∈ C n × n A^HA\in C^{n\times n} AHACn×n 正定
      r ( A ) = m r(A) = m r(A)=m 时, A A H ∈ C m × m AA^H\in C^{m\times m} AAHCm×m 正定
      A H A A^HA AHA A A H AA^H AAH 的特征值是非负实数: λ 1 ≥ λ 2 ≥ . . . ≥ λ n ≥ 0 \lambda_1\geq\lambda_2\geq...\geq\lambda_n\geq0 λ1λ2...λn0

    奇异值

    Def’ 3.4: A ∈ C m × n , r a n k ( A ) = r A\in C^{m\times n}, rank(A) = r ACm×n,rank(A)=r, 设 A H A A^HA AHA 的特征值 λ 1 ≥ λ 2 ≥ . . . ≥ λ r > 0 , λ r + 1 = . . . = λ n = 0 \lambda_1\geq\lambda_2\geq...\geq\lambda_r > 0, \lambda_{r+1}=...=\lambda_n=0 λ1λ2...λr>0,λr+1=...=λn=0, 则矩阵 A A A 的奇异值:
    σ i = λ i , i = 1 , 2 , . . . , r \sigma_i=\sqrt{\lambda_i},i=1,2,...,r σi=λi ,i=1,2,...,r
    注: 此处的 λ i \lambda_i λi 是矩阵 A H A A^HA AHA 的特征值, 奇异值为正(实)数

    Th 3.13 奇异值性质:

    • 正规矩阵 A A A 的奇异值等于 A A A 的(非零)特征值的模 ∣ λ i ∣ , i = 1 , 2 , . . . , n |\lambda_i|,i=1,2,...,n λi,i=1,2,...,n
      (正规矩阵 A H A = A A H = U   d i a g ( λ n λ n ‾ , . . . , λ 1 λ 1 ‾ )   U H A^HA=AA^H=U\ diag(\lambda_n\overline{\lambda_n},...,\lambda_1\overline{\lambda_1})\ U^H AHA=AAH=U diag(λnλn,...,λ1λ1) UH, 所以特征值 σ i = ∣ λ i ∣ \sigma_i=|\lambda_i| σi=λi)
    • 正定的 Hermite 矩阵 A A A 的奇异值就是 A A A 的特征值 σ i = λ i \sigma_i=\lambda_i σi=λi
    • ∃ U ∈ C m × m , V ∈ C n × n \exists U\in C^{m\times m},V\in C^{n\times n} UCm×m,VCn×n 均为酉矩阵, ∃ B ∈ C m × n \exists B\in C^{m\times n} BCm×n: U A V = B UAV =B UAVB, 则称 A A A B B B 酉等价 (等价是要求 P , Q P,Q P,Q 可逆).
      酉等价的矩阵有相同的奇异值 ("奇异值"是"酉等价"的不变性质).

    奇异值分解

    Th 3.14 奇异值分解: 设矩阵 A ∈ C m × n , r a n k ( A ) = r A\in C^{m\times n}, rank(A)=r ACm×n,rank(A)=r. σ 1 ≥ σ 2 ≥ . . . ≥ σ r > 0 \sigma_1\geq\sigma_2\geq...\geq\sigma_r > 0 σ1σ2...σr>0 是矩阵 A A A 的奇异值, 则存在酉矩阵 U ∈ C m × m , V ∈ C n × n U\in C^{m\times m}, V\in C^{n\times n} UCm×m,VCn×n, 分块矩阵 Σ = [ Δ 0 0 0 ] ∈ C m × n \Sigma=

    [Δ000]" role="presentation">[Δ000]
    \in C^{m\times n} Σ=[Δ000]Cm×n, 使
    A = U Σ V H = U [ Δ 0 0 0 ] V H A=U\Sigma V^H=U
    [Δ000]" role="presentation">[Δ000]
    V^H
    A=UΣVH=U[Δ000]VH

    其中, Δ = d i a g ( σ 1 , σ 2 , . . . , σ r ) \Delta=diag(\sigma_1,\sigma_2,...,\sigma_r) Δ=diag(σ1,σ2,...,σr)
    在这里插入图片描述

    奇异值分解方法

    目标: 求矩阵 A m × n A_{m\times n} Am×n 的奇异值分解 U Σ V H U\Sigma V^H UΣVH

    1. A H A A^HA AHA特征值. 由非零特征值降序排序得到奇异值. Δ = d i a g ( σ 1 , σ 2 , . . . , σ r ) \Delta=diag(\sigma_1,\sigma_2,...,\sigma_r) Δ=diag(σ1,σ2,...,σr), 进而得到矩阵 Σ m × n \Sigma_{m\times n} Σm×n.
    2. 分别求 A H A A^HA AHA 特征值对应的特征向量 α 1 , . . . , α n \alpha_1,...,\alpha_n α1,...,αn, 分别将其标准化得到矩阵 V n × n V_{n\times n} Vn×n
      V = ( v 1 , v 2 , . . . , v n ) = ( α 1 ∣ ∣ α 2 ∣ ∣ , α 2 ∣ ∣ α 1 ∣ ∣ , . . . , α n ∣ ∣ α n ∣ ∣ ) V=(v_1,v_2,...,v_n)=(\frac{\alpha_1}{||\alpha_2||},\frac{\alpha_2}{||\alpha_1||},...,\frac{\alpha_n}{||\alpha_n||}) V=(v1,v2,...,vn)=(α2α1,α1α2,...,αnαn)
    3. 利用公式 u i = A v i σ i \pmb{u_i=\frac{Av_i}{\sigma_i}} ui=σiAviui=σiAviui=σiAvi 求矩阵 U m × m = ( u 1 , u 2 , . . . , u m ) U_{m\times m}=(u_1,u_2,...,u_m) Um×m=(u1,u2,...,um) 的每一列 u i u_i ui.
      σ i = 0 \sigma_i=0 σi=0 时, 需要自行扩充向量 u i : ∀ j < i , u i ⊥ u j u_i: \forall jui:j<i,uiuj. 一般使用叉乘 × \times × 计算(eg: u 3 = u 1 × u 2 u_3=u_1\times u_2 u3=u1×u2).

    左右奇异值向量 奇异值展开式

    A m × n , r a n k ( A ) = r A^{m\times n},rank(A)=r Am×n,rank(A)=r
    V = ( v 1 , . . . , v r ∣ v r + 1 , . . . , v n ) = ( V 1 ∣ V 2 ) V=(v_1,...,v_r|v_{r+1},...,v_n)=(V_1|V_2) V=(v1,...,vrvr+1,...,vn)=(V1V2), v i v_i vi 为右奇异向量
    U = ( u 1 , . . . , u r ∣ u r + 1 , . . . , u m ) = ( U 1 ∣ U 2 ) U=(u_1,...,u_r|u_{r+1},...,u_m)=(U_1|U_2) U=(u1,...,urur+1,...,um)=(U1U2), u i u_i ui 为左奇异向量

    • V 2 V_2 V2 的列向量是空间 N ( A ) N(A) N(A) 的标准正交基 ( A V 2 = 0 AV_2=0 AV2=0)
      V 1 V_1 V1 的列向量是空间 N ⊥ ( A ) N^\perp(A) N(A) 的标准正交基 ( V 1 H V 2 = 0 V_1^HV_2=0 V1HV2=0)
    • U 1 U_1 U1 的列向量是 R ( A ) R(A) R(A) 的标准正交基 ( A = U 1 Δ r V 1 H A=U_1\Delta_rV_1^H A=U1ΔrV1H)
      U 2 U_2 U2 的列向量是 R ⊥ ( A ) R^\perp(A) R(A) 的标准正交基 ( U 1 H U 2 = 0 U_1^HU_2=0 U1HU2=0)

    奇异值展开式:
    A = σ 1 u 1 v 1 H + σ 2 u 2 v 2 H + . . . + σ r u r v r H A=\sigma_1u_1v_1^H+\sigma_2u_2v_2^H+...+\sigma_ru_rv_r^H A=σ1u1v1H+σ2u2v2H+...+σrurvrH

    奇异值分解与线性变换

    矩阵 A ∈ C m × n A\in C^{m\times n} ACm×n 可定义线性变换 T A : C n → C m T_A:C^n\rightarrow C^m TA:CnCm.
    A A A 有奇异值分解 A = U Σ V H A=U\Sigma V^H A=UΣVH, 取 U U U V V V 的列向量分别作 C n C^n Cn C m C^m Cm 的标准正交基, 则线性变换 T A T_A TA 对应的变换矩阵为 Σ \Sigma Σ.

    ∀ α = V X ∈ C n \forall\alpha=VX\in C^n α=VXCn:
    T A ( α ) = A α = ( U Σ V H ) V X = U ( Σ X ) = U [ σ 1 x 1 ⋮ σ r x r 0 ⋮ 0 ] T_A(\alpha)=A\alpha=(U\Sigma V^H)VX=U(\Sigma X)=U

    [σ1x1σrxr00]" role="presentation">[σ1x1σrxr00]
    TA(α)=Aα=(UΣVH)VX=U(ΣX)=Uσ1x1σrxr00
    即原像 α \alpha α 的像在基 { u 1 , . . . , u m } \{u_1,...,u_m\} {u1,...,um} 的坐标为 ( σ 1 x 1 , . . . , σ r x r , 0 , . . . , 0 ) T (\sigma_1x_1,...,\sigma_rx_r,0,...,0)^T (σ1x1,...,σrxr,0,...,0)T.

    Th 3.16 对实矩阵 A m × n A_{m\times n} Am×n, R n R_n Rn 中单位球面在线性变换 T A T_A TA 下像的集合是 R m R^m Rm:

    • 球面( r = n r=n r=n)
    • 椭球体( r < n r < n r<n)

    方阵极分解

    A ∈ C n × n , r a n k ( A ) = r A\in C^{n\times n}, rank(A)=r ACn×n,rank(A)=r, A A A 有极分解:
    A = P Q = ( U Σ U H ) ( U V H ) A=PQ=(U\Sigma U^H)(UV^H) A=PQ=(UΣUH)(UVH)
    其中:

    • P = U Σ U H ∈ C n × n , r a n k ( P ) = r P=U\Sigma U^H\in C^{n\times n},rank(P)=r P=UΣUHCn×n,rank(P)=r 是半正定 Hermite 矩阵( r = n r=n r=n 为正定矩阵), 对应在 u i u_i ui 方向进行拉伸变换
    • Q = U V H ∈ C n × n Q=UV^H\in C^{n\times n} Q=UVHCn×n 是酉矩阵, 对应旋转变换
  • 相关阅读:
    神奇的javascript 语言
    分析-ConfigurationClassPostProcessor原理
    Geoffrey Hinton:我的五十年深度学习生涯与研究心法
    MySQL锁
    药品销售数据查询的网站都有哪些?< 市场竞争调研>
    HCIP实验(06)
    尚硅谷设计模式学习(四)工厂模式
    java计算机毕业设计ssm图书馆预约管理系统txke6(附源码、数据库)
    流程审批动作概述
    iOS开发Swift-8-类的继承,方法重写,构造器,枚举类型,可选类型,强制解包,可选绑定,隐式可选类型...
  • 原文地址:https://blog.csdn.net/LostUnravel/article/details/128181212