• [矩阵论] Unit 4. 矩阵的广义逆 - 知识点整理


    • 注: 以下内容均由个人整理, 不保证完全准确, 如有纰漏, 欢迎交流讨论
    • 参考: 杨明, 刘先忠. 矩阵论(第二版)[M]. 武汉: 华中科技大学出版社, 2005

    4 矩阵的广义逆

    4.1 矩阵的左逆与右逆

    左逆 右逆

    Def’ 4.1: 设 A ∈ C m × n A\in C^{m\times n} ACm×n

    • ∃ B ∈ C n × m \exists B\in C^{n\times m} BCn×m, B A = I n BA=I_n BA=In, 则 B B B A A A 左逆, 记为 A L − 1 A_L^{-1} AL1
    • ∃ C ∈ C n × m \exists C\in C^{n\times m} CCn×m, A C = I m AC=I_m AC=Im, 则 C C C A A A 右逆, 记为 A R − 1 A_R^{-1} AR1

    左逆:
    必要条件 ⇒ n = r ( B A ) ≤ r ( A ) ≤ m n=r(BA)\leq r(A)\leq m n=r(BA)r(A)m
    充要条件:
    A A A 列满秩(瘦高) n = r a n k ( A ) ≤ m n=rank(A)\leq m n=rank(A)m
    A H A A^HA AHA 可逆 ( A L − 1 A = ( ( A H A ) − 1 A H ) A = I n A_L^{-1}A=((A^HA)^{-1}A^H)A=I_n AL1A=((AHA)1AH)A=In) ⇒ 左逆求法: A L − 1 = ( A H A ) − 1 A H A_L^{-1}=(A^HA)^{-1}A^H AL1=(AHA)1AH
    ⟺ 零空间 N ( A ) = { 0 } N(A)=\{0\} N(A)={0}

    右逆:
    必要条件 ⇒ m = r ( A C ) ≤ r ( A ) ≤ n m=r(AC)\leq r(A)\leq n m=r(AC)r(A)n
    充要条件:
    A A A 行满秩(矮胖) m = r a n k ( A ) ≤ n m=rank(A)\leq n m=rank(A)n
    A A H AA^H AAH 可逆 ( A A R − 1 = A ( A H ( A A H ) − 1 ) = I m AA_R^{-1}=A(A^H(AA^H)^{-1})=I_m AAR1=A(AH(AAH)1)=Im) ⇒ 右逆求法: A R − 1 = A H ( A A H ) − 1 A_R^{-1}=A^H(AA^H)^{-1} AR1=AH(AAH)1
    ⟺ 列空间 R ( A ) = C m R(A)=C^m R(A)=Cm

    m ≠ n m\neq n m=n 时, 左逆和右逆不可能同时存在

    单侧逆求解线性方程组

    求解线性方程组: A m × n X n = b m A_{m\times n}X_n=b_m Am×nXn=bm

    左可逆矩阵:

    • 条件: ( I m − A A L − 1 ) b = 0 (I_m-AA_L^{-1})b=0 (ImAAL1)b=0
    • 唯一解: ( A H A ) − 1 A H b (A^HA)^{-1}A^Hb (AHA)1AHb ( A L − 1 A_L^{-1} AL1 不唯一, 但 A L − 1 b A_L^{-1}b AL1b 唯一)
      理解: A A A 左可逆是列满秩瘦高的矩阵, 相当于 A X = b AX=b AX=b 有过多等式, 等式个数大于未知数个数, 即 m > n m > n m>n, 此时等式过多很可能没有解, 有解也是唯一解.

    右可逆矩阵:

    • 条件: 无(都有解)
    • 多个解: 任一 A R − 1 b A_R^{-1}b AR1b (所以 A H ( A A H ) − 1 b A^H(AA^H)^{-1}b AH(AAH)1b 是一个解)
      理解: A A A 右可逆是行满秩矮胖的矩阵, 相当于 A X = b AX=b AX=b 等式个数小于未知数个数, 即 m < n m < n m<n, 所以一定有解, 且解不唯一.

    4.2 广义逆矩阵

    减号广义逆

    Def’ 4.2 减号逆: A ∈ C m × n A\in C^{m\times n} ACm×n, 若 G ∈ C n × m G\in C^{n\times m} GCn×m 使得
    A G A = A AGA=A AGA=A
    则称矩阵 G G G A A A 的减号(广义)逆, 或 {1}-逆.
    A A A 的全部减号逆集合记为 A { 1 } = { A 1 − , A 2 − , . . . } A\{1\}=\{A_1^-,A_2^-,...\} A{1}={A1,A2,...}

    A A A 可逆, 则 A − 1 ∈ A { 1 } A^{-1}\in A\{1\} A1A{1}
    A A A 单侧可逆, 则 A L − 1 ∈ A { 1 } A_L^{-1}\in A\{1\} AL1A{1}/ A R − 1 ∈ A { 1 } A_R^{-1}\in A\{1\} AR1A{1}
    A = 0 A=0 A=0, 则 A { 1 } = C m × n A\{1\}=C^{m\times n} A{1}=Cm×n

    Th 4.5: A ∈ C m × n , r a n k ( A ) = r A\in C^{m\times n},rank(A)=r ACm×n,rank(A)=r, 若存在可逆阵 P , Q P,Q P,Q 使 P A Q = [ I r 0 0 0 ] PAQ=

    [Ir000]" role="presentation" style="position: relative;">[Ir000]
    PAQ=[Ir000], 则 A − ∈ A { 1 } A^-\in A\{1\} AA{1}
    A − = Q [ I r U V W ] n × m P A^-=Q
    [IrUVW]" role="presentation" style="position: relative;">[IrUVW]
    _{n\times m}P
    A=Q[IrVUW]n×mP

    其中 U ∈ C r × ( m − r ) U\in C^{r\times (m-r)} UCr×(mr), V ∈ C ( n − r ) × r V\in C^{(n-r)\times r} VC(nr)×r, W ∈ C ( n − r ) × ( m − r ) W\in C^{(n-r)\times(m-r)} WC(nr)×(mr)
    是任意的.

    减号逆性质 A ∈ C m × n , A − A\in C^{m\times n}, A^- ACm×n,A:

    • A A A 可逆时减号逆唯一.
    • r a n k ( A ) ≤ r a n k ( A − ) rank(A)\leq rank(A^-) rank(A)rank(A) ( A − ∼ [ I r U V W ] A^-\sim
      [IrUVW]" role="presentation" style="position: relative;">[IrUVW]
      A[IrVUW]
      )
    • A A − AA^- AA A − A A^-A AA 都是幂等阵, 且 r a n k ( A ) = r a n k ( A A − ) = r a n k ( A − ) rank(A) = rank(AA^-) = rank(A^-) rank(A)=rank(AA)=rank(A)
    • R ( A A − ) = R ( A ) R(AA^-)=R(A) R(AA)=R(A), N ( A − A ) = N ( A ) N(A^-A)=N(A) N(AA)=N(A)

    减号逆求法

    目标: 求 A ∈ C m × n A\in C^{m\times n} ACm×n 的减号逆 A − ∈ C n × m A^-\in C^{n\times m} ACn×m

    1. 构造增广矩阵
      [ A I I 0 ] \left[
      AII0" role="presentation" style="position: relative;">AII0
      \right]
      [AII0]
    2. 对该增广矩阵先进行行初等变换得到最简形; 再进行列初等变换, 至最简形每一行只有最左侧一个"1", 即 A A A 转换为 [ I r 0 0 0 ]
      [Ir000]" role="presentation" style="position: relative;">[Ir000]
      [Ir000]
      , 此时增广矩阵即为:
      [ ( I r 0 0 0 ) P Q 0 ] \left[
      (Ir000)PQ0" role="presentation" style="position: relative;">(Ir000)PQ0
      \right]
      (Ir000)QP0
    3. 由上述增广矩阵得到 P , Q P,Q P,Q, 取大小符合的任意 U , V , W U,V,W U,V,W 构成 [ I r U V W ] n × m
      [IrUVW]" role="presentation" style="position: relative;">[IrUVW]
      _{n\times m}
      [IrVUW]n×m

    减号逆求解线性方程组

    A ∈ C m × n , A − ∈ A { 1 } A\in C^{m\times n}, A^-\in A\{1\} ACm×n,AA{1}. 若 A m × n X n = b m A_{m\times n}X_n = b_m Am×nXn=bm 有解, 则其通解可表示为: X = A − b + ( I n − A − A ) z X=A^-b+(I_n-A^-A)z X=Ab+(InAA)z, z ∈ C n z\in C^n zCn 任意.
    ( A − b A^-b Ab A X = b AX=b AX=b 特解, ( I n − A − A ) z (I_n-A^-A)z (InAA)z A x = 0 Ax=0 Ax=0 通解)

    M-P 广义逆(加号广义逆)

    Def 4.3’ 加号逆: 设矩阵 A ∈ C m × n A\in C^{m\times n} ACm×n, 若 ∃ G ∈ C n × m \exists G\in C^{n\times m} GCn×m 使得:
    A G A = A AGA = A AGA=A
    G A G = G GAG = G GAG=G
    ( A G ) H = A G (AG)^H = AG (AG)H=AG
    ( G A ) H = G A (GA)^H = GA (GA)H=GA
    则称 G G G A A A 的 M-P 广义逆(加号逆), 记为 G = A + G=A^+ G=A+.

    矩阵的加号逆存在且唯一.

    加号逆性质 A ∈ C m × n , A + A\in C^{m\times n}, A^+ ACm×n,A+:

    • ( A + ) + = A (A^+)^+=A (A+)+=A
    • ( A + ) H = ( A H ) + (A^+)^H=(A^H)^+ (A+)H=(AH)+
    • ( λ A ) + = λ + A + (\lambda A)^+=\lambda^+A^+ (λA)+=λ+A+, 其中 λ + = { 1 λ , λ ≠ 0 0 , λ = 0 \lambda^+=
      {1λ,λ00,λ=0" role="presentation" style="position: relative;">{1λ,λ00,λ=0
      λ+={λ1,0,λ=0λ=0
    • A A A 列满秩: A + = ( A H A ) − 1 A H A^+=(A^HA)^{-1}A^H A+=(AHA)1AH (左逆的特殊解)
      A A A 行满秩: A + = A H ( A A H ) − 1 A^+=A^H(AA^H)^{-1} A+=AH(AAH)1 (右逆的特殊解)
    • A A A满秩分解: A = B C A=BC A=BC, 则 A + = C + B + \pmb{A^+=C^+B^+} A+=C+B+A+=C+B+A+=C+B+
    • r a n k ( A ) = r a n k ( A + ) = r a n k ( A A + ) = r a n k ( A + A ) rank(A)=rank(A^+)=rank(AA^+)=rank(A^+A) rank(A)=rank(A+)=rank(AA+)=rank(A+A)

    加号逆求法

    目标: 求 A ∈ C m × n A\in C^{m\times n} ACm×n 的加号逆 A + ∈ C n × m A^+\in C^{n\times m} A+Cn×m

    法一:

    1. A A A 进行满秩分解, 得到列满秩和行满秩的 B , C B,C B,C
    2. 利用左右逆的特殊解求 B , C B,C B,C 的加号逆: B + = ( B H B ) − 1 B H B^+=(B^HB)^{-1}B^H B+=(BHB)1BH, C + = C H ( C C H ) − 1 C^+=C^H(CC^H)^{-1} C+=CH(CCH)1
    3. 求得 A A A 的加号逆 A + = C + B + A^+=C^+B^+ A+=C+B+

    法二:

    1. A A A 进行奇异值分解, 得 A = U m × m [ Δ 0 0 0 ] m × n V n × n H A=U_{m\times m}
      [Δ000]" role="presentation" style="position: relative;">[Δ000]
      _{m\times n}V^H_{n\times n}
      A=Um×m[Δ000]m×nVn×nH
    2. 则矩阵加号逆:
      A + = V [ Δ − 1 0 0 0 ] n × m U H A^+=V
      [Δ1000]" role="presentation" style="position: relative;">[Δ1000]
      _{n\times m}U^H
      A+=V[Δ1000]n×mUH

    特殊矩阵的加号逆:

    • [ 0 ] m × n + = [ 0 ] n × m [0]_{m\times n}^+=[0]_{n\times m} [0]m×n+=[0]n×m
    • [ a ] + = [ 1 a ] [a]^+=[\frac{1}{a}] [a]+=[a1]
    • d i a g ( λ 1 , . . . , λ n ) + = d i a g ( λ 1 + , . . . , λ n + ) diag(\lambda_1,...,\lambda_n)^+=diag(\lambda_1^+,...,\lambda_n^+) diag(λ1,...,λn)+=diag(λ1+,...,λn+)
    • 非零向量 x = ( x 1 , . . . , x n ) T x=(x_1,...,x_n)^T x=(x1,...,xn)T, x + = x H ∣ ∣ x ∣ ∣ 2 x^+=\frac{x^H}{||x||^2} x+=x2xH

    4.3 投影变换

    投影变换 投影矩阵

    Def’ 4.4: 设 C n = L ⊕ M C^n =L\oplus M Cn=LM, 向量 x ∈ C n x\in C^n xCn, x = y + z , y ∈ L , z ∈ M x = y + z, y\in L, z\in M x=y+z,yL,zM, 如果线性变换 σ : C n → C n \sigma:C^n\rightarrow C^n σ:CnCn, σ ( x ) = y \sigma(x) = y σ(x)=y, 则称 σ \sigma σ 为从 C n C^n Cn 沿子空间 M M M 到子空间 L L L ( y ∈ L y\in L yL)的投影变换. 投影变换在 C n C^n Cn 空间的一组基下的矩阵称为投影矩阵.

    C n = R ( σ ) ⊕ N ( σ ) C^n=R(\sigma)\oplus N(\sigma) Cn=R(σ)N(σ)

    • R ( σ ) = L R(\sigma)=L R(σ)=L: 像空间
    • N ( σ ) = M N(\sigma)=M N(σ)=M: 核空间

    C n C^n Cn 上线性变换 σ \sigma σ 是投影变换 ⟺ σ \sigma σ幂等变换 ⟺ 变换矩阵在某组基下是幂等矩阵 A 2 = A A^2=A A2=A

    自然基下投影矩阵求法:
    L L L 的投影矩阵: A = ( B ∣ 0 ) ( B ∣ C ) − 1 A=(B|0)(B|C)^{-1} A=(B0)(BC)1
    M M M 的投影矩阵: A ~ = I n − A \tilde{A}=I_n-A A~=InA

    • B B B: 空间 L L L 的基构成的矩阵
    • C C C: 空间 M M M 的基构成的矩阵

    正交投影变换

    Def’ 4.5: σ \sigma σ C n C^n Cn 上投影变换 C n = R ( σ ) ⊕ N ( σ ) C^n=R(\sigma)\oplus N(\sigma) Cn=R(σ)N(σ). 若 R ( σ ) R(\sigma) R(σ) 正交补子空间 R ( σ ) ⊥ = N ( σ ) R(\sigma)^\perp=N(\sigma) R(σ)=N(σ), 则 σ \sigma σ 是正交投影变换.

    C n C^n Cn 上线性变换 σ \sigma σ 是正交投影变换 ⟺ 变换矩阵在某组基下是幂等 Hermite 矩阵 A 2 = A , A H = A A^2=A, A^H=A A2=A,AH=A

    正交投影变换(向量)表示: P ( x ) = x − ( x , u ) u P(x)=x-(x,u)u P(x)=x(x,u)u, u u u 为投影平面的法向

    自然基下正交投影矩阵求法: B H C = 0 B^HC=0 BHC=0
    L L L 的投影矩阵: A = ( B ∣ 0 ) ( B ∣ C ) − 1 = B ( B H B ) − 1 B H A=(B|0)(B|C)^{-1}=B(B^HB)^{-1}B^H A=(B0)(BC)1=B(BHB)1BH
    M M M 的投影矩阵: A ~ = I n − A = C ( C H C ) − 1 C H \tilde{A}=I_n-A=C(C^HC)^{-1}C^H A~=InA=C(CHC)1CH

    • B B B: 空间 L L L 的基构成的矩阵
    • C C C: 空间 M M M 的基构成的矩阵

    正交投影变换性质:
    Th 4.16: 设 W W W C n C^n Cn 的子空间, x 0 ∈ C n , x 0 ∈ W x_0\in C^n, x_0\in W x0Cn,x0W, 如果 σ \sigma σ 是空间 C n C^n Cn 向空间 W W W 的正交投影, 则:
    ∣ ∣ σ ( x 0 ) − x 0 ∣ ∣ ≤ ∣ ∣ y − x 0 ∣ ∣ , ∀ y ∈ W ||\sigma(x_0)-x_0||\leq||y-x_0||,\forall y\in W σ(x0)x0yx0,yW
    含义: 点 σ ( x 0 ) \sigma(x_0) σ(x0) 是空间 W W W 中与点 x 0 x_0 x0 距离最近的点

    正交投影与 A + A A^+A A+A A A + AA^+ AA+

    Th 4.15: A ∈ C m × n A\in C^{m\times n} ACm×n
    A + A ∈ C n × n A^+A\in C^{n\times n} A+ACn×n 性质:

    • ( A + A ) 2 = A + A , ( A + A ) H = A + A (A^+A)^2=A^+A, (A^+A)^H=A^+A (A+A)2=A+A,(A+A)H=A+A
    • { C n = R ( A + ) ⊕ N ( A ) R ( A + ) ⊥ = N ( A )
      {Cn=R(A+)N(A)R(A+)=N(A)" role="presentation" style="position: relative;">{Cn=R(A+)N(A)R(A+)=N(A)
      {Cn=R(A+)N(A)R(A+)=N(A)

      { C n = R ( A + A ) ⊕ N ( A + A ) R ( A + A ) = R ( A + ) , N ( A + A ) = N ( A )
      {Cn=R(A+A)N(A+A)R(A+A)=R(A+),N(A+A)=N(A)" role="presentation" style="position: relative;">{Cn=R(A+A)N(A+A)R(A+A)=R(A+),N(A+A)=N(A)
      {Cn=R(A+A)N(A+A)R(A+A)=R(A+),N(A+A)=N(A)

      含义: A + A A^+A A+A 是正交投影, 它将向量 x x x 投影到空间 R ( A + ) R(A+) R(A+)

    A A + ∈ C m × m AA^+\in C^{m\times m} AA+Cm×m 性质:

    • ( A A + ) 2 = A A + , ( A + A ) H = A A + (AA^+)^2=AA^+, (A^+A)^H=AA^+ (AA+)2=AA+,(A+A)H=AA+
    • { C m = R ( A ) ⊕ N ( A + ) R ( A ) ⊥ = N ( A + )
      {Cm=R(A)N(A+)R(A)=N(A+)" role="presentation" style="position: relative;">{Cm=R(A)N(A+)R(A)=N(A+)
      {Cm=R(A)N(A+)R(A)=N(A+)

      { C m = R ( A A + ) ⊕ N ( A A + ) R ( A A + ) = R ( A ) , N ( A A + ) = N ( A + )
      {Cm=R(AA+)N(AA+)R(AA+)=R(A),N(AA+)=N(A+)" role="presentation" style="position: relative;">{Cm=R(AA+)N(AA+)R(AA+)=R(A),N(AA+)=N(A+)
      {Cm=R(AA+)N(AA+)R(AA+)=R(A),N(AA+)=N(A+)

      含义: A A + AA^+ AA+ 是正交投影, 它将向量 x x x 投影到空间 R ( A ) R(A) R(A)
      在这里插入图片描述

    4.4 最佳的最小二乘解

    最小二乘解 最佳最小二乘解

    A ∈ C m × n , b ∈ C m A\in C^{m\times n}, b\in C^m ACm×n,bCm
    最小二乘解 u ∈ C n u\in C^n uCn ∣ ∣ A u − b ∣ ∣ ≤ ∣ ∣ A x − b ∣ ∣ , ∀ x ∈ C n ||Au-b||\leq||Ax-b||,\forall x\in C^n AubAxb,xCn
    最佳最小二乘解 x 0 ∈ C n x_0\in C^n x0Cn ∣ ∣ x 0 ∣ ∣ 2 ≤ ∣ ∣ u ∣ ∣ 2 ||x_0||_2\leq||u||_2 x02u2

    A x = b Ax=b Ax=b 最佳最小二乘解

    有解性判断:
    A m × n x n = b m A_{m\times n}x_n=b_m Am×nxn=bm

    • 有解 ⟺ b ∈ R ( A ) b\in R(A) bR(A)
    • 无解 ⟺ b ∉ R ( A ) b\not\in R(A) bR(A)

    x 0 = A + b x^0=A^+b x0=A+b A m × n x n = b m A_{m\times n}x_n=b_m Am×nxn=bm 的最佳最小二乘解.

    最佳拟合曲线

    利用数据 ( x 1 , y 1 ) , . . . ( x n , y n ) (x_1,y_1),...(x_n,y_n) (x1,y1),...(xn,yn)使具有两个参数 β 1 , β 2 \beta_1,\beta_2 β1,β2 的经验公式 f ( x , y ) f(x,y) f(x,y) 误差最小
    方法:

    1. 根据经验公式 f ( x , y ) f(x,y) f(x,y)代入数据构造矩阵方程
      [ x 1 y 1 ⋯ ⋯ x n y n ] [ β 1 β 2 ] = [ ⋯ ]
      [x1y1xnyn]" role="presentation">[x1y1xnyn]
      [β1β2]" role="presentation">[β1β2]
      =
      []" role="presentation">[]
      x1xny1yn[β1β2]=
    2. A x = b Ax=b Ax=b 的最佳最小二乘解 A + b A^+b A+b 确定 β 1 , β 2 \beta_1,\beta_2 β1,β2
    3. 误差即 ∣ ∣ A β − b ∣ ∣ 2 ||A\beta-b||_2 Aβb2
  • 相关阅读:
    修改Ubuntu对CPU,socket,进程,文件数等的限制
    【JavaSE】注释\标识符\关键字\字面常量\数据类型与变量
    第六章 使用 Callable 和 Future 的 Java ExecutorService 示例
    【linux网络】IO多路复用select、epoll的区别,含示例代码
    关于使用 uniapp Vue3 开发分享页面 语法糖 setup 开发获取ref踩坑
    WPF(二) WPF核心进阶
    Vmware Linux虚拟机安装教程(Centos版)
    下载安装Ipa Guard
    数字秒表verilog电子秒表跑表,代码/视频
    mongodb 基本概念
  • 原文地址:https://blog.csdn.net/LostUnravel/article/details/128206652