Th 3.1 矩阵的
k
k
k 阶顺主子式: 取矩阵的前
k
k
k 行、前
k
k
k 列得到的行列式.
Th 3.1:
A
∈
F
n
×
n
A\in F^{n\times n}
A∈Fn×n 有唯一 LDV 分解 ⟺
A
A
A 的顺主子式
∣
A
k
∣
≠
0
,
k
=
1
,
2
,
.
.
.
,
n
−
1
|A_k|\neq 0, k=1,2,...,n-1
∣Ak∣=0,k=1,2,...,n−1,
∣
A
0
∣
=
1
|A_0|=1
∣A0∣=1. 其中
D
=
d
i
a
g
(
d
1
,
d
2
,
…
,
d
n
)
,
d
k
=
∣
A
k
∣
∣
A
k
−
1
∣
,
k
=
1
,
…
,
n
D = diag(d_1,d_2,…,d_n), d_k = \frac{|A_k|}{|A_{k-1}|}, k=1, …, n
D=diag(d1,d2,…,dn),dk=∣Ak−1∣∣Ak∣,k=1,…,n.
LU 分解:
LDV 分解:
A
X
=
b
⇒
{
L
Y
=
b
U
X
=
Y
AX=b\Rightarrow
A
X
=
b
⇒
{
L
Z
=
b
D
Y
=
Z
V
X
=
Y
AX=b\Rightarrow
Def 3.2: 设 A ∈ F m × n , r a n k ( A ) = r A\in F^{m\times n}, rank(A)=r A∈Fm×n,rank(A)=r, 若存在秩为 r r r 的矩阵 B ∈ F m × r B\in F^{m\times r} B∈Fm×r(列满秩, 瘦高矩阵), C ∈ F r × n C\in F^{r\times n} C∈Fr×n(行满秩, 矮胖矩阵), 使得 A = B C A=BC A=BC, 则称此式为 A A A 的满秩分解.
Th 3.3 任何非零矩阵 A ∈ F m × n A\in F^{m\times n} A∈Fm×n 都有满秩分解.
求矩阵列的极大无关组
举例:
A
=
[
1
1
2
0
2
2
1
0
1
]
→
[
1
0
1
0
1
1
0
0
0
]
A=
C
=
[
1
0
1
0
1
1
]
,
B
=
[
1
1
0
2
1
0
]
C=
矩阵的谱: 矩阵 A A A 互异的特征值的集合 { λ 1 , λ 2 , . . . , λ s } \{\lambda_1,\lambda_2,...,\lambda_s\} {λ1,λ2,...,λs}.
矩阵的谱分解:
A
=
P
(
λ
1
[
I
r
1
0
⋱
0
]
+
λ
2
[
0
I
r
2
⋱
0
]
+
⋯
+
λ
s
[
0
0
⋱
λ
s
]
)
P
−
1
=
P
(
λ
1
Q
1
+
λ
2
Q
2
+
⋯
+
λ
s
Q
s
)
P
−
1
=
P
(
∑
i
=
1
s
λ
i
Q
i
)
P
−
1
=
∑
i
=
1
s
λ
i
P
Q
i
P
−
1
=
=
=
=
=
=
=
=
d
e
f
P
i
=
P
Q
i
P
−
1
∑
i
=
1
s
λ
i
P
i
Q i , P i Q_i,P_i Qi,Pi 性质:
Th 3.5: 矩阵可对角化 ⟺ 矩阵有谱分解 A = ∑ i = 1 s λ i P i A=\sum_{i=1}^s\lambda_iP_i A=∑i=1sλiPi, 其中 P i P_i Pi 满足上述 3 条性质.
幂等矩阵性质: P ∈ F n × n , P 2 = P P\in F^{n\times n},P^2=P P∈Fn×n,P2=P
欧式空间: 实对称矩阵
A
(
A
T
=
A
)
A(A^T=A)
A(AT=A) 相似于对角矩阵. 存在正交矩阵
C
(
C
C
T
=
C
T
C
=
I
)
C\ (CC^T=C^TC=I)
C (CCT=CTC=I):
C
T
A
C
=
C
−
1
A
C
=
[
λ
1
λ
2
⋱
λ
n
]
C^TAC=C^{-1}AC=
酉空间: Hermite 矩阵
A
(
A
H
=
A
)
A(A^H=A)
A(AH=A) 相似于对角矩阵. 存在酉矩阵
U
(
U
U
H
=
U
H
U
=
I
)
U\ (UU^H=U^HU=I)
U (UUH=UHU=I):
U
H
A
U
=
U
−
1
A
U
=
[
λ
1
λ
2
⋱
λ
n
]
U^HAU=U^{-1}AU=
Th 3.7 可逆矩阵的 UR (酉)分解:
A
∈
C
n
×
n
A\in C^{n\times n}
A∈Cn×n 为可逆矩阵, 则存在酉矩阵(正交矩阵)
U
U
U 和主对角线上元素皆正的上三角矩阵
R
R
R, 使得
A
=
U
R
A=UR
A=UR.
Th 3.8 列满秩矩阵(列线性无关, 瘦高矩阵)的 QR 分解:
矩阵
A
∈
C
n
×
r
A\in C^{n\times r}
A∈Cn×r 是列满秩的矩阵, 则矩阵
A
A
A 可以分解为
A
=
Q
R
A=QR
A=QR, 其中
Q
∈
C
n
×
r
Q\in C^{n\times r}
Q∈Cn×r 的列向量是标准正交的向量组,
R
∈
C
r
×
r
R\in C^{r\times r}
R∈Cr×r 是主对角线上元素皆正的上三角形矩阵.
思路: 将矩阵
A
A
A 的列向量(均线性无关)视作矩阵列空间中的一组基
A
=
(
α
1
,
.
.
.
,
α
r
)
A=(\alpha_1,...,\alpha_r)
A=(α1,...,αr), 使用 Schmidt 正交化方法对其求标准正交基.
(
α
1
,
α
2
,
.
.
.
,
α
r
)
=
(
ϵ
1
,
ϵ
2
.
.
.
,
ϵ
r
)
[
∣
∣
β
1
∣
∣
(
α
2
,
ϵ
1
)
⋯
(
α
r
,
ϵ
1
)
∣
∣
β
2
∣
∣
⋯
(
α
r
,
ϵ
2
)
⋱
⋮
∣
∣
β
r
∣
∣
]
(\alpha_1,\alpha_2,...,\alpha_r)=(\epsilon_1,\epsilon_2...,\epsilon_r)
Th 3.9 Schur 分解: 对矩阵
A
∈
C
n
×
n
A\in C^{n\times n}
A∈Cn×n, 存在酉矩阵
U
U
U 和上三角矩阵
T
T
T, 使得:
U
H
A
U
=
T
=
[
λ
1
∗
∗
∗
λ
2
⋱
∗
⋱
∗
λ
n
]
U^HAU=T=
Def’ 3.3: 方阵 A A A 是正规矩阵 ⟺ A H A = A A H A^HA=AA^H AHA=AAH
常见的正规矩阵:
正规矩阵特性:
Th 3.10:
A
∈
C
n
×
n
A\in C^{n\times n}
A∈Cn×n 是正规矩阵 ⟺
A
A
A 酉相似于对角矩阵 ("正规"是"酉相似"的不变性质).
⟺
A
A
A 有
n
n
n 个标准正交的特征向量.
⟺ (推论)
A
A
A 有
n
n
n 个标准正交的特征向量构成空间
C
n
C^n
Cn 的标准正交基. 即
理解: 正规矩阵关键在"酉相似于"对角矩阵. "相似"是线性变换从一组基到另一组基的坐标变换; 而"酉相似"是线性变换从一组标准正交基到另一组标准正交基的坐标变换.
⟺
A
A
A 有谱分解:
A
=
∑
i
=
1
s
λ
i
P
i
A=\sum_{i=1}^s\lambda_iP_i
A=∑i=1sλiPi.
P
P
P 满足:
P
i
2
=
P
i
,
P
i
H
=
P
i
P_i^2=P_i,P_i^H=P_i
Pi2=Pi,PiH=Pi;
P
i
P
j
=
0
,
i
≠
j
P_iP_j=0,i\neq j
PiPj=0,i=j;
∑
i
=
1
s
P
i
=
I
\sum_{i=1}^sP_i=I
∑i=1sPi=I. (即满足谱分解矩阵
P
i
P_i
Pi 的性质外还需要满足 Hermite 性,
P
i
=
P
Q
i
P
−
1
⟶
正
规
矩
阵
P
i
=
U
Q
i
U
H
P_i=PQ_iP^{-1}\overset{正规矩阵}{\longrightarrow}P_i=UQ_iU^H
Pi=PQiP−1⟶正规矩阵Pi=UQiUH)
Hermite 矩阵: A H = A A^H=A AH=A
基本性质:
Hermite 矩阵谱分解:
设
A
∈
F
n
×
n
A\in F^{n\times n}
A∈Fn×n 是秩为
k
k
k 的半正定的 Hermite 矩阵, 则
A
A
A 可以分解为下列半正定矩阵的和:
A
=
v
1
v
1
H
+
v
2
v
2
H
+
.
.
.
+
v
k
v
k
H
A=v_1v_1^H+v_2v_2^H+...+v_kv_k^H
A=v1v1H+v2v2H+...+vkvkH
其中,
{
v
1
,
v
2
,
…
,
v
k
}
\{v_1, v_2, …,v_k\}
{v1,v2,…,vk} 是
F
n
F^n
Fn 中的正交向量组, 且秩为 1.
A ∈ C m × n A\in C^{m\times n} A∈Cm×n, A H A ∈ C n × n , A A H ∈ C m × m A^HA\in C^{n\times n},AA^H\in C^{m\times m} AHA∈Cn×n,AAH∈Cm×m 为 Hermite 矩阵, 从而也为正规矩阵.
Th 3.12
Def’ 3.4:
A
∈
C
m
×
n
,
r
a
n
k
(
A
)
=
r
A\in C^{m\times n}, rank(A) = r
A∈Cm×n,rank(A)=r, 设
A
H
A
A^HA
AHA 的特征值
λ
1
≥
λ
2
≥
.
.
.
≥
λ
r
>
0
,
λ
r
+
1
=
.
.
.
=
λ
n
=
0
\lambda_1\geq\lambda_2\geq...\geq\lambda_r > 0, \lambda_{r+1}=...=\lambda_n=0
λ1≥λ2≥...≥λr>0,λr+1=...=λn=0, 则矩阵
A
A
A 的奇异值:
σ
i
=
λ
i
,
i
=
1
,
2
,
.
.
.
,
r
\sigma_i=\sqrt{\lambda_i},i=1,2,...,r
σi=λi,i=1,2,...,r
注: 此处的
λ
i
\lambda_i
λi 是矩阵
A
H
A
A^HA
AHA 的特征值, 奇异值为正(实)数
Th 3.13 奇异值性质:
Th 3.14 奇异值分解: 设矩阵
A
∈
C
m
×
n
,
r
a
n
k
(
A
)
=
r
A\in C^{m\times n}, rank(A)=r
A∈Cm×n,rank(A)=r.
σ
1
≥
σ
2
≥
.
.
.
≥
σ
r
>
0
\sigma_1\geq\sigma_2\geq...\geq\sigma_r > 0
σ1≥σ2≥...≥σr>0 是矩阵
A
A
A 的奇异值, 则存在酉矩阵
U
∈
C
m
×
m
,
V
∈
C
n
×
n
U\in C^{m\times m}, V\in C^{n\times n}
U∈Cm×m,V∈Cn×n, 分块矩阵
Σ
=
[
Δ
0
0
0
]
∈
C
m
×
n
\Sigma=
A
=
U
Σ
V
H
=
U
[
Δ
0
0
0
]
V
H
A=U\Sigma V^H=U
其中,
Δ
=
d
i
a
g
(
σ
1
,
σ
2
,
.
.
.
,
σ
r
)
\Delta=diag(\sigma_1,\sigma_2,...,\sigma_r)
Δ=diag(σ1,σ2,...,σr)
目标: 求矩阵
A
m
×
n
A_{m\times n}
Am×n 的奇异值分解
U
Σ
V
H
U\Sigma V^H
UΣVH
A
m
×
n
,
r
a
n
k
(
A
)
=
r
A^{m\times n},rank(A)=r
Am×n,rank(A)=r
V
=
(
v
1
,
.
.
.
,
v
r
∣
v
r
+
1
,
.
.
.
,
v
n
)
=
(
V
1
∣
V
2
)
V=(v_1,...,v_r|v_{r+1},...,v_n)=(V_1|V_2)
V=(v1,...,vr∣vr+1,...,vn)=(V1∣V2),
v
i
v_i
vi 为右奇异向量
U
=
(
u
1
,
.
.
.
,
u
r
∣
u
r
+
1
,
.
.
.
,
u
m
)
=
(
U
1
∣
U
2
)
U=(u_1,...,u_r|u_{r+1},...,u_m)=(U_1|U_2)
U=(u1,...,ur∣ur+1,...,um)=(U1∣U2),
u
i
u_i
ui 为左奇异向量
奇异值展开式:
A
=
σ
1
u
1
v
1
H
+
σ
2
u
2
v
2
H
+
.
.
.
+
σ
r
u
r
v
r
H
A=\sigma_1u_1v_1^H+\sigma_2u_2v_2^H+...+\sigma_ru_rv_r^H
A=σ1u1v1H+σ2u2v2H+...+σrurvrH
矩阵
A
∈
C
m
×
n
A\in C^{m\times n}
A∈Cm×n 可定义线性变换
T
A
:
C
n
→
C
m
T_A:C^n\rightarrow C^m
TA:Cn→Cm.
A
A
A 有奇异值分解
A
=
U
Σ
V
H
A=U\Sigma V^H
A=UΣVH, 取
U
U
U 和
V
V
V 的列向量分别作
C
n
C^n
Cn 和
C
m
C^m
Cm 的标准正交基, 则线性变换
T
A
T_A
TA 对应的变换矩阵为
Σ
\Sigma
Σ.
∀
α
=
V
X
∈
C
n
\forall\alpha=VX\in C^n
∀α=VX∈Cn:
T
A
(
α
)
=
A
α
=
(
U
Σ
V
H
)
V
X
=
U
(
Σ
X
)
=
U
[
σ
1
x
1
⋮
σ
r
x
r
0
⋮
0
]
T_A(\alpha)=A\alpha=(U\Sigma V^H)VX=U(\Sigma X)=U
即原像
α
\alpha
α 的像在基
{
u
1
,
.
.
.
,
u
m
}
\{u_1,...,u_m\}
{u1,...,um} 的坐标为
(
σ
1
x
1
,
.
.
.
,
σ
r
x
r
,
0
,
.
.
.
,
0
)
T
(\sigma_1x_1,...,\sigma_rx_r,0,...,0)^T
(σ1x1,...,σrxr,0,...,0)T.
Th 3.16 对实矩阵 A m × n A_{m\times n} Am×n, R n R_n Rn 中单位球面在线性变换 T A T_A TA 下像的集合是 R m R^m Rm:
A
∈
C
n
×
n
,
r
a
n
k
(
A
)
=
r
A\in C^{n\times n}, rank(A)=r
A∈Cn×n,rank(A)=r,
A
A
A 有极分解:
A
=
P
Q
=
(
U
Σ
U
H
)
(
U
V
H
)
A=PQ=(U\Sigma U^H)(UV^H)
A=PQ=(UΣUH)(UVH)
其中: