对于 A = [ v 1 v 2 v 3 ] A=[\mathbf{v}_1 \mathbf{v}_2 \mathbf{v}_3] A=[v1v2v3],有方程 A x = v 1 − v 2 + v 3 \mathbf A \mathbf{x}=\mathbf{v}_1-\mathbf{v}_2+\mathbf{v}_3 Ax=v1−v2+v3
对于 m × n m\times n m×n的秩为 r r r的矩阵,已知①方程 A x = [ 1 0 0 ] \boldsymbol{A x} =\left[100\right] Ax=⎣⎡100⎦⎤无解;② A x = [ 0 1 0 ] \boldsymbol{A x}=\left[010\right] Ax=⎣⎡010⎦⎤有唯一解;
对于上一题的 A \boldsymbol A A, r = n < m = 3 r=n
r=n<m=3 ,判断下列命题是否成立
① A T A \mathbf A^T \mathbf A ATA可逆
② A A T \mathbf A \mathbf A^T AAT正定
③ d e t ( A T A ) = d e t ( A A T ) det(\mathbf A^T \mathbf A)=det(\mathbf A \mathbf A^T) det(ATA)=det(AAT)
注意,对于方阵 A \mathbf A A和方阵 B \mathbf B B,必然有 d e t ( A B ) = d e t ( A ) d e t ( B ) = d e t ( B A ) det(\mathbf A \mathbf B)=det(\mathbf A)det(\mathbf B)=det(\mathbf B\mathbf A) det(AB)=det(A)det(B)=det(BA);对于非方阵则不成立
已知Markov矩阵 A = [ 0.2 0.4 0.3 0.4 0.2 0.3 0.4 0.4 0.4 ] \boldsymbol{A} =\left[0.20.40.30.40.20.30.40.40.4\right] A=⎣⎡0.20.40.40.40.20.40.30.30.4⎦⎤
对于方程 A x = b \mathbf A\mathbf x=\mathbf b Ax=b即 [ 1 0 1 1 1 2 ] [ C ^ D ^ ] = [ 3 4 1 ] \left[101112\right] \left[ˆCˆD\right]= \left[341\right] ⎣⎡111012⎦⎤[C^D^]=⎣⎡341⎦⎤,
已知通过最小二乘法得出的“最优解”为 [ C ^ D ^ ] = [ 11 / 3 − 1 ] \left[ˆCˆD\right] =\left[11/3−1\right] [C^D^]=[11/3−1]
求向量
b
=
[
3
4
1
]
\mathbf b=\left[341\right]
b=⎣⎡341⎦⎤在
A
\mathbf A
A列空间上的投影
p
\mathbf p
p
根据最小二乘法的几何意义,其就是将
b
\mathbf b
b向
A
\mathbf A
A列空间投影,然后对投影
p
\mathbf p
p求解“最优解”;
因此,带入
[
C
^
D
^
]
=
[
11
/
3
−
1
]
\left[ˆCˆD\right] =\left[11/3−1\right]
[C^D^]=[11/3−1]得到投影
p
=
[
1
0
1
1
1
2
]
[
C
^
D
^
]
=
[
11
/
3
8
/
3
5
/
3
]
\mathbf p=\left[101112\right] \left[ˆCˆD\right]=\left[11/38/35/3\right]
p=⎣⎡111012⎦⎤[C^D^]=⎣⎡11/38/35/3⎦⎤
将问题视为对三个数据点的直线拟合,画出对应的图像
希望直线
y
=
k
x
+
b
y=kx+b
y=kx+b同时过三个点,方程写为:
[
1
0
1
1
1
2
]
[
b
k
]
=
[
3
4
1
]
[101112][bk]=[341]
⎣⎡111012⎦⎤[bk]=⎣⎡341⎦⎤
对应的三个点为
(
0
,
3
)
,
(
1
,
4
)
,
(
2
,
1
)
(0,3),(1,4),(2,1)
(0,3),(1,4),(2,1),而最“最优解”
[
11
/
3
−
1
]
\left[11/3−1\right]
[11/3−1]给出终拟合得到的直线
y
=
−
x
+
11
/
3
y=-x+11/3
y=−x+11/3

另求一个非零向量
b
\mathbf b
b,使得
A
x
=
b
\mathbf A\mathbf x=\mathbf b
Ax=b最小二乘法的“最优解”为
0
\mathbf 0
0,即
[
C
^
D
^
]
=
[
0
0
]
\left[ˆCˆD\right] =\left[00\right]
[C^D^]=[00]
根据最小二乘法的几何意义,先将
b
\mathbf b
b向
A
\mathbf A
A列空间投影得到
p
\mathbf p
p,那么“最优解”就是
A
x
^
=
p
\mathbf A\mathbf {\hat x}=\mathbf p
Ax^=p的解
仅当
b
\mathbf b
b垂直/正交于
A
\mathbf A
A列空间时,投影为
p
=
0
\mathbf p=\mathbf 0
p=0,进而“最优解”为
0
\mathbf 0
0,从而得到
b
=
[
1
−
2
1
]
\mathbf{b}=\left[1−21\right]
b=⎣⎡1−21⎦⎤
求符合下列要求的2x2矩阵
①能将向量投影到 a = [ 4 − 3 ] \mathbf{a}=\left[4−3\right] a=[4−3]的投影矩阵
②具有特征值 0 , 3 0,3 0,3和特征向量 [ 1 2 ] , [ 2 1 ] {\left[12\right] , \left[21\right]} [12],[21]的矩阵
③不能被分解为 A = B T B \boldsymbol A=\boldsymbol{B}^{T} \boldsymbol{B} A=BTB的矩阵
④特征向量正交的矩阵(除了对称阵)
对于可逆矩阵 A = [ 4 4 − 3 3 ] \boldsymbol{A}=\left[44−33\right] A=[4−343]求SVD分解(可逆矩阵 r = n r=n r=n,则 A T A \boldsymbol{A}^{T} \boldsymbol{A} ATA和 A A T \boldsymbol{A}\boldsymbol{A}^{T} AAT为正定矩阵,特征值全为正, A \boldsymbol{A} A对应的奇异值全为正)
首先求正交矩阵 V \boldsymbol{V} V和正交矩阵 U \boldsymbol{U} U
SVD分解结果: A = U Σ V T , [ 4 4 − 3 3 ] = [ 1 0 0 − 1 ] [ 32 0 0 18 ] [ 1 / 2 1 / 2 1 / 2 − 1 / 2 ] \boldsymbol{A}=\boldsymbol{U} \boldsymbol{\Sigma} \boldsymbol{V}^{T},\quad\left[44−33\right]=\left[100−1\right]\left[√3200√18\right]\left[1/√21/√21/√2−1/√2\right] A=UΣVT,[4−343]=[100−1][320018][1/21/21/2−1/2]
对于奇异矩阵 A = [ 4 3 8 6 ] \boldsymbol{A}=\left[4386\right] A=[4836]求SVD分解(奇异矩阵 r < n r
r<n ,则 A T A \boldsymbol{A}^{T} \boldsymbol{A} ATA和 A A T \boldsymbol{A}\boldsymbol{A}^{T} AAT为半正定矩阵)
与上面不同的是,这里 A \boldsymbol{A} A为奇异矩阵,秩为1,导致了 A \boldsymbol{A} A的行空间并不能张成整个 R 2 \boldsymbol{R}^2 R2空间,因此这里的SVD即 A V = U Σ \boldsymbol{A}\boldsymbol{V} =\boldsymbol{U} \boldsymbol{\Sigma} AV=UΣ的 V \boldsymbol{V} V中,还多了“零空间”的部分(如上面所述,这部分对应 Σ \boldsymbol{\Sigma} Σ中的零元素)
由于是秩1矩阵,情况比较简单,我们不再用上面的通用方法求正交矩阵
V
\boldsymbol{V}
V和正交矩阵
U
\boldsymbol{U}
U,这里直接从矩阵的行空间和列空间来求解,同时有助于加深理解:

最终,SVD分解结果: A = U Σ V T , [ 4 3 8 6 ] = 1 5 [ 1 2 2 − 1 ] [ 125 0 0 0 ] 1 5 [ 4 3 3 − 4 ] \boldsymbol{A}=\boldsymbol{U} \boldsymbol{\Sigma} \boldsymbol{V}^{T},\quad\left[4386\right]= \frac{1}{\sqrt{5}}\left[122−1\right] \left[√125000\right] \frac{1}{5}\left[433−4\right] A=UΣVT,[4836]=51[122−1][125000]51[433−4]
再次可见, A \boldsymbol{A} A的零空间向量(即 V \boldsymbol{V} V中的 v 2 = [ 3 / 5 − 4 / 5 ] \mathbf{v} 2=\left[3/5−4/5\right] v2=[3/5−4/5]),经过 A V = U Σ \boldsymbol{A}\boldsymbol{V} =\boldsymbol{U} \boldsymbol{\Sigma} AV=UΣ后,对应于 A \boldsymbol{A} A的左零空间向量(即 U \boldsymbol{U} U中的 u 2 = 1 5 [ 2 − 1 ] \mathbf{u} 2=\frac{1}{\sqrt{5}}\left[2−1\right] u2=51[2−1]),也对应于 Σ \boldsymbol{\Sigma} Σ中的 σ 2 = 0 \sigma_2=0 σ2=0