设
A
\boldsymbol{A}
A 为
n
n
n 阶矩阵,记
φ
(
A
)
=
a
0
E
+
a
1
A
+
⋯
a
m
A
m
(1)
\varphi(\boldsymbol{A}) = a_0 \boldsymbol{E} + a_1 \boldsymbol{A} + \cdots a_m \boldsymbol{A}^m \tag{1}
φ(A)=a0E+a1A+⋯amAm(1)
为矩阵
A
\boldsymbol{A}
A 的
m
m
m 次多项式。下面考虑通过逆矩阵简化式
(
1
)
(1)
(1)。
首先,先将矩阵 A \boldsymbol{A} A 的多项式简化为对角矩阵 Λ \boldsymbol{\Lambda} Λ 的多项式。有定理如下:
定理 1 若 A = P Λ P − 1 \boldsymbol{A} = \boldsymbol{P} \boldsymbol{\Lambda} \boldsymbol{P}^{-1} A=PΛP−1,则 A k = P Λ k P − 1 \boldsymbol{A}^k = \boldsymbol{P} \boldsymbol{\Lambda}^k \boldsymbol{P}^{-1} Ak=PΛkP−1。
证明 略。
根据定理 1,上式
(
1
)
(1)
(1) 可以写成
φ
(
A
)
=
a
0
E
+
a
1
A
+
⋯
a
m
A
m
=
P
a
0
E
P
−
1
+
P
a
1
Λ
P
−
1
+
⋯
+
P
a
m
Λ
m
P
−
1
=
P
φ
(
Λ
)
P
−
1
(2)
\tag{2}
φ(A)=a0E+a1A+⋯amAm=Pa0EP−1+Pa1ΛP−1+⋯+PamΛmP−1=Pφ(Λ)P−1(2)
下面,考虑将对角矩阵
Λ
\boldsymbol{\Lambda}
Λ 的多项式简化为对角矩阵内元素的多项式。有定理如下:
定理 2 若 Λ = diag ( λ 1 , λ 2 , ⋯ , λ n ) \boldsymbol{\Lambda} = \operatorname{diag}(\lambda_1,\lambda_2,\cdots,\lambda_n) Λ=diag(λ1,λ2,⋯,λn) 为对角矩阵,则 Λ k = diag ( λ 1 k , λ 2 k , ⋯ , λ n k ) \Lambda^k = \operatorname{diag}(\lambda_1^k,\lambda_2^k,\cdots,\lambda_n^k) Λk=diag(λ1k,λ2k,⋯,λnk)。
证明 略。
根据定理 2,上式
(
2
)
(2)
(2) 中的
φ
(
Λ
)
\varphi(\boldsymbol{\Lambda})
φ(Λ) 可以写成
φ
(
Λ
)
=
a
0
E
+
a
1
Λ
+
⋯
+
Λ
m
=
a
0
(
1
1
⋱
1
)
+
a
1
(
λ
1
λ
2
⋱
λ
n
)
+
⋯
+
a
m
(
λ
1
m
λ
2
m
⋱
λ
n
m
)
=
(
φ
(
λ
1
)
φ
(
λ
2
)
⋱
φ
(
λ
n
)
)
φ(Λ)=a0E+a1Λ+⋯+Λm=a0
11⋱1
+a1
λ1λ2⋱λn
+⋯+am
λ1mλ2m⋱λnm
=
φ(λ1)φ(λ2)⋱φ(λn)
上式表明当
Λ
=
diag
(
λ
1
,
λ
2
,
⋯
,
λ
n
)
\boldsymbol{\Lambda} = \operatorname{diag}(\lambda_1,\lambda_2,\cdots,\lambda_n)
Λ=diag(λ1,λ2,⋯,λn) 为
n
n
n 阶对角矩阵时,
φ
(
Λ
)
\varphi(\boldsymbol{\Lambda})
φ(Λ) 也是
n
n
n 阶对角矩阵,且它的第
i
i
i 个对角元为
φ
(
λ
i
)
\varphi(\lambda_i)
φ(λi)。于是式
(
2
)
(2)
(2) 最终可以写成
φ
(
A
)
=
P
(
φ
(
λ
1
)
φ
(
λ
2
)
⋱
φ
(
λ
n
)
)
P
−
1
\varphi(\boldsymbol{A}) = \boldsymbol{P} \boldsymbol{P}^{-1}
φ(A)=P
φ(λ1)φ(λ2)⋱φ(λn)
P−1