前置定义 1(基变换公式、过渡矩阵) 设
α
1
,
⋯
,
α
n
\boldsymbol{\alpha}_1,\cdots,\boldsymbol{\alpha}_n
α1,⋯,αn 及
β
1
,
⋯
,
β
n
\boldsymbol{\beta}_1,\cdots,\boldsymbol{\beta}_n
β1,⋯,βn 是线性空间
V
n
V_n
Vn 中的两个基,
{
β
1
=
p
11
α
1
+
p
21
α
2
+
⋯
+
p
n
1
α
n
β
2
=
p
12
α
1
+
p
22
α
2
+
⋯
+
p
n
2
α
n
⋯
β
n
=
p
1
n
α
1
+
p
2
n
α
2
+
⋯
+
p
n
n
α
n
\left\{
把
α
1
,
α
2
,
⋯
,
α
n
\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n
α1,α2,⋯,αn 这
n
n
n 个有序向量记作
(
α
1
,
α
2
,
⋯
,
α
n
)
(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n)
(α1,α2,⋯,αn),记
n
n
n 阶矩阵
P
=
(
p
i
j
)
\boldsymbol{P} = (p_{ij})
P=(pij),利用向量和矩阵的形式,
(
1
)
(1)
(1) 式可表示为
(
β
1
,
β
2
,
⋯
,
β
n
)
=
(
α
1
,
α
2
,
⋯
,
α
n
)
P
(\boldsymbol{\beta}_1,\boldsymbol{\beta}_2,\cdots,\boldsymbol{\beta}_n) = (\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n) \boldsymbol{P}
(β1,β2,⋯,βn)=(α1,α2,⋯,αn)P
(
1
)
(1)
(1) 式或
(
2
)
(2)
(2) 式称为 基变换公式,矩阵
P
\boldsymbol{P}
P 称为由基
α
1
,
α
2
,
⋯
,
α
n
\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n
α1,α2,⋯,αn 到基
β
1
,
β
2
,
⋯
,
β
n
\boldsymbol{\beta}_1,\boldsymbol{\beta}_2,\cdots,\boldsymbol{\beta}_n
β1,β2,⋯,βn 的过渡矩阵。
定义详见 “基变换与坐标变换”。
前置定义 2 设
T
T
T 是线性空间
V
n
V_n
Vn 中的线性变换,在
V
n
V_n
Vn 中取定一个基
α
1
,
α
2
,
⋯
,
α
n
\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n
α1,α2,⋯,αn,如果这个基在变换
T
T
T 下的像(用这个基线性表示)为
{
T
(
α
1
)
=
a
11
α
1
+
a
21
α
2
+
⋯
+
a
n
1
α
n
T
(
α
2
)
=
a
12
α
1
+
a
22
α
2
+
⋯
+
a
n
2
α
n
⋯
⋯
⋯
T
(
α
n
)
=
a
1
n
α
1
+
a
2
n
α
2
+
⋯
+
a
n
n
α
n
\left\{
记
T
(
α
1
,
α
2
,
⋯
,
α
n
)
=
(
T
(
α
1
)
,
T
(
α
2
)
,
⋯
,
T
(
α
n
)
)
T(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n) = (T(\boldsymbol{\alpha}_1), T(\boldsymbol{\alpha}_2), \cdots, T(\boldsymbol{\alpha}_n))
T(α1,α2,⋯,αn)=(T(α1),T(α2),⋯,T(αn)),则上式
(
6
)
(6)
(6) 可表示为
T
(
α
1
,
α
2
,
⋯
,
α
n
)
=
(
α
1
,
α
2
,
⋯
,
α
n
)
A
T(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n) = (\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n) \boldsymbol{A}
T(α1,α2,⋯,αn)=(α1,α2,⋯,αn)A
其中
A
=
(
a
11
a
12
⋯
a
1
n
a
21
a
22
⋯
a
2
n
⋮
⋮
⋮
a
n
1
a
n
2
⋯
a
n
n
)
\boldsymbol{A} =
那么,
A
\boldsymbol{A}
A 就称为 线性变换
T
T
T 在基
α
1
,
α
2
,
⋯
,
α
n
\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n
α1,α2,⋯,αn 下的矩阵。
定义详见 “【推导】线性变换的矩阵表达式”。
定理 1 设线性空间
V
n
V_n
Vn 中取定两个基
α
1
,
α
2
,
⋯
,
α
n
;
β
1
,
β
2
,
⋯
,
β
n
\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n; \hspace{1em} \boldsymbol{\beta}_1, \boldsymbol{\beta}_2, \cdots, \boldsymbol{\beta}_n
α1,α2,⋯,αn;β1,β2,⋯,βn
由基
α
1
,
α
2
,
⋯
,
α
n
\boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n
α1,α2,⋯,αn 到基
β
1
,
β
2
,
⋯
,
β
n
\boldsymbol{\beta}_1, \boldsymbol{\beta}_2, \cdots, \boldsymbol{\beta}_n
β1,β2,⋯,βn 的过渡矩阵为
P
\boldsymbol{P}
P,
V
n
V_n
Vn 中的线性变换
T
T
T 在这两个基下的矩阵依次为
A
\boldsymbol{A}
A 和
B
\boldsymbol{B}
B,那么
B
=
P
−
1
A
P
\boldsymbol{B} = \boldsymbol{P}^{-1} \boldsymbol{A} \boldsymbol{P}
B=P−1AP。
证明 因为基 α 1 , α 2 , ⋯ , α n \boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n α1,α2,⋯,αn 到基 β 1 , β 2 , ⋯ , β n \boldsymbol{\beta}_1, \boldsymbol{\beta}_2, \cdots, \boldsymbol{\beta}_n β1,β2,⋯,βn 的过渡矩阵为 P \boldsymbol{P} P,所以根据前置定义 1,有
( β 1 , β 2 , ⋯ , β n ) = ( α 1 , α 2 , ⋯ , α n ) P (1) (\boldsymbol{\beta}_1,\boldsymbol{\beta}_2,\cdots,\boldsymbol{\beta}_n) = (\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n) \boldsymbol{P} \tag{1} (β1,β2,⋯,βn)=(α1,α2,⋯,αn)P(1)
由于 β 1 , β 2 , ⋯ , β n \boldsymbol{\beta}_1, \boldsymbol{\beta}_2, \cdots, \boldsymbol{\beta}_n β1,β2,⋯,βn 线性无关,所以矩阵 P \boldsymbol{P} P 可逆。有
( α 1 , α 2 , ⋯ , α n ) = ( β 1 , β 2 , ⋯ , β n ) P − 1 (2) (\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n) = (\boldsymbol{\beta}_1,\boldsymbol{\beta}_2,\cdots,\boldsymbol{\beta}_n) \boldsymbol{P}^{-1} \tag{2} (α1,α2,⋯,αn)=(β1,β2,⋯,βn)P−1(2)
因为线性变换 T T T 在这两个基下的矩阵依次为 A \boldsymbol{A} A 和 B \boldsymbol{B} B,所以根据前置定义 2,有
T ( α 1 , α 2 , ⋯ , α n ) = ( α 1 , α 2 , ⋯ , α n ) A (3) T(\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n) = (\boldsymbol{\alpha}_1,\boldsymbol{\alpha}_2,\cdots,\boldsymbol{\alpha}_n) \boldsymbol{A} \tag{3} T(α1,α2,⋯,αn)=(α1,α2,⋯,αn)A(3)T ( β 1 , β 2 , ⋯ , β n ) = ( β 1 , β 2 , ⋯ , β n ) B (4) T(\boldsymbol{\beta}_1,\boldsymbol{\beta}_2,\cdots,\boldsymbol{\beta}_n) = (\boldsymbol{\beta}_1,\boldsymbol{\beta}_2,\cdots,\boldsymbol{\beta}_n) \boldsymbol{B} \tag{4} T(β1,β2,⋯,βn)=(β1,β2,⋯,βn)B(4)
于是,依次代入式 ( 4 ) (4) (4)、式 ( 1 ) (1) (1)、式 ( 3 ) (3) (3)、式 ( 2 ) (2) (2),有
( β 1 , β 2 , ⋯ , β n ) B = T ( β 1 , β 2 , ⋯ , β n ) = T [ ( α 1 , α 2 , ⋯ , α n ) P ] = [ T ( α 1 , α 2 , ⋯ , α n ) ] P = ( α 1 , α 2 , ⋯ , α n ) A P = ( β 1 , β 2 , ⋯ , β n ) P − 1 A P(β1,β2,⋯,βn)B=T(β1,β2,⋯,βn)=T[(α1,α2,⋯,αn)P]=[T(α1,α2,⋯,αn)]P=(α1,α2,⋯,αn)AP=(β1,β2,⋯,βn)P−1AP" role="presentation"> ( β 1 , β 2 , ⋯ , β n ) B = T ( β 1 , β 2 , ⋯ , β n ) = T [ ( α 1 , α 2 , ⋯ , α n ) P ] = [ T ( α 1 , α 2 , ⋯ , α n ) ] P = ( α 1 , α 2 , ⋯ , α n ) A P = ( β 1 , β 2 , ⋯ , β n ) P − 1 A P
因为 β 1 , β 2 , ⋯ , β n \boldsymbol{\beta}_1, \boldsymbol{\beta}_2, \cdots, \boldsymbol{\beta}_n β1,β2,⋯,βn 线性无关,所以
B = P − 1 A P \boldsymbol{B} = \boldsymbol{P}^{-1} \boldsymbol{A} \boldsymbol{P} B=P−1AP
得证。