将学习到什么
本节讨论关于实矩阵的实形式的 Jordan 标准型,也讨论关于复矩阵的另外一种形式的 Jordan 标准型,因为它在与交换性有关的问题中很有用.
实 Jordan 标准型
假设 (A in M_n(mathbb{R})), 所以任何非实的特征值必定成对共轭出现,由于结任何 (lambda in mathbb{C}), 以及所有 (k=1,2,cdots) 我们有 (mathrm{rank} \, (A-lambda I)^k= mathrm{rank} \, overline{(A-lambda I)^k}=mathrm{rank} \, overline{(A-lambda I)}^k=mathrm{rank} \, (A-ar{lambda} I)^k), 所以我们断定 (A) 的各种阶的有非实特征值的 Jordan 分块中,同阶的分块总是共轭成对出现. 比如,如果在 (A) 的 Jordan 标准型中有 (k) 个分块 (J_2(lambda)), 那么有 (k) 个分块 (J_2(ar{lambda})), 分块对角矩阵
egin{align}
egin{bmatrix} J_2(lambda) & \ 0 & J_2(ar{lambda}) end{bmatrix} = left [ egin{array}{cc|cc} lambda & 1 & \ 0 & lambda & & \ hline & & ar{lambda} & 1 \ && 0& ar{lambda} end{array}
ight ]
end{align}
通过交换 2,3 行以及 2,3 列,其置换相似于分块上三角矩阵
egin{align}
left [ egin{array}{cc|cc} lambda & 0 & 1 & 0 \ 0 & ar{lambda} & 0 & 1 \ hline & & lambda & 0 \ && 0& ar{lambda} end{array}
ight ] =egin{bmatrix} D(lambda) & I_2 \ & D(lambda) end{bmatrix}
end{align}
其中 $ D(lambda)=egin{bmatrix} lambda & 0 \ 0 & ar{lambda} end{bmatrix} in M_2$.
一般来说,形如
egin{align} label{e1}
egin{bmatrix} J_k(lambda) & \ 0 & J_k(ar{lambda}) end{bmatrix} in M_{2k}
end{align}
的 Jordan 矩阵置换相似于分块上三角(分块双对角)矩阵
egin{align} label{e4}
egin{bmatrix} D(lambda) & I_2 & & & \ & D(lambda) & I_2 & & \ & & ddots & ddots & \ &&& ddots & I_2 \ &&&& D(lambda) end{bmatrix} in M_{2k}
end{align}
实现地时候可按照上述举例方法一步步上移,注意避免下对角出现非零元素. 它在分块主对角线上有 (k) 个 (2 imes 2) 的块 (D(lambda)), 且分块超对角线上有 (k-1) 个分块 (I_2).
设 (lambda=a+mathrm{i}b, a,b in mathbb{R}). 计算表明 (D(lambda)) 相似于实矩阵
egin{align} label{e111}
C(a,b):=egin{bmatrix} a & b \ -b & a end{bmatrix} =SD(lambda)S^{-1}
end{align}
其中 (S=egin{bmatrix} -mathrm{i} & -mathrm{i} \ 1 & -1 end{bmatrix}), 而 (S^{-1}=dfrac{1}{2mathrm{i}}egin{bmatrix} -1 & mathrm{i} \ -1 & -mathrm{i} end{bmatrix}). 此外,对非实的 (lambda), 每一个形如
ef{e4} 的分块矩阵都通过相似矩阵 (Soplus cdots oplus S)((k) 个直和项)与形如
egin{align} label{e3}
C_k(a,b):=egin{bmatrix} C(a,b) & I_2 & & & \ & C(a,b) & I_2 & & \ & & ddots & ddots & \ &&& ddots & I_2 \ &&&& C(a,b) end{bmatrix} in M_{2k}
end{align}
的实分块矩阵相似. 从而每一个形如
ef{e1} 的分块对角矩阵都相似于
ef{e3} 中的矩阵 (C_k(a,b)). 这些结论将我们引导到实 Jordan 标准型定理.
定理1: 每一个 (A in M_n{mathbb{R}}) 都通过一个实相似与一个形如
egin{align} label{e5}
C_{n_1}(a_1,b_1) oplus cdots oplus C_{n_p}(a_p,b_p) oplus J_{m_1}(mu_1) oplus cdots oplus J_{m_r}(mu_r)
end{align}
的实分块对角矩阵相似,其中 $lambda_k=a_k+mathrm{i}b_k(k=1,2,cdots p) $ 是 (A) 的非实特征值,每一个 (a_k) 以及 (b_k) 都是实的,且 (b_k >0), 而 (mu_1,cdots,mu_r) 是 (A) 的实特征值. 每一个实的分块三角矩阵 (C_{n_k}(a_k,b_k) in M_{2n_k}) 都有
ef{e3} 的形式,且与 (A) 的 Jordan 标准型中与非零的实特征值 (lambda_k) 相关的一对共轭 Jordan 块 (J_{n_k}(lambda_k),J_{n_k}(overline{lambda_k}) in M_{n_k}) 相对应.
ef{e5} 中的实的 Jordan 块 (J_{m_k}(mu_k)) 就是Jordan 标准型中有实特征值的那些 Jordan 块.
分块矩阵
ef{e5} 就是 (A) 的实 Jordan 标准型. 下面的推论总结了另外几个与实矩阵相似的有用和判别法.
推论1: 设给定 (A in M_n). 则以下诸命题等价:
(a) (A) 与一个实矩阵相似.
(b) 对 (A) 的每个非零特征值 (lambda) 以及每个 (k=1,2,cdots), 分块 (J_k{lambda}) 以及 (J_k{ar{lambda}}) 各自的个数相等.
(c) 对 (A) 的每个非实特征值 (lambda) 以及每个 (k=1,2,cdots), 分块 (J_k{lambda}) 以及 (J_k{ar{lambda}}) 各自的个数相等.
(d) 对 (A) 的每个非实特征值 (lambda) 以及每个 (k=1,2,cdots), (mathrm{rank}\, (A-lambda I)^k=mathrm{rank}\,(A-ar{lambda}I)^k).
(e) 对 (A) 的每个非实特征值 (lambda) 以及每个 (k=1,2,cdots), (mathrm{rank}\, (A-lambda I)^k=mathrm{rank}\,(ar{A}-lambda I)^k).
(f) 对 (A) 的每个非实特征值 (lambda), (A) 与 (lambda) 以及与 (ar{lambda}) 相关的 Weyr 特征是相同的.
(g) (A) 与 (ar{A}) 相似.
推论2: 如果 (A = egin{bmatrix} B & C \ 0 & 0 end{bmatrix} in M_n), 而 (B in M_m) 与一个实矩阵相似,那么 (A) 与一个实矩阵相似.
证明:假设 (Sin M_m) 是非奇异的,且 (SBS^{-1}=R) 是实的. 那么 (mathcal{A} =(S oplus I_{n-m})A(S oplus I_{n-m})^{-1}= egin{bmatrix} R & igstar \ 0 & 0 end{bmatrix}) 与 (A) 相似. 现在只要证明 (mathcal{A}) 与实矩阵相似就好了. 如果 (lambda
eq 0), 那么
egin{align}
(mathcal{A}-lambda I)^k = egin{bmatrix} (R-lambda I)^k & igstar \ & (-lambda)^k I_{n-m} end{bmatrix}
otag
end{align}
与
egin{align}
(ar{mathcal{A}}-lambda I)^k = egin{bmatrix} (R-lambda I)^k & igstar \ & (-lambda)^k I_{n-m} end{bmatrix}
otag
end{align}
的列秩相同:(n-m+mathrm{rank}(R-lambda I)^k). 我们断言 (mathcal{A}) 与 (ar{mathcal{A}}) 相似,所以 (mathcal{A}) 与实矩阵相似.
推论3: 对每个 (Ain M_n), (Aar{A}) 与 (ar{A}A) 相似,也与一个实矩阵相似.
证明: (A ar{A}) 与 (ar{A} A) 的非奇异的 Jordan 构造是相同的. 由于矩阵与它的复共轭有同样的秩,对每个 (k=1,2,cdots) 有 (mathrm{rank} (A ar{A})^k= mathrm{rank} overline{(A ar{A})^k} = mathrm{rank} overline{(A ar{A})}^k= mathrm{rank} (ar{A} A )^k). 于是,(Aar{A}) 与 (ar{A}A) 的幂零部分的 Jordan 构造也是相同的,所以 (Aar{A}) 与 (ar{A}A) 相似. 由于 (ar{A}A=overline{A ar{A}}), 所以 (A ar{A}) 与一个实矩阵相似.
由 Schur 型知,每个复方阵 (A) 通过一个复相似而与一个复的上三角矩阵 (T) 相似. 如果 (A) 可以对角化,对么它通过一个复相似而与一个对角矩阵相似,且这个对角矩阵的对角元素与 (T) 的对角元素相同,这些元素就是 (A) 的特征值. 那么这个结论的实的类似结果 是什么?
每一个实方阵 (A) 通过一个实相似与一实的上拟三角矩阵 (T) 相似,其中任何 (2 imes 2) 对角分块都有特殊的形式(
ef{e111}). 如果 (A) 可以对角化,则实 Jordan 标准型定理的如下推论就确保 (A) 通过一个实相似与一个实的拟对角矩阵相似,它的对角分块与 (T) 的对角分块相同.
推论4: 设给定 (Ain M_n(mathbb{R})), 并假设它可以对角化. 设 (mu_1,cdots, mu_q) 是 (A) 的实特征值,并设 (a_1 + mathrm{i} b_1, cdots, a_1 + mathrm{i} b_{ell}) 是 (A) 的非实特征值,其中每个 (b_j >0). 那么 (A) 通过一个实相似与
egin{align}
C_1(a_1, b_1) oplus cdots oplus C_1(a_{ell}, b_{ell}) oplus [mu_1] oplus cdots oplus [mu_q]
end{align}
相似.
证明: 这是式 (
ef{e5}) 中 (n_1 = cdots =n_p=m_1=cdots = m_r=1) 的情形.
Weyr 标准型
基本定义
Weyr 特征在我们关于 Jordan 标准型的唯一性的讨论中起着关键的作用,它还可以用来定义一种相似标准型. 我们先来定义 Weyr 分块.
设给定 (lambda in mathbb{C}), 设 (q geqslant 1) 是给定的正整数,(w_1 geqslant cdots geqslant w_q geqslant 1) 是给定的由正整数组成的非增序列,又设 (w_1=(w_1,cdots,w_q)). 与 (lambda) 以及 (w) 相关的 Weyr 分块 (W(w,lambda)) 是上三角的 (q imes q) 分块双对角矩阵
egin{align}
W(w,lambda)=egin{bmatrix} lambda I_{w_1} & G_{w_1,w_2} &&& \ & lambda I_{w_2} & G_{w_2,w_3} && \ && ddots & ddots & \ &&& ddots & G_{w_{q-1},w_q} \ &&&& lambda I_{w_q} end{bmatrix}
end{align}
其中
egin{align} label{e222}
G_{w_i,w_j}=egin{bmatrix} I_{w_j} \ 0 end{bmatrix} in M_{w_i,w_j}, qquad 1 leqslant i < j
end{align}
注意到 (mathrm{rank}\, G_{w_i,w_j}=w_j), 且如果 (w_i=w_{i+1}), 则有 (G_{w_i,w_{i+1}}=I_{w_i}).
Weyr 分块 (W(w,lambda)) 可以被看成为与 Jordan 分块相似的 (q imes q) 分块矩阵. 对角分块是按照阶的大小不增的次序排列的纯量矩阵 (lambda I), 而超对角线分块是列满秩的块 (egin{bmatrix} I \ 0 end{bmatrix}), 它的大小是由对角分块的大小所决定的.
式 (
ef{e222}) 中 Weyr 分块 (W(w,lambda)) 的大小是 (w_1+cdots +w_q), 由于 (G_{w_i,w_{i+1}}) 都是列满秩的块,所以
egin{align}
mathrm{rank}(W(w,lambda)-lambda I) = w_2 +cdots + w_q
end{align}
直接计算可验证 (G_{w_{k-1},w_k} G_{w_k,w_{k+1}}=G_{w_{k-1},w_{k+1}}), 即
egin{align}
egin{bmatrix} I_{w_k} \ 0_{w_{k-1}-w_k, w_k} end{bmatrix} egin{bmatrix} I_{w_{k+1}} \ 0_{w_k-w_{k+1}, w_{k+1}} end{bmatrix} = egin{bmatrix} I_{w_{k+1}} \ 0_{w_{k-1}-w_{k+1}, w_{k+1}} end{bmatrix}
end{align}
利用上式,我们发现
egin{align}
(W(w,lambda) - lambda I)^2 = egin{bmatrix} 0_{w_1} & 0 & G_{w_1,w_3} && \ & 0_{w_2} & 0 & ddots & \ && 0_{w_3} & ddots & G_{w_{q-2},w_q} \ &&& ddots & 0 \ &&&& 0_{w_q} end{bmatrix}
end{align}
所以 (mathrm{rank}(W(w,lambda)-lambda I)^2 = w_3 +cdots + w\_q). 按照此规律可推出 (mathrm{rank}(W(w,lambda)-lambda I)^p = w_{p+1} +cdots + w\_q)(对每个 (p=1,2,cdots)). 由此推出
egin{align}
mathrm{rank}(W(w,lambda)-lambda I)^{p-1} - mathrm{rank}(W(w,lambda)-lambda I)^p = w_p, quad p=1,cdots ,q
end{align}
所以 (W(w,lambda)) 的与特征值 (lambda) 相关和 Weyr 特征就是 (w). 由特征值指数的定义知, 式 (
ef{e222}) 中的对角分块的个数(参数 (q))就是 (lambda) 作为 (W(w,lambda)) 的特征值的指数.
Weyr 矩阵是与不同的特征值对应的 Weyr 分块的直和.
对任意给定的 (A in M_n), 设 (q) 是 (A) 的特征值 (lambda) 的指数,设 (w_k=w_k(A,lambda)(k=1,2,cdots)) 是 (A) 的与 (lambda) 相关的 Weyr 特征,并定义 (A) 的与特征值 (lambda) 相关的 Weyr 分块是
egin{align}
W_A(lambda) = W(w(A,lambda), lambda)
end{align}
Weyr 分块 (W_A(lambda)) 的大小是 (lambda) 的代数重数.
为了加深理解,计算一个例子:
egin{align}
W_J(0) = egin{bmatrix} 0_6 & G_{6,5} & \ & 0_5 & G_{5,2} \ & & 0_2 end{bmatrix} ,quad W_{J}(0)^2 = egin{bmatrix} 0_6 & 0_{6,5} & G_{6,2} \ & 0_5 & 0_{5,2} \ & & 0_2 end{bmatrix} ,quad W_J(0)^3 = 0
end{align}
显然,(mathrm{rank} W_{J}(0)=7=w_2+w_3), 且 (mathrm{rank} W_{J}(0)^2=2=w_3). (W_{J}(0)) 的与它(仅有的)特征值 (0) 相关的 Weyr 特征是 ((6,5,2)).
Weyr 标准型定理
定理2(Weyr 标准型定理): 设给定 (Ain M_n), 又设 (lambda_1, cdots, lambda_d) 是它的按照任意次序排列的不同的特征值. 则存在一个非奇异的 (S in M_n), 且存在 Weyr 分块 (W_1,cdots,W_d), 使得 (a) (W_j) 的(仅有的)特征值是 (lambda_j) (对每个(j=1,cdots,d))以及 (b) (A=S(W_1 oplus cdots oplus W_d) S^{-1}). Weyr 矩阵((A) 与之相似)(W_1 oplus cdots oplus W_d) 由 (A) 以及所列举出的给定的不同的特征值唯一确定:对每个 (j=1,cdots,d) 有 (W_j=W_A(lambda_j)), 所以
egin{align}
A=S egin{bmatrix} W_A(lambda_1) & & \ & ddots & \ & & W_A(lambda_d) end{bmatrix} S^{-1}
end{align}
如果 (A) 与一个 Weyr 矩阵相似,那么那个矩阵可以由 (W_A = W_A(lambda_1) oplus cdots oplus W_A(lambda_d)) 通过它的直和项的一个排列而得到. 如果 (A) 是实的且仅有实的特征值,那么 (S) 可以选取为实的.
证明:先前的结论表明 (W_A = W_A(lambda_1) oplus cdots oplus W_A(lambda_d)), 且对于它们的每一个不同的特征值,(A) 的与之相关的 Weyr 特征都是相同的. 由于 (W_A) 与 (A) 都是相似于相同的 Jordan 标准型,所以它们相似. 如果两个 Weyr 矩阵相似,那么它们必定有同样的不同的特征值,且对于每个特征值有相同的与之相关的 Weyr 特征;由此推出,它们有同样的 Weyr 分块,这些分块在各自的直和中有不同的排列次序. 如果 (A) 与它的所有的特征值都是实的,则 (W_A) 是实的,且 (A) 与 (W_A) 通过一个实的相似而相似.
上个定理中的 Weyr 矩阵 (W_A) 就是 (A) 的 Weyr 标准型. Weyr 与 Jordan 标准型 (W_A) 与 (J_A) 包含了 (A) 的同样的信息,不过各自是以不同的方式给出这些信息. Weyr 标准型以明显地方式展示了 (A) 的 Weyr 特征,而 Jordan 标准型以明显的方式展示了它的 Segre 特征. 此外 (W_A) 与 (J_A) 还是置换相似的.
应该学习到什么
- 实矩阵才有实的 Jordan 标准型
- 矩阵 (A in M_n) 与一个实矩阵相似,等价于 (A) 与 (ar{A}) 相似(因为它们有相同的实 Jordan 标准型)
- 对每个 (Ain M_n), (Aar{A}) 与 (ar{A}A) 相似,也与一个实矩阵相似.
- Weyr 分块 (W(w,lambda)) 由 Weyr 特征 (w) 完全决定
- Weyr 矩阵是与不同的特征值对应的 Weyr 分块的直和
- Weyr 与 Jordan 标准型 (W_A) 与 (J_A) 包含了 (A) 的同样的信息,且它们是置换相似的