将学习到什么
这一节介绍一类非常特殊且非常重要的矩阵,酉矩阵。并简单介绍了一些性质。
入门知识
先给定义
可以看到,如果把矩阵定义域限定在实数域,酉矩阵就叫实正交矩阵啦。这只是“官方定义”,它还有很多等价说法,列出来
证明:(a)~(f) 都没什么好说的,说一下最后一个 (g). 如果说 (U) 是酉矩阵,令 (y=Ux),那么 (y^*y=x^*U^*Ux=x^*Ix=x^*x), 即 (lVert x Vert_2=lVert Ux Vert_2). 反过来,我们设 (U^*U=A=[a_{ij}]),取 (x=z+w),其中 (z,w in mathbb{C}^n), 则 (x^*x=z^*z+w^*w+2mathrm{Re}\, z^*w), 且 (y^*y=x^*Ax=z^*Az+w^*Aw+ 2 mathrm{Re}\,z^*Aw). 由 (lVert x Vert_2=lVert Ux Vert_2) 可知 (z^*z=z^*Az) 以及 (w^*w=w^*Aw), 从而对任意的 (z) 与 (w) 有 (mathrm{Re}\,z^*w=mathrm{Re}\,z^*Aw). 取 (z=e_p) 以及 (w=mathrm{i} e_q), 并计算 (mathrm{Re}\,mathrm{i}e_p^Te_q=0=mathrm{Re}\, mathrm{i}e_p^TAe_q=mathrm{Re}\,mathrm{i}a_{pq}=-mathrm{im}\,a_{pq}), 即虚部全为零,则 (A) 的每个元素都是实的。再取 (z=e_p) 以及 (w=e_q), 计算 (e_p^Te_q=mathrm{Re}\,e_p^Te_q=mathrm{Re}\,e_p^TAe_q=a_{pq}), 这告诉我们有 (A=I), 则证明了 (U) 是酉矩阵。
上个定理中的 (g) 中的条件有个定义
那么就是说,复方阵 (Uin M_n) 是 Euclid 等距的,当且仅当它是酉矩阵。下面给出一个简单结论
证明:((UV)^*(UV)=V^*U^*UV=V^*V=I), 所以 (UV) 是酉矩阵。
可见酉矩阵相乘还是酉矩阵。其实酉矩阵的集合构成一个群。这个群称为 (n imes n) 酉群,对应实数域中的实正交群。群是对单独一个满足结合律的二元运算封闭的集合,且在此集合中含有该运算的恒等元以及逆元,对酉矩阵来说,其相乘仍是酉矩阵,所以对乘法运算封闭,乘法显然是可结合的,酉群的恒等元是 (I), 其逆元仍是酉矩阵,即 (U^{-1}=U^*).
深入一点
酉矩阵 (Uin M_n) 的每一列或者每一行的 Euclid 范数都是 1,因而 (U=[u_{ij}]) 中没有任何元素有绝对值大于 1. 如果我们把酉群看作是 (mathbb{C}^{n^2}) 的一个子集,这就是说是它的一个子集;如果 (U_k=[u_{ij}^{(k)}]) 是酉矩阵组成的一个无限序列((k=1,2,cdots)), 使得对所有 (i,j=1,2,cdots,n) 都有 (limlimits_{k
ightarrow infty}u_{ij}^k=u_{ij}), 那么由恒等式 (U_k^*U_k=I, k=1,2,cdots) ,我们就看出 (limlimits_{k
ightarrow infty}U_k^*U_k=U^*U=I), 其中 (U=[u_{ij}]). 于是,极限矩阵 (U) 也是酉矩阵. 也就是说,酉矩阵的集合是 (mathbb{C}^{n^2}) 的封闭子集. 学过泛函的都知道有限维的有界闭集是一个紧集,所以我们可以说(M_n) 中酉群是紧的. 由这个结论可推出关于酉矩阵的选择原理.
证明:紧集中必存在收敛的无限子序列于自身的某个元素。
上面引理告诉我们如果酉矩阵的序列收敛于某个矩阵,那么极限矩阵必定是酉矩阵。但是要注意引理确保存在的酉极限未必是唯一的,它有可能与子序列的选择有关。比如酉矩阵序列 (U_k=egin{bmatrix} 0&1 \ 1&0 end{bmatrix}^k \,\,(k=1,2,cdots)) 其奇数序列收敛于酉矩阵 (egin{bmatrix} 0&1 \ 1&0 end{bmatrix}), 偶数序列收敛于酉矩阵 (egin{bmatrix} 1&0 \ 0&1 end{bmatrix}).
对于酉矩阵 (U),(U^{-1}=U^*). 推广酉矩阵的一种方式是要求 (U^{-1}) 与 (U^*) 相似。这样的矩阵组成的集合容易刻画成映射 (A
ightarrow A^{-1}A^*) 的值域(对所有非奇异的 (Ain M_n)).
证明: 如果对某个非奇异的 (Bin M_n) 有 (A=B^{-1}B^*), 那么 (A^{-1}=(B^*)^{-1}B), 且 (B^*A^{-1}(B^*)^{-1}=B(B^*)^{-1}=(B^{-1}B^*)^*=A^*). 反过来,如果 (A^{-1}) 与 (A^*) 相似,那么就存在一个非奇异的 $Sin M_n $, 使得 (SA^{-1}S^{-1}=A^*), 从而 (S=A^*SA). 令 (S_{ heta}=mathrm{e}^{mathrm{i} heta}S,\,\, heta in mathbb{R}), 则 (S_{ heta}^*=A^*S_{ heta}^*A). 将这两个恒等式相加给出 (H_{ heta}=A^*H_{ heta}A), 其中 (H_{ heta}=S_{ heta}+S_{ heta}^*) 是 Hermite 的. 如果 (H_{ heta}) 是奇异的,那么就存在一个非零的 (xin mathbb{C}^n), 使得 (0=H_{ heta}x=S_{ heta}x+S_{ heta}^*x), 所以 (-x=S_{ heta}^{-1}S_{ heta}^*x=mathrm{e}^{-2mathrm{i} heta}S^{-1}S^*x), 且 (S^{-1}S^*x=-mathrm{e}^{2mathrm{i} heta}x), 选取一个值 ( heta= heta_0in [0,2pi)), 使得 (-mathrm{e}^{2mathrm{i} heta_0}) 不是 (S^{-1}S^*) 的特征值;所产生的 Hermite 矩阵 (H=H_{ heta_0}) 就是非奇异的,且有性质 (H=A^*HA). 现在选取任意一个复的 (alpha), 使得 $vert alpha
vert=1 $, 且 (alpha) 不是 (A^*) 的特征值. 令 (B=eta(alpha I-A^*)H), 其中复参数 (eta
eq 0) 有待选取,注意 (B) 是非奇异的,我们希望有 (A=B^{-1}B^*), 即 (BA=B^*). 计算 (B^*=H(ar{eta}ar{alpha}I-ar{eta}A)) 以及 (BA=eta(alpha I-A^*)HA=eta(alpha HA-A^*HA)eta(alpha HA-H)=H(alpha eta A-eta I)). 如果我们能选取一个非零的 (eta), 使得 (eta=-ar{eta}ar{alpha}), 我们就完成了,但是如果 (alpha=mathrm{e}^{mathrm{i}psi}), 那么就有 (eta=mathrm{e}^{mathrm{i}(pi-psi)/2}), 证明完成。
如果酉矩阵作为 (2 imes 2) 分块矩阵出现,那么它落在对角线之外的那些块的秩相等,它的对角线块的秩通过一个简单的公式相联系。
证明: 对于酉矩阵 (U),有 (U^{-1}=egin{bmatrix}
U_{11}^* &U_{21}^* \ U_{12}^* &U_{22}^* end{bmatrix}). 由零性互补法则 可得,(mathrm{rank}\,U_{12}=mathrm{rank}\,U_{21}^*=mathrm{rank}\,U_{21}), (mathrm{rank}\,U_{11}=mathrm{rank}\,U_{22}^*+2k-n=mathrm{rank}\,U_{22}+2k-n), 即可得。(mathrm{rank}\,U_{12}=mathrm{rank}\,U_{21}^*=mathrm{rank}\,U_{21}=), 故 (U_{12}=0) 当且仅当 (U_{21}=0). 按块矩阵的乘法可知此时 (U_{11}) 与 (U_{22}) 为 酉矩阵.
由以上引理知,如果一个酉矩阵是上三角或者是下三角阵,则它必是对角阵。
应该知道点什么
- 复方阵 (Uin M_n) 是 Euclid 等距的,当且仅当它是酉矩阵
- 其实酉矩阵的集合构成一个群,且是紧的
- 上个引理中块酉矩阵中秩的关系
- 一个酉矩阵是上三角或者是下三角阵,则它必是对角阵