第一章 线性方程组和矩阵
同济大学(线性代数)
第一节 矩阵的概念及运算
[课前导读]
线性方程组的求解是线性代数要研究的重要问题之一,而矩阵是求解线性方程组的核心工具.另一方面,矩阵理论在自然科学、工程技术、经济管理等领域中有着广泛的应用,是一些实际问题得以解决的基本工具.这一节我们通过线性方程组和矩阵的关系引出矩阵的定义,并给出矩阵的运算及运算性质.在正式学习矩阵之前,需要读者了解线性方程组的相关知识.
一、矩阵的定义
由(m)个方程(n)个未知量(x_1,x_2,...,x_n)构成的线性(即:一次)方程组可以表示为
在线性方程组中,未知量用什么字母表示无关紧要,重要的是方程组中未知量的个数以及未知量的系数和常数项.也就是说,线性方程组(1-1)由常数(a_{ij}(i=1,2,…,m;j=1,2,…,n))和(b_i(i=1,2,…,m))完全确定,所以可以用一个(m×(n+1))个数排成的(m)行(n+1)列的数表
表示线性方程组(1-1).这个数表的第(j(j=1,2,…,n))列表示未知量(x_j(j=1,2,…,n))前的系数,第(i(i=1,2,…,m))行表示线性方程组(1-1)中的第(i(i=1,2,…,m))个方程,这个数表反映了线性方程组(1-1)的全部信息.反之,任意给定一个(m)行(n+1)列的数表,可以通过这个数表写出一个线性方程组.因此,线性方程组与这样的数表之间有了一个对应关系.
定义1 矩阵定义
(m×n)个数(a_{ij}(i=1,2,{cdots},m;j=1,2,{cdots},n))排成的(m)行(n)列的数表
称为一个(m×n)矩阵,简记为((a_{ij})),有时为了强调矩阵的行数和列数,也记为((a_{ij})_{m×n}).数(a_{ij})位于矩阵((a_{ij}))的第(i)行第(j)列,称为矩阵的((i,j))元素,其中(i)称为元素(a_{ij})的行标,(j)称为元素((_{ij})的列标.
一般地,常用英文大写字母(A,B,…)或字母(α,β,γ,…)表示矩阵,如(A=(a_{ij}), B=(b_{ij}),A_{m×n},B_{m×n})等.
元素是实数的矩阵称为实矩阵,元素是复数的矩阵称为复矩阵.本书中的矩阵除特别指明外,都是指实矩阵.
(1×1)的矩阵
(1×n)的矩阵, 称为行矩阵,也称为(n)维行向量.
(n×1)的矩阵, 称为列矩阵,也称为(n)维列向量.
所有元素都是零的(m×n)的矩阵称为零矩阵,记为(O_{m×n}), 或简记为(O).
(n×n)的矩阵称为方阵. 元素(a_{ii}(i=1, 2, {cdots}, n))所在的位置称为(n)阶方阵的主对角线.
上三角
下三角
对角阵, (diag(a_1, a_2, {cdots}, a_n))
单位矩阵(E_n)或(E)
定义2 矩阵相等
两个矩阵的行数相等、列数也相等,则称这两个矩阵为同型矩阵.如果两个同型矩阵(A=(a_{ij})_{m×n})和(B=(b_{ij})_{m×n})中所有对应位置的元素都相等,即(a_{ij}=b_{ij}),其中(i=1, 2, {cdots}, m; j=1, 2, {cdots}, n)则称矩阵(A)和(B)相等,记为(A=B).
二、矩阵的线性运算
定义3 矩阵加法(A+B)
设(A=(a_{ij})_{m×n})和(B=(b_{ij})_{m×n})是两个同型矩阵,则矩阵(A)与(B)的和记为(A+B),规定
同型矩阵的加法就是两个矩阵对应位置上元素的加法,由此易知矩阵的加法满足如下的运算规律:设(A,B,C)是任意三个(m×n)矩阵,则
- 交换律:(A+B=B+A);
- 结合律:((A+B)+C=A+(B+C));
- (A+O_{m×n}=O_{m×n}+A=A).
对于矩阵(A=(a_{ij})_{m×n}),称矩阵((-a_{ij})_{m×n})为矩阵(A)的负矩阵,记为(-A).显然,(A+(-A)=O_{m×n}).由此可以定义矩阵(A=(a_{ij})_{m×n})和(B=(b_{ij})_{m×n})的减法为(A-B=A+(-B)=(a_{ij}-b_{ij})_{m×n}).
定义4 矩阵数乘(kA)
用一个数(k)乘矩阵(A=(a_{ij})_{m×n})的所有元素得到的矩阵((kcdot a_{ij})_{m×n})称为矩阵的数乘,记为(kA)或者(Ak),即(kA=Ak=(kcdot a_{ij})_{m×n}).
如果(k,l)是任意两个数,(A,B)是任意两个(m×n)矩阵,则矩阵的数乘运算满足:
- (k(A+B)=kA+kB);
- ((k+l)A=kA+lA);
- ((kl)A=k(lA)=l(kA));
- (1A=A);
- ((-1)A=-A);
- (0A=O_{m×n}).
矩阵的加法和矩阵的数乘统称为矩阵的线性运算。
三、矩阵的乘法
定义5 矩阵乘法(A_{m×p}B_{p×n})
设矩阵(A=(a_{ij})_{m×p}),矩阵(B=(b_{ij})_{p×n}),定义矩阵A与B的乘积是矩阵(C=(c_{ij})_{m×n}),其中矩阵(C=(c_{ij}))的第(i)行第(j)列元素(c_{ij})是矩阵(A)的第(i)行元素(a_{i1},a_{i2},…,a_{ip})与矩阵(B)的第(j)列相应元素(b_{1j},b_{2j},…,b_{pj})的乘积之和,即
必须注意:只有当第一个矩阵(左边的矩阵)的列数与第二个矩阵(右边的矩阵)的行数相等时,两个矩阵才能相乘.
1 矩阵乘法不满足交换律,即在一般情况下,(AB≠BA);
2 尽管矩阵(A)与(B)满足(AB=O),但是得不出(A=O)或(B=O)的结论.
但是,矩阵乘法仍满足下列运算规律(假设运算都是可行的).
- 结合律:((AB)C=A(BC)).
- 矩阵乘法对矩阵加法的分配律:(A(B+C)=AB+AC,(A+B)C=AC+BC).
- ((kA)B=A(kB)=k(AB)).
- (E_mA_{m×n}=A_{m×n}E_n=A_{m×n}).
- (O_{m×s}A_{s×n}=O_{m×n};A_{m×s}O_{s×n}=O_{m×n})
对于方阵有
并且规定:对非零方阵(A),有(A^0=E).
方阵的方幂满足以下运算规律(这里k,l均为非负整数):
四、矩阵的转置
定义6 矩阵转置(A_{m×n})
设(A=egin{pmatrix} {a_{11}}&{a_{12}}&{cdots}&{a_{1n}}\ {a_{21}}&{a_{22}}&{cdots}&{a_{2n}}\ {vdots}&{vdots}&{ddots}&{vdots}\ {a_{m1}}&{a_{m2}}&{cdots}&{a_{mn}}\ end{pmatrix}),把矩阵(A)的行换成同充数的列,得到(n×m)矩阵称为矩阵(A)的转置矩阵,记为(A^T),即
矩阵的转置满足下面的运算规律(这里(k)为常数,(A)与(B)为同型矩阵):
- ((A^T)^T=A);
- ((A+B)^T=A^T+B^T);
- ((AB)^T=B^TA^T);
- ((kA)^T=kA^T).
定义7 对称矩阵,反对称矩阵
(n)阶方阵(A)如果满足(A^T=A),则称(A)为对称矩阵,如果满足(A^T=-A),则称(A)为反对称矩阵.
第二节 分块矩阵
[课前导读]
当矩阵的行数和列数较高时,为了证明或计算的方便,常把矩阵分成若干小块,把每个小块当作“数”来处理,这便是矩阵的分块.这一节我们将讨论矩阵的分块方式和分块矩阵的计算.在学习这一节之前,需要读者熟练掌握矩阵的线性运算、矩阵乘法和矩阵的转置运算.
一、分块矩阵的概念
对于行数和列数较高的矩阵(A),运算时常用一些横线和竖线将矩阵(A)分划成若干个小矩阵,每一个小矩阵称为(A)的子块,以子块为元素的形式上的矩阵称为分块矩阵.
二、分块矩阵的运算
分块矩阵的运算规则与普通矩阵的运算规则相类似,不同的计算方式,分块的原则不同,下面分情况讨论.
(1)分块矩阵加(减)运算:设(A、B)都是(m×n)矩阵,对两个矩阵的行和列采用相同的分块方式,不妨设
其中(A_{ij})和(B_{ij})的行数相同、列数相同,则有
(2)分块矩阵的数乘运算:
(3)分块矩阵乘法:设(A_{m×s}、B_{s×n}),要求矩阵(A)的列分块方式与矩阵(B)的行分块方式保持一致,而对矩阵A的行分块方式及矩阵B的列分块方式没有任何要求和限制.不妨设
其中(A_{i1},A_{i2},…,A_{ik})的列数分别等于(B_{1j},B_{2j},…,B_{kj})的行数, 则
其中
(4)分块矩阵的转置:设(A=egin{pmatrix} {A_{11}}&{A_{12}}&{cdots}&{A_{1k}}\ {A_{21}}&{A_{22}}&{cdots}&{A_{2k}}\ {vdots}&{vdots}&{ddots}&{vdots}\ {A_{t1}}&{A_{t2}}&{cdots}&{A_{tk}}\ end{pmatrix}), 则(A^T=egin{pmatrix} {A_{11}}^T&{A_{21}}^T&{cdots}&{A_{t1}}^T\ {A_{12}}^T&{A_{22}}^T&{cdots}&{A_{t2}}^T\ {vdots}&{vdots}&{ddots}&{vdots}\ {A_{1k}}^T&{A_{2k}}^T&{cdots}&{A_{tk}}^T\ end{pmatrix})
(5)分块对角阵:设(A)是(n)阶方阵,若(A)的分块矩阵只有在主对角线上有非零子块,且这些非零子块都是方阵,而其余子块都是零矩阵,即
其中(A_i(i=1,2,…,t))都是方阵,这样的分块阵称为分块对角阵.
第三节 线性方程组与矩阵的初等变换
[课前导读]
本节通过高斯消元法解线性方程组,引入矩阵的初等行变换,并给出矩阵的初等变换、阶梯形矩阵、行最简形矩阵、矩阵等价等概念.最后,我们利用矩阵的初等行变换来求解线性方程组.在学习本节之前,需要读者回忆消元法解线性方程组的相关知识.当然,正文中会详细给出如何用消元法解线性方程组.
一、矩阵的初等变换
定义1 下面三种变换称为矩阵的初等行变换
(1)交换矩阵的某两行,我们用(r_i↔r_j)表示交换矩阵的第(i,j)两行;
(2)矩阵的某一行乘以非零数,用(kr_i)表示矩阵的第(i)行元素乘以非零数(k);
(3)将矩阵的某一行的倍数加到另一行,用(r_j+kr_i)表示将矩阵第(i)行的(k)倍加到第(j)行.
将上面定义中的“行”换成“列”(记号由“(r)”换成“(c)”),就得到了矩阵的初等列变换的定义.
矩阵的初等行变换和初等列变换统称为矩阵的初等变换.
对于一般的矩阵,我们有下面的结论.
定理
- 任意一个(m×n)矩阵总可以经过若干次初等行变换化为行阶梯形矩阵;
- 任意一个(m×n)矩阵总可以经过若干次初等行变换化为行最简形矩阵;
- 任意一个(m×n)矩阵总可以经过若干次初等变换(行变换和列变换)化为它的标准形(F=egin{pmatrix} E_r&O\ O&O end{pmatrix})其中(r)为行阶梯形矩阵中非零行的行数.
定义2 矩阵等价
若矩阵(A)经过有限次初等行(列)变换化为矩阵(B),则称矩阵(A)与矩阵(B)行(列)等价;若矩阵(A)经过有限次初等变换化为矩阵(B),则称矩阵(A)与矩阵(B)等价.
我们用(Astackrel{r}{sim}B)表示矩阵(A)与矩阵(B)行等价,用(Astackrel{c}{sim}B)表示矩阵(A)与矩阵(B)列等价,用(Asim B)表示矩阵(A)与矩阵(B)等价.注意:矩阵间的行(列)等价以及矩阵间的等价是一个等价关系,即满足
- 自反性:任意矩阵A与自身等价.
- 对称性:若矩阵A与矩阵B等价,则矩阵B与矩阵A等价.
- 传递性:若矩阵A与矩阵B等价,矩阵B与矩阵C等价,则矩阵A与矩阵C等价.
等价关系是数学中一个十分重要的概念.等价的对象具有某种共性,这在以后可以得到具体的体现.
第四节 初等矩阵与矩阵的逆矩阵
[课前导读]
我们知道,在实数的运算中有逆的概念,即如果(ab=ba=1),则有(b=a^{-1})和(a=b^{-1}).本节我们也在矩阵的运算中引入类似的概念,即方阵的逆,并给出逆矩阵的性质和求法.在学习本节前,需要读者熟悉矩阵的初等变换.
一、方阵的逆矩阵
1. 逆矩阵的定义
定义1 设(A)为(n)阶方阵,如果存在(n)阶方阵(B)使得
其中,(E)为(n)阶单位方阵,则称矩阵(A)是可逆的,矩阵(B)称为(A)的逆矩阵;否则称(A)是不可逆的.
如果矩阵(A)可逆,则(A)的逆矩阵一定是唯一的.这是因为,若矩阵(B、C)都满足
由于矩阵乘法满足结合律,于是$$C=CE=C(AB)=(CA)B=EB=B$$
所以(A)的逆矩阵一定是唯一的.(A)的逆矩阵记为(A^{-1}).
2. 逆矩阵的性质
- 若(A)可逆, 则(A^{-1})也可逆, 并且((A^{-1})^{-1}=A);
- 若矩阵(A_1,A_s,cdots,A_s)可逆, 则它们的乘积(A_1A_scdots A_s)也可逆, 并且((A_1A_scdots A_s)^{-1}=A_s^{-1}cdots A_2^{-1}A_1^{-1});
- 若(A)可逆, 则(A^T)也可逆, 并且((A^T)^{-1}=(A^{-1})^T);
- 若(A)可逆并且数(k eq0), 则(kA)也可逆, 并且((kA)^{-1}=k^{-1}A^{-1});
二、初等矩阵
定义2 对(n)阶单位矩阵(E)实施一次初等变换得到的矩阵称为(n)阶初等矩阵.由于初等变换有三种,对(n)阶单位矩阵(E)实施一次初等变换得到的初等矩阵也有三类.
- 交换单位阵(E)的第(i)行和第(j)行,或交换(E)的第(i)列和第(j)列,得到的初等矩阵记为(E(i,j)),即
- 用非零数(k)乘单位阵(E)的第(i)行或第(i)列,得到的初等矩阵记为(E(i(k))),即
- 将单位阵(E)的第(i)行乘以非零数(k)加到第(j)行(或将单位阵(E)的第(j)列乘以非零数(k)加到第(i)列),得到的初等矩阵记为(E(i(k), j)),即
关于初等变换与初等矩阵的关系,我们有下面的结论.
命题1 初等矩阵都是可逆的,并且初等矩阵的逆矩阵仍为同一类型的初等矩阵,即
证明 直接计算可得
(E(i,j)E(i,j)=E)
(E(i(k))E(i(dfrac1k))=E(i(dfrac1k))E(i(k))=E)
(E(i(k),j)E(i(-k),j)=E(i(-k),j)E(i(k),j)=E)
命题2 设(A)是一个(m×n)矩阵,对(A)施行一次初等行变换,相当于在(A)的左边乘以相应的(m)阶初等矩阵;对(A)施行一次初等列变换,相当于在(A)的右边乘以相应的(n)阶初等矩阵.
三、初等矩阵与逆矩阵的应用
首先,我们利用初等矩阵和初等变换给出一个方阵可逆的判别条件.
定理1 下面命题互相等价:
(1)(n)阶方阵(A)可逆;
(2)方阵(A)行等价于(n)阶单位矩阵(E);
(3)方阵(A)可表示为一些初等方阵的乘积.
证明 为了证明的方便,我们采取(1)⇒(2)⇒(3)⇒(1)的方式来证明.
(1)⇒(2):由本章第三节的定理可知,方阵(A)经过若干次初等行变换可化为行最简形矩阵(R).再由命题2可知,这相当于存在若干个初等矩阵(P_1,P_2,…,P_s),使得(P_s…P_2P_1A=R). 由于初等矩阵都可逆,若(A)可逆,则根据逆矩阵的性质知(P_s…P_2P_1A=R)可逆,从而行最简形矩阵(R)没有全零行,这迫使(R=E),即(P_s…P_2P_1A=E),所以方阵(A)行等价于(n)阶单位矩阵(E).
(2)⇒(3):若方阵(A)行等价于(n)阶单位矩阵(E),则存在若干个初等矩阵(P_1,P_2,…,P_s),使得(P_s…P_2P_1A=E).由于初等矩阵都可逆且其逆矩阵仍为初等矩阵,记(P_1,P_2,…,P_s)的逆矩阵分别为(P_1^{-1},P_2^{-1},…,P_s^{-1}), 于是(P_1^{-1}P_2^{-1}…P_s^{-1}(P_s…P_2P_1A)=P_1^{-1}P_2^{-1}…P_s^{-1}E), 即(A=P_1^{-1}P_2^{-1}…P_s^{-1})
即也就是说,(A)可表示为初等方阵的乘积.
(3)⇒(1):设方阵(A=P_1^{-1}P_2^{-1}…P_s^{-1}),其中(P_1^{-1},P_2^{-1},…,P_s^{-1})均为初等矩阵,由于初等矩阵均可逆,于是它们的乘积(A=P_1^{-1}P_2^{-1}…P_s^{-1})也可逆.
由定理1的证明可知,若(n)阶方阵(A)可逆,则存在一个可逆阵(P=P_s…P_2P_1),使得(PA=E),于是$$A{-1}=(P_1{-1}P_2{-1}…P_s{-1})^{-1}=P_s…P_2P_1=P$$
构造一个分块矩阵((A|E)),做分块矩阵乘法:
上式等价于对分块矩阵((A|E))实施了若干次初等行变换,当(A)变成(E)时,(E)就变成了(A^{-1}).所以,定理1给出了判别矩阵(A)是否可逆,并在可逆时求(A^{-1})的一种方法:
(1)首先构造分块矩阵((A|E));
(2)对矩阵((A|E))实施初等行变换,将((A|E))化为行最简形矩阵;
(3)如果(A)不能行等价于(E),则矩阵(A)不可逆;若(A)能行等价于(E),则(A)可逆,且(E)就行等价于(A^{-1}).