前面类比了方阵和数,对方阵引入了单位元\(I\)、幂\(A^{k}\)、多项式\(f(A)\),本节考虑可类比实数中倒数的运算——矩阵求逆\(A^{-1}\)。
需要注意的是,并不一定所有方阵都可逆,这也说明方阵不能和数域完全等同,以下定理给出了方阵可逆的充要条件:行列式不为\(0\)。
定理:\(n\)阶方阵\(A\in F^{n\times n}\)可逆的充要条件是\(\det A\ne 0\),这一条件也称为\(A\)非奇异(非退化)。
必要性:已知\(\det I=1\),若\(\det A=0\),则对任何\(B\),\(\det AB=0\ne 1\),即\(AB\ne I\)。
充分性:设\(A=(a_{ij})\),记\(\det A\)的元素\(a_{ij}\)的代数余子式为\(A_{ij}\),取\(A^*=(A_{ij})^{\intercal}\),则因为
\[\sum_{j=1}^{n}a_{ij}A_{kj}=\delta_{ik}\det A, \]我们有
\[A\left(\frac{1}{\det A}A^* \right)=\left(\frac{1}{\det A}A^* \right)A=I_{(n)}, \]这就得到了\(A^{-1}=\dfrac{1}{\det A}A^*\)。
这里不仅得到了\(A\)可逆的充要条件,还在\(A\)可逆即\(\det A\ne 0\)的情况下直接构造出了一个\(A^{-1}\)。
需要考虑,一个矩阵的可逆矩阵是唯一的,因为如果\(B,C\)都是\(A\)的逆矩阵,那么\(B=BAC=C\)。关于逆矩阵,有以下性质:
若\(A\)可逆,则\(A^{-1}\)可逆,且\((A^{-1})^{-1}=A\)。
穿脱原理:若\(A,B\)可逆,则\(AB\)可逆且\((AB)^{-1}=B^{-1}A^{-1}\)。推广至有限个可逆矩阵的乘积,有
\[(A_1A_2\cdots A_k)^{-1}=A_k^{-1}\cdots A_2^{-1}A_1^{-1}. \]\((\lambda A)^{-1}=\lambda^{-1}A^{-1}\)。
转置可逆:\((A^{\intercal})^{-1}=(A^{-1})^{\intercal}\)。
\(\det A^{-1}=(\det A)^{-1}\),即\(A^{-1}\)的行列式与\(A\)的行列式互为倒数。
若\(m\)阶方阵\(A\)与\(n\)阶方阵\(B\)可逆,则\(m+n\)阶方阵\(\mathrm{diag}(A,B)\)可逆,且\((\mathrm{diag}(A,B))^{-1}=\mathrm{diag}(A^{-1},B^{-1})\)。
下面给出一些分块矩阵与逆矩阵的结合应用,即Schur公式。设\(A\in F^{r\times r}\),\(B\in F^{r\times (n-r)}\),\(C\in F^{(n-r)\times r}\),\(D\in F^{(n-r)\times(b-r)}\),且方阵\(A\)可逆,则
这三个公式分别对分块阵作变换,使其变为分块三角阵和分块对角阵,而我们知道,分块对角阵和分块三角阵是很容易求行列式的。
例:设\(A,B,C,D\in F^{n\times n}\)以及\(AC=CA\),求证:
\[\det \begin{pmatrix} A & B \\ C & D \end{pmatrix}=\det(AD-CB). \]由Schur公式,
\[\det\begin{pmatrix} A & B \\ C & D \end{pmatrix}=\det\begin{pmatrix} A & B \\ 0 & D-CA^{-1}B \end{pmatrix}=\det (AD-ACA^{-1}B)=\det (AD-CB). \]
例:设\(A\in F^{m\times n}\),\(B\in F^{n\times m}\),求证:
\[\det(I_{(m)}-AB)=\det(I_{(n)}-BA). \]构造\(m+n\)阶方阵\(\pmatrix{I_{(m)} & A \\ B & I_{(n)}}\),有
\[\begin{pmatrix} I_{(m)} & 0 \\ -B & I_{(n)} \end{pmatrix}\begin{pmatrix} I_{(m)} & A \\ B & I_{(n)} \end{pmatrix}=\begin{pmatrix} I_{(m)} & A \\ 0 & I_{(n)}-BA \end{pmatrix},\\ \begin{pmatrix} I_{(m)} & -A \\ 0 & I_{(n)} \end{pmatrix}\begin{pmatrix} I_{(m)} & A \\ B & I_{(n)} \end{pmatrix}=\begin{pmatrix} I_{(m)}-AB & 0 \\ B & I_{(n)} \end{pmatrix}. \]两边同时取行列式,就得到所求结果。
本节从矩阵的行向量空间、列向量空间角度来呈现矩阵的另一个维度。
矩阵的秩:\(m\times n\)矩阵\(A\)的所有非零子式的最高阶数称为矩阵\(A\)的秩,记作\(\mathrm{rank}(A)\)。
\[\mathrm{rank}(A)\le \min\{m,n\}. \]满秩:对\(n\)阶方阵\(A\),如果\(\mathrm{rank}(A)=n\),则称\(A\)为满秩的,否则称之为降秩的。
\[\mathrm{rank}(A)=n\Leftrightarrow \det(A)\ne 0. \]行满秩:对\(m\times n\)矩阵\(A\),如果\(\mathrm{rank}(A)=m\),则称\(A\)为行满秩的。
列满秩:对\(m\times n\)矩阵\(A\),如果\(\mathrm{rank}(A)=n\),则称\(A\)为列满秩的。
关于矩阵乘积的秩,有以下定理:
设\(A\in F^{m\times n}\),\(B\in F^{n\times p}\),则
\[\mathrm{rank}(AB)\le \min\{\mathrm{rank}(A),\mathrm{rank}(B)\}. \]设\(\mathrm{rank}(A)=r\),\(\mathrm{rank}(B)=s\),\(AB=C\)。任取\(C\)的\(r+1\)阶子式\(C\pmatrix{i_1,i_2,\cdots,i_{r+1}\\j_1,j_2,\cdots,j_{r+1}}\),由Binet-Cauchy公式,
\[C\pmatrix{i_1,i_2,\cdots,i_{r+1}\\j_1,j_2,\cdots,j_{r+1}}=\sum_{1\le k_1<\cdots<k_{r+1}\le n}A\pmatrix{i_1,i_2,\cdots,i_{r+1}\\k_1,k_2,\cdots,k_{r+1}}\pmatrix{k_1,k_2,\cdots,k_{r+1}\\j_1,j_2,\cdots,j_{r+1}}. \]因为\(A\)的每个\(r+1\)阶子式都为\(0\),所以\(C\pmatrix{i_1,i_2,\cdots,i_{r+1}\\j_1,j_2,\cdots,j_{r+1}}=0\),这说明\(\mathrm{rank}(C)\le r\),同理可证\(\mathrm{rank}(C)\le s\)。
设\(A\in F^{m\times n}\),\(P\in F^{m\times m}\),\(Q\in F^{n\times n}\)且\(P,Q\)都可逆,则
\[\mathrm{rank}(PAQ)=\mathrm{rank}(PA)=\mathrm{rank}(AQ)=\mathrm{rank}(A). \]即可逆矩阵不改变矩阵的秩。
由定理\(1\),
\[\mathrm{rank}(A)=\mathrm{rank}(P^{-1}PA)\le \mathrm{rank}(PA)\le \mathrm{rank}(A), \]其他可类似证明。
可逆矩阵不改变矩阵的秩,有一类特殊的可逆矩阵十分重要,它们代表一类基础的变换——初等变换。
初等变换:对矩阵\(A\)试下如下的行或列变换:
这些变换称为对矩阵\(A\)的初等行(或列)变换,简称初等变换。
初等方阵:与初等变换相对应的方阵称为初等方阵,每一种初等变换对应一个初等方阵。
显见初等方阵都是可逆的:\(P_{ij}^{-1}=P_{ji}\),\(Q_{ij}(a)^{-1}=Q_{ij}(-a)\),\(P_i(b)^{-1}=P_i(b^{-1})\)。事实上,用这些矩阵左乘矩阵\(A\)代表对矩阵\(A\)实行对应的行变换,右乘矩阵\(A\)代表对矩阵\(A\)实行对应的列变换。因初等方阵都是可逆的,所以初等变换不改变矩阵的秩。
现在我们给出本节的主要结论:
等秩变换:设\(m\times n\)矩阵\(A\)的秩为\(r\),则矩阵\(A\)可以经过有限次初等变换化为
\[\begin{pmatrix} I_{(r)} & 0 \\ 0 & 0 \end{pmatrix}. \]推论:设\(A\in F^{m\times n}\)且\(\mathrm{rank}(A)=r\),则存在可逆的\(P\in F^{m\times m}\)和\(Q\in F^{n\times n}\)使得
\[PAQ=\begin{pmatrix} I_{(r)} & 0 \\ 0 & 0 \end{pmatrix}. \]这里\(P\)代表对\(A\)执行的行变换总和,\(Q\)代表对\(A\)执行的列变换总和。
实际上,初等变换也完全刻画了可逆矩阵的性质,在下面的定理之后,我们将得出一个用于求矩阵的逆的方法。
可逆矩阵的性质:\(n\)阶方阵\(A\)可逆,等价于\(A\)可以表现为有限个初等方阵的乘积。
必要性:因\(A\)可逆,故\(\mathrm{rank}(A)=n\),从而存在初等矩阵\(P_i\)和\(Q_j\)使得
\[P_1P_2\cdots P_sAQ_1Q_2\cdots Q_t=I_{(n)}, \]因此
\[A=P_s^{-1}P_{s-1}^{-1}\cdots P_1^{-1}Q_t^{-1}Q_{t-1}^{-1}\cdots Q_1^{-1}. \]这表明\(A\)可表为有限个初等方阵的乘积。
充分性:有限个可逆矩阵的乘积仍可逆。
推论:\(n\)阶可逆方阵\(A\)可通过有限次初等行变换变为\(n\)阶单位阵。
由可逆矩阵的性质,
\[A=P_1P_2\cdots P_k, \]这里每一个\(P_i\)是可逆的,从而
\[P_k^{-1}P_{k-1}^{-1}\cdots P_1^{-1}A=I_{(n)}, \]这里每一个\(P_i^{-1}\)都是一个初等矩阵。
由此,我们可以求逆矩阵的方法:初等变换法。因对任何可逆矩阵\(A\),有\(P_1P_2\cdots P_kA=I\),因此\(A\)的逆矩阵就是\(A^{-1}=P_1P_2\cdots P_k=P_1P_2\cdots P_kI\)。这告诉我们,用将\(A\)变为单位阵的初等行变换,恰好可以把\(I\)变为\(A^{-1}\),这样我们就求得了\(A^{-1}\)。
相抵是一种等价关系,满足
在\(F^{m\times n}\)中,所有与\(A\)相抵的集合记作\(R_{A}\),称为\(A\)的相抵等价类。相抵等价类具有以下性质:
矩阵的秩是相抵等价类的全系不变量,即所有属于同一等价类的矩阵都具有相同的秩,因此判定两个矩阵是否相等,实际上只需要判定他们的秩是否相等。
相抵的充要条件:设\(A\in F^{m\times n}\),\(\mathrm{rank}(A)=r\),则矩阵\(A\)相抵于
\[\begin{pmatrix} I_{(r)} & 0 \\ 0 & 0 \end{pmatrix}, \]且\(A,B\)相抵的充要条件是\(\mathrm{rank}(A)=\mathrm{rank}(B)\)。
Hermite标准形:称矩阵\(A\),\(\mathrm{rank}(A)=r\)的Hermite标准形为
\[\begin{pmatrix} I_{(r)} & 0 \\ 0 & 0 \end{pmatrix}. \]Hermite标准形可以唯一刻画矩阵的秩状态,且其形状十分简单,因此应用广泛。
本节摘录书上的例题。
例1:\(m\times n\)矩阵列满秩的充要条件是,存在\(m\)阶可逆阵\(P\)使得
\[A=P\begin{pmatrix} I_{(n)} \\0 \end{pmatrix}. \]证明必要性。因\(A\)列满秩,故存在可逆的\(R\in F^{m\times m}\)和\(T\in F^{n\times n}\)使
\[A=R\begin{pmatrix} I_{(n)} \\ 0 \end{pmatrix}T, \]由分块矩阵的乘法有
\[A=R\begin{pmatrix} T \\ 0 \end{pmatrix}=R\begin{pmatrix} T & 0 \\ 0 & I_{(m-n)} \end{pmatrix}\begin{pmatrix} I_{(n)} \\ 0 \end{pmatrix}\xlongequal{def}P\begin{pmatrix} I_{(n)} \\ 0 \end{pmatrix}. \]容易证明\(P\)可逆。
例2(满秩分解定理):设\(A\in F^{m\times n}\),证明\(\mathrm{rank}(A)=r\ge 1\)的充要条件是,存在列满秩的\(m\times r\)矩阵和行满秩的\(r\times n\)矩阵\(C\),使得\(A=BC\)。
此定理表明,任何都能被分解为一个列满秩矩阵和一个行满秩矩阵的乘积。
有
\[A=P\begin{pmatrix} I_{(r)} & 0 \\ 0 & 0 \end{pmatrix}Q=P\begin{pmatrix} I_{(r)} \\ 0 \end{pmatrix}\begin{pmatrix} I_{(r)} & 0 \end{pmatrix} Q\xlongequal{def}BC. \]\(B\)和\(C\)分别是列满秩和行满秩的。
例3:证明\(n\)阶幂等矩阵\(A\)(\(A^2=A\))的秩等于它的迹。
设\(\mathrm{rank}(A)=r\),则存在\(n\)阶可逆阵\(P,Q\)使得
\[A=P\begin{pmatrix} I_{(r)} & 0 \\ 0 & 0 \end{pmatrix}Q, \]由\(A^2=A\)可得
\[\begin{pmatrix} I_{(r)} & 0 \\ 0 & 0 \end{pmatrix}QP\begin{pmatrix} I_{(r)} & 0 \\ 0 & 0 \end{pmatrix}=\begin{pmatrix} I_{(r)} & 0 \\ 0 & 0 \end{pmatrix}. \]记\(QP=R=\pmatrix{R_{11} & R_{12} \\ R_{21} & R_{22}}\),其中\(R_{11}\)是\(r\)阶方阵,则上式化为
\[\begin{pmatrix} R_{11} & 0 \\ 0 & 0 \end{pmatrix}=\begin{pmatrix} I_{(r)} & 0 \\ 0 & 0 \end{pmatrix}\Rightarrow R_{11}=I_{(r)}. \]于是
\[Q=\begin{pmatrix} I_{(r)} & R_{12} \\ R_{21} & R_{22} \end{pmatrix}P^{-1},\\ A=P\begin{pmatrix} I_{(r)} & 0 \\ 0 & 0 \end{pmatrix}\begin{pmatrix} I_{(r)} & R_{12} \\ R_{21} & R_{22} \end{pmatrix}P^{-1}=P\begin{pmatrix} I_{(r)} & R_{12} \\ 0 & 0 \end{pmatrix}P^{-1}, \]由迹的可交换性,我们有
\[\mathrm{tr}(A)=\mathrm{tr}\left(PP^{-1}\begin{pmatrix} I_{(r)} & R_{12} \\ 0 & 0 \end{pmatrix}\right)=r. \]
例4(Frobenius秩不等式):设\(A\in F^{m\times n}\),\(B\in F^{n\times p}\),\(C\in F^{p\times q}\),证明:
\[\mathrm{rank}(AB)+\mathrm{rank}(BC)-\mathrm{rank}(B)\le \mathrm{rank}(ABC). \]等号成立当且仅当以下两个矩阵相抵。
\[\begin{pmatrix} AB & 0 \\ 0 & BC \end{pmatrix},\quad \begin{pmatrix} AB & 0 \\ B & BC \end{pmatrix}. \]原秩不等式等价于
\[\mathrm{rank}\begin{pmatrix} AB & 0 \\ 0 & BC \end{pmatrix}\le \mathrm{rank}\begin{pmatrix} ABC & 0 \\ 0 & B \end{pmatrix}. \]由于
\[\begin{pmatrix} I_{(m)} & A \\ 0 & I_{(n)} \end{pmatrix}\begin{pmatrix} ABC & 0 \\ 0 & B \end{pmatrix}\begin{pmatrix} I_{(q)} & 0 \\ -C & I_{(p)} \end{pmatrix}\begin{pmatrix} 0 & -I_{(q)} \\ I_{(p)} & 0 \end{pmatrix}=\begin{pmatrix} AB & 0 \\ B & BC \end{pmatrix}, \]所以
\[\mathrm{rank}\begin{pmatrix} ABC & 0 \\ 0 & B \end{pmatrix}=\mathrm{rank}\begin{pmatrix} AB & 0 \\ B & BC \end{pmatrix}, \]也即
\[\mathrm{rank}\begin{pmatrix} AB & 0 \\ 0 & BC \end{pmatrix}\le \mathrm{rank}\begin{pmatrix} AB & 0 \\ B & BC \end{pmatrix}=\mathrm{rank}\begin{pmatrix} ABC & 0 \\ 0 & B \end{pmatrix}. \]原式得证。
特别当\(B\)取\(n\)阶单位阵时,得到Sylvester秩不等式:
\[\mathrm{rank}(A)+\mathrm{rank}(B)-n\le \mathrm{rank}(AB)\le \min\{\mathrm{rank}(A),\mathrm{rank}(B)\}. \]