Loading... # 换个视角理解线性方程组的求解 ## 解线性方程组究竟在干什么 公式$(1)$为一个典型的线性方程组 $$ \left\{\begin{array}{c} a_{11}x_1 + a_{12}x_2+a_{13}x_3+\cdots+a_{1n}x_n=b_1\\ a_{21}x_1 + a_{22}x_2+a_{23}x_3+\cdots+a_{2n}x_n=b_2\\ a_{31}x_1 + a_{32}x_2+a_{33}x_3+\cdots+a_{3n}x_n=b_3\\ \cdot\\ \cdot\\ a_{m1}x_1 + a_{m2}x_2+a_{m3}x_3+\cdots+a_{mn}x_n=b_m\\ \end{array}\right. \tag{1} $$ 对于如上图所示的线性方程组, 我们可以将其写为矩阵的形式 $$ \left( \begin{array}{ccccc} a_{11} & a_{12} & a_{13} & \cdots & a_{1n}\\ a_{21} & a_{22} & a_{23} & \cdots & a_{2n}\\ a_{31} & a_{32} & a_{33} & \cdots & a_{3n}\\ \cdots & \cdots & \cdots & \cdots & \cdots\\ a_{m1} & a_{m2} & a_{m3} & \cdots & a_{mn}\\ \end{array} \right) \left( \begin{array}{c} x_1 \\ x_2 \\ x_3 \\ \cdots \\ x_n \end{array} \right) = \left( \begin{array}{c} b_1 \\ b_2 \\ b_3 \\ \cdots \\ b_m \end{array} \right) \tag{2} $$ 记作 $$ \boldsymbol{A}\boldsymbol{x} = \boldsymbol{b} \tag{3} $$ 由上一小结不难得知, 矩阵向量乘法实际上是将当前向量$X$投影到矩阵$A$的各个列向量决定的基向量对应的线性空间中, 因此, 可以认为:解线性方程组就是寻找在当前的线性空间$V$中合适的向量$X$, 其在矩阵$A$所对应的线性空间$V^{'}$中所对应的映射为$b$ ## 直观理解线性方程组的解 为了更好的从空间视角理解$\boldsymbol{Ax} = \boldsymbol{b}$, 需要解释下面几个空间的含义 - 原始空间:$\boldsymbol{x}$所在的空间称为原始空间 - 列空间:$\boldsymbol{A}$的$n$个列向量的线性组合所对应的空间称之为矩阵$\boldsymbol{A}$的列空间$C(\boldsymbol{A})$, 这$n$个列向量之间线性无关的向量的数量称之为列空间$C(\boldsymbol{A})$的维度$r$, 也就是矩阵的秩, 显然有$r < m$和$r < n$ - 待解空间:$\boldsymbol{b}$所在的空间称为待解空间 不难发现, 当且仅当向量$\boldsymbol{b}$可以写成矩阵$\boldsymbol{A}$的列向量的线性组合的情况下, 方程组才可能会存在解, 也就是说, 当且仅当向量$\boldsymbol{b}$位于矩阵$\boldsymbol{A}$的列空间的情况下才有解 ### 线性方程组有解 由上面的分析可得, 线性方程组有解的条件为向量$\boldsymbol{b}$可以写成矩阵$\boldsymbol{A}$的列向量的线性组合, 具体来说分为以下两种情况: - 当列空间$C(\boldsymbol{A})$的维度$r$大于等于待解空间的维度$m$(等于好理解, 对于大于的解释为:高维一定可以表示低维), 即$r \geq m$,又根据$r \leq m$, 应有$r = m$, 即当列空间的维度$r$和待解空间的维度$m$相同时, 则一定有解。<br>这种情况对应我们线代课程中所学的系数矩阵的秩$R(\boldsymbol{A})$等于增广矩阵的秩$R(\boldsymbol{A|b})$等于$m$ - 当列空间$C(\boldsymbol{A})$的维度$r$小于待解空间的维度$m$, 但是向量$\boldsymbol{b}$可以由矩阵$\boldsymbol{A}$的列向量线性表示<br>这种情况对应我们线代课程中所学的系数矩阵的秩$R(\boldsymbol{A})$等于增广矩阵的秩$R(\boldsymbol{A|b})$等于$k$,且$k < m$ 综上所述, 线性方程组有解的条件为向量$\boldsymbol{b}$可以写成矩阵$\boldsymbol{A}$的列向量的线性组合, 等价于系数矩阵的秩$R(\boldsymbol{A})$等于增广矩阵的秩$R(\boldsymbol{A|b})$ #### 线性方程组有无穷多解 当向量$\boldsymbol{b}$可以由矩阵$\boldsymbol{A}$的列向量的线性组合来表示, 且列空间的维度$r$小于原始空间的维度$n$时,线性方程组有无穷多的解。此时对于任意一个向量$\boldsymbol{b}$, 可以由无数个位于同一个$n - r$维子空间的向量$\boldsymbol{x}$映射到列空间$C(\boldsymbol{A})$中得到, 因此此时方程有无穷多解。<br>为什么有无穷多个向量$\boldsymbol{x}$?答:因为这是将高维空间的向量映射到低维空间, 在映射过程中发生了坍缩, 因此会出现高维空间上的多个向量映射到低维空间的同一个向量的情况(可以理解为三维空间内的一个面都可以投影到二维空间上的一个点),所以一定有无限多个解。 ##### 零空间$N(\boldsymbol{A})$ 由线性代数的知识可知, 在求解线性方程组时, 如果线性方程组有无穷多解, 则起其通解的形式为特解和零解的线性组合, 因此在这里引入零空间$N(\boldsymbol{A})$的概念: - 如果一个线性变换将空间压缩到低维度(比如将三维空间压缩到二维空间上)上,那么就有很多个向量在变换后落在原点(沿$z$轴方向的所有向量都会被压缩到原点)。变换后,使得它们落在原点的向量的集合,称为“零空间”或者“核”。 - 换而言之, 零空间是所有的经过矩阵$\boldsymbol{A}$变换后为零向量的$\boldsymbol{x}$的集合, 即$\{x | \boldsymbol{Ax = 0}\}$ - 线性方程组的零空间的维度为$N(\boldsymbol{A}) = n - r$ 因此, 当线性方程组的零空间的维度大于零, 线性方程组有无穷多解, 其所有解为特解在零空间方向上延伸所得到的向量的集合。 #### 线性方程组有唯一解 由零空间的定义不难发现, 当$r \leq m < n$且向量$\boldsymbol{b}$可以由矩阵$\boldsymbol{A}$的列向量线性表示时, 线性方程组一定有无穷多解。 因此为了保证线性方程组有唯一解, 就需要保证线性方程组的零空间的维度为$0$, 即有$n = r$; 此时如果$r < m$,向量$\boldsymbol{b}$可以由矩阵$\boldsymbol{A}$的列向量的线性组合唯一表示, 下面着重讨论$r = m$的情况, 此时$\boldsymbol{A}$为$n$阶方阵。 ##### 逆矩阵的本质 根据上一小节的内容, 我们可以知道矩阵作为一种线性变换也是一种函数, 用于将原始的向量从$n$维空间变换到$r$维空间当中。这为我们求解线性方程提供了一定的启发:既然矩阵$\boldsymbol{A}$作为一种线性变换是一个函数, 那么是否存在一个反函数$A^{-1}$使得$\boldsymbol{A^{-1}Ax = x}$呢, 这也就引出了逆矩阵的概念。 正如反函数的存在需要一定的条件一样, 逆矩阵的存在也需要一定的条件:可以想象, 如果一个高维($n$维)的向量被映射到一个低维($r$维)的空间, 在这个映射过程中一定会损失部分信息, 因此无法从一个低维向量去反推原始的高维向量。 因此, 为了保证可以反推原始的向量, 至少需要列空间$C(\boldsymbol{A})$的维度$r$大于等于原始空间的维度$n$, 又因为$r \leq n$, 因此有$r = n$。同理也需要列空间$C(\boldsymbol{A})$的维度$r$大于等于待解空间的维度$m$, 因此有$r = m$, 由此我们可以得到, 当且仅当矩阵$\boldsymbol{A}$为**方阵**, 且列向量的极大无关组为$n$的条件下, 才存在逆矩阵 ##### 唯一解是什么 在$\boldsymbol{A}$为$n$阶方阵且$r = n$的情况下, 唯一解$x = \boldsymbol{A^{-1}b}$ ### 线性方程组没有解 显然, 当向量$\boldsymbol{b}$不可以写成矩阵$\boldsymbol{A}$的列向量的线性组合的情况下, 即系数矩阵的秩小于增广矩阵的秩的情况下, 线性方程组没有解。 最后修改:2025 年 03 月 13 日 © 允许规范转载 赞 如果觉得我的文章对你有用,请随意赞赏