Loading... # 换个视角理解矩阵向量乘法与线性变换 ## 从实例中观察矩阵向量乘法 对于矩阵$\boldsymbol{A} = \left(\begin{array}{cc}1 & 2\\3 & 4\\ 5 & 6\\\end{array}\right)$和向量$\boldsymbol{x} = \left(\begin{array}{c}1\\1\end{array}\right)$ , 由线性代数知识不难计算$\boldsymbol{Ax} = \boldsymbol{x} = \left(\begin{array}{c}3\\7\\11\end{array}\right)$, 从中可以看到, 对于二维空间中的一个点$\left(\begin{array}{c}1\\1\end{array}\right)$, 在经过矩阵$\boldsymbol{A}$的作用后映射到了三维空间的一个点$\left(\begin{array}{c}3\\7\\11\end{array}\right)$。也就是说, 矩阵向量乘法不仅改变了向量$\boldsymbol{x}$的位置,同时向量$\boldsymbol{x}$所在的空间也发生了变化。 ## 什么是线性变换 > 摘自百度百科:<br>线性空间V上的一个变换A称为线性变换,对于V中任意的元素**α**,**β**和数域P中任意k,都有<br>可加性:A(**α**+**β**)=A(**α**)+A(**β**)<br>同质性:A (k**α**)=kA(**α**) 从几何的角度来说, 线性变换表现的是直线的特性, 具有以下两个性质: - 变换前后零点不变 - 变换后还是直线 下面对这两个性质进行证明: - 变换前后零点不变: - 设$\boldsymbol{e_1, e_2, \cdots, e_n}$是线性空间$V$上的一组正交基, 由基向量的定义不难得到$\boldsymbol{x} = \boldsymbol{a_1e_1+a_2e_2+\cdots+a_ne_n}$可以表示线性空间$\boldsymbol{V}$上的所有的向量, 当$\boldsymbol{a_1 = a_2 = \cdots = a_n = 0}$时, 表示线性空间中的零点 - 由线性变换的可加性可得 $$ \begin{equation} \begin{aligned} A(\boldsymbol{x}) &= A(a_1 \boldsymbol{e_1} + a_2 \boldsymbol{e_2} + \cdots + a_n \boldsymbol{e_n}) \\ &= a_1 A(\boldsymbol{e_1}) + a_2 A(\boldsymbol{e_2}) + \cdots + a_n A(\boldsymbol{e_n}) \end{aligned} \tag{1} \end{equation} $$ - 当$\boldsymbol{a_1 = a_2 = \cdots = a_n = 0}$时, $A(\boldsymbol{x})$仍然是线性空间中的零点 - 变换后还是直线: - 要证明 线性变换后直线仍然是直线,可以从线性变换保持加法运算和数乘运算的角度出发。 - 在线性空间中,一条经过点 $\boldsymbol{p}$,方向向量为 $\boldsymbol{d}$的直线可以用参数方程表示: $$ \begin{equation} \boldsymbol{x} = \boldsymbol{p} + t \boldsymbol{d}, \quad t \in \mathbb{R} \tag{2} \end{equation} $$ 这表示 $\boldsymbol{x} $在直线上,并且沿着方向 $\boldsymbol{d}$ 变化。 - 设线性变换 $A:V\rightarrow V$作用于 $\boldsymbol{x}$,我们看看变换后的点集: $$ \begin{equation} \begin{aligned} A(\boldsymbol{x}) &= A(\boldsymbol{p} + t \boldsymbol{d})\\ &=A(\boldsymbol{p}) + A(t \boldsymbol{d})\\ &= A(\boldsymbol{p}) + t A(\boldsymbol{d}) \end{aligned} \tag{3} \end{equation} $$ - 上面的式子表明,$A(\boldsymbol{x})$ 依然是一个点 $A(\boldsymbol{p}) $加上一个参数$t$乘以方向向量 $A(\boldsymbol{d})$,它的形式和直线方程完全相同: $$ \boldsymbol{x}' = A(\boldsymbol{p}) + t A(\boldsymbol{d}) $$ ## 如何理解矩阵向量乘法 假设某个线性变换使得原始基向量$\left(\begin{array}{c}1 \\0\end{array}\right)$和$\left(\begin{array}{c}0 \\1\end{array}\right)$变换为新的基向量$\left(\begin{array}{c}a \\c\end{array}\right)$和$\left(\begin{array}{c}b \\d\end{array}\right)$,那么原来的任一向量$\left(\begin{array}{c}x \\y\end{array}\right)$就会变换为目标向量$x\left(\begin{array}{c}a \\c\end{array}\right) + y\left(\begin{array}{c}b \\d\end{array}\right)$。如果将变换后基向量$\left(\begin{array}{c}a \\c\end{array}\right)$和$\left(\begin{array}{c}b \\d\end{array}\right)$的坐标放在一个$2×2$的格子里,得到一个$2×2$的矩阵$\left(\begin{array}{cc}a & b \\c & d\end{array}\right)$,这个矩阵就描述了这个线性变换,其中矩阵的每一列就表示线性变换之后的基向量的去向即: $$ \left(\begin{array}{cc}a & b \\c & d\end{array}\right)\left(\begin{array}{c}x \\y\end{array}\right) =x\left(\begin{array}{c}a \\c\end{array}\right) + y\left(\begin{array}{c}b \\d\end{array}\right)=\left(\begin{array}{c}ax+by \\cx+dy\end{array}\right) $$ 一般来说,矩阵$A$具有$m$行和$n$列,向量$\boldsymbol{x}$是一个$n$维列向量,那么矩阵$A$与向量$\boldsymbol{x}$的乘法$A\boldsymbol{x}$的结果就是,将原始基向量变换为矩阵$A$的各列,用矩阵$A$的各列作为新的基向量,向量$\boldsymbol{x}$的各元素分别作为对应的系数,最终可以得到$A\boldsymbol{x}$的结果: $$ \left( \begin{array}{cccc} a_{11} & a_{12} & \cdots & a_{1n}\\ a_{21} & a_{22} & \cdots & a_{2n}\\ \cdots & \cdots & \cdots & \cdots\\ a_{m1} & a_{m2} & \cdots & a_{mn}\\ \end{array} \right) \left( \begin{array}{c} x_{1}\\ x_{2}\\ \cdots\\ x_{n}\\ \end{array} \right) = x_1 \left( \begin{array}{c} a_{11}\\ a_{21}\\ \cdots\\ a_{n1}\\ \end{array} \right)+ x_2 \left( \begin{array}{c} a_{12}\\ a_{22}\\ \cdots\\ a_{n2}\\ \end{array} \right)+ \cdots+ x_n \left( \begin{array}{c} a_{1n}\\ a_{2n}\\ \cdots\\ a_{nn}\\ \end{array} \right) $$ 设$A_i=\left(\begin{array}{c}a_{1i} \\ a_{2i} \\ \cdots \\ a_{mi}\end{array}\right)$,$A=\left(\begin{array}{cccc}A_1 & A_2 & \cdots & A_n\end{array}\right)$, 矩阵$A$的秩为$k$, 且$1 \leq k \leq n$, 矩阵向量乘法实际上是将原向量空间$V$中的向量$\boldsymbol{x}$映射到矩阵$A$的列向量所对应的线性空间$V^{'}$当中, 其中线性空间$V^{'}$的基向量为矩阵$A$的所有列向量中线性无关的向量的个数, 即为矩阵的秩。 最后修改:2025 年 03 月 07 日 © 允许规范转载 赞 如果觉得我的文章对你有用,请随意赞赏