矩阵在抽象向量空间中可表示为列向量的原理困惑及技术问询

阿华AIGC实验室

2026-4-23

最近我解决了这么一道线性代数题：

设 $V = \mathbb{R}^{2\times 2}$，基为
$\mathbf{B} = (\mathbf{b_1}, \mathbf{b_2}, \mathbf{b_3}, \mathbf{b_4})$，其中
$\mathbf{b_1} = \begin{pmatrix}1 & 0\0 & 0\end{pmatrix}$
$\mathbf{b_2} = \begin{pmatrix}0 & 0\1 & 0\end{pmatrix}$
$\mathbf{b_3} = \begin{pmatrix}0 & 1\0 & 0\end{pmatrix}$
$\mathbf{b_4} = \begin{pmatrix}0 & 0\0 & 1\end{pmatrix}$
因此 $\dim(V) = 4$。映射 $f: V \mapsto V$ 定义为 $f(A) = A^{T}C$，其中 $C = \begin{bmatrix}1 &3 \2& 4\end{bmatrix}$，该映射是线性的。求 $M_{\mathbf{B} \leftarrow \mathbf{B}}$

算出来的结果是：
$M_{\mathbf{B} \leftarrow \mathbf{B}} = \begin{pmatrix}1 & 2 & 0 & 0\0 & 0 & 1 & 2\3 &4 & 0 & 0\0 & 0 & 3 & 4\end{pmatrix}$

虽然我知道这类题的解法，但我始终搞不懂为什么矩阵在抽象向量空间里能被表示成列向量。我明白在这个例子里必须转成列向量，因为直接用变换矩阵乘原矩阵（比如 $\begin{pmatrix}1 & 2 & 0 & 0\0 & 0 & 1 & 2\3 &4 & 0 & 0\0 & 0 & 3 & 4\end{pmatrix}\begin{pmatrix}1 & 0\0 & 0\end{pmatrix}$）根本没法计算，但换成列向量（$\begin{pmatrix}1 & 2 & 0 & 0\0 & 0 & 1 & 2\3 &4 & 0 & 0\0 & 0 & 3 & 4\end{pmatrix}\begin{pmatrix}1 \0 \0 \0 \\end{pmatrix}$）就可以运算了。

我之前看过相关帖子，但还是没完全搞懂。我知道矩阵确实满足抽象向量空间的公理，但把一个二阶矩阵 $\begin{pmatrix}a & b\c & d\end{pmatrix}$ 转换成列向量 $\begin{pmatrix}a \c \b \d \\end{pmatrix}$ 的操作，总感觉有点“违和”，没法从直觉上接受。

有没有大佬能帮我梳理清楚这个点？万分感谢！

我的理解与解答

其实这个转换本质上就是**“坐标化”**的过程，核心是把抽象的向量空间元素，转换成我们熟悉的、能进行矩阵运算的数值数组，说白了就是给每个向量（这里就是二阶矩阵）贴个“坐标标签”。

我给你拆解几个关键点：

向量空间的本质是“集合+运算”：不管元素是矩阵、多项式还是函数，只要满足向量空间的8条公理，它就是一个向量空间。$\mathbb{R}^{2\times2}$ 里的每个二阶矩阵，和 $\mathbb{R}^4$ 里的每个4维列向量，本质上是同构的——你可以把它们看成是同一个“东西”的两种不同写法，只是表现形式不一样。
基的作用就是“坐标系”：题目里给的基 $\mathbf{B}$ 就像$\mathbb{R}^{4$里的标准基$\mathbf{e_1}=(1,0,0,0)}T,\mathbf{e_2}=(0,1,0,0)^T,...$。当我们把矩阵 $\begin{pmatrix}a & b\c & d\end{pmatrix}$ 写成 $a\mathbf{b_1} + c\mathbf{b_2} + b\mathbf{b_3} + d\mathbf{b_4}$ 时，系数 $(a,c,b,d)$ 就是这个矩阵在基$\mathbf{B}$下的坐标，把坐标写成列向量的形式，只是为了方便和线性变换的矩阵做乘法——这是我们约定俗成的运算规则。
为什么转换后感觉“违和”？ 因为你习惯了矩阵作为“变换工具”的身份，现在突然把它当成“被变换的对象”，还拆成列向量，肯定会有点不适应。但换个角度想：如果我们把二阶矩阵看成是一个“装了4个数字的盒子”，基$\mathbf{B}$就是规定了盒子里数字的取出顺序——先取左上，再取下左，再取右上，最后取下右，然后把这四个数字排成一列，就是它的坐标向量。这个顺序完全是由基的定义决定的，如果题目里的基顺序换成$\mathbf{b_1},\mathbf{b_3},\mathbf{b_2},\mathbf{b_4}$，那坐标向量就会变成$\begin{pmatrix}a \b \c \d \\end{pmatrix}$了，本质上还是同一个矩阵的坐标。
线性变换矩阵的意义：$M_{\mathbf{B} \leftarrow \mathbf{B}}$ 这个矩阵的作用，就是把一个元素在基$\mathbf{B}$下的坐标，转换成这个元素经过$f$变换后，在基$\mathbf{B}$下的新坐标。所以我们必须用坐标向量来和它相乘，因为它本身就是基于坐标定义出来的矩阵。

举个简单的例子验证：你有一个矩阵$\mathbf{b_1}=\begin{pmatrix}1&0\0&0\end{pmatrix}$，它在基$\mathbf{B}$下的坐标是$\begin{pmatrix}1\0\0\0\end{pmatrix}$，用变换矩阵乘这个坐标，得到$\begin{pmatrix}1\0\3\0\end{pmatrix}$，对应的矩阵就是$1\mathbf{b_1}+0\mathbf{b_2}+3\mathbf{b_3}+0\mathbf{b_4}=\begin{pmatrix}1&3\0&0\end{pmatrix}$，而你直接计算$f(\mathbf{b_1})=\mathbf{b_1}^{TC=\begin{pmatrix}1&0\0&0\end{pmatrix}}T\begin{pmatrix}1&3\2&4\end{pmatrix}=\begin{pmatrix}1&3\0&0\end{pmatrix}$，结果完全一致，这就说明坐标转换是有效的。

其实说白了，这个转换就是一种“翻译”，把抽象空间里的元素翻译成我们能进行数值运算的语言，核心是保持线性运算的一致性——加法和数乘的结果在两种表示下是对应的，这就是同构的意义。

备注：内容来源于stack exchange，提问作者Anonymous73648