矩阵在抽象向量空间中可表示为列向量的原理困惑及技术问询
最近我解决了这么一道线性代数题:
设 $V = \mathbb{R}^{2\times 2}$,基为
$\mathbf{B} = (\mathbf{b_1}, \mathbf{b_2}, \mathbf{b_3}, \mathbf{b_4})$,其中
$\mathbf{b_1} = \begin{pmatrix}1 & 0\0 & 0\end{pmatrix}$
$\mathbf{b_2} = \begin{pmatrix}0 & 0\1 & 0\end{pmatrix}$
$\mathbf{b_3} = \begin{pmatrix}0 & 1\0 & 0\end{pmatrix}$
$\mathbf{b_4} = \begin{pmatrix}0 & 0\0 & 1\end{pmatrix}$
因此 $\dim(V) = 4$。映射 $f: V \mapsto V$ 定义为 $f(A) = A^{T}C$,其中 $C = \begin{bmatrix}1 &3 \2& 4\end{bmatrix}$,该映射是线性的。求 $M_{\mathbf{B} \leftarrow \mathbf{B}}$
算出来的结果是:
$M_{\mathbf{B} \leftarrow \mathbf{B}} = \begin{pmatrix}1 & 2 & 0 & 0\0 & 0 & 1 & 2\3 &4 & 0 & 0\0 & 0 & 3 & 4\end{pmatrix}$
虽然我知道这类题的解法,但我始终搞不懂为什么矩阵在抽象向量空间里能被表示成列向量。我明白在这个例子里必须转成列向量,因为直接用变换矩阵乘原矩阵(比如 $\begin{pmatrix}1 & 2 & 0 & 0\0 & 0 & 1 & 2\3 &4 & 0 & 0\0 & 0 & 3 & 4\end{pmatrix}\begin{pmatrix}1 & 0\0 & 0\end{pmatrix}$)根本没法计算,但换成列向量($\begin{pmatrix}1 & 2 & 0 & 0\0 & 0 & 1 & 2\3 &4 & 0 & 0\0 & 0 & 3 & 4\end{pmatrix}\begin{pmatrix}1 \0 \0 \0 \\end{pmatrix}$)就可以运算了。
我之前看过相关帖子,但还是没完全搞懂。我知道矩阵确实满足抽象向量空间的公理,但把一个二阶矩阵 $\begin{pmatrix}a & b\c & d\end{pmatrix}$ 转换成列向量 $\begin{pmatrix}a \c \b \d \\end{pmatrix}$ 的操作,总感觉有点“违和”,没法从直觉上接受。
有没有大佬能帮我梳理清楚这个点?万分感谢!
我的理解与解答
其实这个转换本质上就是**“坐标化”**的过程,核心是把抽象的向量空间元素,转换成我们熟悉的、能进行矩阵运算的数值数组,说白了就是给每个向量(这里就是二阶矩阵)贴个“坐标标签”。
我给你拆解几个关键点:
向量空间的本质是“集合+运算”:不管元素是矩阵、多项式还是函数,只要满足向量空间的8条公理,它就是一个向量空间。$\mathbb{R}^{2\times2}$ 里的每个二阶矩阵,和 $\mathbb{R}^4$ 里的每个4维列向量,本质上是同构的——你可以把它们看成是同一个“东西”的两种不同写法,只是表现形式不一样。
基的作用就是“坐标系”:题目里给的基 $\mathbf{B}$ 就像$\mathbb{R}4$里的标准基$\mathbf{e_1}=(1,0,0,0)T,\mathbf{e_2}=(0,1,0,0)^T,...$。当我们把矩阵 $\begin{pmatrix}a & b\c & d\end{pmatrix}$ 写成 $a\mathbf{b_1} + c\mathbf{b_2} + b\mathbf{b_3} + d\mathbf{b_4}$ 时,系数 $(a,c,b,d)$ 就是这个矩阵在基$\mathbf{B}$下的坐标,把坐标写成列向量的形式,只是为了方便和线性变换的矩阵做乘法——这是我们约定俗成的运算规则。
为什么转换后感觉“违和”? 因为你习惯了矩阵作为“变换工具”的身份,现在突然把它当成“被变换的对象”,还拆成列向量,肯定会有点不适应。但换个角度想:如果我们把二阶矩阵看成是一个“装了4个数字的盒子”,基$\mathbf{B}$就是规定了盒子里数字的取出顺序——先取左上,再取下左,再取右上,最后取下右,然后把这四个数字排成一列,就是它的坐标向量。这个顺序完全是由基的定义决定的,如果题目里的基顺序换成$\mathbf{b_1},\mathbf{b_3},\mathbf{b_2},\mathbf{b_4}$,那坐标向量就会变成$\begin{pmatrix}a \b \c \d \\end{pmatrix}$了,本质上还是同一个矩阵的坐标。
线性变换矩阵的意义:$M_{\mathbf{B} \leftarrow \mathbf{B}}$ 这个矩阵的作用,就是把一个元素在基$\mathbf{B}$下的坐标,转换成这个元素经过$f$变换后,在基$\mathbf{B}$下的新坐标。所以我们必须用坐标向量来和它相乘,因为它本身就是基于坐标定义出来的矩阵。
举个简单的例子验证:你有一个矩阵$\mathbf{b_1}=\begin{pmatrix}1&0\0&0\end{pmatrix}$,它在基$\mathbf{B}$下的坐标是$\begin{pmatrix}1\0\0\0\end{pmatrix}$,用变换矩阵乘这个坐标,得到$\begin{pmatrix}1\0\3\0\end{pmatrix}$,对应的矩阵就是$1\mathbf{b_1}+0\mathbf{b_2}+3\mathbf{b_3}+0\mathbf{b_4}=\begin{pmatrix}1&3\0&0\end{pmatrix}$,而你直接计算$f(\mathbf{b_1})=\mathbf{b_1}TC=\begin{pmatrix}1&0\0&0\end{pmatrix}T\begin{pmatrix}1&3\2&4\end{pmatrix}=\begin{pmatrix}1&3\0&0\end{pmatrix}$,结果完全一致,这就说明坐标转换是有效的。
其实说白了,这个转换就是一种“翻译”,把抽象空间里的元素翻译成我们能进行数值运算的语言,核心是保持线性运算的一致性——加法和数乘的结果在两种表示下是对应的,这就是同构的意义。
备注:内容来源于stack exchange,提问作者Anonymous73648




