矩阵几何重数与代数重数不等时的具象含义是什么？

阿华AIGC实验室

2026-5-19

为啥几何重数≠代数重数时矩阵不能对角化？说点人话帮你理解

别盯着那些干巴巴的定义死磕啦，我给你从线性变换的本质上掰扯清楚——其实你纠结的不是“不可对角化”这个结论，而是这个结论背后，矩阵对应的变换到底在空间里搞了什么事情。

先把两个“重数”翻译成大白话

代数重数：某个特征值λ，在特征多项式里“重复出现的次数”，说白了就是解方程det(A-λI)=0时，λ是几次根。比如矩阵[[2,1],[0,2]]的特征多项式是(λ-2)²=0，那λ=2的代数重数就是2。
几何重数：对应λ的线性无关特征向量的个数，也就是满足Av=λv的所有向量构成的子空间的维数。还是上面那个矩阵，解Av=2v只能得到v=[k, 0]^T（k是任意常数），所以几何重数是1。

当两者不等时，到底发生了什么？

对角化的核心是什么？是我们能找到n个线性无关的特征向量当基，这样矩阵在这个基下就变成对角矩阵——这意味着这个线性变换可以拆成“沿着每个基向量的方向单独缩放”，各个方向完全独立，互不干扰。

但如果几何重数＜代数重数，比如刚才的例子，λ=2代数重数2，几何重数1，这就说明：

这个线性变换里，只有1个方向的向量被缩放后不会跑偏（就是x轴方向的向量），但还有一个维度的向量，被变换后不仅会被缩放，还会“蹭到”那个不变的方向上，没法独立存在。

拿这个矩阵作用在向量[x,y]^T上算一遍你就懂了：
A[x,y]^T = [2x+y, 2y]^T = 2*[x,y]^T + [y, 0]^T
看到没？只要y≠0，变换后的向量除了被2倍缩放，还多了一个x轴方向的分量[y,0]^T——这就是“剪切”效果，这个方向的向量没法单独被缩放，必须“依赖”x轴方向的向量。

换句话说，这个线性变换没法把整个空间拆成两个独立的“不变子空间”，只能拆出一个1维的不变子空间（x轴），剩下的部分和这个子空间是“纠缠”在一起的——这就是Jordan块描述的那种“广义特征向量”场景，你可以理解成这个变换带有“扭曲”的成分，不是纯粹的各方向独立缩放。

再给你个直观的几何例子

想象你在平面上：

对角矩阵比如[[3,0],[0,2]]，就是把x轴方向的点拉长3倍，y轴方向的点拉长2倍，两个方向完全独立，互不影响，就像调整图片的宽高比。
而[[2,1],[0,2]]呢？它是把整个平面“沿着x轴拉伸2倍，同时把y轴方向的点往x轴方向推”——你找不到第二个方向，让这个方向上的点只被拉伸不被推，所以没法用对角矩阵来描述这个变换。