对角化:代数重数与几何重数——如何证明特征值重数相等时矩阵可对角化?
嘿,这个问题是矩阵对角化判定里的核心结论之一,咱们一步步拆解证明过程,保证你能彻底搞明白~
在证明之前,先把两个核心定义掰扯清楚,避免混淆:
- 代数重数:特征值$\lambda$的代数重数,是它作为矩阵$A$特征多项式根的重数,记为$m_a(\lambda)$。简单说就是特征多项式里$(\lambda - \lambda_0)^k$的$k$值。
- 几何重数:特征值$\lambda$的几何重数,是对应特征子空间$E_\lambda = {x \mid Ax = \lambda x}$的维数,也就是齐次方程组$(A - \lambda I)x = 0$的解空间维度,记为$m_g(\lambda)$。
假设$A$是$n$阶方阵,所有互不相同的特征值为$\lambda_1, \lambda_2, ..., \lambda_k$,且对每个$i$,都满足$m_g(\lambda_i) = m_a(\lambda_i)$。我们要证明$A$可对角化,而可对角化的等价条件是:存在一组由$A$的特征向量构成的$\mathbb{R}n$(或$\mathbb{C}n$)的基,所以咱们就从构造这组基入手:
构造单个特征值的特征子空间基
对每个特征值$\lambda_i$,因为它的几何重数是$m_g(\lambda_i)$,所以我们能找到$E_{\lambda_i}$的一组基:$v_{i1}, v_{i2}, ..., v_{i,m_g(\lambda_i)}$,这组向量都是$A$的特征向量,且线性无关。组合所有特征子空间的基
把所有特征值对应的特征子空间基放在一起,得到一组向量:
$v_{11}, v_{12}, ..., v_{1,m_g(\lambda_1)}, v_{21}, ..., v_{k,m_g(\lambda_k)}$
这里有个关键前置结论:不同特征值对应的特征向量是线性无关的(后面我会补充这个结论的证明,先默认它成立)。验证总向量个数等于空间维度
特征多项式的次数是$n$,而所有特征值的代数重数之和等于$n$,也就是$\sum_{i=1}^k m_a(\lambda_i) = n$。结合题目条件$m_g(\lambda_i) = m_a(\lambda_i)$,这组向量的总个数就是$\sum_{i=1}^k m_g(\lambda_i) = n$。得出可对角化结论
这$n$个向量线性无关(由不同特征值特征向量线性无关+子空间基线性无关可得),正好构成$n$维空间的一组基,且每个向量都是$A$的特征向量。根据可对角化的定义,取$P$为这组基作为列向量组成的矩阵,那么$P^{-1}AP$就是对角矩阵,对角元就是对应的特征值,每个特征值出现的次数等于它的代数重数。
用数学归纳法来证,严谨性拉满:
- 当$k=1$时,单个特征向量非零,显然线性无关。
- 假设对于$k-1$个不同特征值的特征向量,结论成立。现在看$k$个的情况:
设$c_1v_1 + c_2v_2 + ... + c_kv_k = 0$,其中$Av_i = \lambda_i v_i$,且所有$\lambda_i$互不相同。
用$A$左乘等式两边,得到:$c_1\lambda_1v_1 + c_2\lambda_2v_2 + ... + c_k\lambda_kv_k = 0$。
把第一个等式乘以$\lambda_k$,再减去第二个等式,可得:
$c_1(\lambda_k - \lambda_1)v_1 + c_2(\lambda_k - \lambda_2)v_2 + ... + c_{k-1}(\lambda_k - \lambda_{k-1})v_{k-1} = 0$。
根据归纳假设,$v_1$到$v_{k-1}$线性无关,而$\lambda_k \neq \lambda_i$($i=1..k-1$),所以$c_1=c_2=...=c_{k-1}=0$。
代入最初的等式,得$c_kv_k=0$,又因为$v_k$是特征向量(非零),所以$c_k=0$。因此所有系数都为0,这$k$个向量线性无关。
内容的提问来源于stack exchange,提问作者MasaJuno




