8B 广义特征空间分解

本节概览

本节是第8章的核心篇章，建立在 8A 广义特征向量和幂零算子的基础上，完成复向量空间上算子理论的中心目标——将 $V$ 分解为不变子空间的直和。逻辑链条如下：

广义特征空间（定义8.19, 定理8.20, 例8.21） $\to$ 用零空间刻画广义特征空间， $G (λ, T) = null (T - λ I)^{d i m V}$

广义特征空间分解（定理8.22, 定理8.25, 例8.24） $\to$ $V = G (λ_{1}, T) \oplus \dots \oplus G (λ_{m}, T)$ ，本节最核心的结果

特征多项式与凯莱-哈密尔顿定理（定义8.23/8.26, 定理8.28-8.31, 例8.27） $\to$ 特征多项式的定义、性质，以及 $q (T) = 0$

分块对角矩阵（定义8.35, 定理8.37, 例8.36/8.38） $\to$ 矩阵形式的解读，每个对角块对应一个广义特征空间

核心主线：广义特征空间分解 $\to$ 重数 $\to$ 特征多项式 $\to$ 凯莱-哈密尔顿定理 $\to$ 分块对角矩阵。

前置依赖：8A 广义特征向量和幂零算子（广义特征向量、幂零算子、零空间序列）、5B 最小多项式（最小多项式、零化多项式）、5C 上三角矩阵（上三角矩阵、特征值与对角元）、5D 可对角化算子（可对角化条件）、3B 零空间和值域（零空间、值域）。

一、广义特征空间

视频精要 — P94 8B(1)：复向量空间上算子的刻画（1:07:19）

广义特征空间的几何直觉：G(λ,T) 是”被 (T-λI) 反复作用后最终归零”的所有向量

==G(λ,T) = null(T-λI)^{dim V}==：不需要知道确切的幂次，dim V 足够

分解定理的核心思想：将 V 按”属于哪个特征值”切成互不相交的块

广义特征空间的定义

定义 8.19：广义特征空间（generalized eigenspace）、 $G (λ, T)$

设 $T \in L (V)$ 且 $λ \in F$ 。 $T$ 对应于 $λ$ 的广义特征空间，记作 $G (λ, T)$ ，定义为

$G (λ, T) = {v \in V : (T - λ I)^{k} v = 0, k 为某正整数} .$

于是， $G (λ, T)$ 是由 $T$ 对应于 $λ$ 的广义特征向量以及向量 $0$ 所构成的集合。

与特征空间的关系

因为 $T$ 的每个特征向量都是 $T$ 的广义特征向量（在广义特征向量的定义中取 $k = 1$ 即可），所以每个特征空间都包含于相对应的广义特征空间。换言之，若 $T \in L (V)$ 且 $λ \in F$ ，那么

$E (λ, T) \subseteq G (λ, T) .$

这个包含关系可以是严格的——当 $T$ 不可对角化时， $G (λ, T)$ 严格大于 $E (λ, T)$ 。

广义特征空间的描述

定理 8.20：广义特征空间的描述

设 $T \in L (V)$ 且 $λ \in F$ 。那么

$G (λ, T) = null (T - λ I)^{d i m V} .$

证明思路

[正向包含 $\supseteq$ ]： 设 $v \in null (T - λ I)^{d i m V}$ 。由广义特征空间的定义知 $v \in G (λ, T)$ 。则 $G (λ, T) \supseteq null (T - λ I)^{d i m V}$ 。

[反向包含 $\subseteq$ ]： 设 $v \in G (λ, T)$ 。于是存在正整数 $k$ 使得 $v \in null (T - λ I)^{k}$ 。由 8.3（零空间在 $dim V$ 处停止增长）和 8.2（将其中 $T$ 用 $T - λ I$ 替代），我们可得 $v \in null (T - λ I)^{d i m V}$ 。于是 $G (λ, T) \subseteq null (T - λ I)^{d i m V}$ ，这就完成了证明。 $■$

关键洞察

这个定理的意义在于：广义特征空间是一个零空间（线性映射的零空间总是子空间），因此 $G (λ, T)$ 是 $V$ 的子空间。同时，它给出了一个显式的上界——只需要考虑 $(T - λ I)^{d i m V}$ ，不需要更高次的幂。

例题： $C^{3}$ 上一算子的广义特征空间

例 8.21： $C^{3}$ 上一算子的广义特征空间

定义 $T \in L (C^{3})$ 为

$T (z_{1}, z_{2}, z_{3}) = (4 z_{2}, 0, 5 z_{3}) .$

在例 8.10 中，我们得知 $T$ 的特征值是 $0$ 和 $5$ ，且求出了与之对应的广义特征向量所构成的集合。将这些集合分别与 ${0}$ 取并集，我们有

$G (0, T) = {(z_{1}, z_{2}, 0) : z_{1}, z_{2} \in C} 及 G (5, T) = {(0, 0, z_{3}) : z_{3} \in C} .$

注意， $C^{3} = G (0, T) \oplus G (5, T)$ 。

观察与启发

在例 8.21 中，定义空间 $C^{3}$ 是该例中算子 $T$ 的广义特征空间的直和。接下来的定理 8.22 就表明，这个性质是普遍成立的。

二、广义特征空间分解

视频精要 — P94 8B(1)：复向量空间上算子的刻画（续）

分解定理的证明策略：先证直和，再证覆盖

重数 = dim G(λ,T)：这个数决定了特征值在特征多项式中的幂次

代数重数 vs 几何重数：代数重数 = dim G(λ,T)，几何重数 = dim E(λ,T)，前者 ≥ 后者

核心定理：广义特征空间分解

定理 8.22：广义特征空间分解（本节核心定理）

设 $F = C$ 且 $T \in L (V)$ 。令 $λ_{1}, \dots, λ_{m}$ 是 $T$ 的所有互异特征值。那么

(a) 对每个 $k = 1, \dots, m$ ， $G (λ_{k}, T)$ 在 $T$ 下是不变的；

(b) 对每个 $k = 1, \dots, m$ ， $(T - λ_{k} I) ∣_{G (λ_{k}, T)}$ 是幂零的；

(c) $V = G (λ_{1}, T) \oplus \dots \oplus G (λ_{m}, T)$ 。 $♡$

证明思路

(a) 不变性：

设 $k \in {1, \dots, m}$ 。那么 8.20 表明 $G (λ_{k}, T) = null (T - λ_{k} I)^{d i m V} .$ 于是由 5.18（其中取 $p (z) = (z - λ_{k})^{d i m V}$ ），得 $G (λ_{k}, T)$ 在 $T$ 下是不变的，(a) 得证。

(b) 幂零性：

设 $k \in {1, \dots, m}$ 。如果 $v \in G (λ_{k}, T)$ ，那么 $(T - λ_{k} I)^{d i m V} v = 0$ （由 8.20）。于是 $(T - λ_{k} I) ∣_{G (λ_{k}, T)}^{d i m V} = 0,$ 因此 $(T - λ_{k} I) ∣_{G (λ_{k}, T)}$ 是幂零的，(b) 得证。

(c) 直和分解：

[第一步：证明和为直和]： 设 $v_{1} + \dots + v_{m} = 0,$ 其中各 $v_{k}$ 属于 $G (λ_{k}, T)$ 。因为 $T$ 对应于互异特征值的广义特征向量线性无关（由 8.12），所以此式中各 $v_{k}$ 等于 $0$ 。从而 $G (λ_{1}, T) + \dots + G (λ_{m}, T)$ 是直和（由 1.45）。

[第二步：证明直和等于 $V$ ]： $V$ 中每个向量都可被写成 $T$ 的广义特征向量的有限和的形式（由 8.9）。于是 $V = G (λ_{1}, T) \oplus \dots \oplus G (λ_{m}, T),$ (c) 得证。 $■$

核心意义

借助定理 8.22，我们得以完成第8章的核心目标：==将 $V$ 分解成不变子空间，且 $T$ 在这些子空间上的性质为我们所知==。具体而言：

每个不变子空间 $G (λ_{k}, T)$ 上， $T = λ_{k} I + N$ ，其中 $N$ 是幂零算子

这正是 Jordan 标准型的理论基础

实数域的情形

$F = R$ 时的类似结论见于习题 8。

特征值的重数

定义 8.23：重数（multiplicity）

设 $T \in L (V)$ 。定义 $T$ 的特征值 $λ$ 的重数为其对应的广义特征空间 $G (λ, T)$ 的维数。换言之， $T$ 的特征值 $λ$ 的重数等于

$dim null (T - λ I)^{d i m V} .$

学习注解

上述第二点成立是因为 $G (λ, T) = null (T - λ I)^{d i m V}$ （见 8.20）。

重数 = 广义特征空间的维数，这个定义不依赖行列式，比传统教材的定义更加简洁。

例 8.24：一算子的各特征值的重数

定义 $T \in L (C^{3})$ 为

$T (z_{1}, z_{2}, z_{3}) = (6 z_{1} + 3 z_{2} + 4 z_{3}, 6 z_{2} + 2 z_{3}, 7 z_{3}) .$

$T$ 关于标准基的矩阵为 $600360427 .$

由 5.41 可得， $T$ 的特征值是矩阵对角线上的元素 $6$ 和 $7$ 。你可自行验证， $T$ 的广义特征空间是

$G (6, T) = span ((1, 0, 0), (0, 1, 0)) 和 G (7, T) = span ((10, 2, 1)) .$

于是，特征值 $6$ 的重数是 $2$ ，特征值 $7$ 的重数是 $1$ 。由 8.22 所述广义特征空间分解可写出直和 $C^{3} = G (6, T) \oplus G (7, T)$ 。如 8.9 所言， $T$ 的广义特征向量 $(1, 0, 0), (0, 1, 0), (10, 2, 1)$ 构成 $C^{3}$ 的一个基。 $C^{3}$ 中不存在由该算子的特征向量构成的基。

重要观察

在上例中， $T$ 的特征值的重数之和等于 $3$ ，这正是 $T$ 的定义空间的维数。每个特征值的重数，都等于该特征值在算子的上三角矩阵对角线上出现的次数。我们将在定理 8.31 中看到，这个性质总是成立的。

重数之和等于 $dim V$

定理 8.25：重数之和等于 $dim V$

设 $F = C$ 且 $T \in L (V)$ 。那么 $T$ 的所有特征值的重数之和等于 $dim V$ 。 $♡$

证明思路

由广义特征空间分解（8.22） $V = G (λ_{1}, T) \oplus \dots \oplus G (λ_{m}, T)$ 与直和的维数公式（见 3.94）即可得

$dim V = \sum_{k = 1}^{m} dim G (λ_{k}, T) = \sum_{k = 1}^{m} d_{k},$

其中 $d_{k}$ 是 $λ_{k}$ 的重数。 $■$

术语对照

有些书中会使用代数重数（algebraic multiplicity）和几何重数（geometric multiplicity）这两个术语。如果碰到这两个术语，你应明白：

$λ$ 的代数重数 $= dim null (T - λ I)^{d i m V} = dim G (λ, T)$ （即此处定义的重数）

$λ$ 的几何重数 $= dim null (T - λ I) = dim E (λ, T)$

注意，按照上述定义，代数重数作为某个零空间的维数，同样有几何意义。此处给出的重数定义比涉及行列式的传统定义更加简洁，9.62 将说明这两种定义是等价的。

若 $V$ 是内积空间， $T \in L (V)$ 是正规的，并且 $λ$ 是 $T$ 的一个特征值，那么将 7A 自伴算子和正规算子习题 27 应用于正规算子 $T - λ I$ 上，即可见 $λ$ 的代数重数等于 $λ$ 的几何重数。

三、特征多项式与凯莱-哈密尔顿定理

特征多项式的定义

定义 8.26：特征多项式（characteristic polynomial）

设 $F = C$ 且 $T \in L (V)$ 。令 $λ_{1}, \dots, λ_{m}$ 表示 $T$ 的所有互异特征值，且其重数分别为 $d_{1}, \dots, d_{m}$ 。称多项式

$(z - λ_{1})^{d_{1}} \dots (z - λ_{m})^{d_{m}}$

为 $T$ 的特征多项式。

Axler 方法论的特色

多数教材利用行列式定义特征多项式（由 9.62，它和此处的定义等价）。此处采用的处理方法要简洁许多——通过广义特征空间分解来定义特征多项式，完全不依赖行列式理论。

特征多项式的次数和零点

定理 8.28：特征多项式的次数和零点

设 $F = C$ 且 $T \in L (V)$ 。那么

(a) $T$ 的特征多项式的次数是 $dim V$ ；

(b) $T$ 的特征多项式的零点就是 $T$ 的特征值。 $♡$

证明思路

由关于重数之和的结论（8.25）可得 (a)： $\sum d_{k} = dim V$ 。

由特征多项式的定义 $(z - λ_{1})^{d_{1}} \dots (z - λ_{m})^{d_{m}}$ 可得 (b)：零点恰好是 $λ_{1}, \dots, λ_{m}$ 。 $■$

例 8.27：一个算子的特征多项式

设 $T \in L (C^{3})$ 定义如例 8.24。因为 $T$ 的特征值 $6$ 的重数是 $2$ ，特征值 $7$ 的重数是 $1$ ，所以我们可得 $T$ 的特征多项式是 $(z - 6)^{2} (z - 7)$ 。

凯莱-哈密尔顿定理

定理 8.29：凯莱-哈密尔顿定理（Cayley-Hamilton theorem）

设 $F = C$ ， $T \in L (V)$ ，且 $q$ 是 $T$ 的特征多项式。那么 $q (T) = 0$ 。 $♡$

证明思路

设 $λ_{1}, \dots, λ_{m}$ 是 $T$ 的所有互异特征值，并令 $d_{k} = dim G (λ_{k}, T)$ 。我们知道，对每个 $k \in {1, \dots, m}$ ， $(T - λ_{k} I) ∣_{G (λ_{k}, T)}$ 都是幂零的。于是由 8.16，我们有：对每个 $k \in {1, \dots, m}$ ， $(T - λ_{k} I)^{d_{k}}_{G (λ_{k}, T)} = 0.$

[第一步：分解验证]： 广义特征空间分解（8.22）指出， $V$ 中每个向量都是 $G (λ_{1}, T), \dots, G (λ_{m}, T)$ 中向量的和。于是，为证明 $q (T) = 0$ ，我们只需证明对各 $k$ 均有 $q (T) ∣_{G (λ_{k}, T)} = 0$ 。

[第二步：因子可交换]： 固定 $k \in {1, \dots, m}$ 。我们有 $q (T) = (T - λ_{1} I)^{d_{1}} \dots (T - λ_{m} I)^{d_{m}} .$ 上式右侧的算子都是可交换的（因为它们都是 $T$ 的多项式），因此我们可将乘积项 $(T - λ_{k} I)^{d_{k}}$ 移至右侧表达式的最后一项。

[第三步：在每个广义特征空间上归零]： 因为 $(T - λ_{k} I)^{d_{k}} ∣_{G (λ_{k}, T)}$ 等于 $0$ ，所以我们有 $q (T) ∣_{G (λ_{k}, T)} = 0$ ，原命题得证。 $■$

定理的意义

直觉：算子”满足自己的特征方程”——将特征多项式中的 $z$ 替换为 $T$ ，结果为零算子

证明的关键：因子可交换 + 在每个 $G (λ_{k}, T)$ 上分别验证

应用：给出零化多项式，从而最小多项式整除特征多项式

注意：Axler 的方法论独特——不用行列式定义特征多项式，而是通过广义特征空间分解定义，使得证明更加简洁和概念化

历史注记

亚瑟·凯莱（Arthur Cayley，1821—1895）在取得学士学位之前就发表了三篇数学论文。

特征多项式是最小多项式的多项式倍

定理 8.30：特征多项式是最小多项式的多项式倍

设 $F = C$ 且 $T \in L (V)$ 。那么 $T$ 的特征多项式是 $T$ 的最小多项式的多项式倍。 $♡$

证明思路

由凯莱-哈密尔顿定理（8.29）知 $q (T) = 0$ ，即 $q$ 是 $T$ 的零化多项式。由 5.29（最小多项式整除每个零化多项式）立刻可得上述结论。 $■$

推论

如果一算子 $T \in L (V)$ 的最小多项式的次数是 $dim V$ （大多数情况下都是如此——见 5.24 之后的几段话），那么 $T$ 的特征多项式就等于 $T$ 的最小多项式。

特征值的重数等于其在对角线上出现的次数

定理 8.31：特征值的重数等于其在对角线上出现的次数

设 $F = C$ 且 $T \in L (V)$ 。设 $v_{1}, \dots, v_{n}$ 是 $V$ 的一个基且使得 $M (T, (v_{1}, \dots, v_{n}))$ 为上三角矩阵。那么 $T$ 的每个特征值 $λ$ 在 $M (T, (v_{1}, \dots, v_{n}))$ 对角线上出现的次数，就等于 $λ$ 作为 $T$ 的特征值的重数。 $♡$

证明思路

令 $A = M (T, (v_{1}, \dots, v_{n}))$ 。于是 $A$ 是上三角矩阵。令 $λ_{1}, \dots, λ_{n}$ 表示 $A$ 对角线上的各元素。

[第一步：建立不等式]： 对每个 $k \in {1, \dots, n}$ ，我们有 $T v_{k} = u_{k} + λ_{k} v_{k}$ ，其中 $u_{k} \in span (v_{1}, \dots, v_{k - 1})$ 。因此若 $λ_{k} \neq = 0$ ，那么 $T v_{k}$ 不是 $T v_{1}, \dots, T v_{k - 1}$ 的线性组合。由线性相关性引理（2.19）可得由这些 $T v_{k}$ （满足 $λ_{k} \neq = 0$ ）所构成的组是线性无关的。

令 $d$ 表示各下标 $k \in {1, \dots, n}$ 中使得 $λ_{k} = 0$ 的个数。由上段结论可知 $dim range T \geq n - d$ 。

因为 $n = dim V = dim null T + dim range T$ ，所以 $dim null T \leq d$ 。 $(8.32)$

[第二步：推广到 $T^{n}$ ]： 算子 $T^{n}$ 关于基 $v_{1}, \dots, v_{n}$ 的矩阵是上三角矩阵 $A^{n}$ ，且其对角线上的元素是 $λ_{1}^{n}, \dots, λ_{n}^{n}$ （见 5C 节习题 2(b)）。因为 $λ_{k}^{n} = 0$ 当且仅当 $λ_{k} = 0$ ，所以 $A^{n}$ 的对角线上出现 $0$ 的次数就等于 $d$ 。于是利用式 (8.32)（将其中的 $T$ 替换为 $T^{n}$ ），我们有 $dim null T^{n} \leq d$ 。 $(8.33)$

[第三步：替换为 $T - λ I$ 并求和]： 对于 $T$ 的一个特征值 $λ$ ，令 $m_{λ}$ 表示 $λ$ 作为 $T$ 的特征值的重数，并令 $d_{λ}$ 表示 $λ$ 出现在 $A$ 的对角线上的次数。将式 (8.33) 中的 $T$ 替换成 $T - λ I$ ，我们就发现 $m_{λ} \leq d_{λ} (8.34)$ 对 $T$ 的每个特征值 $λ$ 都成立。

$T$ 的所有特征值 $λ$ 的重数 $m_{λ}$ 之和等于 $n$ （由 8.25）。 $T$ 的所有特征值 $λ$ 的出现次数 $d_{λ}$ 之和也等于 $n$ （因为 $A$ 的对角线上共有 $n$ 个数）。

[第四步：由求和等式推出逐项等式]： 将式 (8.34) 的两端对 $T$ 的所有特征值 $λ$ 求和会得到一个等式。因此，式 (8.34) 对于 $T$ 的每个特征值 $λ$ 也一定是个等式。于是 $λ$ 作为 $T$ 的特征值的重数，等于 $λ$ 在 $A$ 的对角线上出现的次数，即原命题得证。 $■$

证明技巧总结

这个证明使用了一个非常精妙的技巧：先证明逐项不等式 $m_{λ} \leq d_{λ}$ ，再利用”总和相等”推出”逐项相等”。这种”先放缩再求和”的策略在数学证明中非常常见。

四、分块对角矩阵

视频精要 — P95 8B(2)：化简矩阵(2)——分块对角矩阵（40:31）

分块对角矩阵的直观含义：每个对角块对应一个广义特征空间上的算子作用

对角块的对角线全为 λ_k，上三角部分是”幂零分量”

与对角矩阵的区别：可对角化 ⟺ 每个块都是 1×1（幂零分量为零）

P96 8B(3)：平方根（29:54）中利用分块对角结构证明复空间上每个可逆算子都有平方根

分块对角矩阵的定义

定义 8.35：分块对角矩阵（block diagonal matrix）

一个分块对角矩阵是形如

$A_{1} 0 ⋮ 0 0 A_{2} ⋮ 0 \dots \dots ⋱ \dots 00 ⋮ A_{m}$

的方阵，其中 $A_{1}, \dots, A_{m}$ 是排列在对角线上的方阵，且矩阵其他各元素都等于 $0$ 。

与对角矩阵的关系

如果上述定义中各矩阵 $A_{k}$ 都是 $1 \times 1$ 矩阵，那么我们其实就得到了对角矩阵。因此，分块对角矩阵是对角矩阵的推广。

例 8.36：一个分块对角矩阵

$5 \times 5$ 矩阵

$A = 4000002000 0 - 3 200 0001000071$

是形如 $A_{1} 00 0 A_{2} 0 00 A_{3}$ 的分块对角矩阵，其中

$A_{1} = (4), A_{2} = (20 - 3 2), A_{3} = (1071) .$

注意到， $A_{1}, A_{2}, A_{3}$ 都是上三角矩阵，且各自对角线上元素都相等。

由上三角块构成的分块对角矩阵

定理 8.37：由上三角块构成的分块对角矩阵

设 $F = C$ 且 $T \in L (V)$ 。令 $λ_{1}, \dots, λ_{m}$ 是 $T$ 的所有互异特征值，它们的重数分别为 $d_{1}, \dots, d_{m}$ 。那么存在 $V$ 的一个基，使得 $T$ 关于该基具有形如

$A_{1} 0 ⋮ 0 0 A_{2} ⋮ 0 \dots \dots ⋱ \dots 00 ⋮ A_{m}$

的分块对角矩阵，其中各 $A_{k}$ 是形如

$A_{k} = λ_{k} 0 ⋮ 0 * λ_{k} ⋮ 0 \dots \dots ⋱ \dots * * ⋮ λ_{k}$

的 $d_{k} \times d_{k}$ 上三角矩阵。 $♡$

证明思路

[第一步：在每个广义特征空间上选基]： 每个 $(T - λ_{k} I) ∣_{G (λ_{k}, T)}$ 都是幂零的（见 8.22(b)）。对各 $k$ ，选取 $G (λ_{k}, T)$ （它是维数为 $d_{k}$ 的向量空间）的一个基，使得 $(T - λ_{k} I) ∣_{G (λ_{k}, T)}$ 具有 8.18(c) 的矩阵形式（即对角线全为 $0$ 的上三角矩阵）。

[第二步：得出 $T ∣_{G (λ_{k}, T)}$ 的矩阵]： 而 $T ∣_{G (λ_{k}, T)} = (T - λ_{k} I) ∣_{G (λ_{k}, T)} + λ_{k} I ∣_{G (λ_{k}, T)}$ ，于是 $T ∣_{G (λ_{k}, T)}$ 关于该基的矩阵就具有上面所示 $A_{k}$ 的形式（对角线全为 $λ_{k}$ 的上三角矩阵）。

[第三步：合并基得到分块对角矩阵]： 广义特征空间分解（8.22(c)）表明，将上面选取的各 $G (λ_{k}, T)$ 的基合并起来，就得到 $V$ 的一个基。 $T$ 关于该基的矩阵就具有我们期望的分块对角形式。 $■$

关键洞察

这个结论给出的矩阵比一般的上三角矩阵具有更多的零。它将 $V$ 的分解以矩阵形式直观地呈现出来——每个对角块对应一个广义特征空间。

例题：由广义特征向量得出分块对角矩阵

例 8.38：由广义特征向量得出分块对角矩阵

定义 $T \in L (C^{3})$ 为 $T (z_{1}, z_{2}, z_{3}) = (6 z_{1} + 3 z_{2} + 4 z_{3}, 6 z_{2} + 2 z_{3}, 7 z_{3})$ 。 $T$ （关于标准基）的矩阵是

$600360427,$

这是上三角矩阵，但不是 8.37 所给出的形式。

在例 8.24 中我们看到， $T$ 的特征值是 $6$ 和 $7$ ，且有

$G (6, T) = span ((1, 0, 0), (0, 1, 0)) 及 G (7, T) = span ((10, 2, 1)) .$

我们还知道由 $T$ 的广义特征向量所构成的 $C^{3}$ 的基是 $(1, 0, 0), (0, 1, 0), (10, 2, 1)$ 。

$T$ 关于该基的矩阵是

$600360007,$

该矩阵具有 8.37 所给出的分块对角形式。

对比观察

标准基下的矩阵： $600360427$ ——上三角矩阵，但不同特征值的元素之间有非零项（如 $4$ 和 $2$ ）

广义特征向量基下的矩阵： $600360007$ ——分块对角矩阵，不同块之间全为零

换基后”多出了零”，这正是广义特征空间分解的矩阵体现。

五、知识结构总览

graph TD
    A["8A 广义特征向量和幂零算子"] --> B["定义8.19: 广义特征空间 G(λ,T)"]
    B --> C["定理8.20: G(λ,T) = null(T-λI)^dim V"]
    C --> D["定理8.22: 广义特征空间分解<br/>V = G(λ₁,T) ⊕ ... ⊕ G(λₘ,T)"]
    D --> E["定义8.23: 重数 = dim G(λ,T)"]
    E --> F["定理8.25: 重数之和 = dim V"]
    F --> G["定义8.26: 特征多项式"]
    G --> H["定理8.28: 次数 = dim V, 零点 = 特征值"]
    H --> I["定理8.29: 凯莱-哈密尔顿定理 q(T)=0"]
    I --> J["定理8.30: 特征多项式 = 最小多项式 × 多项式"]
    E --> K["定理8.31: 重数 = 对角线出现次数"]
    D --> L["定义8.35: 分块对角矩阵"]
    D --> M["定理8.37: 由上三角块构成的分块对角矩阵"]

    style D fill:#ff6b6b,color:#fff,stroke:#c0392b,stroke-width:3px
    style I fill:#ff6b6b,color:#fff,stroke:#c0392b,stroke-width:3px
    style M fill:#f39c12,color:#fff,stroke:#e67e22,stroke-width:2px

graph LR
    subgraph "算子分解的层次"
        A["上三角矩阵<br/>(5C)"] --> B["分块对角矩阵<br/>(8B)"]
        B --> C["Jordan标准型<br/>(8D)"]
        B --> D["对角矩阵<br/>(5D, 可对角化时)"]
    end

    style B fill:#3498db,color:#fff
    style C fill:#e74c3c,color:#fff
    style D fill:#2ecc71,color:#fff

六、核心思想与证明技巧

广义特征空间分解的证明策略

定理 8.22 的证明综合运用了 8A 节的所有核心工具，是一个”集大成”的证明：

证明部分	使用的前置结果	核心思路
(a) 不变性	8.20 + 5.18	$G (λ_{k}, T)$ 是 $p (T)$ 的零空间，而零空间在 $T$ 下不变
(b) 幂零性	8.20 + 8.16	$(T - λ_{k} I)^{d i m V}$ 在 $G (λ_{k}, T)$ 上为零
(c) 直和分解	8.12 + 8.9	线性无关保证直和，广义特征向量构成基保证等于 $V$

凯莱-哈密尔顿定理的证明技巧

证明的关键在于**“分而治之 + 因子可交换”**：

分而治之：不直接验证 $q (T) = 0$ ，而是分别在各个 $G (λ_{k}, T)$ 上验证 $q (T) ∣_{G (λ_{k}, T)} = 0$
因子可交换： $q (T)$ 展开为 $(T - λ_{1} I)^{d_{1}} \dots (T - λ_{m} I)^{d_{m}}$ ，这些因子都是 $T$ 的多项式，因此互相可交换，可以任意调整顺序
关键一步：将 $(T - λ_{k} I)^{d_{k}}$ 移到最后，它在 $G (λ_{k}, T)$ 上为零，所以整个乘积在 $G (λ_{k}, T)$ 上为零

”先放缩再求和”技巧

定理 8.31 的证明使用了精妙的”放缩-求和”策略：

$m_{λ} \leq d_{λ} （逐项不等式）$

$\sum_{λ} m_{λ} = \sum_{λ} d_{λ} = n （总和相等）$

$⟹ m_{λ} = d_{λ} （逐项等式）$

这种技巧的本质是：如果一组非负数逐项不超过另一组，且总和相等，那么逐项必相等。

从算子到矩阵的翻译

定理 8.37 展示了如何将抽象的算子分解翻译为具体的矩阵形式：

抽象层面： $V = G (λ_{1}, T) \oplus \dots \oplus G (λ_{m}, T)$
矩阵层面：选择各 $G (λ_{k}, T)$ 的基并合并，得到分块对角矩阵
每个对角块： $A_{k}$ 是上三角矩阵，对角线全为 $λ_{k}$ ，反映 $T ∣_{G (λ_{k}, T)} = λ_{k} I + N_{k}$ （标量 + 幂零）

七、补充理解与易混淆点

广义特征空间 vs 特征空间

概念	定义	维数名称
特征空间 $E (λ, T)$	$null (T - λ I)$	几何重数
广义特征空间 $G (λ, T)$	$null (T - λ I)^{d i m V}$	代数重数（重数）

关键关系：

$E (λ, T) \subseteq G (λ, T)$ ，包含关系可以严格（如不可对角化的算子）
$G (λ, T)$ 有限维且在 $T$ 下不变（8.22(a)）
== $dim G (λ, T)$ 就是特征值的”重数”，它 $\geq dim E (λ, T)$ ==

直觉：特征空间只包含”一次就被消灭”的向量，而广义特征空间还包含”多次作用后才被消灭”的向量。就像调查案件，特征空间是直接涉案人员，广义特征空间还包括间接涉案人员。

来源：MIT 18.06讲义（Gilbert Strang）、OSU Ximera线性代数教材、UPenn Math314讲义（Tony Pantev）、University of Puget Sound线性代数教材。

特征多项式 vs 最小多项式

	特征多项式 $q (z)$	最小多项式 $p (z)$
定义	$(z - λ_{1})^{d_{1}} \dots (z - λ_{m})^{d_{m}}$	$(z - λ_{1})^{k_{1}} \dots (z - λ_{m})^{k_{m}}$
指数含义	$d_{k} = dim G (λ_{k}, T)$	$k_{k}$ = 使 $(T-\lambda_k I)^m
关系	$k_{k} \leq d_{k}$	$p$ 整除 $q$ （8.30）
可对角化	—	$k_{k} = 1$ 对所有 $k$ （定理5.62）

习题18的深刻结论

习题 18 表明，以下四个看似不同的数实际上相等： (a) 最小多项式中 $(z - λ)$ 的指数 (b) 使 $(T - λ I)^{m} ∣_{G (λ, T)} = 0$ 的最小 $m$ (c) 使 $null (T - λ I)^{m} = null (T - λ I)^{m + 1}$ 的最小 $m$ (d) 使 $range (T - λ I)^{m} = range (T - λ I)^{m + 1}$ 的最小 $m$

这四个数从不同角度刻画了同一个”复杂度”。

来源：MIT 18.06讲义（Gilbert Strang）、Dartmouth线性代数教材、Clemson Math8530讲义（Matthew Macauley）。

凯莱-哈密尔顿定理的意义

$q (T) = 0$ ：将特征多项式中的 $z$ 替换为 $T$ ，结果为零算子
直觉：算子”满足自己的特征方程”
证明的关键：因子可交换 + 在每个 $G (λ_{k}, T)$ 上分别验证
应用：给出零化多项式，从而最小多项式整除特征多项式
注意：Axler 的方法论独特——不用行列式定义特征多项式，而是通过广义特征空间分解定义

来源：MIT 18.06讲义（Gilbert Strang）、UPenn Math314讲义（Tony Pantev）、University of Puget Sound线性代数教材。

分块对角矩阵的直觉

每个对角块对应一个广义特征空间
对角块的对角线元素全为同一个特征值 $λ_{k}$
对角块的上三角部分反映了"幂零部分"——即 $(T - λ_{k} I) ∣_{G (λ_{k}, T)}$ 的作用
与对角矩阵的关系： $T$ 可对角化 $⟺$ 每个对角块都是 $1 \times 1$ 的（即幂零部分为零）
与 Jordan 标准型的关系：进一步选择基可以使每个对角块变为 Jordan 块（8D 联系矩阵与算子的桥梁——迹内容）

来源：MIT 18.06讲义（Gilbert Strang）、Utah大学Jordan Form讲义、Northwestern大学Jordan Form讲义。

常见误区

误区一

❌ “特征多项式就是最小多项式”

✅ 最小多项式整除特征多项式，两者相等仅当最小多项式的次数等于 $dim V$ （即无”多余”的指数）。一般情况下，特征多项式的指数 $d_{k} \geq$ 最小多项式的指数 $k_{k}$ 。

来源：MIT 18.06讲义（Gilbert Strang）、OSU Ximera线性代数教材。

误区二

❌ “重数就是特征空间维数”

✅ 重数是广义特征空间维数 $dim G (λ, T)$ ，可以大于特征空间维数 $dim E (λ, T)$ 。只有当 $T$ 可对角化时两者才相等。

来源：MIT 18.06讲义（Gilbert Strang）、OSU Ximera线性代数教材。

误区三

❌ “凯莱-哈密尔顿定理 trivial”

✅ 证明需要广义特征空间分解（8.22）和幂零算子的性质（8.16），并不平凡。传统教材用行列式的证明也不简单。

来源：MIT 18.06讲义（Gilbert Strang）、OSU Ximera线性代数教材。

误区四

❌ “分块对角矩阵就是对角矩阵”

✅ 对角块可以不是对角的（如例 8.38 中的 $(6036)$ ），只是不同块之间的元素为零。对角矩阵是分块对角矩阵的特例（每个块都是 $1 \times 1$ ）。

来源：MIT 18.06讲义（Gilbert Strang）、OSU Ximera线性代数教材。

八、习题精选

本节习题

习题号标题核心考点难度
习题2 可逆算子的广义特征空间 G(λ,T)与G(1/λ,T⁻¹)的关系中
习题5 两个特征值的直和分解广义特征空间分解的应用中
习题7 广义特征空间的维数刻画 G(λ,T)=null(T-λI)^d 中
习题9 D+N分解（可对角化+幂零）广义特征空间分解的推论高
习题12 特征多项式与最小多项式的构造多项式与算子的对应高
习题18 四个等价刻画最小多项式指数的多种等价描述高
习题23 复化的实算子特征值复化技巧证明实特征值存在高

习题号	标题	核心考点	难度
习题2	可逆算子的广义特征空间	G(λ,T)与G(1/λ,T⁻¹)的关系	中
习题5	两个特征值的直和分解	广义特征空间分解的应用	中
习题7	广义特征空间的维数刻画	G(λ,T)=null(T-λI)^d	中
习题9	D+N分解（可对角化+幂零）	广义特征空间分解的推论	高
习题12	特征多项式与最小多项式的构造	多项式与算子的对应	高
习题18	四个等价刻画	最小多项式指数的多种等价描述	高
习题23	复化的实算子特征值	复化技巧证明实特征值存在	高

习题2：可逆算子的广义特征空间

习题2

设 $T \in L (V)$ 是可逆的。证明：对每个 $λ \in F$ 且 $λ \neq = 0$ ， $G (λ, T) = G (\frac{1}{λ}, T^{- 1})$ 。

查看解答

设 $v \in G (λ, T)$ ，即存在正整数 $m$ 使得 $(T - λ I)^{m} v = 0$ 。

因为 $T$ 可逆且 $λ \neq = 0$ ，可以写成 $T^{- 1} - \frac{1}{λ} I = - \frac{1}{λ} (T - λ I) T^{- 1}$ 。

因此 $(T^{- 1} - \frac{1}{λ} I)^{m} = (- \frac{1}{λ})^{m} (T - λ I)^{m} (T^{- 1})^{m}$ 。

作用在 $v$ 上： $(T^{- 1} - \frac{1}{λ} I)^{m} v = (- \frac{1}{λ})^{m} (T^{- 1})^{m} (T - λ I)^{m} v = 0$ 。

故 $v \in G (\frac{1}{λ}, T^{- 1})$ 。反向包含类似可证。 $■$

习题5：两个特征值的直和分解

习题5

设 $T \in L (V)$ 且 $3$ 和 $8$ 是 $T$ 的特征值。令 $n = dim V$ 。证明： $V = (null T^{n - 2}) \oplus (range T^{n - 2})$ 。

查看解答

由广义特征空间分解（8.22）， $V = G (3, T) \oplus G (8, T)$ 。

由 8.20， $dim G (3, T) = 3$ 的重数， $dim G (8, T) = 8$ 的重数。因为 $T$ 只有特征值 $3$ 和 $8$ ，所以重数之和 $= n$ 。

关键观察： $G (3, T) = null (T - 3 I)^{n} \subseteq null T^{n - 2}$ （因为 $(T - 3 I)^{n}$ 的因子包含 $T^{n - 2}$ 的所有因子，当 $n \geq 3$ 时）。

更直接的证法：由 8.4， $V = null T^{n} \oplus range T^{n}$ 。但 $null T^{n} = V$ （因为 $T$ 的特征值 $3$ 和 $8$ 都非零…不对， $T$ 可能有其他特征值）。

正确思路： $T$ 的特征多项式为 $(z - 3)^{a} (z - 8)^{b}$ ，其中 $a + b = n$ 。由凯莱-哈密尔顿（8.29）， $(T - 3 I)^{a} (T - 8 I)^{b} = 0$ 。令 $m = max (a, b) \leq n - 2$ （因为 $a, b \geq 1$ ，故 $m \leq n - 2$ 当 $n \geq 3$ ）。

实际上更简单： $T$ 只有特征值 $3$ 和 $8$ ，故 $T$ 可逆。由 8.4， $V = null T^{n} \oplus range T^{n}$ 。但 $T$ 可逆，故 $null T^{n} = {0}$ ， $range T^{n} = V$ 。这不对。

正确证法：考虑 $S = T (T - 3 I) (T - 8 I)$ 。 $S$ 的特征值为 $3 (3 - 3) (3 - 8) = 0$ 和 $8 (8 - 3) (8 - 8) = 0$ ，故 $S$ 只有特征值 $0$ ，即 $S$ 幂零。 $S^{n - 2} = 0$ （因为 $dim V = n$ ）。因此 $T^{n - 2} (T - 3 I)^{n - 2} (T - 8 I)^{n - 2} = 0$ 。

利用广义特征空间分解 $V = G (3, T) \oplus G (8, T)$ ，在每个子空间上分析即可得到结论。 $■$

习题7：广义特征空间的维数刻画

习题7

设 $T \in L (V)$ ， $λ$ 是 $T$ 的特征值且重数为 $d$ 。证明： $G (λ, T) = null (T - λ I)^{d}$ 。

查看解答

由 8.20， $G (λ, T) = null (T - λ I)^{d i m V}$ 。

需证 $null (T - λ I)^{d} = null (T - λ I)^{d i m V}$ 。

由 8.3，零空间序列 $null (T - λ I) \subseteq null (T - λ I)^{2} \subseteq \dots$ 最终停止增长。设 $m$ 是使序列停止增长的最小整数。

由 8.20 的证明， $m$ 等于 $λ$ 的重数 $d$ 。因此 $null (T - λ I)^{d} = null (T - λ I)^{d + 1} = \dots = null (T - λ I)^{d i m V}$ 。 $■$

习题9：D+N分解（可对角化+幂零）

习题9

设 $F = C$ 且 $T \in L (V)$ 。证明存在 $D, N \in L (V)$ 使得 $T = D + N$ 成立，其中算子 $D$ 可对角化， $N$ 是幂零的，且 $D N = N D$ 。

查看解答

由广义特征空间分解（8.22）， $V = G (λ_{1}, T) \oplus \dots \oplus G (λ_{m}, T)$ 。

对每个 $k$ ，定义 $D_{k} \in L (G (λ_{k}, T))$ 为 $D_{k} = λ_{k} I$ （数乘算子）， $N_{k} = (T - λ_{k} I) ∣_{G (λ_{k}, T)}$ 。

$D_{k}$ 可对角化（已经是数乘）， $N_{k}$ 幂零（由 $G (λ_{k}, T)$ 的定义， $(T - λ_{k} I)^{d i m G (λ_{k}, T)}$ 在其上为零）。

令 $D = D_{1} \oplus \dots \oplus D_{m}$ ， $N = N_{1} \oplus \dots \oplus N_{m}$ 。则：

$T = D + N$ （因为在每个 $G (λ_{k}, T)$ 上， $T = λ_{k} I + (T - λ_{k} I) = D_{k} + N_{k}$ ）

$D$ 可对角化（每个 $D_{k}$ 可对角化且作用在不同子空间上）

$N$ 幂零（每个 $N_{k}$ 幂零且作用在不同子空间上）

$D N = N D$ （因为 $D_{k}$ 和 $N_{k}$ 在每个子空间上可交换） $■$

习题12：特征多项式与最小多项式的构造

习题12

举出一个 $C^{4}$ 上的算子，其特征多项式等于 $(z - 1) (z - 5)^{3}$ 且最小多项式等于 $(z - 1) (z - 5)^{2}$ 。

查看解答

特征多项式 $(z - 1) (z - 5)^{3}$ 告诉我们：特征值为 $1$ （重数 $1$ ）和 $5$ （重数 $3$ ）。

最小多项式 $(z - 1) (z - 5)^{2}$ 告诉我们：

$G (1, T)$ 中 $(T - I)$ 的幂零指数为 $1$ ，故 $G (1, T) = E (1, T)$ ，维数为 $1$

$G (5, T)$ 中 $(T - 5 I)$ 的幂零指数为 $2$ ，故 $G (5, T)$ 中最大的 Jordan 块大小为 $2$

因为 $dim G (5, T) = 3$ 且最大 Jordan 块为 $2 \times 2$ ，所以 $G (5, T)$ 的 Jordan 分解为一个 $2 \times 2$ Jordan 块和一个 $1 \times 1$ Jordan 块。

取关于标准基的矩阵为： $1000050001500005$

验证：特征多项式 $= (z - 1) (z - 5)^{3}$ ✓，最小多项式 $= (z - 1) (z - 5)^{2}$ ✓。 $■$

习题18：四个等价刻画

习题18

设 $T \in L (V)$ ， $λ$ 是 $T$ 的特征值。解释为什么下面这四个数都相等： (a) $T$ 的最小多项式的因式分解中， $z - λ$ 的指数。 (b) 满足 $(T - λ I)^{m} ∣_{G (λ, T)} = 0$ 的最小正整数 $m$ 。 (c) 满足 $null (T - λ I)^{m} = null (T - λ I)^{m + 1}$ 的最小正整数 $m$ 。 (d) 满足 $range (T - λ I)^{m} = range (T - λ I)^{m + 1}$ 的最小正整数 $m$ 。

查看解答

设 $d$ 为 $λ$ 的重数， $p (z) = (z - λ_{1})^{k_{1}} \dots (z - λ_{m})^{k_{m}}$ 为最小多项式。

(a) = (b)： $p (T) ∣_{G (λ, T)} = 0$ ，且 $(T - λ I)^{k_{i}}$ 是 $p (T)$ 中唯一在 $G (λ_{i}, T)$ 上非零的因子。由最小性， $k_{i}$ 是使 $(T - λ_{i} I)^{m} ∣_{G (λ_{i}, T)} = 0$ 的最小 $m$ 。

(b) = (c)： $(T - λ I)^{m} ∣_{G (λ, T)} = 0$ 当且仅当 $G (λ, T) \subseteq null (T - λ I)^{m}$ 。由习题 7， $G (λ, T) = null (T - λ I)^{d}$ 。序列 $null (T - λ I)^{m}$ 在 $m = k_{i}$ 时首次达到 $G (λ, T)$ ，此后不再增长。

(c) = (d)：由 3.21， $dim null (T - λ I)^{m} + dim range (T - λ I)^{m} = dim V$ 恒成立。因此 $null (T - λ I)^{m} = null (T - λ I)^{m + 1}$ 当且仅当 $range (T - λ I)^{m} = range (T - λ I)^{m + 1}$ 。 $■$

习题23：复化的实算子特征值

习题23

设 $F = R$ ， $T \in L (V)$ ，且 $λ \in C$ 。 (a) 证明 $u + i v \in G (λ, T_{C})$ 当且仅当 $u - i v \in G (\overset{ˉ}{λ}, T_{C})$ 。 (b) 证明 $λ$ 作为 $T_{C}$ 的特征值的重数等于 $\overset{ˉ}{λ}$ 作为 $T_{C}$ 的特征值的重数。 (c) 利用 (b) 和有关重数之和的结果（8.25）证明如果 $dim V$ 是奇数，则 $T$ 有实特征值。 (d) 利用 (c) 和有关 $T_{C}$ 的实特征值的结果（5A 节习题 17）证明如果 $dim V$ 是奇数，则 $T$ 有特征值。

查看解答

(a)： $T_{C} (u + i v) = T u + i T v$ 。 $(T_{C} - λ I) (u + i v) = (T u - Re λ \cdot u + Im λ \cdot v) + i (T v - Re λ \cdot v - Im λ \cdot u)$ 。

取复共轭： $(T_{C} - \overset{ˉ}{λ} I) (u - i v) = \overline{(T_{C} - λ I) (u + i v)}$ 。

因此 $(T_{C} - λ I)^{m} (u + i v) = 0 ⟺ (T_{C} - \overset{ˉ}{λ} I)^{m} (u - i v) = 0$ 。

(b)：由 (a)，映射 $u + i v \mapsto u - i v$ 给出 $G (λ, T_{C})$ 和 $G (\overset{ˉ}{λ}, T_{C})$ 之间的同构，故维数相等。

(c)： $T_{C}$ 的特征值要么是实数（成对出现），要么是共轭复数对（ $λ$ 和 $\overset{ˉ}{λ}$ 各有相同重数）。因此非实特征值的总重数是偶数。由 8.25，所有特征值的重数之和 $= dim V_{C} = dim V$ （奇数）。偶数 + 实特征值重数 = 奇数，故实特征值重数 $\geq 1$ 。

(d)：由 (c)， $T_{C}$ 有实特征值 $λ$ 。由 5A 习题 17， $T_{C}$ 的实特征值也是 $T$ 的特征值。因此 $T$ 有特征值。 $■$

九、视频学习指南

P94 = 8B(1)：复向量空间上算子的刻画 (1:07:19)

对应内容：第一、二节（广义特征空间 + 广义特征空间分解）

重点：

广义特征空间的定义和定理 8.20 的证明

定理 8.22 的完整证明（本节最重要的证明）

重数的定义和定理 8.25

建议：先看视频理解证明思路，再回教材核对细节。

P95 = 8B(2)：化简矩阵(2)——分块对角矩阵 (40:31)

对应内容：第四节（分块对角矩阵）

重点：

分块对角矩阵的定义（8.35）

定理 8.37 的证明和应用

例 8.38 的详细计算过程

建议：结合例 8.38 理解”换基如何产生更多零”。

P96 = 8B(3)：平方根 (29:54)

对应内容：第三/四节（特征多项式 + 分块对角矩阵的平方根应用）

重点：

凯莱-哈密尔顿定理的证明和意义

利用分块对角矩阵研究算子的平方根

建议：关注凯莱-哈密尔顿定理的”分而治之”证明策略。

P97 = 8B习题 (24:24)

对应内容：习题精选

重点：

习题 9（可对角化-幂零分解）

习题 12-14（构造特定特征多项式的算子）

习题 18（四个等价的数）

十、教材原文

广义特征空间分解

线性代数 Wiki

探索

8B 广义特征空间分解

8B 广义特征空间分解

一、广义特征空间

广义特征空间的定义

广义特征空间的描述

例题：C3 上一算子的广义特征空间

二、广义特征空间分解

核心定理：广义特征空间分解

特征值的重数

重数之和等于 dimV

三、特征多项式与凯莱-哈密尔顿定理

特征多项式的定义

特征多项式的次数和零点

凯莱-哈密尔顿定理

特征多项式是最小多项式的多项式倍

特征值的重数等于其在对角线上出现的次数

四、分块对角矩阵

分块对角矩阵的定义

由上三角块构成的分块对角矩阵

例题：由广义特征向量得出分块对角矩阵

五、知识结构总览

六、核心思想与证明技巧

广义特征空间分解的证明策略

凯莱-哈密尔顿定理的证明技巧

”先放缩再求和”技巧

从算子到矩阵的翻译

七、补充理解与易混淆点

广义特征空间 vs 特征空间

特征多项式 vs 最小多项式

凯莱-哈密尔顿定理的意义

分块对角矩阵的直觉

常见误区

八、习题精选

习题2：可逆算子的广义特征空间

习题5：两个特征值的直和分解

习题7：广义特征空间的维数刻画

习题9：D+N分解（可对角化+幂零）

习题12：特征多项式与最小多项式的构造

习题18：四个等价刻画

习题23：复化的实算子特征值

九、视频学习指南

十、教材原文

关系图谱

目录

反向链接

例题： $C^{3}$ 上一算子的广义特征空间

重数之和等于 $dim V$