8B 广义特征空间分解

本节概览

本节是第8章的核心篇章,建立在 8A 广义特征向量和幂零算子 的基础上,完成复向量空间上算子理论的中心目标——将 分解为不变子空间的直和。逻辑链条如下:

  1. 广义特征空间(定义8.19, 定理8.20, 例8.21) 用零空间刻画广义特征空间,
  2. 广义特征空间分解定理8.22, 定理8.25, 例8.24) ,本节最核心的结果
  3. 特征多项式与凯莱-哈密尔顿定理(定义8.23/8.26, 定理8.28-8.31, 例8.27) 特征多项式的定义、性质,以及
  4. 分块对角矩阵(定义8.35, 定理8.37, 例8.36/8.38) 矩阵形式的解读,每个对角块对应一个广义特征空间

核心主线:广义特征空间分解 重数 特征多项式 凯莱-哈密尔顿定理 分块对角矩阵。

前置依赖8A 广义特征向量和幂零算子(广义特征向量、幂零算子、零空间序列)、5B 最小多项式(最小多项式、零化多项式)、5C 上三角矩阵(上三角矩阵、特征值与对角元)、5D 可对角化算子(可对角化条件)、3B 零空间和值域(零空间、值域)。


一、广义特征空间

视频精要 — P94 8B(1):复向量空间上算子的刻画(1:07:19)

  • 广义特征空间的几何直觉:G(λ,T) 是”被 (T-λI) 反复作用后最终归零”的所有向量
  • ==G(λ,T) = null(T-λI)^{dim V}==:不需要知道确切的幂次,dim V 足够
  • 分解定理的核心思想:将 V 按”属于哪个特征值”切成互不相交的块

广义特征空间的定义

定义 8.19:广义特征空间(generalized eigenspace)、

对应于 广义特征空间,记作 ,定义为

于是, 是由 对应于 广义特征向量以及向量 所构成的集合。

与特征空间的关系

因为 的每个特征向量都是 的广义特征向量(在广义特征向量的定义中取 即可),所以每个特征空间都包含于相对应的广义特征空间。换言之,若 ,那么

这个包含关系可以是严格的——当 不可对角化时, 严格大于

广义特征空间的描述

定理 8.20:广义特征空间的描述

。那么

证明思路

[正向包含 ]:。由广义特征空间的定义知 。则

[反向包含 ]:。于是存在正整数 使得 。由 8.3(零空间在 处停止增长)和 8.2(将其中 替代),我们可得 。于是 ,这就完成了证明。

关键洞察

这个定理的意义在于:广义特征空间是一个零空间(线性映射的零空间总是子空间),因此 的子空间。同时,它给出了一个显式的上界——只需要考虑 ,不需要更高次的幂。

例题: 上一算子的广义特征空间

例 8.21: 上一算子的广义特征空间

定义

例 8.10 中,我们得知 的特征值是 ,且求出了与之对应的广义特征向量所构成的集合。将这些集合分别与 取并集,我们有

注意,

观察与启发

在例 8.21 中,定义空间 是该例中算子 的广义特征空间的直和。接下来的定理 8.22 就表明,这个性质是普遍成立的。


二、广义特征空间分解

  • 分解定理的证明策略:先证直和,再证覆盖
  • 重数 = dim G(λ,T):这个数决定了特征值在特征多项式中的幂次
  • 代数重数 vs 几何重数:代数重数 = dim G(λ,T),几何重数 = dim E(λ,T),前者 ≥ 后者

核心定理:广义特征空间分解

定理 8.22:广义特征空间分解( 本节核心定理

。令 的所有互异特征值。那么

(a) 对每个 下是不变的;

(b) 对每个 是幂零的;

(c)

证明思路

(a) 不变性:

。那么 8.20 表明 于是由 5.18(其中取 ),得 下是不变的,(a) 得证。

(b) 幂零性:

。如果 ,那么 (由 8.20)。于是 因此 是幂零的,(b) 得证。

(c) 直和分解:

[第一步:证明和为直和]: 其中各 属于 。因为 对应于互异特征值的广义特征向量线性无关(由 8.12),所以此式中各 等于 。从而 是直和(由 1.45)。

[第二步:证明直和等于 ]: 中每个向量都可被写成 的广义特征向量的有限和的形式(由 8.9)。于是 (c) 得证。

核心意义

借助定理 8.22,我们得以完成第8章的核心目标:==将 分解成不变子空间,且 在这些子空间上的性质为我们所知==。具体而言:

  • 每个不变子空间 上,,其中 是幂零算子
  • 这正是 Jordan 标准型的理论基础

实数域的情形

时的类似结论见于习题 8。

特征值的重数

定义 8.23:重数(multiplicity)

。定义 的特征值 重数为其对应的广义特征空间 的维数。换言之, 的特征值 的重数等于

学习注解

上述第二点成立是因为 (见 8.20)。

重数 = 广义特征空间的维数,这个定义不依赖行列式,比传统教材的定义更加简洁。

例 8.24:一算子的各特征值的重数

定义

关于标准基的矩阵为

5.41 可得, 的特征值是矩阵对角线上的元素 。你可自行验证, 的广义特征空间是

于是,特征值 的重数是 ,特征值 的重数是 。由 8.22 所述广义特征空间分解可写出直和 。如 8.9 所言, 的广义特征向量 构成 的一个基。 中不存在由该算子的特征向量构成的基。

重要观察

在上例中, 的特征值的重数之和等于 ,这正是 的定义空间的维数。每个特征值的重数,都等于该特征值在算子的上三角矩阵对角线上出现的次数。我们将在定理 8.31 中看到,这个性质总是成立的。

重数之和等于

定理 8.25:重数之和等于

。那么 的所有特征值的重数之和等于

证明思路

由广义特征空间分解(8.22) 与直和的维数公式(见 3.94)即可得

其中 的重数。

术语对照

有些书中会使用代数重数(algebraic multiplicity)和几何重数(geometric multiplicity)这两个术语。如果碰到这两个术语,你应明白:

  • 代数重数 (即此处定义的重数)
  • 几何重数

注意,按照上述定义,代数重数作为某个零空间的维数,同样有几何意义。此处给出的重数定义比涉及行列式的传统定义更加简洁,9.62 将说明这两种定义是等价的。

是内积空间, 是正规的,并且 的一个特征值,那么将 7A 自伴算子和正规算子 习题 27 应用于正规算子 上,即可见 的代数重数等于 的几何重数。


三、特征多项式与凯莱-哈密尔顿定理

特征多项式的定义

定义 8.26:特征多项式(characteristic polynomial)

。令 表示 的所有互异特征值,且其重数分别为 。称多项式

特征多项式

Axler 方法论的特色

多数教材利用行列式定义特征多项式(由 9.62,它和此处的定义等价)。此处采用的处理方法要简洁许多——通过广义特征空间分解来定义特征多项式,完全不依赖行列式理论。

特征多项式的次数和零点

定理 8.28:特征多项式的次数和零点

。那么

(a) 的特征多项式的次数是

(b) 的特征多项式的零点就是 的特征值。

证明思路

由关于重数之和的结论(8.25)可得 (a):

由特征多项式的定义 可得 (b):零点恰好是

例 8.27:一个算子的特征多项式

定义如例 8.24。因为 的特征值 的重数是 ,特征值 的重数是 ,所以我们可得 的特征多项式是

凯莱-哈密尔顿定理

定理 8.29:凯莱-哈密尔顿定理(Cayley-Hamilton theorem)

,且 的特征多项式。那么

证明思路

的所有互异特征值,并令 。我们知道,对每个 都是幂零的。于是由 8.16,我们有:对每个

[第一步:分解验证]: 广义特征空间分解(8.22)指出, 中每个向量都是 中向量的和。于是,为证明 ,我们只需证明对各 均有

[第二步:因子可交换]: 固定 。我们有 上式右侧的算子都是可交换的(因为它们都是 的多项式),因此我们可将乘积项 移至右侧表达式的最后一项。

[第三步:在每个广义特征空间上归零]: 因为 等于 ,所以我们有 ,原命题得证。

定理的意义

  • 直觉:算子”满足自己的特征方程”——将特征多项式中的 替换为 ,结果为零算子
  • 证明的关键:因子可交换 + 在每个 上分别验证
  • 应用:给出零化多项式,从而最小多项式整除特征多项式
  • 注意:Axler 的方法论独特——不用行列式定义特征多项式,而是通过广义特征空间分解定义,使得证明更加简洁和概念化

历史注记

亚瑟·凯莱(Arthur Cayley,1821—1895)在取得学士学位之前就发表了三篇数学论文。

特征多项式是最小多项式的多项式倍

定理 8.30:特征多项式是最小多项式的多项式倍

。那么 的特征多项式是 的最小多项式的多项式倍。

证明思路

由凯莱-哈密尔顿定理(8.29)知 ,即 的零化多项式。由 5.29(最小多项式整除每个零化多项式)立刻可得上述结论。

推论

如果一算子 的最小多项式的次数是 (大多数情况下都是如此——见 5.24 之后的几段话),那么 的特征多项式就等于 的最小多项式。

特征值的重数等于其在对角线上出现的次数

定理 8.31:特征值的重数等于其在对角线上出现的次数

。设 的一个基且使得 为上三角矩阵。那么 的每个特征值 对角线上出现的次数,就等于 作为 的特征值的重数。

证明思路

。于是 是上三角矩阵。令 表示 对角线上的各元素。

[第一步:建立不等式]: 对每个 ,我们有 ,其中 。因此若 ,那么 不是 的线性组合。由线性相关性引理(2.19)可得由这些 (满足 )所构成的组是线性无关的。

表示各下标 中使得 的个数。由上段结论可知

因为 ,所以

[第二步:推广到 ]: 算子 关于基 的矩阵是上三角矩阵 ,且其对角线上的元素是 (见 5C 节习题 2(b))。因为 当且仅当 ,所以 的对角线上出现 的次数就等于 。于是利用式 (8.32)(将其中的 替换为 ),我们有

[第三步:替换为 并求和]: 对于 的一个特征值 ,令 表示 作为 的特征值的重数,并令 表示 出现在 的对角线上的次数。将式 (8.33) 中的 替换成 ,我们就发现 的每个特征值 都成立。

的所有特征值 的重数 之和等于 (由 8.25)。 的所有特征值 的出现次数 之和也等于 (因为 的对角线上共有 个数)。

[第四步:由求和等式推出逐项等式]: 将式 (8.34) 的两端对 的所有特征值 求和会得到一个等式。因此,式 (8.34) 对于 的每个特征值 也一定是个等式。于是 作为 的特征值的重数,等于 的对角线上出现的次数,即原命题得证。

证明技巧总结

这个证明使用了一个非常精妙的技巧:先证明逐项不等式 ,再利用”总和相等”推出”逐项相等”。这种”先放缩再求和”的策略在数学证明中非常常见。


四、分块对角矩阵

  • 分块对角矩阵的直观含义:每个对角块对应一个广义特征空间上的算子作用
  • 对角块的对角线全为 λ_k,上三角部分是”幂零分量”
  • 与对角矩阵的区别:可对角化 ⟺ 每个块都是 1×1(幂零分量为零)
  • P96 8B(3):平方根(29:54)中利用分块对角结构证明复空间上每个可逆算子都有平方根

分块对角矩阵的定义

定义 8.35:分块对角矩阵(block diagonal matrix)

一个分块对角矩阵是形如

的方阵,其中 是排列在对角线上的方阵,且矩阵其他各元素都等于

与对角矩阵的关系

如果上述定义中各矩阵 都是 矩阵,那么我们其实就得到了对角矩阵。因此,分块对角矩阵是对角矩阵的推广。

例 8.36:一个分块对角矩阵

矩阵

是形如 的分块对角矩阵,其中

注意到, 都是上三角矩阵,且各自对角线上元素都相等。

由上三角块构成的分块对角矩阵

定理 8.37:由上三角块构成的分块对角矩阵

。令 的所有互异特征值,它们的重数分别为 。那么存在 的一个基,使得 关于该基具有形如

的分块对角矩阵,其中各 是形如

上三角矩阵。

证明思路

[第一步:在每个广义特征空间上选基]: 每个 都是幂零的(见 8.22(b))。对各 ,选取 (它是维数为 的向量空间)的一个基,使得 具有 8.18(c) 的矩阵形式(即对角线全为 的上三角矩阵)。

[第二步:得出 的矩阵]:,于是 关于该基的矩阵就具有上面所示 的形式(对角线全为 的上三角矩阵)。

[第三步:合并基得到分块对角矩阵]: 广义特征空间分解(8.22(c))表明,将上面选取的各 的基合并起来,就得到 的一个基。 关于该基的矩阵就具有我们期望的分块对角形式。

关键洞察

这个结论给出的矩阵比一般的上三角矩阵具有更多的零。它将 的分解以矩阵形式直观地呈现出来——每个对角块对应一个广义特征空间。

例题:由广义特征向量得出分块对角矩阵

例 8.38:由广义特征向量得出分块对角矩阵

定义 (关于标准基)的矩阵是

这是上三角矩阵,但不是 8.37 所给出的形式。

在例 8.24 中我们看到, 的特征值是 ,且有

我们还知道由 的广义特征向量所构成的 的基是

关于该基的矩阵是

该矩阵具有 8.37 所给出的分块对角形式。

对比观察

  • 标准基下的矩阵——上三角矩阵,但不同特征值的元素之间有非零项(如
  • 广义特征向量基下的矩阵——分块对角矩阵,不同块之间全为零

换基后”多出了零”,这正是广义特征空间分解的矩阵体现。


五、知识结构总览

graph TD
    A["8A 广义特征向量和幂零算子"] --> B["定义8.19: 广义特征空间 G(λ,T)"]
    B --> C["定理8.20: G(λ,T) = null(T-λI)^dim V"]
    C --> D["定理8.22: 广义特征空间分解<br/>V = G(λ₁,T) ⊕ ... ⊕ G(λₘ,T)"]
    D --> E["定义8.23: 重数 = dim G(λ,T)"]
    E --> F["定理8.25: 重数之和 = dim V"]
    F --> G["定义8.26: 特征多项式"]
    G --> H["定理8.28: 次数 = dim V, 零点 = 特征值"]
    H --> I["定理8.29: 凯莱-哈密尔顿定理 q(T)=0"]
    I --> J["定理8.30: 特征多项式 = 最小多项式 × 多项式"]
    E --> K["定理8.31: 重数 = 对角线出现次数"]
    D --> L["定义8.35: 分块对角矩阵"]
    D --> M["定理8.37: 由上三角块构成的分块对角矩阵"]

    style D fill:#ff6b6b,color:#fff,stroke:#c0392b,stroke-width:3px
    style I fill:#ff6b6b,color:#fff,stroke:#c0392b,stroke-width:3px
    style M fill:#f39c12,color:#fff,stroke:#e67e22,stroke-width:2px
graph LR
    subgraph "算子分解的层次"
        A["上三角矩阵<br/>(5C)"] --> B["分块对角矩阵<br/>(8B)"]
        B --> C["Jordan标准型<br/>(8D)"]
        B --> D["对角矩阵<br/>(5D, 可对角化时)"]
    end

    style B fill:#3498db,color:#fff
    style C fill:#e74c3c,color:#fff
    style D fill:#2ecc71,color:#fff

六、核心思想与证明技巧

广义特征空间分解的证明策略

定理 8.22 的证明综合运用了 8A 节的所有核心工具,是一个”集大成”的证明:

证明部分使用的前置结果核心思路
(a) 不变性8.20 + 5.18 的零空间,而零空间在 下不变
(b) 幂零性8.20 + 8.16 上为零
(c) 直和分解8.12 + 8.9线性无关保证直和,广义特征向量构成基保证等于

凯莱-哈密尔顿定理的证明技巧

证明的关键在于**“分而治之 + 因子可交换”**:

  1. 分而治之:不直接验证 ,而是分别在各个 上验证
  2. 因子可交换 展开为 ,这些因子都是 的多项式,因此互相可交换,可以任意调整顺序
  3. 关键一步:将 移到最后,它在 上为零,所以整个乘积在 上为零

”先放缩再求和”技巧

定理 8.31 的证明使用了精妙的”放缩-求和”策略:

这种技巧的本质是:如果一组非负数逐项不超过另一组,且总和相等,那么逐项必相等。

从算子到矩阵的翻译

定理 8.37 展示了如何将抽象的算子分解翻译为具体的矩阵形式:

  • 抽象层面
  • 矩阵层面:选择各 的基并合并,得到分块对角矩阵
  • 每个对角块 是上三角矩阵,对角线全为 ,反映 (标量 + 幂零)

七、补充理解与易混淆点

广义特征空间 vs 特征空间

概念定义维数名称
特征空间 几何重数
广义特征空间 代数重数(重数)

关键关系

  • ,包含关系可以严格(如不可对角化的算子)
  • 有限维且在 下不变(8.22(a))
  • == 就是特征值的”重数”,它 ==

直觉:特征空间只包含”一次就被消灭”的向量,而广义特征空间还包含”多次作用后才被消灭”的向量。就像调查案件,特征空间是直接涉案人员,广义特征空间还包括间接涉案人员。

来源:MIT 18.06讲义(Gilbert Strang)、OSU Ximera线性代数教材、UPenn Math314讲义(Tony Pantev)、University of Puget Sound线性代数教材。

特征多项式 vs 最小多项式

特征多项式 最小多项式
定义
指数含义 = 使 $(T-\lambda_k I)^m
关系 整除 (8.30)
可对角化 对所有 定理5.62

习题18的深刻结论

习题 18 表明,以下四个看似不同的数实际上相等: (a) 最小多项式中 的指数 (b) 使 的最小 (c) 使 的最小 (d) 使 的最小

这四个数从不同角度刻画了同一个”复杂度”。

来源:MIT 18.06讲义(Gilbert Strang)、Dartmouth线性代数教材、Clemson Math8530讲义(Matthew Macauley)。

凯莱-哈密尔顿定理的意义

  • :将特征多项式中的 替换为 ,结果为零算子
  • 直觉:算子”满足自己的特征方程”
  • 证明的关键:因子可交换 + 在每个 上分别验证
  • 应用:给出零化多项式,从而最小多项式整除特征多项式
  • 注意:Axler 的方法论独特——不用行列式定义特征多项式,而是通过广义特征空间分解定义

来源:MIT 18.06讲义(Gilbert Strang)、UPenn Math314讲义(Tony Pantev)、University of Puget Sound线性代数教材。

分块对角矩阵的直觉

  • 每个对角块对应一个广义特征空间
  • 对角块的对角线元素全为同一个特征值
  • 对角块的上三角部分反映了"幂零部分"——即 的作用
  • 与对角矩阵的关系 可对角化 每个对角块都是 的(即幂零部分为零)
  • 与 Jordan 标准型的关系:进一步选择基可以使每个对角块变为 Jordan 块(8D 联系矩阵与算子的桥梁——迹 内容)

来源:MIT 18.06讲义(Gilbert Strang)、Utah大学Jordan Form讲义、Northwestern大学Jordan Form讲义。

常见误区

误区一

❌ “特征多项式就是最小多项式”

✅ 最小多项式整除特征多项式,两者相等仅当最小多项式的次数等于 (即无”多余”的指数)。一般情况下,特征多项式的指数 最小多项式的指数

来源:MIT 18.06讲义(Gilbert Strang)、OSU Ximera线性代数教材。

误区二

❌ “重数就是特征空间维数”

✅ 重数是广义特征空间维数 ,可以大于特征空间维数 。只有当 可对角化时两者才相等。

来源:MIT 18.06讲义(Gilbert Strang)、OSU Ximera线性代数教材。

误区三

❌ “凯莱-哈密尔顿定理 trivial”

✅ 证明需要广义特征空间分解(8.22)和幂零算子的性质(8.16),并不平凡。传统教材用行列式的证明也不简单。

来源:MIT 18.06讲义(Gilbert Strang)、OSU Ximera线性代数教材。

误区四

❌ “分块对角矩阵就是对角矩阵”

✅ 对角块可以不是对角的(如例 8.38 中的 ),只是不同块之间的元素为零。对角矩阵是分块对角矩阵的特例(每个块都是 )。

来源:MIT 18.06讲义(Gilbert Strang)、OSU Ximera线性代数教材。


八、习题精选

本节习题

习题号标题核心考点难度
习题2可逆算子的广义特征空间G(λ,T)与G(1/λ,T⁻¹)的关系
习题5两个特征值的直和分解广义特征空间分解的应用
习题7广义特征空间的维数刻画G(λ,T)=null(T-λI)^d
习题9D+N分解(可对角化+幂零)广义特征空间分解的推论
习题12特征多项式与最小多项式的构造多项式与算子的对应
习题18四个等价刻画最小多项式指数的多种等价描述
习题23复化的实算子特征值复化技巧证明实特征值存在

习题2:可逆算子的广义特征空间

习题2

是可逆的。证明:对每个

习题5:两个特征值的直和分解

习题5

的特征值。令 。证明:

习题7:广义特征空间的维数刻画

习题7

的特征值且重数为 。证明:

习题9:D+N分解(可对角化+幂零)

习题9

。证明存在 使得 成立,其中算子 可对角化, 是幂零的,且

习题12:特征多项式与最小多项式的构造

习题12

举出一个 上的算子,其特征多项式等于 且最小多项式等于

习题18:四个等价刻画

习题18

的特征值。解释为什么下面这四个数都相等: (a) 的最小多项式的因式分解中, 的指数。 (b) 满足 的最小正整数 。 (c) 满足 的最小正整数 。 (d) 满足 的最小正整数

习题23:复化的实算子特征值

习题23

,且 。 (a) 证明 当且仅当 。 (b) 证明 作为 的特征值的重数等于 作为 的特征值的重数。 (c) 利用 (b) 和有关重数之和的结果(8.25)证明如果 是奇数,则 有实特征值。 (d) 利用 (c) 和有关 的实特征值的结果(5A 节习题 17)证明如果 是奇数,则 有特征值。


九、视频学习指南

P94 = 8B(1):复向量空间上算子的刻画 (1:07:19)

对应内容:第一、二节(广义特征空间 + 广义特征空间分解)

重点

  • 广义特征空间的定义和定理 8.20 的证明
  • 定理 8.22 的完整证明(本节最重要的证明)
  • 重数的定义和定理 8.25

建议:先看视频理解证明思路,再回教材核对细节。

P95 = 8B(2):化简矩阵(2)——分块对角矩阵 (40:31)

对应内容:第四节(分块对角矩阵)

重点

  • 分块对角矩阵的定义(8.35)
  • 定理 8.37 的证明和应用
  • 例 8.38 的详细计算过程

建议:结合例 8.38 理解”换基如何产生更多零”。

P96 = 8B(3):平方根 (29:54)

对应内容:第三/四节(特征多项式 + 分块对角矩阵的平方根应用)

重点

  • 凯莱-哈密尔顿定理的证明和意义
  • 利用分块对角矩阵研究算子的平方根

建议:关注凯莱-哈密尔顿定理的”分而治之”证明策略。

P97 = 8B习题 (24:24)

对应内容:习题精选

重点

  • 习题 9(可对角化-幂零分解)
  • 习题 12-14(构造特定特征多项式的算子)
  • 习题 18(四个等价的数)

十、教材原文


广义特征空间分解