8A 广义特征向量和幂零算子
本节概览
本节是第8章的基础工具篇,为后续的广义特征空间分解和Jordan标准型奠定核心基础。逻辑链条如下:
- 算子幂的零空间(8.1-8.4) 零空间序列递增、一旦相邻相等则后续全等、在 处停止增长、
- 广义特征向量(定义8.8, 8.9-8.12) 放宽特征向量条件,在复向量空间上保证能构成基
- 幂零算子(定义8.14, 8.15-8.18) 某次幂为零的算子,特征值唯一为0,与上三角矩阵的刻画
核心主线:零空间序列 广义特征向量(核心定理8.9) 幂零算子(特殊情形)。
前置依赖:5A 不变子空间、特征值和特征向量(特征值、特征向量、不变子空间)、5B 最小多项式(最小多项式)、5C 上三角矩阵(上三角矩阵、特征值与对角元)、3B 零空间和值域(零空间、值域、线性映射基本定理)。
一、算子幂的零空间
我们从研究算子的幂的零空间开启本章。这一小节的结果是后续广义特征向量理论的基石。
视频精要
P90 - 8A(1):幂的零空间(48:19)
本节视频对应教材定理 8.1—8.4 和例 8.6,重点讲解零空间序列的递增性质和直和分解。
递增的零空间序列
定理 8.1:递增的零空间序列
设 。那么
证明思路
[零空间递增性]: 设 是非负整数,且 。那么 ,这表明 。从而 。因此 。
直觉理解: 作用在 上如果已经归零了,那么多作用一次 (即 )自然还是零。所以被”消灭”的向量集合只会越来越大,不会缩小。
零空间序列中的等式
定理 8.2:零空间序列中的等式
设 , 是非负整数,满足 。那么
证明思路
[目标]: 证明 对任意正整数 成立。
由 8.1,已知 。
[反向包含]: 设 。那么 因此 (利用已知等式)。
于是 ,意味着 。
[结论]: ,结合正向包含得等式。
直觉理解:一旦零空间”停止增长”(相邻两项相等),它就永远不会再增长了。就像水桶装水,一旦满了,再倒也不会更多。
零空间停止增长
定理 8.3:零空间停止增长
设 。那么
证明思路
[反证法]: 只需证明 (由 8.2 即可推广)。
假设此式不成立。那么由 8.1 和 8.2,我们有 其中 表示真包含。
[维数论证]: 在每个真包含号处,维数至少增加 1。因此 这与” 的子空间的维数不超过 “矛盾。
关键洞察
零空间序列最多在 步之内就会停止增长。这是一个非常强的结论——它给出了一个显式的上界,告诉我们不需要考虑任意高次的幂。
注意
并不对每个 都成立。下面的定理给出了一个”好用的替代结论”——用 代替 。
定理 8.4: 是 与 的直和
设 。那么
证明思路
令 。
[第一步:证明交集为零]: 证明 。
设 。那么 ,并且存在 使得 。将 作用于 两侧,可得 。因此 ,由 8.3(零空间在 处停止增长),这表明 。于是 。
[第二步:维数论证]: 由第一步和 3B 零空间和值域 中的 1.46, 是直和。并且, 其中第一个等号源于 3.94,第二个等号来自线性映射基本定理(3.21)。
[结论]: 维数等于 的子空间就是 本身(2.39),即 。
例 8.6:对于 ,
定义 为 。
- ,
- 注意 (例如 同时属于两者),所以 不是直和!
- 同时 (缺少形如 的向量)
但是,,所以:
因此 ,正如 8.4 所述。
教材注记
上述结论的加强版本见习题 19:若 不是幂零的,则 ,即可以少用一次幂。
二、广义特征向量
仅凭特征向量不足以很好地描述有些算子。在本小节中,我们引入广义特征向量的概念,它将在描述算子的结构方面发挥决定性作用。
视频精要
P91 - 8A(2):广义特征向量和特征空间(1:01:16)
本节视频对应教材定义 8.8、定理 8.9—8.12 和例 8.10,是本节最核心的内容。
为什么需要推广特征向量?
为了理解为何需要拓展特征向量,我们来回顾 5A 不变子空间、特征值和特征向量 中的讨论。
取定 。我们想通过找到一个”好”的直和分解 (其中各 都是 的在 下不变的子空间)来描述 。
- 最简单的非零不变子空间是一维的
- 当且仅当 具有由 的特征向量构成的基时,上述直和分解式中各 才全是 的在 下不变的一维子空间(见 5.55)
- 这等价于 具有特征空间分解: V = E(\lambda_1, T) \oplus \cdots \oplus E(\lambda_m, T) \tag{8.7} 其中 是 的所有互异特征值
由 7B 谱定理 可知,若 是内积空间,那么形如 (8.7) 的分解对于每个自伴算子(若 )及每个正规算子(若 )都成立。
核心问题
然而,对于更一般的算子来说,形如 (8.7) 的分解不一定成立,即便在复向量空间上也是如此。比如,5A 不变子空间、特征值和特征向量 中 5.57 展示的算子的特征向量就不足以使 (8.7) 成立。
广义特征向量和广义特征空间正是为了解决这一问题而引入的。
广义特征向量的定义
定义 8.8:广义特征向量(Generalized Eigenvector)
设 , 是 的特征值。称向量 是 对应于 的广义特征向量,若 且对某个正整数 有
补充说明
- 我们并未定义”广义特征值”,因为这样不会得到任何新东西:若 对于某个正整数 不是单射,那么 也不是单射,因此 就是 的特征值。
- 将 8.1 和 8.3 应用于算子 即可得出:非零向量 是 对应于 的广义特征向量,当且仅当 。这意味着我们==总是可以取 ==。
关键洞察
- 当 时,,即 是普通的特征向量。所以特征向量是广义特征向量的特例
- 广义特征向量允许 ,条件更宽松,因此能提供更多的向量
核心定理:由广义特征向量构成的基
定理 8.9:由广义特征向量构成的基(核心定理!)
设 且 。那么存在由 的广义特征向量构成的 的基。
这是本节最重要的定理,也是整个第8章的基石之一。
证明思路
[归纳法]: 令 ,对 用归纳法。
[基础步]: 时, 中每个非零向量都是 的特征向量(因为 上每个算子都有特征值),结论成立。
[归纳步]: 设 ,假设结论在维数更小时成立。
[选取特征值并分解]: 设 是 的特征值( 上必存在)。将 8.4 应用于 ,可得
[讨论两种情况]:
- 若 ,则 中每个非零向量都是 对应于 的广义特征向量,结论成立。
- 若 ,则 。
[关键估计]: (因为 是特征值),所以
[不变子空间]: 在 下不变(由 5A 不变子空间、特征值和特征向量 中的 5.18,取 )。
[应用归纳假设]: 令 等于限制在 上的算子 。将归纳假设应用于 ,可得存在由 的广义特征向量构成的 的基,这些向量当然也是 的广义特征向量。
[合并基]: 将 的这个基与 的基合并,就得到了由 的广义特征向量构成的 的基。
定理 8.9 的意义
在复向量空间上,虽然不是每个算子都有足够多的特征向量来对角化,但每个算子都有足够多的广义特征向量来构成基。 这是广义特征向量理论的根本价值所在。
实数域的情形
若 且 ,那么 上有些算子的广义特征向量可构成 的基,其他算子则不具有该性质。判定条件见习题 11。
例题: 上一算子的广义特征向量
例 8.10: 上一算子的广义特征向量
定义 为:对每个 ,
特征值和特征向量:
- 的特征值是 和
- 对应于 的特征向量:形如 的非零向量
- 对应于 的特征向量:形如 的非零向量
- ==特征向量不足以张成 ==(缺少 方向)
广义特征向量:
- 计算
- 由 8.1 和 8.3, 对应于特征值 的广义特征向量是形如 的非零向量
- 计算
- 对应于特征值 的广义特征向量是形如 的非零向量
结论: 的标准基 中每个向量都是 的广义特征向量。正如 8.9 所言, 的确具有由 的广义特征向量构成的基。
广义特征向量对应于唯一的特征值
定理 8.11:广义特征向量对应于唯一的特征值
设 。那么 的每个广义特征向量都仅对应于 的一个特征值。
证明思路
[反证法]: 设 是同时对应于 的两个特征值 和 的广义特征向量。
令 是满足 的最小正整数,令 。那么 其中 ,其余二项式系数 的值无关紧要。
[关键操作]: 将 作用于上式两边。注意到当 时 ,而当 时 ( 的最小性),所以只有 的项可能非零。但 ,所以 。
更精确地说,作用 后,所有 的项为零, 的项中 (因为 ),只剩 的项:
因为 ( 的最小性),所以 ,即 。
线性无关的广义特征向量
定理 8.12:线性无关的广义特征向量
设 。那么由对应于 的互异特征值的广义特征向量构成的每个向量组都是线性无关的。
证明思路
[反证法]: 设结论不成立。那么存在最小正整数 ,使得对应于 的互异特征值 的广义特征向量 构成线性相关组(注意 ,因为广义特征向量非零)。
于是存在全不为 0 的数 ( 最小保证所有系数非零)使得
[作用算子]: 令 。将 作用于上式两侧,可得 a_1 (T - \lambda_m I)^n v_1 + \cdots + a_{m-1} (T - \lambda_m I)^n v_{m-1} = 0. \tag{8.13}
[验证非零性]: 设 。那么 ——否则 就会成为 的同时对应于不同特征值 和 的广义特征向量,与 8.11 矛盾。
[验证广义特征向量性质]: 又有 所以 是 对应于特征值 的广义特征向量。
[导出矛盾]: 因此 是由 个对应于互异特征值的广义特征向量所构成的线性相关组(由式 (8.13)),这与 的最小性矛盾。
与特征向量的类比
这个证明的思路与 5A 不变子空间、特征值和特征向量 中 5.11(对应于不同特征值的特征向量线性无关)的证明完全类似,只是将 替换为 。
三、幂零算子
幂零算子是自乘若干次后会等于 0 的算子,在算子结构的研究中扮演着重要的角色。
视频精要
P92 - 8A(3):幂零算子(56:28)
本节视频对应教材定义 8.14、例 8.15、定理 8.16—8.18,重点讲解幂零算子的各种等价刻画。
幂零的定义
定义 8.14:幂零(Nilpotent)
称一个算子是幂零的(nilpotent),如果它的某个幂等于 。
拉丁文词语”nil”意为”无”或”零”,“potens”意为”幂”。于是”nilpotent”的字面意思就是”幂零”。
等价表述
算子 是幂零的,当且仅当 中每个非零向量都是 对应于特征值 的广义特征向量。
幂零算子的例子
例 8.15:幂零算子
(a) 定义为 的算子 是幂零的,因为 。
(b) 关于标准基的矩阵为 的 上的算子是幂零的,通过求该矩阵的立方得到零矩阵即可证明。
(c) 上的微分算子是幂零的,因为每个不超过 次的多项式的 阶导数都等于 。注意,在这个维数是 的向量空间上,我们需求该算子的 次幂才能得到算子 。
幂零算子的 次幂等于 0
定理 8.16: 维空间上幂零算子的 次幂等于 0
设 是幂零的。那么 。
证明思路
[利用零空间停止增长]: 因为 是幂零的,所以存在正整数 使得 。于是 。
由 8.1 和 8.3,。于是 。
关键洞察
定理 8.16 给出了一个统一的幂次上界:无论幂零算子实际需要多少次幂才能归零, 次幂一定足够。习题 18 给出了更强的结论:。
幂零算子的特征值
定理 8.17:幂零算子的特征值
设 。
(a) 如果 是幂零的,那么 是 的特征值,并且 没有其他的特征值。
(b) 若 ,且 是 的唯一特征值,那么 是幂零的。
证明思路
(a) 的证明:
[0 是特征值]: 设 是幂零的,则存在正整数 使得 。这表明 不是单射,于是 是 的特征值。
[没有其他特征值]: 设 是 的特征值,则存在非零向量 使得 。将 反复作用于上式两端,可得 于是 。
(b) 的证明:
[利用最小多项式]: 设 且 是 的唯一特征值。根据 5B 最小多项式 中的 5.27 (b), 的最小多项式等于 ( 为正整数)。于是 ,因此 是幂零的。
实数域的注意
习题 23 说明了上述结论 (b) 中 这个前提条件不可删去——在实数域上, 是唯一特征值并不蕴含幂零性。
幂零算子的最小多项式和上三角矩阵
定理 8.18:幂零算子的最小多项式和上三角矩阵
设 。那么下面各命题等价:
(a) 是幂零的。
(b) 的最小多项式等于 ( 为正整数)。
(c) 存在 的一个基,使得 关于该基的矩阵形如 其中对角线及对角线下方各元素均等于 。
证明思路
这是一个循环证明:。
[(a) (b)]: 设 是幂零的,则存在正整数 使得 。由 5B 最小多项式 中的 5.29, 是 的最小多项式的多项式倍。于是 的最小多项式就是 ( 为正整数)。
[(b) (c)]: 设 的最小多项式是 。由 5B 最小多项式 中的 5.27 (a),( 的唯一零点)是 的唯一特征值;由 5C 上三角矩阵 中的 5.44,存在 的一个基,使得 关于该基具有上三角矩阵。进而,由 5C 上三角矩阵 中的 5.41,该矩阵中对角线上的所有元素都等于 。
[(c) (a)]: 设 关于某基的矩阵是严格上三角的(对角线及以下全为零)。由 5C 上三角矩阵 中的 5.40,。于是 是幂零的。
定理 8.18 的意义
幂零算子有三种等价刻画:代数上的(某次幂为零)、多项式上的(最小多项式为 )、矩阵上的(严格上三角)。这三种视角的统一为我们后续研究提供了极大的灵活性。
四、知识结构总览
graph TD A["8A 广义特征向量和幂零算子"] --> B["一、算子幂的零空间"] A --> C["二、广义特征向量"] A --> D["三、幂零算子"] B --> B1["8.1 递增的零空间序列<br/>null T⁰ ⊆ null T¹ ⊆ ..."] B --> B2["8.2 零空间序列中的等式<br/>相邻相等 ⇒ 后续全等"] B --> B3["8.3 零空间停止增长<br/>null T^dim V = null T^{dim V+1} = ..."] B --> B4["8.4 V = null T^n ⊕ range T^n<br/>n = dim V"] B --> B5["例8.6 F³上的直和分解"] C --> C1["定义8.8 广义特征向量<br/>(T-λI)^k v = 0"] C --> C2["8.9 由广义特征向量构成的基<br/>⭐核心定理"] C --> C3["例8.10 C³上的广义特征向量"] C --> C4["8.11 唯一特征值"] C --> C5["8.12 线性无关性"] D --> D1["定义8.14 幂零算子<br/>T^m = 0"] D --> D2["例8.15 幂零算子三例"] D --> D3["8.16 T^dim V = 0"] D --> D4["8.17 特征值唯一为0"] D --> D5["8.18 三种等价刻画<br/>(a)⇔(b)⇔(c)"] B3 --> B4 B4 --> C2 C1 --> C2 C2 --> D1 D1 --> D3 D1 --> D4 D4 --> D5 style A fill:#e1f5fe style C2 fill:#fff9c4 style D5 fill:#f3e5f5
五、核心思想与证明技巧
维数论证的威力
本节多次使用维数论证作为核心证明工具:
- 定理 8.3:假设零空间序列严格递增到 ,则 ,矛盾
- 定理 8.4:证明 后,利用线性映射基本定理 得出直和等于
- 定理 8.9:归纳法中关键一步是证明 ,从而可以应用归纳假设
证明技巧总结
- 维数上界:子空间的维数不超过全空间的维数
- 线性映射基本定理:
- 真包含 ⇒ 维数增加: 意味着
归纳法与算子限制
定理 8.9 的证明展示了处理算子问题的一种经典模式:
- 选取特征值(利用 保证存在性)
- 利用直和分解将空间分成两部分
- 验证不变子空间,从而可以将算子限制到子空间上
- 对子空间应用归纳假设
关键引理
5A 不变子空间、特征值和特征向量 中的 5.18 在这里发挥了关键作用:若 且 是多项式,则 在 下不变。取 即得 在 下不变。
最小性论证与反证法
定理 8.11 和 8.12 都使用了”最小性论证”:
- 8.11:取使 的最小正整数 ,从而保证
- 8.12:取使广义特征向量线性相关的最小 ,从而保证所有系数非零,且 个向量的子集线性无关
证明技巧总结
- 最小性论证的核心价值:提供”非零性”保证
- 配合反证法使用效果极佳
循环证明
定理 8.18 使用了经典的循环证明模式。这种模式的优点是每个方向的证明都比较简短,避免了直接证明任意两个命题等价时的冗长。
六、补充理解与易混淆点
广义特征向量 vs 特征向量:为什么需要推广?
核心动机:特征向量要求 ,条件太强。很多算子没有足够的特征向量构成基,例如例 8.10 中的算子只有两个线性无关的特征向量,但 。
广义特征向量要求 (某个 ),条件更宽松:
| 特征向量 | 广义特征向量 | |
|---|---|---|
| 定义 | (某个 ) | |
| 条件强度 | 强 | 弱( 时退化为特征向量) |
| 能否构成基 | 不一定(如例 8.10) | 上一定可以(定理 8.9) |
关键洞察
在复向量空间上,虽然不是每个算子都有足够多的特征向量来对角化,但每个算子都有足够多的广义特征向量来构成基。
类比:特征向量是”一击即中”—— 作用一次就归零;广义特征向量是”多次打击后归零”——可能需要作用多次才能归零,但最终一定会被消灭。
来源:UPenn Math314讲义(Tony Pantev)、MIT 18.06讲义(Gilbert Strang)、UC Berkeley Math110讲义(Arthur Ogus)、OSU Ximera线性代数教材。
幂零算子的直觉
幂零算子 = “反复作用后最终归零”的算子。
典型例子:
- 严格上三角矩阵是幂零的(定理 8.18 (c))
- 微分算子在多项式空间上是幂零的(例 8.15 (c))
- 移位算子 是幂零的(例 8.15 (a),)
易混淆点:幂零 ≠ 零算子!
幂零算子可以非零。例如例 8.15 (a) 的移位算子 ,但 。幂零只是说”某次幂为零”,而不是算子本身为零。
幂零指数:使 的最小正整数 称为 的幂零指数。由定理 8.16,幂零指数满足 。
来源:UPenn Math314讲义(Tony Pantev)、MIT 18.06讲义(Gilbert Strang)、Puget Sound线性代数教材。
的几何意义
定理 8.4 告诉我们,当 足够大时(),零空间和值域”完美互补”——它们的交集只有零向量,且直和等于全空间。
关键注意: 时不一定成立!
仅在 时成立(习题 3)。
例 8.6 就是一个反例:,所以 不是直和。
这正是为什么需要推广到”幂的零空间”——取足够高的幂次后,零空间”吸收”了所有需要吸收的向量,不再与值域重叠。
几何直觉:随着 增大, 不断增大, 不断缩小。当 足够大时,两者恰好”互补”——就像两个拼图碎片完美契合。
来源:UPenn Math314讲义(Tony Pantev)、MIT 18.06讲义(Gilbert Strang)、OSU Ximera线性代数教材。
广义特征空间分解(前瞻)
虽然本节没有正式定义”广义特征空间” ,但定理 8.9 已经蕴含了分解:
其中 是对应于特征值 的广义特征空间。
前瞻
- 这是后续 8B 节(分块对角矩阵)和 8D 节(Jordan标准型)的基础
- 广义特征空间分解告诉我们:任何复向量空间上的算子都可以分解为”幂零部分”的直和
- 来源:Axler 2025年演讲 “Unlocking Hidden Dimensions”
常见误区与辨析
误区一
❌ “广义特征向量一定不是特征向量”
✅ ==特征向量是 的特殊广义特征向量==。每个特征向量都是广义特征向量,但反之不成立。
来源:UPenn Math314讲义(Tony Pantev)、MIT 18.06讲义(Gilbert Strang)、OSU Ximera线性代数教材。
误区二
❌ “幂零算子没有特征值”
✅ 幂零算子的==唯一特征值是 ==(定理 8.17 (a))。事实上,幂零算子的定义空间中每个非零向量都是对应于 的广义特征向量。
来源:UPenn Math314讲义(Tony Pantev)、MIT 18.06讲义(Gilbert Strang)、OSU Ximera线性代数教材。
误区三
❌ ” 总是等于 ”
✅ 序列递增但可能严格递增,直到 后停止(定理 8.3)。例如例 8.6 中 。
来源:UPenn Math314讲义(Tony Pantev)、MIT 18.06讲义(Gilbert Strang)、OSU Ximera线性代数教材。
误区四
❌ ” 幂零 ”
✅ 可以非零,只要 。例 8.15 (a) 的移位算子就是 但 的例子。
来源:UPenn Math314讲义(Tony Pantev)、MIT 18.06讲义(Gilbert Strang)、OSU Ximera线性代数教材。
误区五
❌ “在实向量空间上,0 是唯一特征值 ⇒ 幂零”
✅ 这个蕴涵关系仅在复数域上成立(定理 8.17 (b))。在实数域上存在反例(习题 23)。
来源:UPenn Math314讲义(Tony Pantev)、MIT 18.06讲义(Gilbert Strang)、OSU Ximera线性代数教材。
七、习题精选
本节习题
习题号 标题 核心考点 难度 习题2 T的幂作用下的线性无关性 幂零算子的核心引理 中 习题3 null T ⊕ range T 的等价刻画 零空间与值域的关系 中 习题5 null T^m 的维数上界 零空间维数的增长速度 中 习题9 null与range的等式等价 零空间和值域的对偶性 中 习题13 ST幂零推出TS幂零 幂零算子的乘法性质 高 习题17 I-T的可逆性与Neumann级数 幂零算子的逆公式 高 习题21 零空间维数的精确刻画 零空间逐级增长 高
习题2:T的幂作用下的线性无关性
习题2
设 , 是正整数,,且 但 。证明: 是线性无关的。
查看解答
设 。
将 作用于上式两侧,得 。因为 ,所以 。
再将 作用于上式两侧,得 ,故 。
重复此过程,可得 。因此 线性无关。
习题3:null T ⊕ range T 的等价刻画
习题3
设 。证明:。
查看解答
⇒:假设 。需证 。
设 ,则 。同时 ,故 ,其中 ,。于是 。但 ,故 ,即 。又 ,由直和性质 ,需进一步分析。
更直接的证法:设 。则 。又 ,故 ,因此 ,即 。
⇐:假设 。需证 。
设 。则 且存在 使得 。于是 ,故 ,即 ,故 。
习题5:null T^m 的维数上界
习题5
设 , 是正整数。证明:。
查看解答
对 用归纳法。 时显然成立。
设 。考虑商映射 ,定义为 。
。
因此 。
由归纳假设,。两式相加得 。
习题9:null与range的等式等价
习题9
设 , 是非负整数。证明:。
查看解答
由线性映射基本定理(3.21),,。
因此 。
由 8.1,,且由习题 6,。
等维数的包含关系即为相等。
习题13:ST幂零推出TS幂零
习题13
设 且 是幂零的。证明: 是幂零的。
查看解答
设 。那么:
。
因此 是幂零的。
习题17:I-T的可逆性与Neumann级数
习题17
设 是幂零的, 是正整数,满足 。 (a) 证明: 是可逆的,且 。 (b) 解释你会如何猜想出上述公式。
查看解答
(a):。
同理 。因此 可逆且逆为 。
(b):类比几何级数 。当 幂零时,级数在有限项后截断(因为 ),给出精确公式。
习题21:零空间维数的精确刻画
习题21
设 满足 。证明: 是幂零的,且对于每个满足 的整数 ,有 。
查看解答
设 。由已知 ,故零空间序列在每一步都严格增长(否则由 8.2 后续全部相等,矛盾)。
因此 。
每步维数至少增加1,而 ,故每步恰好增加1:。
特别地,,故 ,即 是幂零的。
八、视频学习指南
| 视频 | 标题 | 时长 | 核心内容 | 对应笔记章节 |
|---|---|---|---|---|
| P90 | 8A(1):幂的零空间 | 48:19 | 零空间序列递增、停止增长定理、null range 直和 | 一 |
| P91 | 8A(2):广义特征向量和特征空间 | 1:01:16 | 广义特征向量定义、构成基定理、唯一性、线性无关 | 二 |
| P92 | 8A(3):幂零算子 | 56:28 | 幂零定义、、特征值、最小多项式与上三角矩阵 | 三 |
| P93 | 8A习题 | 32:05 | 习题 3/6/9/10 的详细讲解 | 七 |
学习建议
- 先看 P90,理解零空间序列的基本性质,这是后续一切的基础
- 重点看 P91,定理 8.9 的证明是本节最核心的内容,建议反复观看
- P92 相对独立,可以在理解前两节后单独学习
- P93 建议先自己尝试做题,再看视频讲解