8A 广义特征向量和幂零算子

本节概览

本节是第8章的基础工具篇,为后续的广义特征空间分解和Jordan标准型奠定核心基础。逻辑链条如下:

  1. 算子幂的零空间(8.1-8.4) 零空间序列递增、一旦相邻相等则后续全等、在 处停止增长、
  2. 广义特征向量(定义8.8, 8.9-8.12) 放宽特征向量条件,在复向量空间上保证能构成基
  3. 幂零算子(定义8.14, 8.15-8.18) 某次幂为零的算子,特征值唯一为0,与上三角矩阵的刻画

核心主线:零空间序列 广义特征向量(核心定理8.9) 幂零算子(特殊情形)。

前置依赖5A 不变子空间、特征值和特征向量(特征值、特征向量、不变子空间)、5B 最小多项式(最小多项式)、5C 上三角矩阵(上三角矩阵、特征值与对角元)、3B 零空间和值域(零空间、值域、线性映射基本定理)。


一、算子幂的零空间

我们从研究算子的幂的零空间开启本章。这一小节的结果是后续广义特征向量理论的基石。

视频精要

P90 - 8A(1):幂的零空间(48:19)

本节视频对应教材定理 8.1—8.4 和例 8.6,重点讲解零空间序列的递增性质和直和分解。

递增的零空间序列

定理 8.1:递增的零空间序列

。那么

证明思路

[零空间递增性]: 是非负整数,且 。那么 ,这表明 。从而 。因此

直觉理解 作用在 上如果已经归零了,那么多作用一次 (即 )自然还是零。所以被”消灭”的向量集合只会越来越大,不会缩小。

零空间序列中的等式

定理 8.2:零空间序列中的等式

是非负整数,满足 。那么

证明思路

[目标]: 证明 对任意正整数 成立。

由 8.1,已知

[反向包含]:。那么 因此 (利用已知等式)。

于是 ,意味着

[结论]: ,结合正向包含得等式。

直觉理解:一旦零空间”停止增长”(相邻两项相等),它就永远不会再增长了。就像水桶装水,一旦满了,再倒也不会更多。

零空间停止增长

定理 8.3:零空间停止增长

。那么

证明思路

[反证法]: 只需证明 (由 8.2 即可推广)。

假设此式不成立。那么由 8.1 和 8.2,我们有 其中 表示真包含。

[维数论证]: 在每个真包含号处,维数至少增加 1。因此 这与” 的子空间的维数不超过 “矛盾。

关键洞察

零空间序列最多在 步之内就会停止增长。这是一个非常强的结论——它给出了一个显式的上界,告诉我们不需要考虑任意高次的幂。

注意

并不对每个 都成立。下面的定理给出了一个”好用的替代结论”——用 代替

定理 8.4: 的直和

。那么

证明思路

[第一步:证明交集为零]: 证明

。那么 ,并且存在 使得 。将 作用于 两侧,可得 。因此 ,由 8.3(零空间在 处停止增长),这表明 。于是

[第二步:维数论证]: 由第一步和 3B 零空间和值域 中的 1.46, 是直和。并且, 其中第一个等号源于 3.94,第二个等号来自线性映射基本定理(3.21)。

[结论]: 维数等于 的子空间就是 本身(2.39),即

例 8.6:对于

定义

  • 注意 (例如 同时属于两者),所以 不是直和!
  • 同时 (缺少形如 的向量)

但是,,所以:

因此 ,正如 8.4 所述。

教材注记

上述结论的加强版本见习题 19:若 不是幂零的,则 ,即可以少用一次幂。


二、广义特征向量

仅凭特征向量不足以很好地描述有些算子。在本小节中,我们引入广义特征向量的概念,它将在描述算子的结构方面发挥决定性作用

视频精要

P91 - 8A(2):广义特征向量和特征空间(1:01:16)

本节视频对应教材定义 8.8、定理 8.9—8.12 和例 8.10,是本节最核心的内容。

为什么需要推广特征向量?

为了理解为何需要拓展特征向量,我们来回顾 5A 不变子空间、特征值和特征向量 中的讨论。

取定 。我们想通过找到一个”好”的直和分解 (其中各 都是 的在 下不变的子空间)来描述

  • 最简单的非零不变子空间是一维的
  • 当且仅当 具有由 的特征向量构成的基时,上述直和分解式中各 才全是 的在 下不变的一维子空间(见 5.55)
  • 这等价于 具有特征空间分解V = E(\lambda_1, T) \oplus \cdots \oplus E(\lambda_m, T) \tag{8.7} 其中 的所有互异特征值

7B 谱定理 可知,若 是内积空间,那么形如 (8.7) 的分解对于每个自伴算子(若 )及每个正规算子(若 )都成立。

核心问题

然而,对于更一般的算子来说,形如 (8.7) 的分解不一定成立,即便在复向量空间上也是如此。比如,5A 不变子空间、特征值和特征向量 中 5.57 展示的算子的特征向量就不足以使 (8.7) 成立。

广义特征向量和广义特征空间正是为了解决这一问题而引入的。

广义特征向量的定义

定义 8.8:广义特征向量(Generalized Eigenvector)

的特征值。称向量 对应于 广义特征向量,若 且对某个正整数

补充说明

  • 我们并未定义”广义特征值”,因为这样不会得到任何新东西:若 对于某个正整数 不是单射,那么 也不是单射,因此 就是 的特征值。
  • 将 8.1 和 8.3 应用于算子 即可得出:非零向量 对应于 的广义特征向量,当且仅当 。这意味着我们==总是可以取 ==。

关键洞察

  • 时,,即 是普通的特征向量。所以特征向量是广义特征向量的特例
  • 广义特征向量允许 ,条件更宽松,因此能提供更多的向量

核心定理:由广义特征向量构成的基

定理 8.9:由广义特征向量构成的基(核心定理!)

。那么存在由 的广义特征向量构成的 的基。

这是本节最重要的定理,也是整个第8章的基石之一。

证明思路

[归纳法]:,对 用归纳法。

[基础步]: 时, 中每个非零向量都是 的特征向量(因为 上每个算子都有特征值),结论成立。

[归纳步]:,假设结论在维数更小时成立。

[选取特征值并分解]: 的特征值( 上必存在)。将 8.4 应用于 ,可得

[讨论两种情况]:

  • ,则 中每个非零向量都是 对应于 的广义特征向量,结论成立。
  • ,则

[关键估计]: (因为 是特征值),所以

[不变子空间]: 下不变(由 5A 不变子空间、特征值和特征向量 中的 5.18,取 )。

[应用归纳假设]: 等于限制在 上的算子 。将归纳假设应用于 ,可得存在由 的广义特征向量构成的 的基,这些向量当然也是 的广义特征向量。

[合并基]: 的这个基与 的基合并,就得到了由 的广义特征向量构成的 的基。

定理 8.9 的意义

在复向量空间上,虽然不是每个算子都有足够多的特征向量来对角化,但每个算子都有足够多的广义特征向量来构成基。 这是广义特征向量理论的根本价值所在。

实数域的情形

,那么 上有些算子的广义特征向量可构成 的基,其他算子则不具有该性质。判定条件见习题 11。

例题: 上一算子的广义特征向量

例 8.10: 上一算子的广义特征向量

定义 为:对每个

特征值和特征向量:

  • 的特征值是
  • 对应于 的特征向量:形如 的非零向量
  • 对应于 的特征向量:形如 的非零向量
  • ==特征向量不足以张成 ==(缺少 方向)

广义特征向量:

  • 计算
  • 由 8.1 和 8.3, 对应于特征值 的广义特征向量是形如 的非零向量
  • 计算
  • 对应于特征值 的广义特征向量是形如 的非零向量

结论: 的标准基 中每个向量都是 的广义特征向量。正如 8.9 所言, 的确具有由 的广义特征向量构成的基。

广义特征向量对应于唯一的特征值

定理 8.11:广义特征向量对应于唯一的特征值

。那么 的每个广义特征向量都仅对应于 的一个特征值。

证明思路

[反证法]: 是同时对应于 的两个特征值 的广义特征向量。

是满足 的最小正整数,令 。那么 其中 ,其余二项式系数 的值无关紧要。

[关键操作]: 作用于上式两边。注意到当 ,而当 的最小性),所以只有 的项可能非零。但 ,所以

更精确地说,作用 后,所有 的项为零, 的项中 (因为 ),只剩 的项:

因为 的最小性),所以 ,即

线性无关的广义特征向量

定理 8.12:线性无关的广义特征向量

。那么由对应于 的互异特征值的广义特征向量构成的每个向量组都是线性无关的。

证明思路

[反证法]: 设结论不成立。那么存在最小正整数 ,使得对应于 的互异特征值 的广义特征向量 构成线性相关组(注意 ,因为广义特征向量非零)。

于是存在全不为 0 的数 最小保证所有系数非零)使得

[作用算子]:。将 作用于上式两侧,可得 a_1 (T - \lambda_m I)^n v_1 + \cdots + a_{m-1} (T - \lambda_m I)^n v_{m-1} = 0. \tag{8.13}

[验证非零性]:。那么 ——否则 就会成为 的同时对应于不同特征值 的广义特征向量,与 8.11 矛盾。

[验证广义特征向量性质]: 又有 所以 对应于特征值 的广义特征向量。

[导出矛盾]: 因此 是由 个对应于互异特征值的广义特征向量所构成的线性相关组(由式 (8.13)),这与 的最小性矛盾。

与特征向量的类比

这个证明的思路与 5A 不变子空间、特征值和特征向量 中 5.11(对应于不同特征值的特征向量线性无关)的证明完全类似,只是将 替换为


三、幂零算子

幂零算子是自乘若干次后会等于 0 的算子,在算子结构的研究中扮演着重要的角色。

视频精要

P92 - 8A(3):幂零算子(56:28)

本节视频对应教材定义 8.14、例 8.15、定理 8.16—8.18,重点讲解幂零算子的各种等价刻画。

幂零的定义

定义 8.14:幂零(Nilpotent)

称一个算子是幂零的(nilpotent),如果它的某个幂等于

拉丁文词语”nil”意为”无”或”零”,“potens”意为”幂”。于是”nilpotent”的字面意思就是”幂零”。

等价表述

算子 是幂零的,当且仅当 中每个非零向量都是 对应于特征值 的广义特征向量。

幂零算子的例子

例 8.15:幂零算子

(a) 定义为 的算子 是幂零的,因为

(b) 关于标准基的矩阵为 上的算子是幂零的,通过求该矩阵的立方得到零矩阵即可证明。

(c) 上的微分算子是幂零的,因为每个不超过 次的多项式的 阶导数都等于 。注意,在这个维数是 的向量空间上,我们需求该算子的 次幂才能得到算子

幂零算子的 次幂等于 0

定理 8.16: 维空间上幂零算子的 次幂等于 0

是幂零的。那么

证明思路

[利用零空间停止增长]: 因为 是幂零的,所以存在正整数 使得 。于是

由 8.1 和 8.3,。于是

关键洞察

定理 8.16 给出了一个统一的幂次上界:无论幂零算子实际需要多少次幂才能归零, 次幂一定足够。习题 18 给出了更强的结论:

幂零算子的特征值

定理 8.17:幂零算子的特征值

(a) 如果 是幂零的,那么 的特征值,并且 没有其他的特征值。

(b) 若 ,且 的唯一特征值,那么 是幂零的。

证明思路

(a) 的证明:

[0 是特征值]: 是幂零的,则存在正整数 使得 。这表明 不是单射,于是 的特征值。

[没有其他特征值]: 的特征值,则存在非零向量 使得 。将 反复作用于上式两端,可得 于是

(b) 的证明:

[利用最小多项式]: 的唯一特征值。根据 5B 最小多项式 中的 5.27 (b), 的最小多项式等于 为正整数)。于是 ,因此 是幂零的。

实数域的注意

习题 23 说明了上述结论 (b) 中 这个前提条件不可删去——在实数域上, 是唯一特征值并不蕴含幂零性。

幂零算子的最小多项式和上三角矩阵

定理 8.18:幂零算子的最小多项式和上三角矩阵

。那么下面各命题等价:

(a) 是幂零的。

(b) 的最小多项式等于 为正整数)。

(c) 存在 的一个基,使得 关于该基的矩阵形如 其中对角线及对角线下方各元素均等于

证明思路

这是一个循环证明:

[(a) (b)]: 是幂零的,则存在正整数 使得 。由 5B 最小多项式 中的 5.29, 的最小多项式的多项式倍。于是 的最小多项式就是 为正整数)。

[(b) (c)]: 的最小多项式是 。由 5B 最小多项式 中的 5.27 (a), 的唯一零点)是 的唯一特征值;由 5C 上三角矩阵 中的 5.44,存在 的一个基,使得 关于该基具有上三角矩阵。进而,由 5C 上三角矩阵 中的 5.41,该矩阵中对角线上的所有元素都等于

[(c) (a)]: 关于某基的矩阵是严格上三角的(对角线及以下全为零)。由 5C 上三角矩阵 中的 5.40,。于是 是幂零的。

定理 8.18 的意义

幂零算子有三种等价刻画:代数上的(某次幂为零)、多项式上的(最小多项式为 )、矩阵上的(严格上三角)。这三种视角的统一为我们后续研究提供了极大的灵活性。


四、知识结构总览

graph TD
    A["8A 广义特征向量和幂零算子"] --> B["一、算子幂的零空间"]
    A --> C["二、广义特征向量"]
    A --> D["三、幂零算子"]

    B --> B1["8.1 递增的零空间序列<br/>null T⁰ ⊆ null T¹ ⊆ ..."]
    B --> B2["8.2 零空间序列中的等式<br/>相邻相等 ⇒ 后续全等"]
    B --> B3["8.3 零空间停止增长<br/>null T^dim V = null T^{dim V+1} = ..."]
    B --> B4["8.4 V = null T^n ⊕ range T^n<br/>n = dim V"]
    B --> B5["例8.6 F³上的直和分解"]

    C --> C1["定义8.8 广义特征向量<br/>(T-λI)^k v = 0"]
    C --> C2["8.9 由广义特征向量构成的基<br/>⭐核心定理"]
    C --> C3["例8.10 C³上的广义特征向量"]
    C --> C4["8.11 唯一特征值"]
    C --> C5["8.12 线性无关性"]

    D --> D1["定义8.14 幂零算子<br/>T^m = 0"]
    D --> D2["例8.15 幂零算子三例"]
    D --> D3["8.16 T^dim V = 0"]
    D --> D4["8.17 特征值唯一为0"]
    D --> D5["8.18 三种等价刻画<br/>(a)⇔(b)⇔(c)"]

    B3 --> B4
    B4 --> C2
    C1 --> C2
    C2 --> D1
    D1 --> D3
    D1 --> D4
    D4 --> D5

    style A fill:#e1f5fe
    style C2 fill:#fff9c4
    style D5 fill:#f3e5f5

五、核心思想与证明技巧

维数论证的威力

本节多次使用维数论证作为核心证明工具:

  1. 定理 8.3:假设零空间序列严格递增到 ,则 ,矛盾
  2. 定理 8.4:证明 后,利用线性映射基本定理 得出直和等于
  3. 定理 8.9:归纳法中关键一步是证明 ,从而可以应用归纳假设

证明技巧总结

  • 维数上界:子空间的维数不超过全空间的维数
  • 线性映射基本定理
  • 真包含 ⇒ 维数增加 意味着

归纳法与算子限制

定理 8.9 的证明展示了处理算子问题的一种经典模式:

  1. 选取特征值(利用 保证存在性)
  2. 利用直和分解将空间分成两部分
  3. 验证不变子空间,从而可以将算子限制到子空间上
  4. 对子空间应用归纳假设

关键引理

5A 不变子空间、特征值和特征向量 中的 5.18 在这里发挥了关键作用:若 是多项式,则 下不变。取 即得 下不变。

最小性论证与反证法

定理 8.11 和 8.12 都使用了”最小性论证”:

  • 8.11:取使 的最小正整数 ,从而保证
  • 8.12:取使广义特征向量线性相关的最小 ,从而保证所有系数非零,且 个向量的子集线性无关

证明技巧总结

  • 最小性论证的核心价值:提供”非零性”保证
  • 配合反证法使用效果极佳

循环证明

定理 8.18 使用了经典的循环证明模式。这种模式的优点是每个方向的证明都比较简短,避免了直接证明任意两个命题等价时的冗长。


六、补充理解与易混淆点

广义特征向量 vs 特征向量:为什么需要推广?

核心动机:特征向量要求 ,条件太强。很多算子没有足够的特征向量构成基,例如例 8.10 中的算子只有两个线性无关的特征向量,但

广义特征向量要求 (某个 ),条件更宽松:

特征向量广义特征向量
定义(某个
条件强度弱( 时退化为特征向量)
能否构成基不一定(如例 8.10) 上一定可以(定理 8.9)

关键洞察

在复向量空间上,虽然不是每个算子都有足够多的特征向量来对角化,但每个算子都有足够多的广义特征向量来构成基

类比:特征向量是”一击即中”—— 作用一次就归零;广义特征向量是”多次打击后归零”——可能需要作用多次才能归零,但最终一定会被消灭。

来源:UPenn Math314讲义(Tony Pantev)、MIT 18.06讲义(Gilbert Strang)、UC Berkeley Math110讲义(Arthur Ogus)、OSU Ximera线性代数教材。

幂零算子的直觉

幂零算子 = “反复作用后最终归零”的算子。

典型例子

  • 严格上三角矩阵是幂零的(定理 8.18 (c))
  • 微分算子在多项式空间上是幂零的(例 8.15 (c))
  • 移位算子 是幂零的(例 8.15 (a),

易混淆点:幂零 ≠ 零算子!

幂零算子可以非零。例如例 8.15 (a) 的移位算子 ,但 。幂零只是说”某次幂为零”,而不是算子本身为零。

幂零指数:使 的最小正整数 称为 的幂零指数。由定理 8.16,幂零指数满足

来源:UPenn Math314讲义(Tony Pantev)、MIT 18.06讲义(Gilbert Strang)、Puget Sound线性代数教材。

的几何意义

定理 8.4 告诉我们,当 足够大时(),零空间和值域”完美互补”——它们的交集只有零向量,且直和等于全空间。

关键注意: 时不一定成立!

仅在 时成立(习题 3)。

例 8.6 就是一个反例:,所以 不是直和。

这正是为什么需要推广到”幂的零空间”——取足够高的幂次后,零空间”吸收”了所有需要吸收的向量,不再与值域重叠。

几何直觉:随着 增大, 不断增大, 不断缩小。当 足够大时,两者恰好”互补”——就像两个拼图碎片完美契合。

来源:UPenn Math314讲义(Tony Pantev)、MIT 18.06讲义(Gilbert Strang)、OSU Ximera线性代数教材。

广义特征空间分解(前瞻)

虽然本节没有正式定义”广义特征空间” ,但定理 8.9 已经蕴含了分解:

其中 是对应于特征值 的广义特征空间。

前瞻

  • 这是后续 8B 节(分块对角矩阵)和 8D 节(Jordan标准型)的基础
  • 广义特征空间分解告诉我们:任何复向量空间上的算子都可以分解为”幂零部分”的直和
  • 来源:Axler 2025年演讲 “Unlocking Hidden Dimensions”

常见误区与辨析

误区一

❌ “广义特征向量一定不是特征向量”

✅ ==特征向量是 的特殊广义特征向量==。每个特征向量都是广义特征向量,但反之不成立。

来源:UPenn Math314讲义(Tony Pantev)、MIT 18.06讲义(Gilbert Strang)、OSU Ximera线性代数教材。

误区二

❌ “幂零算子没有特征值”

✅ 幂零算子的==唯一特征值是 ==(定理 8.17 (a))。事实上,幂零算子的定义空间中每个非零向量都是对应于 的广义特征向量。

来源:UPenn Math314讲义(Tony Pantev)、MIT 18.06讲义(Gilbert Strang)、OSU Ximera线性代数教材。

误区三

❌ ” 总是等于

✅ 序列递增但可能严格递增,直到 后停止(定理 8.3)。例如例 8.6 中

来源:UPenn Math314讲义(Tony Pantev)、MIT 18.06讲义(Gilbert Strang)、OSU Ximera线性代数教材。

误区四

❌ ” 幂零

可以非零,只要 。例 8.15 (a) 的移位算子就是 的例子。

来源:UPenn Math314讲义(Tony Pantev)、MIT 18.06讲义(Gilbert Strang)、OSU Ximera线性代数教材。

误区五

❌ “在实向量空间上,0 是唯一特征值 ⇒ 幂零”

✅ 这个蕴涵关系仅在复数域上成立(定理 8.17 (b))。在实数域上存在反例(习题 23)。

来源:UPenn Math314讲义(Tony Pantev)、MIT 18.06讲义(Gilbert Strang)、OSU Ximera线性代数教材。


七、习题精选

本节习题

习题号标题核心考点难度
习题2T的幂作用下的线性无关性幂零算子的核心引理
习题3null T ⊕ range T 的等价刻画零空间与值域的关系
习题5null T^m 的维数上界零空间维数的增长速度
习题9null与range的等式等价零空间和值域的对偶性
习题13ST幂零推出TS幂零幂零算子的乘法性质
习题17I-T的可逆性与Neumann级数幂零算子的逆公式
习题21零空间维数的精确刻画零空间逐级增长

习题2:T的幂作用下的线性无关性

习题2

是正整数,,且 。证明: 是线性无关的。

习题3:null T ⊕ range T 的等价刻画

习题3

。证明:

习题5:null T^m 的维数上界

习题5

是正整数。证明:

习题9:null与range的等式等价

习题9

是非负整数。证明:

习题13:ST幂零推出TS幂零

习题13

是幂零的。证明: 是幂零的。

习题17:I-T的可逆性与Neumann级数

习题17

是幂零的, 是正整数,满足 。 (a) 证明: 是可逆的,且 。 (b) 解释你会如何猜想出上述公式。

习题21:零空间维数的精确刻画

习题21

满足 。证明: 是幂零的,且对于每个满足 的整数 ,有


八、视频学习指南

视频标题时长核心内容对应笔记章节
P908A(1):幂的零空间48:19零空间序列递增、停止增长定理、null range 直和
P918A(2):广义特征向量和特征空间1:01:16广义特征向量定义、构成基定理、唯一性、线性无关
P928A(3):幂零算子56:28幂零定义、、特征值、最小多项式与上三角矩阵
P938A习题32:05习题 3/6/9/10 的详细讲解

学习建议

  1. 先看 P90,理解零空间序列的基本性质,这是后续一切的基础
  2. 重点看 P91,定理 8.9 的证明是本节最核心的内容,建议反复观看
  3. P92 相对独立,可以在理解前两节后单独学习
  4. P93 建议先自己尝试做题,再看视频讲解

九、教材原文


广义特征向量