5.A 不变子空间、特征值和特征向量
本节概览
本节是第 5 章的起点,引入了算子理论中最核心的概念——不变子空间、特征值和特征向量,并建立了多项式作用于算子的理论框架。整个逻辑链条为:
算子定义 不变子空间 一维不变子空间 特征值/特征向量 等价条件 线性无关性 特征值个数上界 算子的幂 多项式作用于算子 乘积性质 的不变性
一、不变子空间
1.1 算子
定义 5.1:算子(operator)
从一个向量空间到其本身的线性映射称为算子。即 。
学习注解
算子就是 。算子理论比一般线性映射理论更丰富,因为算子可以”自乘为幂”——这是特征值理论的基础。
研究动机:若 (各 非零),则理解 的作用只需理解各 的作用——而 比 更小,所以更简单。
1.2 不变子空间的定义
定义 5.2:不变子空间(invariant subspace)
设 。 的子空间 称为在 下是不变的,若对每个 均有 。
学习注解
等价表述: 在 下不变 是 上的算子(即 将 映射到 自身)。
研究不变子空间的动机:如果 且每个 都在 下不变,那么要理解 的作用,只需理解每个 的作用——而 比 更小,所以更简单。
1.3 不变子空间的实例
例 5.3-5.4:不变子空间
微分算子:。 在 下不变,因为求导不升高次数。
四个平凡不变子空间(对任意 ):
- :
- :
- :
- :
学习注解
和 不一定提供”非平凡”的不变子空间——当 可逆时, 且 。稍后将证明:如果 ()或 (),则 一定有非平凡不变子空间。
二、特征值和特征向量
2.1 特征值的定义
定义 5.5:特征值(eigenvalue)
设 。称数 为 的特征值,若存在 使得 且 。
学习注解
- 要求 是必要的,因为 对所有 成立。
- “eigenvalue” 一半德文一半英文,德文前缀 “eigen” 意为”自身的”——特征值刻画了算子”固有的”标量倍行为。
- 有在 下不变的一维子空间 有特征值。
2.2 成为特征值的等价条件
定理 5.7:成为特征值的等价条件
设 是有限维的, 且 。那么以下等价:
- (a) 是 的特征值
- (b) 不是单射
- (c) 不是满射
- (d) 不可逆
学习注解
证明思路
分两步建立等价链:(a) 与 (b) 通过特征值定义直接变形;(b)、(c)、(d) 则利用有限维空间中单射、满射、可逆的三者等价。
[(a) ⟺ (b) 特征值定义变形]: ,有非零解 不是单射。
[(b) ⟺ (c) ⟺ (d) 有限维三者等价]: 由 3.65(有限维等维数下,单射 满射 可逆)。
关键洞察:条件 (d) 是最实用的——判断 是否为特征值,只需计算 是否为零(下一节将展开)。
2.3 特征向量的定义
定义 5.8:特征向量(eigenvector)
设 且 是 的特征值。满足 且 的向量 称为 对应于 的特征向量。
学习注解
等价表述: 是 对应于 的特征向量 。
特征向量的几何意义: 意味着 将 映射到 所在的直线上(可能拉伸或反向)。所以特征向量确定了算子的”不变方向”。
例 5.9:旋转算子的特征值
(逆时针旋转 )。
- :没有特征值!旋转 不会将任何非零向量映射到自身的标量倍。
- :特征值为 和 。对应特征向量分别为 和 。
这个例子深刻说明了:同一个算子在不同数域上可能有完全不同的特征值结构。复数域”更大”,所以能提供更多的特征值。
三、特征向量的线性无关性
3.1 不同特征值对应的特征向量线性无关
定理 5.11:线性无关的特征向量
设 。那么分别对应于 的不同特征值的特征向量构成的每个组都线性无关。
学习注解
证明思路 使 个对应互异特征值的特征向量线性相关,用 作用消去第 个向量,得到 个向量线性相关,与 的最小性矛盾。
反证法 + 最小反例。假设存在最小正整数
[假设最小反例]: 假设结论不成立,取最小的正整数 使得对应于互异特征值 的特征向量 线性相关()。
存在非零 使得 。
[用 消去第 个向量]: 将 作用于上式:
[导出矛盾]: 因为特征值互异,各系数非零,所以 线性相关——与 的最小性矛盾。
证明的核心技巧:用 作用可以”消去”第 个向量,将 个向量的线性相关”降维”为 个向量的线性相关。
3.2 特征值个数的上界
定理 5.12:特征值个数不超过维数
设 是有限维的。那么 上的每个算子最多有 个互异特征值。
学习注解
证明思路 维空间中线性无关组的大小不超过 (2.22),两者结合即得上界。
不同特征值对应的特征向量线性无关(5.11),而
[由 5.11 得线性无关]: 设 是 的互异特征值, 是对应的特征向量。由 5.11, 线性无关。
[由 2.22 得维数上界]: 由 2.22,。
直觉: 维空间中最多有 个线性无关的向量,而不同特征值对应的特征向量线性无关,所以最多有 个不同特征值。
四、多项式作用于算子
4.1 算子的幂
记号 5.13:
设 , 是正整数。
- (恒等算子)
- 若 可逆,
学习注解
你应验证: 且 。算子可以取幂,这是算子区别于一般线性映射的关键。
4.2 多项式作用于算子
记号 5.14:
设 且 。那么
例 5.15:多项式作用于微分算子
,。则 ,于是
学习注解
核心思想:将多项式 中的变量 替换为算子 。常数项 变成 (因为 ,所以 变成 )。
映射 是从 到 的线性映射。
4.3 乘积性质
定理 5.17:乘积性质
设 且 。那么
- (a)
- (b)
学习注解
证明思路 ,由 (a) 直接推出。
(a) 将多项式乘积展开后直接逐项验证;(b) 利用标量乘法可交换性
[(a) 展开验证]: 设 ,。则
[(b) 标量乘法可交换]: 。
关键洞察:性质 (b) 表明,对单个算子的多项式取乘积时,顺序无关紧要——因为标量的乘法是可交换的。但 (一般情况),所以对不同算子的多项式不能交换。
4.4 的零空间和值域在 下不变
定理 5.18: 的零空间和值域在 下不变
设 且 。那么 和 在 下不变。
学习注解
证明思路 与 的可交换性 (定理 5.17),分别验证零空间和值域中元素经 作用后仍在原集合内。
利用
[零空间的不变性]: 设 ,则 。于是 其中关键步骤是 (因为 和 在乘积中可交换位置)。故 。
[值域的不变性]: 设 。则 。
这个定理极其重要:它说明了算子的多项式的零空间和值域都是不变子空间。下一节将利用这个结论证明”复向量空间上的每个算子都有特征值”。
五、知识结构总览
graph TD A["定义5.1: 算子 T∈L(V)"] --> B["定义5.2: 不变子空间<br/>Tu∈U 对所有 u∈U"] B --> C["一维不变子空间"] C --> D["定义5.5: 特征值 λ<br/>Tv=λv, v≠0"] D --> E["定义5.8: 特征向量<br/>v∈null(T-λI)"] D --> F["定理5.7: 等价条件<br/>λ是特征值 ⟺ T-λI不可逆"] E --> G["定理5.11: 不同特征值对应的<br/>特征向量线性无关"] G --> H["定理5.12: 特征值个数 ≤ dim V"] A --> I["记号5.13: Tᵐ (算子的幂)"] I --> J["记号5.14: p(T)<br/>多项式作用于算子"] J --> K["定理5.17: (pq)(T)=p(T)q(T)<br/>p(T)q(T)=q(T)p(T)"] K --> L["定理5.18: null p(T) 和<br/>range p(T) 在 T 下不变"] L --> M["下一节: 复向量空间上<br/>每个算子都有特征值"]
六、核心思想与证明技巧
核心思想
- 不变子空间是简化算子的工具:如果 且每个 在 下不变,那么理解 归结为理解每个 ——“分而治之”。
- 特征值 = 一维不变子空间的”拉伸因子”: 意味着 在 上的作用就是乘以 。特征值揭示了算子的”固有标量行为”。
- 不同特征值对应的特征向量线性无关:这是特征值理论中最基本的线性代数结论之一,直接推出特征值个数不超过维数。
- 多项式作用于算子: 将多项式理论与算子理论连接起来。关键性质 依赖于标量乘法的可交换性。
证明技巧清单
- 消去法(5.11):用 作用消去第 个向量,将 个向量的问题降为 个
- 等价条件链(5.7):特征值 非单射 非满射 不可逆(利用 3.65)
- 交换性论证(5.18):,因为 和 在乘积中可交换
- 反例构造:旋转 在 上无特征值,在 上有——说明数域的选择至关重要
七、补充理解与易混淆点
7.1 不变子空间的直觉理解
Note
不变子空间是”在算子作用下封闭”的子空间——算子将子空间中的向量仍然映射到该子空间内。这意味着我们可以将算子”限制”在这个子空间上,得到一个维数更低的算子。这是简化复杂算子的基本策略。
7.2 特征值与特征向量的几何意义
Note
特征向量是”只被拉伸/压缩、不被旋转”的向量——算子作用在特征向量上,只改变其长度(可能反向),不改变其方向。特征值就是拉伸/压缩的倍数。如果存在一组特征向量构成基,算子在该基下的矩阵就是对角矩阵。
7.3 常见误区
误区1:每个算子都有特征值
❌ 错误认知:所有线性算子都有特征值 ✅ 正确理解:在实数域上,不是所有算子都有特征值(例如 上的旋转 没有实特征值)。在复数域上,由代数基本定理,每个算子都有特征值
误区2:特征向量只有一个方向
❌ 错误认知:每个特征值只对应一个特征向量 ✅ 正确理解:每个特征值对应一个特征空间(所有满足 的向量),特征空间的维数(几何重数)可以大于1
误区3:不变子空间必须由特征向量张成
❌ 错误认知:不变子空间一定是某些特征空间的直和 ✅ 正确理解:不变子空间不一定要由特征向量张成。例如幂零算子的不变子空间链中,许多不变子空间不包含特征向量(除了零空间)
八、习题精选
推荐习题
- 习题 1: 不变; 不变(不变子空间的两个充分条件)
- 习题 5: 在 上求特征值(类似旋转,但角度不同)
- 习题 8:投影 的特征值只有 和 (投影算子的特征值刻画)
- 习题 9:微分算子 的特征值和特征向量(== 是特征函数==)
- 习题 13: 和 特征值相同(相似变换不改变特征值)
- 习题 21:可逆算子的特征值 ,且 是 的特征值
- 习题 23: 和 特征值相同(即使 )
- 习题 26:每个非零向量都是特征向量 是恒等算子的标量倍(对角化的极端情况)
- 习题 34: 线性无关 存在 使它们是对应不同特征值的特征向量(5.11 的逆命题)
- 习题 39: 有特征值 存在 维不变子空间(==一维不变子空间 = 特征向量==)
九、视频学习指南
暂无对应视频,建议通过阅读教材原文和本笔记学习。