5C 上三角矩阵
本节概览
本节引入算子的矩阵 M(T) 的正式定义,建立上三角矩阵与不变子空间之间的深刻联系,证明复向量空间上每个算子都有上三角矩阵(Schur 分解的抽象形式),并给出由上三角矩阵直接读出特征值的简便方法。
逻辑链条:算子的矩阵 M(T) → 上三角矩阵定义 → 等价条件(不变子空间链)→ (T-λ₁I)…(T-λₙI)=0 → 特征值=对角线元素 → 充要条件(最小多项式可分解)→ F=C 时总存在
前置依赖:5A 不变子空间、特征值和特征向量(算子、不变子空间、特征值、p(T) 的不变性)、5B 最小多项式(最小多项式、q(T)=0 条件)、第4章 多项式(代数基本定理、因式分解)、3C 矩阵(矩阵的定义)、2B 基(基与线性无关)
核心主线:上三角矩阵是线性代数中”最简矩阵表示”的第一步——通过选取合适的基,使算子的矩阵尽可能多的位置为 0。在复数域上,每个算子都可以上三角化(5.47),对角线元素恰好给出全部特征值。
一、算子的矩阵与上三角矩阵
算子的矩阵定义
定义 5.35:算子的矩阵 M(T)
设 , 是 的基。 关于该基的算子的矩阵 是 矩阵,其第 列由 在基 下的坐标构成: 其中 是 第 列第 行的元素。
与 3C 矩阵的联系
算子的矩阵一定是方阵(行数 = 列数 = ),这与一般线性映射的长方形矩阵不同。当 是 上的算子且未明确基的选取时,默认使用标准基。
例 5.36:算子关于标准基的矩阵
关于标准基的矩阵为:
M(T) = ⎡2 1 0⎤ ⎢0 5 3⎥ ⎣0 0 8⎦这是一个上三角矩阵——对角线以下所有元素为零。
对角线与上三角矩阵
定义 5.37:矩阵的对角线
方阵的对角线由从左上角到右下角的直线上的元素所构成。对于 矩阵 ,对角线元素为 。
定义 5.38:上三角矩阵
称一个方阵为上三角矩阵,若其中所有在对角线之下的元素都是 。即对一切 ,。
上三角矩阵的一般形式
其中 表示任意元素。 上三角矩阵中至少有 个零。
上三角矩阵的等价条件
定理 5.39:上三角矩阵的等价条件
设 且 是 的基。以下三条等价:
- (a) 关于 的矩阵是上三角矩阵。
- (b) 对每个 , 在 下不变。
- (c) 对每个 ,。
证明思路
(a) ⇒ (b): 上三角意味着 。当 时,,故 ,即 在 下不变。
(b) ⇒ (c):取 即可。
(c) ⇒ (a): 只用到 ,故 第 列中第 行以下的元素全为零,即对角线以下全为零。
核心洞察
上三角矩阵对应着一组不变子空间链: 每一层都在 下不变。这就是5A 不变子空间、特征值和特征向量中不变子空间概念的”嵌套版本”。
二、上三角矩阵的性质
上三角算子满足的等式
定理 5.40:上三角算子满足的等式
设 关于 的某个基有上三角矩阵,对角线元素为 。则
证明思路
设基为 ,利用上三角矩阵的嵌套不变子空间结构,逐个验证乘积将每个基向量映为零。
基向量 :,故 ,从而整个乘积作用 。
基向量 :(上三角性),故 ,从而乘积作用 。
归纳推广到 :,由前 步的归纳结果,,从而整个乘积作用 。
结论:乘积把基中所有向量映为零,故为零算子。
证明的关键
利用 和 的可交换性(5A 不变子空间、特征值和特征向量 5.17(b)),保证消去顺序无关紧要。
由上三角矩阵确定特征值
定理 5.41:由上三角矩阵确定特征值
关于 的某个基有上三角矩阵 ⟹ 的特征值恰为对角线上各元素。
证明思路
对角线元素是特征值: ⇒ 是特征值。对 , 将 映入 。由维数公式(从 维映到至多 维), 不是单射 ⇒ 存在非零 使 ⇒ 是特征值。
无其他特征值:令 ,由 5.40 得 。由5B 最小多项式 5.29, 是最小多项式的倍数。由 5.27, 的特征值都是 的零点 ⊆ 。
例 5.42:由上三角矩阵直接读特征值
的对角线为 ⇒ 的特征值为 。无需计算特征多项式,直接”读”对角线即可。
核心结论
==(T-λ₁I)…(T-λₙI) = 0 是连接上三角矩阵与特征值的关键桥梁。一旦找到上三角矩阵,特征值=对角线元素==,这是上三角矩阵最大的实用价值。
三、上三角矩阵的存在性
存在性取决于域的选择
例 5.43:上三角矩阵的存在性可能取决于
,最小多项式 。
- :, 在 上不可分解为一次因式之积 ⇒ 无上三角矩阵。
- :,全为一次因式 ⇒ 有上三角矩阵。
存在上三角矩阵的充要条件
定理 5.44:存在上三角矩阵的充要条件
关于 的某个基有上三角矩阵 ⟺ 最小多项式 ,其中 。
证明思路
必要性(⇒):由 5.40,,其中 。由5B 最小多项式 5.29,最小多项式整除 ,故最小多项式为一次因式之积。
充分性(⇐),对 归纳:
:,关于任何基的矩阵都是上三角的。
:令 。由5A 不变子空间、特征值和特征向量 5.18, 在 下不变。 的最小多项式是至多 个一次因式之积。由归纳假设, 关于 的某个基 有上三角矩阵。将 扩充为 的基 。验证 (利用 )。由 5.39 得证。
定理 5.44 的意义
最小多项式能否分解为一次因式之积,完全取决于域 。这解释了为什么例 5.43 中 和 的结果不同。
复向量空间上的上三角化
定理 5.47: 时每个算子都有上三角矩阵
是有限维复向量空间, ⇒ 关于 的某个基有上三角矩阵。
证明思路
由 5.44 和第4章 多项式代数基本定理版本二(4.13: 上多项式可分解为一次因式之积)直接得出。
核心结论
==F=C 时每个算子都可上三角化。这是本章最重要的结论之一,本质上是Schur 分解==的抽象形式。它保证了复向量空间上每个算子都可以上三角化,从而特征值可以直接从对角线读出。
注意
上三角矩阵中, 一定是 的特征向量(),但 不一定是。 是特征向量 ⟺ 第 列除第 个元素外全为零(即矩阵为对角矩阵时)。
四、知识结构总览
graph TD A["算子的矩阵 M of T<br/>Def 5.35"] --> B["上三角矩阵<br/>Def 5.38"] B --> C["等价条件<br/>Thm 5.39"] C --> D["乘积等式<br/>Thm 5.40"] D --> E["特征值等于对角线<br/>Thm 5.41"] B --> F["充要条件<br/>Thm 5.44"] F --> G["C上总存在<br/>Thm 5.47"] A --> H["取决于F的选择<br/>Ex 5.43"]
五、核心思想与证明技巧
核心思想
- 上三角矩阵是”最简矩阵表示”的第一步——通过换基使矩阵尽可能多的位置为 0
- 上三角矩阵与不变子空间链等价—— 在 下不变 ⟺ 上三角
- 上三角矩阵直接给出特征值——对角线元素就是全部特征值(含重数)
- 上三角化的存在性取决于域—— 上总成立(FTA), 上不一定
证明技巧清单
- 利用不变子空间链证明等价条件(定理 5.39):上三角 ⟺ 嵌套不变子空间 ⟺ ,三轮循环论证
- 逐个基向量验证乘积为零(定理 5.40——核心归纳技巧):从 开始,利用 逐层消去
- 维数公式证明”不是单射”(定理 5.41): 将 维空间映入 维空间 ⇒ 有非零核 ⇒ 是特征值
- 利用 归纳构造基(定理 5.44——最深刻的证明):在不变子空间上应用归纳假设,再扩充为全空间基
六、补充理解与易混淆点
上三角矩阵与行阶梯形的区别
Note
行阶梯形通过行变换得到,不保持特征值信息,与基无关。算子的上三角矩阵通过换基得到,对角线就是特征值。行阶梯形是计算工具(高斯消元),上三角矩阵是理论工具(算子表示)。两者之间没有本质联系。
来源:UC Berkeley EE16B “Note 15: Upper Triangulation, Schur Decomposition”、MIT 18.700 “Upper Triangular Matrices and Diagonalization”
Schur 分解与定理 5.47 的关系
Note
定理 5.47 本质上是 Schur 分解的抽象形式。
- Schur 分解(矩阵版本):对任意 ,存在幺正矩阵 和上三角矩阵 使得
- 抽象版本(5.47):对任意 ( 为复向量空间),存在基使 上三角
Schur 分解在数值线性代数中有重要应用(如 QR 算法),是计算特征值的核心工具。
来源:UCLA “The Schur Decomposition”、UC Berkeley EE16B “Note 15”、UCSB “Lecture 5: The Schur Decomposition”
为什么上三角矩阵如此重要
Note
- 上三角矩阵是 Jordan 标准形(第8章)和谱定理(第7章)的”前奏”——从上三角出发,添加不同条件可得到更精细的矩阵表示
- 从上三角到对角化只需一个额外条件:最小多项式无重根(5B 最小多项式)
- 上三角矩阵使算子的幂、多项式计算变得简单——上三角矩阵的幂仍为上三角,对角线元素取幂即可
来源:UPenn Math 314 “Triangular and Diagonal Forms”、UC Davis “Eigenvalues and Eigenvectors”
常见误区
误区1:"上三角矩阵就是行阶梯形"
❌ 行阶梯形和算子的上三角矩阵是一回事 ✅ 行阶梯形通过行变换得到,不保持特征值;算子的上三角矩阵通过换基得到,对角线就是特征值。两者之间没有联系。
误区2:"每个算子都有上三角矩阵"
❌ 无论在什么域上,算子都有上三角矩阵 ✅ 仅当最小多项式可分解为一次因式之积时成立(定理 5.44)。 总成立(代数基本定理), 不一定。例如 上的旋转算子可能没有实上三角矩阵。
误区3:"对角线上每个元素都是不同的特征值"
❌ 对角线元素就是不同的特征值 ✅ 对角线元素恰好是全部特征值(可能有重复)。重复次数是代数重数,不一定等于几何重数(特征空间的维数)。
误区4:"上三角矩阵的每个基向量都是特征向量"
❌ 上三角矩阵的每个基向量都是特征向量 ✅ 只有 一定是特征向量()。 不一定是——只有当矩阵是对角矩阵时,所有基向量才是特征向量。
七、习题精选
推荐习题
编号 标题 核心考点 难度 1 T² 有上三角矩阵 ⟹ T 有? 上三角矩阵的充分条件 低 2 上三角矩阵的和与积 对角线元素运算 低 3 可逆算子的上三角逆矩阵 T⁻¹ 的对角线 中 4 C 上任意 k 维不变子空间 5.47 的推论 中 5 T²v+2Tv=-2v 的上三角矩阵 最小多项式与上三角 中 6 不变子空间的受限与商算子 受限/商算子的上三角 高 7 对偶算子的上三角矩阵 T’ 与 T 的关系 高
习题1:T² 有上三角矩阵 ⟹ T 有?
习题1
证明或给出一反例:如果 且 关于 的某个基有上三角矩阵,那么 关于 的某个基有上三角矩阵。
查看解答
反例。设 , 定义为 (旋转 90°)。
,关于任何基的矩阵都是 (对角矩阵,上三角)。但 没有实特征值,故 关于 的任何基都没有上三角矩阵(由 5.41,上三角矩阵的对角线元素是特征值,但 没有实特征值)。
习题2:上三角矩阵的和与积
习题2
设 和 是大小相同的上三角矩阵, 的对角线上是 , 的对角线上是 。 (a) 证明 是上三角矩阵,对角线上是 。 (b) 证明 是上三角矩阵,对角线上是 。
查看解答
(a) 。若 ,则 且 ,故 。对角线:。
(b) 。若 ,则对每个 :当 时 (因为 );当 时 。故每项为 0。对角线:,仅 时 和 可能都非零,故 。
习题3:可逆算子的上三角逆矩阵
习题3
设 可逆,且 的基 使得 关于这个基的矩阵是上三角的,对角线上是 。证明 关于这个基的矩阵也是上三角的,对角线上是 。
查看解答
可逆 ⇒ 每个 (否则由 5.41, 是特征值, 可逆 ⇒ 不是特征值)。
设 (上三角),则 。因为 是上三角且可逆, 也是上三角(可用前代法验证),且对角线元素为 。
习题6:C 上任意 k 维不变子空间
习题6
设 , 是有限维的,且 。证明:如果 ,那么 有在 下不变的 维子空间。
查看解答
由定理 5.47,存在 的基 使得 是上三角矩阵。由定理 5.39,对每个 , 在 下不变。取 ,则 且 在 下不变。
习题8:T²v+2Tv=-2v 的上三角矩阵
习题8
设 是有限维的,,且存在非零向量 使得 。 (a) 证明如果 ,那么 中不存在能使 有上三角矩阵的基。 (b) 证明如果 且 是 关于 的某个基得到的上三角矩阵,那么 的对角线上会出现 或 。
查看解答
(a) ,即 。 说明 不是单射。若 关于某基有上三角矩阵,则由 5.40,,最小多项式为一次因式之积。但 在 上不可分解为一次因式之积(判别式 ),矛盾于 5.44。
(b) 。由 5.27, 的特征值包含 或 (因为 整除最小多项式,最小多项式的零点包含 的零点)。由 5.41,上三角矩阵的对角线包含所有特征值。
习题12:不变子空间的受限与商算子
习题12
设 是有限维的, 关于 的某个基有上三角矩阵,且 是 的在 下不变的子空间。 (a) 证明 关于 的某个基有上三角矩阵。 (b) 证明商算子 关于 的某个基有上三角矩阵。
查看解答
(a) 由 5.44, 的最小多项式可分解为一次因式之积。由5B 最小多项式 5.31, 的最小多项式整除 的最小多项式,故也可分解为一次因式之积。由 5.44, 关于 的某个基有上三角矩阵。
(b) 类似地, 的最小多项式也整除 的最小多项式(习题 5B.25(a)),故可分解为一次因式之积。由 5.44, 关于 的某个基有上三角矩阵。
习题14:对偶算子的上三角矩阵
习题14
设 是有限维的,且 。证明: 关于 的某个基有上三角矩阵,当且仅当对偶算子 关于对偶空间 的某个基有上三角矩阵。
查看解答
(⇒) 设 是 的基使 上三角。令 是 的对偶基()。计算 。当 时,, 在 上为零(因为 ),故 。因此 ,由 5.39(c) 的对偶版本, 关于 有上三角矩阵。
(⇐) 由对称性( 与 自然同构)。
八、视频学习指南
视频资源
资源 主题 链接 3Blue1Brown 特征值与特征向量(直觉理解) Essence of Linear Algebra Dr. Peyam Upper Triangular Matrices YouTube Michael Penn Triangularization Theorem YouTube Zach Star 线性代数核心概念 YouTube 李沐 动手学深度学习 - 线性代数 Bilibili
视频精要
- 3Blue1Brown 的特征值视频提供了极佳的几何直觉,适合作为本节的入门
- Dr. Peyam 和 Michael Penn 的视频更贴近教材风格,适合深入学习证明细节
- 建议先看 3Blue1Brown 建立直觉,再结合教材和本笔记学习严格证明
九、教材原文