5C 上三角矩阵

本节概览

本节引入算子的矩阵 M(T) 的正式定义,建立上三角矩阵不变子空间之间的深刻联系,证明复向量空间上每个算子都有上三角矩阵(Schur 分解的抽象形式),并给出由上三角矩阵直接读出特征值的简便方法。

逻辑链条:算子的矩阵 M(T) → 上三角矩阵定义 → 等价条件(不变子空间链)→ (T-λ₁I)…(T-λₙI)=0 → 特征值=对角线元素 → 充要条件(最小多项式可分解)→ F=C 时总存在

前置依赖5A 不变子空间、特征值和特征向量(算子、不变子空间、特征值、p(T) 的不变性)、5B 最小多项式(最小多项式、q(T)=0 条件)、第4章 多项式(代数基本定理、因式分解)、3C 矩阵(矩阵的定义)、2B 基(基与线性无关)

核心主线:上三角矩阵是线性代数中”最简矩阵表示”的第一步——通过选取合适的基,使算子的矩阵尽可能多的位置为 0。在复数域上,每个算子都可以上三角化(5.47),对角线元素恰好给出全部特征值。


一、算子的矩阵与上三角矩阵

算子的矩阵定义

定义 5.35:算子的矩阵 M(T)

的基。 关于该基的算子的矩阵 矩阵,其第 列由 在基 下的坐标构成: 其中 列第 行的元素。

3C 矩阵的联系

算子的矩阵一定是方阵(行数 = 列数 = ),这与一般线性映射的长方形矩阵不同。当 上的算子且未明确基的选取时,默认使用标准基。

例 5.36:算子关于标准基的矩阵

关于标准基的矩阵为:

M(T) = ⎡2 1 0⎤
       ⎢0 5 3⎥
       ⎣0 0 8⎦

这是一个上三角矩阵——对角线以下所有元素为零。

对角线与上三角矩阵

定义 5.37:矩阵的对角线

方阵的对角线由从左上角到右下角的直线上的元素所构成。对于 矩阵 ,对角线元素为

定义 5.38:上三角矩阵

称一个方阵为上三角矩阵,若其中所有在对角线之下的元素都是 。即对一切

上三角矩阵的一般形式

其中 表示任意元素。 上三角矩阵中至少有 个零。

上三角矩阵的等价条件

定理 5.39:上三角矩阵的等价条件

的基。以下三条等价:

  • (a) 关于 的矩阵是上三角矩阵。
  • (b) 对每个 下不变。
  • (c) 对每个

证明思路

(a) ⇒ (b) 上三角意味着 。当 时,,故 ,即 下不变。

(b) ⇒ (c):取 即可。

(c) ⇒ (a) 只用到 ,故 列中第 行以下的元素全为零,即对角线以下全为零。

核心洞察

上三角矩阵对应着一组不变子空间链 每一层都在 下不变。这就是5A 不变子空间、特征值和特征向量中不变子空间概念的”嵌套版本”。


二、上三角矩阵的性质

上三角算子满足的等式

定理 5.40:上三角算子满足的等式

关于 的某个基有上三角矩阵,对角线元素为 。则

证明思路

设基为 ,利用上三角矩阵的嵌套不变子空间结构,逐个验证乘积将每个基向量映为零。

基向量 ,故 ,从而整个乘积作用

基向量 (上三角性),故 ,从而乘积作用

归纳推广到 ,由前 步的归纳结果,,从而整个乘积作用

结论:乘积把基中所有向量映为零,故为零算子。

证明的关键

利用 可交换性5A 不变子空间、特征值和特征向量 5.17(b)),保证消去顺序无关紧要。

由上三角矩阵确定特征值

定理 5.41:由上三角矩阵确定特征值

关于 的某个基有上三角矩阵 ⟹ 的特征值恰为对角线上各元素。

证明思路

对角线元素是特征值 是特征值。对 映入 。由维数公式(从 维映到至多 维), 不是单射 ⇒ 存在非零 使 是特征值。

无其他特征值:令 ,由 5.40 得 。由5B 最小多项式 5.29, 是最小多项式的倍数。由 5.27, 的特征值都是 的零点 ⊆

例 5.42:由上三角矩阵直接读特征值

的对角线为 的特征值为 。无需计算特征多项式,直接”读”对角线即可。

核心结论

==(T-λ₁I)…(T-λₙI) = 0 是连接上三角矩阵与特征值的关键桥梁。一旦找到上三角矩阵,特征值=对角线元素==,这是上三角矩阵最大的实用价值。


三、上三角矩阵的存在性

存在性取决于域的选择

例 5.43:上三角矩阵的存在性可能取决于

,最小多项式

  • 上不可分解为一次因式之积 ⇒ 无上三角矩阵
  • ,全为一次因式 ⇒ 有上三角矩阵

存在上三角矩阵的充要条件

定理 5.44:存在上三角矩阵的充要条件

关于 的某个基有上三角矩阵 ⟺ 最小多项式 ,其中

证明思路

必要性(⇒):由 5.40,,其中 。由5B 最小多项式 5.29,最小多项式整除 ,故最小多项式为一次因式之积。

充分性(⇐),对 归纳

,关于任何基的矩阵都是上三角的。

:令 。由5A 不变子空间、特征值和特征向量 5.18, 下不变。 的最小多项式是至多 个一次因式之积。由归纳假设, 关于 的某个基 有上三角矩阵。将 扩充为 的基 。验证 (利用 )。由 5.39 得证。

定理 5.44 的意义

最小多项式能否分解为一次因式之积,完全取决于域 。这解释了为什么例 5.43 中 的结果不同。

复向量空间上的上三角化

定理 5.47: 时每个算子都有上三角矩阵

是有限维复向量空间, 关于 的某个基有上三角矩阵。

证明思路

由 5.44 和第4章 多项式代数基本定理版本二(4.13: 上多项式可分解为一次因式之积)直接得出。

核心结论

==F=C 时每个算子都可上三角化。这是本章最重要的结论之一,本质上是Schur 分解==的抽象形式。它保证了复向量空间上每个算子都可以上三角化,从而特征值可以直接从对角线读出。

注意

上三角矩阵中, 一定是 的特征向量(),但 不一定是。 是特征向量 ⟺ 第 列除第 个元素外全为零(即矩阵为对角矩阵时)。


四、知识结构总览

graph TD
    A["算子的矩阵 M of T<br/>Def 5.35"] --> B["上三角矩阵<br/>Def 5.38"]
    B --> C["等价条件<br/>Thm 5.39"]
    C --> D["乘积等式<br/>Thm 5.40"]
    D --> E["特征值等于对角线<br/>Thm 5.41"]
    B --> F["充要条件<br/>Thm 5.44"]
    F --> G["C上总存在<br/>Thm 5.47"]
    A --> H["取决于F的选择<br/>Ex 5.43"]

五、核心思想与证明技巧

核心思想

  1. 上三角矩阵是”最简矩阵表示”的第一步——通过换基使矩阵尽可能多的位置为 0
  2. 上三角矩阵与不变子空间链等价—— 下不变 ⟺ 上三角
  3. 上三角矩阵直接给出特征值——对角线元素就是全部特征值(含重数)
  4. 上三角化的存在性取决于域—— 上总成立(FTA), 上不一定

证明技巧清单

  1. 利用不变子空间链证明等价条件(定理 5.39):上三角 ⟺ 嵌套不变子空间 ⟺ ,三轮循环论证
  2. 逐个基向量验证乘积为零(定理 5.40——核心归纳技巧):从 开始,利用 逐层消去
  3. 维数公式证明”不是单射”(定理 5.41): 维空间映入 维空间 ⇒ 有非零核 ⇒ 是特征值
  4. 利用 归纳构造基(定理 5.44——最深刻的证明):在不变子空间上应用归纳假设,再扩充为全空间基

六、补充理解与易混淆点

上三角矩阵与行阶梯形的区别

Note

行阶梯形通过行变换得到,不保持特征值信息,与基无关。算子的上三角矩阵通过换基得到,对角线就是特征值。行阶梯形是计算工具(高斯消元),上三角矩阵是理论工具(算子表示)。两者之间没有本质联系。

来源:UC Berkeley EE16B “Note 15: Upper Triangulation, Schur Decomposition”、MIT 18.700 “Upper Triangular Matrices and Diagonalization”

Schur 分解与定理 5.47 的关系

Note

定理 5.47 本质上是 Schur 分解的抽象形式。

  • Schur 分解(矩阵版本):对任意 ,存在幺正矩阵 和上三角矩阵 使得
  • 抽象版本(5.47):对任意 为复向量空间),存在基使 上三角

Schur 分解在数值线性代数中有重要应用(如 QR 算法),是计算特征值的核心工具。

来源:UCLA “The Schur Decomposition”、UC Berkeley EE16B “Note 15”、UCSB “Lecture 5: The Schur Decomposition”

为什么上三角矩阵如此重要

Note

  • 上三角矩阵是 Jordan 标准形(第8章)和谱定理(第7章)的”前奏”——从上三角出发,添加不同条件可得到更精细的矩阵表示
  • 从上三角到对角化只需一个额外条件:最小多项式无重根(5B 最小多项式
  • 上三角矩阵使算子的幂、多项式计算变得简单——上三角矩阵的幂仍为上三角,对角线元素取幂即可

来源:UPenn Math 314 “Triangular and Diagonal Forms”、UC Davis “Eigenvalues and Eigenvectors”

常见误区

误区1:"上三角矩阵就是行阶梯形"

❌ 行阶梯形和算子的上三角矩阵是一回事 ✅ 行阶梯形通过行变换得到,不保持特征值;算子的上三角矩阵通过换基得到,对角线就是特征值。两者之间没有联系。

误区2:"每个算子都有上三角矩阵"

❌ 无论在什么域上,算子都有上三角矩阵 ✅ 仅当最小多项式可分解为一次因式之积时成立(定理 5.44)。 总成立(代数基本定理), 不一定。例如 上的旋转算子可能没有实上三角矩阵。

误区3:"对角线上每个元素都是不同的特征值"

❌ 对角线元素就是不同的特征值 ✅ 对角线元素恰好是全部特征值(可能有重复)。重复次数是代数重数,不一定等于几何重数(特征空间的维数)。

误区4:"上三角矩阵的每个基向量都是特征向量"

❌ 上三角矩阵的每个基向量都是特征向量 ✅ 只有 一定是特征向量()。 不一定是——只有当矩阵是对角矩阵时,所有基向量才是特征向量。


七、习题精选

推荐习题

编号标题核心考点难度
1T² 有上三角矩阵 ⟹ T 有?上三角矩阵的充分条件
2上三角矩阵的和与积对角线元素运算
3可逆算子的上三角逆矩阵T⁻¹ 的对角线
4C 上任意 k 维不变子空间5.47 的推论
5T²v+2Tv=-2v 的上三角矩阵最小多项式与上三角
6不变子空间的受限与商算子受限/商算子的上三角
7对偶算子的上三角矩阵T’ 与 T 的关系

习题1:T² 有上三角矩阵 ⟹ T 有?

习题1

证明或给出一反例:如果 关于 的某个基有上三角矩阵,那么 关于 的某个基有上三角矩阵。

习题2:上三角矩阵的和与积

习题2

是大小相同的上三角矩阵, 的对角线上是 的对角线上是 。 (a) 证明 是上三角矩阵,对角线上是 。 (b) 证明 是上三角矩阵,对角线上是

习题3:可逆算子的上三角逆矩阵

习题3

可逆,且 的基 使得 关于这个基的矩阵是上三角的,对角线上是 。证明 关于这个基的矩阵也是上三角的,对角线上是

习题6:C 上任意 k 维不变子空间

习题6

是有限维的,且 。证明:如果 ,那么 有在 下不变的 维子空间。

习题8:T²v+2Tv=-2v 的上三角矩阵

习题8

是有限维的,,且存在非零向量 使得 。 (a) 证明如果 ,那么 中不存在能使 有上三角矩阵的基。 (b) 证明如果 关于 的某个基得到的上三角矩阵,那么 的对角线上会出现

习题12:不变子空间的受限与商算子

习题12

是有限维的, 关于 的某个基有上三角矩阵,且 的在 下不变的子空间。 (a) 证明 关于 的某个基有上三角矩阵。 (b) 证明商算子 关于 的某个基有上三角矩阵。

习题14:对偶算子的上三角矩阵

习题14

是有限维的,且 。证明: 关于 的某个基有上三角矩阵,当且仅当对偶算子 关于对偶空间 的某个基有上三角矩阵。


八、视频学习指南

视频资源

资源主题链接
3Blue1Brown特征值与特征向量(直觉理解)Essence of Linear Algebra
Dr. PeyamUpper Triangular MatricesYouTube
Michael PennTriangularization TheoremYouTube
Zach Star线性代数核心概念YouTube
李沐动手学深度学习 - 线性代数Bilibili

视频精要

  • 3Blue1Brown 的特征值视频提供了极佳的几何直觉,适合作为本节的入门
  • Dr. Peyam 和 Michael Penn 的视频更贴近教材风格,适合深入学习证明细节
  • 建议先看 3Blue1Brown 建立直觉,再结合教材和本笔记学习严格证明

九、教材原文

上三角矩阵