8C 广义特征空间分解的推论

本节概览

本节是第8章的高潮收尾,建立在 8B 广义特征空间分解 的基础上,得到两个重要成果:

  1. 可逆算子的平方根(引理8.39, 定理8.41) 利用幂零算子的有限性,构造
  2. 若当基与若当型(定义8.44, 定理8.45, 定理8.46) 本节最核心的结果,证明每个复向量空间上的算子都有若当基,从而得到若当型——比上三角矩阵更精细的”最简标准形”

核心主线:幂零算子的平方根 可逆算子的平方根 若当基(归纳法) 若当型(广义特征空间分解 + 若当基)。

前置依赖8A 广义特征向量和幂零算子(幂零算子、广义特征向量)、8B 广义特征空间分解(广义特征空间分解、分块对角矩阵)、5C 上三角矩阵(上三角矩阵、特征值与对角元)、7A 自伴算子和正规算子(谱定理对比)。


一、可逆算子的平方根

视频精要 — P98 8C(1):特征多项式(19:51)

  • 注意:第四版8C节内容与视频P98-P100可能不完全对应,视频基于第三版录制
  • 视频P98主要讨论特征多项式,而第四版8C节聚焦于若当型
  • 建议参考视频 P101-P103(第三版8D,对应第四版8C的若当型内容)

引理8.39: 有平方根( 幂零时)

引理 8.39:恒等算子加上幂零算子有平方根

是幂零的。那么 有平方根。

证明思路

[关键步骤1:泰勒级数启发]: 考虑 的泰勒级数

其中 。我们不需要关心各系数的确切值,只需要知道它们存在。

[关键步骤2:代入算子]: 因为 是幂零的,所以存在正整数 使得 。将 换成 换成 ,无限和变为有限和:

[关键步骤3:逐次确定系数]: 展开上述算子的平方:

令其等于 ,逐次求解:

  • ,得
  • ,得
  • ,得
  • 对每个 ,类似地求出

每一步只需要解一个关于 的线性方程(前一步的系数已知),因此总能求解。

关键洞察

  • 幂零性的威力 将无限级数截断为有限和,这是整个证明的核心
  • 上述引理在实向量空间和复向量空间上都成立
  • 系数的具体值不重要,重要的是归纳式地逐次可解

定理8.41:复空间上可逆算子有平方根

定理 8.41: 上可逆算子具有平方根

是复向量空间, 是可逆的。那么 有平方根。

证明思路

[关键步骤1:广义特征空间上的分解]: 的所有互异特征值。由 定理8.22(b),对每个 存在幂零算子 使得

[关键步骤2:提取特征值]: 因为 可逆,所以各 。因此

因为 仍是幂零的,由 引理8.39 有平方根。

[关键步骤3:构造平方根]: 将复数 的平方根()与 的平方根相乘,得到 的平方根

[关键步骤4:拼接]: 由广义特征空间分解,每个 可唯一写成 ,其中 。定义

的平方根。

推广

效仿上述技巧可以证明:如果 是复向量空间且 可逆,那么 具有任意正整数次方根

反例:不可逆算子不一定有平方根

上定义为 的算子没有平方根(见习题1)。这个算子不可逆并非偶然。

实向量空间的限制

一维实向量空间 上”与 相乘”这个算子就没有平方根——因为 。这说明定理8.41在实向量空间上不成立


二、若当基与若当型

视频精要

版本差异说明 第三版的8D节(Jordan标准型),而第四版中Jordan型被提前到了8C节。视频中的定理编号和内容组织可能与教材不完全一致,但核心思想相同。

视频P101-P103对应的是

例8.42:单个若当块的幂零算子

例 8.42:具有很好的矩阵的幂零算子

上定义为

的算子。那么 ,从而 是幂零的。

,则 的基。 关于该基的矩阵是

观察要点

  • 这就是一个 若当块(特征值为0)
  • 对角线上全是0,紧挨对角线正上方的元素全是1,其余为0
  • 基的排列顺序是 从高次幂到低次幂),这保证了1出现在超对角线上

例8.43:多个若当块的幂零算子

例 8.43:具有稍复杂点的矩阵的幂零算子

上定义为

的算子。那么 ,从而 是幂零的。

与例8.42不同,这里不存在单个向量 使得 构成基。然而,取

的一个基。 关于该基的矩阵是

这是一个分块对角矩阵,包含:

  • 一个 的若当块(对应 的链)
  • 一个 的若当块(对应 的链)
  • 一个 的零块(对应

关键观察

  • 当找不到一条足够长的链来覆盖整个空间时,需要多条较短的链
  • 每条链对应一个若当块,链的长度等于块的阶数
  • 产生长度为3的链:
  • 产生长度为2的链:
  • 产生长度为1的链:

定义8.44:若当基

定义 8.44:若当基(Jordan basis)

。称 的一个基是 若当基,如果 关于该基具有分块对角矩阵

其中每个对角块 是形如

的上三角矩阵。这样的矩阵 称为若当块(Jordan block)。

若当块的结构

  • 对角线上全是同一个特征值
  • 紧挨对角线正上方的元素全是
  • 其余元素全为
  • 若当块可以是 的(仅含 ),此时退化为对角元素
  • 不一定互异

定理8.45:每个幂零算子都有若当基(核心定理)

定理 8.45:每个幂零算子都有若当基

是幂零的。那么 中有一个基是 的若当基。

证明思路

[关键步骤1:归纳奠基]: 用归纳法。 时,唯一的幂零算子是 算子,结论显然成立。

[关键步骤2:构造最长链]:,令 是使得 的最小正整数。取 使得 。令

8A节习题2 线性无关。若 ,则将这组向量反过来排列就得到若当基,证明完成。

[关键步骤3:构造补空间 ]:。取 使得 。令

的在 下不变的子空间(若 ,则 对所有 成立;)。

[关键步骤4:证明 ]:

  • :设 。则 。令 是使 的最小下标。将 作用于两端,得 。用 作用得 ,与 矛盾。

  • :定义 。则 ,由 线性映射基本定理(3.21)

因此 ,由 2.39

[关键步骤5:归纳完成]: 都在 下不变,且维数都小于 。由归纳假设, 的若当基, 的若当基。将两者合并即得 的若当基。

证明的核心技巧

  • 对偶空间的使用:通过 构造补空间 ,这是整个证明最精妙的部分
  • 线性映射 的维度估计:利用 来证明
  • 归纳法的结构:找到 -不变子空间 ,分别应用归纳假设,然后合并

定理8.46:若当型(核心定理)

定理 8.46:若当型(Jordan Form)

。那么 有一个基是 的若当基。

证明思路

[关键步骤]: 的所有互异特征值。由 广义特征空间分解(8.22)

且每个 都是幂零的。由 定理8.45,每个 都有 的若当基。将这些基合并,就得到 的一个基,且它是 的若当基。

证明的结构之美

  • 若当型定理的证明将前两节的所有工具完美串联:
  • 整个第8章的逻辑链条:广义特征向量 幂零算子 广义特征空间分解 若当基 若当型

历史注记

卡米耶·若当(Camille Jordan, 1838—1922)于1870年发表了定理8.46的证明。


三、知识结构总览

graph TB
    subgraph "8C 广义特征空间分解的推论"
        A["引理8.39<br/>I+T有平方根<br/>(T幂零时)"]
        B["定理8.41<br/>可逆算子有平方根<br/>(复空间)"]
        C["定义8.44<br/>若当基"]
        D["定理8.45<br/>幂零算子有若当基<br/>(归纳法)"]
        E["定理8.46<br/>若当型<br/>(Jordan Form)"]
    end

    subgraph "前置知识"
        F["8A 幂零算子"]
        G["8B 广义特征空间分解"]
        H["5C 上三角矩阵"]
    end

    F --> A
    F --> D
    G --> B
    G --> E
    D --> E
    A --> B
    H --> C

    style E fill:#ff6b6b,color:#fff,stroke:#c0392b,stroke-width:3px
    style D fill:#ff6b6b,color:#fff,stroke:#c0392b,stroke-width:3px
    style B fill:#74b9ff,color:#fff,stroke:#2980b9,stroke-width:2px
graph LR
    subgraph "矩阵形式的层次关系"
        A["一般矩阵"] --> B["上三角矩阵<br/>(定理5.27)"]
        B --> C["分块对角矩阵<br/>(定理8.37)"]
        C --> D["若当型<br/>(定理8.46)"]
        D --> E["对角矩阵<br/>(可对角化时)"]
    end

    style D fill:#ff6b6b,color:#fff,stroke:#c0392b,stroke-width:3px
    style E fill:#2ecc71,color:#fff,stroke:#27ae60,stroke-width:2px

四、核心思想与证明技巧

泰勒级数截断法(引理8.39)

核心技巧

的泰勒级数中的 替换为幂零算子 。因为 ,无限级数自动截断为有限和,从而避免了收敛性问题。这一技巧的精髓在于:

  • ==幂零性 有限性 无需讨论收敛==
  • 系数可以逐次确定,每步只需求解一个线性方程
  • 该方法可推广到构造任意多项式函数

归纳法 + 对偶空间(定理8.45)

核心技巧

定理8.45的证明是本章最精妙的归纳论证之一,其关键创新在于:

  1. 构造最长链 :取 使得 ,生成循环子空间
  2. 利用对偶空间构造补空间 :通过 定义 ,巧妙地保证 下不变
  3. 维度估计:构造线性映射 ,利用 证明

对偶空间的使用是整个证明的灵魂——它使得我们能够”正交地”切出补空间,同时保持 -不变性。

从幂零到一般(定理8.46)

核心技巧

定理8.46的证明体现了"化归为幂零情形"的标准策略:

  1. 利用广义特征空间分解,将 分解为 的直和
  2. 在每个 上, 是幂零的
  3. 对幂零算子 应用定理8.45,得到若当基
  4. 合并各若当基,得到 的若当基

这一策略与定理8.37(分块对角矩阵)的证明策略完全一致,只是这里用若当基替换了上三角基。

若当链的构造

核心概念

给定幂零算子 和向量 使得 ,则

构成一条若当链(Jordan chain),对应一个 的若当块。若当链中的每个向量都是 广义特征向量


五、补充理解与易混淆点

若当块是什么?——最直观的理解

若当块的直观形象

若当块是一个”几乎对角”的上三角矩阵:对角线上全是同一个特征值 ,紧挨对角线正上方的元素全是 ,其余为

例如 若当块:

几何直觉:若当块描述了”链式作用”——

  • (将 映射到 方向,加上 倍自身)
  • 是真正的特征向量)

可以想象成一条”降级链”:(减去 倍自身后)。

来源:MIT 18.06讲义(Gilbert Strang)、University of Toronto Jordan Form讲义、Northwestern大学Jordan Form讲义、Utah大学Jordan Form讲义。

若当型 vs 对角矩阵 vs 分块对角矩阵

矩阵形式的层次关系

形式描述条件例子
对角矩阵每个块都是 可对角化
若当型每个块是若当块 是复空间上的算子含若当块的分块对角矩阵
分块对角矩阵每个块是上三角的 是复空间上的算子[[8B 广义特征空间分解#41-分块对角矩阵
上三角矩阵一般上三角 是复向量空间[[5C 上三角矩阵

层次关系:对角矩阵 若当型 分块对角矩阵 上三角矩阵 一般矩阵

  • 对角矩阵:最理想的情况, 可对角化时取得
  • 若当型:最精细的”几乎对角”形式,对任意复算子都存在
  • 分块对角矩阵8.37):每个块是上三角的,对角线全为 ,但超对角线不一定是
  • 若当型是分块对角矩阵的进一步精细化:强制超对角线元素为

来源:MIT 18.06讲义(Gilbert Strang)、University of Toronto Jordan Form讲义、Northwestern大学Jordan Form讲义、Utah大学Jordan Form讲义。

若当链(Jordan Chain)的构造

若当链的详细说明

给定幂零算子 和向量 使得 ,则

构成一条长度为 若当链

性质

  • 这条链对应一个 的若当块
  • 链中每个向量都是 广义特征向量
  • 的(真正的)特征向量(属于
  • 链的长度 等于 作为广义特征向量的”级”(level)

在若当基中的排列:若当链在基中按从高次幂到低次幂排列,即 ,这样 作用后每个向量恰好变成前一个向量(加上 倍自身)。

来源:MIT 18.06讲义(Gilbert Strang)、University of Toronto Jordan Form讲义、Northwestern大学Jordan Form讲义、Utah大学Jordan Form讲义。

为什么若当型重要?

若当型的意义

  1. 最简标准形:若当型是复向量空间上算子的”最简标准形”——比 谱定理 更一般
    • 谱定理要求 正规(),若当型对任意算子都成立
    • 谱定理给出对角矩阵,若当型给出”最接近对角”的形式
  2. 揭示内部结构:若当型直接告诉我们:
    • 有哪些特征值
    • 每个特征值对应多少个若当块(= 该特征值的几何重数 =
    • 每个若当块多大(最大块的阶数 = 上的幂零指数)
  3. 重要应用
    • 解微分方程组 的通解可通过若当型直接写出
    • 计算矩阵函数 等可通过若当块上的函数值计算
    • Markov链分析:若当型揭示马尔可夫矩阵的长期行为

来源:MIT 18.06讲义(Gilbert Strang)、University of Toronto Jordan Form讲义、Northwestern大学Jordan Form讲义、Utah大学Jordan Form讲义。

常见误区

常见误区纠正

误区正确理解
❌ “若当型要求算子可对角化”✅ 恰恰相反,若当型处理的是不可对角化的情况。可对角化时若当型退化为对角矩阵
❌ “若当块的大小等于特征值的(代数)重数”✅ 若当块大小之等于代数重数,但可以有多个块。例如代数重数为4的特征值可以对应一个 块加一个
❌ “若当基是唯一的”✅ 若当基不唯一,但若当块的个数和大小是唯一确定的(不计排列顺序)
❌ “实矩阵没有若当型”✅ 实矩阵在复化后仍有若当型,但可能涉及复特征值。若当型定理只在复数域上成立
❌ “若当型中的1可以换成其他数”✅ 超对角线上的1是标准化的,通过适当的基变换总可以化为1

误区二:"若当型是唯一的"

❌ 一个算子的若当型矩阵是唯一确定的。 ✅ 若当型的对角块可以任意排列,因此矩阵形式不唯一。但每个特征值对应的若当块的大小(不计顺序)是唯一的。

来源:MIT 18.06讲义(Gilbert Strang)、OSU Ximera线性代数教材。

误区三:"若当基只在复数域上存在"

❌ 若当基只在复向量空间上有意义。 ✅ 幂零算子的若当基在实数域上也成立(定理8.45不依赖域)。但完整的若当型定理(8.46)确实只在复数域上成立,因为需要广义特征空间分解。

来源:MIT 18.06讲义(Gilbert Strang)、Northwestern大学Jordan Form讲义。


六、习题精选

本节习题

习题号标题核心考点难度
习题1无平方根的算子平方根不存在的证明
习题2I+T的平方根计算引理8.39的应用
习题4-I的平方根与维数实空间上的平方根
习题5若当基的构造若当基的具体计算
习题7若当基与最小多项式若当块大小与最小多项式
习题10颠倒若当基的矩阵若当基的顺序变换
习题14不可分解的刻画最小多项式与不变子空间

习题1:无平方根的算子

习题1

是定义为 的算子。证明: 没有平方根。

习题2:I+T的平方根计算

习题2

定义 。 (a) 证明: 是幂零的。 (b) 求出 的一个平方根。

习题4:-I的平方根与维数

习题4

是实向量空间。证明:当且仅当 为偶数, 上的算子 才有平方根。

习题5:若当基的构造

习题5

是定义为 的算子。求出 的一个若当基。

习题7:若当基与最小多项式

习题7

是幂零的, 的若当基。证明: 的最小多项式是 ,其中 关于 的矩阵中,紧挨在对角线上方的这条线上连续出现的 的最大数目。

习题10:颠倒若当基的矩阵

习题10

的基 的若当基。描述 关于基 (通过颠倒各 的顺序得到)的矩阵。

习题14:不可分解的刻画

习题14

。证明: 不能分解为两个在 下不变的非零子空间的直和,当且仅当 的最小多项式形如 (其中 )。


七、视频学习指南

视频精要汇总

编号标题时长内容要点
P988C(1):特征多项式19:51第四版8C内容与视频可能不完全对应
P998C(2):极小多项式52:51极小多项式的性质与应用
P1008C习题40:54习题讲解
P1018D(1):幂零算子的循环子空间分解52:56推荐:对应第四版8C的若当基构造
P1028D(2):定理8.55的推论42:34若当型的推论与应用
P1038D(3):Jordan标准型23:42推荐:若当型的总结与展望

版本差异说明

  • 视频基于第三版录制,第三版中 Jordan 标准型在 8D 节
  • 第四版中 Jordan 型被提前到 8C 节,因此视频 P101-P103(第三版8D)对应第四版的8C
  • 视频中的定理编号可能与教材不一致,请以第四版教材为准
  • 建议重点观看 P101(若当基的构造思想)和 P103(若当型总结)

学习建议

  1. 先阅读教材8C节,理解若当基和若当型的定义
  2. 观看 P101,理解幂零算子的循环子空间分解(即若当基的构造过程)
  3. 观看 P103,建立若当型的整体认知
  4. 回到教材,仔细研读定理8.45的归纳证明
  5. 完成习题5和习题7,巩固若当基的构造和最小多项式的联系

八、教材原文

教材原文


若当型 #学习/线性代数/复向量空间上的算子/幂零算子 #学习/线性代数/复向量空间上的算子/平方根