5E 可交换算子

本节概览

本节研究同一向量空间上两个算子之间的可交换性)这一核心关系。可交换性看似简单的代数条件,却蕴含着深刻的结构信息:它保证特征空间的不变性(引理 5.75),进而导出本节最重要的结果——可对角化算子可同时对角化的充要条件是可交换性(定理 5.76)。在此基础上,我们进一步得到公共特征向量的存在性(定理 5.78)、同时上三角化(定理 5.80)以及和与积的特征值公式(定理 5.81)。

逻辑链条:可交换定义 可交换矩阵 特征空间不变 同时对角化充要条件 公共特征向量 同时上三角化 和与积的特征值

前置依赖5A 不变子空间、特征值和特征向量(特征空间、不变子空间)、5B 最小多项式(多项式作用于算子)、5C 上三角矩阵(上三角化定理 5.47)、5D 可对角化算子(可对角化条件 5.55、限制算子的可对角化 5.65)、第4章 多项式3E 向量空间的积和商(直和分解)、3F 对偶(对偶算子)

核心主线 是贯穿全节的唯一假设,由此逐步推导出一系列等价刻画和结构性质,最终回答”两个算子何时能共享同一组优良基”这一核心问题。


一、可交换的定义与基本性质

可交换的定义

定义 5.71:可交换(commute)

对于同一向量空间 上的两个算子 ,若 ,则它们可交换。 对于两个大小相同的方阵 ,若 ,则它们可交换

可交换性是算子之间最基本的代数关系之一。以下是一些天然满足可交换性的例子:

  • 恒等算子:若 上的恒等算子且 ,那么 上每个算子都可交换。
  • 同一算子的多项式:若 是算子,那么 可交换。更一般地,若 ,那么 可交换(见 5.17 (b))。

偏微分算子:可交换性的经典实例

例 5.72:偏微分算子可交换

是非负整数。令 表示具有两个自变量且次数最高为 的复系数多项式构成的复向量空间。其元素是从 的形式如下的函数 p(w, z) = \sum_{j+k \leq m} a_{j,k}\, w^j z^k \tag{5.73} 其中每个 表示定义为 上的函数。

定义偏微分算子 为:

可交换,因为:

这个例子说明了一个重要的分析学事实:对于性质良好的函数,偏微分运算的顺序是无关紧要的(Clairaut 定理 / Schwarz 定理的离散版本)。

可交换矩阵的稀有性

教材给出了一个令人惊讶的统计数据:各元素均为区间 内整数的 矩阵,两两共可凑出 对(考虑顺序),但如此多对矩阵中仅有约 0.3% 是可交换的( 对)。

这意味着可交换性是一个极强的约束条件——两个随机矩阵几乎不可能可交换。这也从侧面说明了为什么可交换的算子具有如此丰富的结构性质:可交换性本身就排除了绝大多数”一般情况”。

可交换算子对应可交换矩阵

命题 5.74:可交换算子对应可交换矩阵

的基。那么 可交换,当且仅当 可交换。

证明思路

[矩阵表示保持乘法运算]:利用算子乘积的矩阵等于矩阵的乘积这一基本性质。

可交换 可交换。

这个命题建立了算子语言与矩阵语言之间的桥梁:讨论算子的可交换性等价于讨论矩阵的可交换性,前提是两个矩阵关于同一个基


二、可交换算子的核心定理

本节包含六个紧密相连的结果,构成一条从”特征空间不变”到”和与积的特征值公式”的逻辑链条。

特征空间在可交换算子下不变

引理 5.75:特征空间在可交换算子下不变

可交换且 。那么 下不变。

证明思路

[直接验证不变性条件]:要证 下不变,只需验证对任意 ,有

,即 。那么:

上式即表明 。因此 下不变。

关键洞察:这个证明的核心只有一步——利用 的”右边”移到”左边”。可交换性使得我们可以自由调整算子的作用顺序,从而将 作用后的向量仍然保持在 的特征空间内。这个引理是本节所有后续定理的基础。

可同时对角化的充要条件

定理 5.76:可同时对角化 可交换性

同一向量空间上的两个可对角化算子关于相同的基都有对角矩阵,当且仅当这两个算子可交换。

这是本节最重要的定理,它给出了可交换性与同时对角化之间的完全等价关系。

证明思路

[充分性():可交换 同时对角化]

是可对角化算子且可交换。令 代表 的所有互异特征值。

[利用可对角化的直和分解]:因为 可对角化,由 5.55 (c) 有: V = E(\lambda_1, S) \oplus \cdots \oplus E(\lambda_m, S) \tag{5.77}

[特征空间在 下不变]:每个子空间 )在 下不变(由引理 5.75)。

[限制算子仍可对角化]:因为 是可对角化的,由 5.65,对每个 ,限制算子 均可对角化。

[在每个特征空间中取 的特征向量基]:所以对每个 ,都存在由 的特征向量组成的 的基。

[合并基]:将这些基合并起来就得到了 的基(由式 (5.77) 的直和性质),且该基中每个向量既是 的特征向量(因为它属于某个 ),又是 的特征向量。于是 关于这个基均具有对角矩阵。

[必要性():同时对角化 可交换]

关于同一个基有对角矩阵。两个大小相同的对角矩阵的乘积,等于将这两个矩阵对角线上的元素对应相乘所得的对角矩阵,因此任意两个大小相同的对角矩阵都可交换。于是 可交换(由命题 5.74)。

定理结构的对称之美:充分性方向的证明展示了一个精妙的”分治”策略——先按 的特征空间分解 ,再在每个子空间中找 的特征向量。必要性方向则极其简洁——对角矩阵天然可交换。

可交换算子的公共特征向量

定理 5.78:可交换算子的公共特征向量

非零有限维向量空间上的每对可交换算子都有公共的特征向量。

注意

两个可交换算子有公共特征向量,但不一定有共同的特征值。公共特征向量意味着存在某个向量 和标量 使得 ,但 一般不同。

证明思路

[在特征空间中寻找特征向量]

是非零有限维复向量空间且 可交换。

[取 的特征值]:令 的特征值(5.19 告诉我们 肯定有特征值,因为 是代数闭域)。

[特征空间非零]:于是

[特征空间在 下不变]:并且, 下不变(由引理 5.75)。

[限制算子有特征向量]:于是,再次利用 5.19,限制算子 具有特征向量。该向量既是 的特征向量(因为它属于 ),又是 的特征向量,证毕。

这个证明极其简洁——核心思想就是”在 的特征空间里找 的特征向量”。引理 5.75 保证了这个操作是合法的。

偏微分算子的公共特征向量

例 5.79:偏微分算子的公共特征向量

定义如例 5.72, 是可交换偏微分算子。这两个算子的唯一特征值是 (因为对任何多项式 的次数比 ,反复求导最终得到 )。

这两个特征空间的交集 是由常值函数构成的集合。常值函数既是 的特征向量又是 的特征向量,验证了定理 5.78 的结论。

可交换算子可同时上三角化

定理 5.80:可交换算子可同时上三角化

是有限维复向量空间, 上的可交换算子。那么存在 的一个基,使得 关于该基均有上三角矩阵。

这个定理将 5.47(单个算子的上三角化)推广到两个可交换算子的情形。注意,与定理 5.76 不同,这里不要求 可对角化。

证明思路

[对维数用归纳法 + 投影算子技术]

。对 用归纳法。

[基础情形] 时结论成立,因为所有 矩阵都是上三角矩阵。

[归纳步骤]:设 ,假设结论对所有维数为 的复向量空间成立。

[取公共特征向量]:令 共有的特征向量(由定理 5.78)。因此

[作直和分解]:令 的子空间使得 (由 2.33)。

[定义投影算子]:定义线性映射 为:对各 和各

[定义 上的诱导算子]:定义 为:对每个

[验证诱导算子可交换]:设 。那么存在 使得 (因为 ),于是: 其中最后一个等号成立是因为 的特征向量且 。类似有 。因为 可交换,所以 。因此 可交换。

[应用归纳假设]:由归纳假设,存在 的基 使得 关于该基都有上三角矩阵。

[验证 的基满足上三角性] 的基。若 ,那么存在 使得: 因为 关于 有上三角矩阵,所以 。因此: 于是 关于基 有上三角矩阵。

证明技巧要点:这个证明的关键创新是投影算子技术——不是直接在商空间 上工作,而是选取一个补空间 并通过投影 “压缩”到 上。这种方法保持了算子的线性性,同时利用 是公共特征向量这一事实来确保压缩后的算子仍然可交换。

可交换算子的和与积的特征值

定理 5.81:可交换算子的和与积的特征值

是有限维复向量空间, 上的可交换算子。那么:

  • 的每个特征值都等于 的某个特征值加上 的某个特征值。
  • 的每个特征值都等于 的某个特征值乘以 的某个特征值。

注意

这个定理要求 向量空间。在实向量空间上,结论不一定成立(见习题 10)。

证明思路

[利用同时上三角化,对角线上读特征值]

[同时上三角化]:存在 的一个基,使得 关于该基都有上三角矩阵(由定理 5.80)。

[矩阵运算保持上三角性]:由 3.353.43,关于该基的矩阵满足:

[对角线元素对应特征值] 对角线上的每个元素都是 的特征值, 对角线上的每个元素都是 的特征值(由 5.41)。

[和的对角线]:矩阵加法的定义表明, 对角线上的每个元素都等于 对角线与 对角线上对应元素之和。

[积的对角线]:由于 都是上三角矩阵,矩阵乘法的定义表明, 对角线上的每个元素都等于 对角线与 对角线上对应元素之积。

[上三角矩阵的和与积仍为上三角] 都是上三角矩阵。

[读出特征值] 的每个特征值都在 对角线上, 的每个特征值都在 对角线上(由 5.41)。

综上所述, 的每个特征值都等于 的某个特征值加上 的某个特征值, 的每个特征值都等于 的某个特征值乘以 的某个特征值。


三、知识结构总览

graph TD
    A["Def 5.71 可交换 ST=TS"] --> B["Prop 5.74 可交换算子对应可交换矩阵"]
    A --> C["Lem 5.75 特征空间在可交换算子下不变"]
    C --> D["Thm 5.76 同时对角化充要条件"]
    C --> E["Thm 5.78 公共特征向量"]
    E --> F["Ex 5.79 偏微分算子的公共特征向量"]
    E --> G["Thm 5.80 同时上三角化"]
    G --> H["Thm 5.81 和与积的特征值"]
    D --> I["习题2 任意多个算子的同时对角化"]
    G --> J["习题9 任意多个算子的同时上三角化"]
    H --> K["习题10 实向量空间上的反例"]

四、核心思想与证明技巧

核心思想:可交换性是不变性的源泉

本节最核心的洞察是: 这一简单的代数条件,保证了算子 的结构(特征空间)在算子 下不被破坏。引理 5.75 是这一思想的精确表达:

这一不变性是一系列深刻结论的起点:

  • 在可对角化情形下,不变性允许我们在每个特征空间中独立地对 对角化 同时对角化(定理 5.76)
  • 在一般情形下,不变性允许我们在特征空间中找到 的特征向量 公共特征向量(定理 5.78)
  • 通过归纳法,公共特征向量提供了同时上三角化的起点 同时上三角化(定理 5.80)
  • 同时上三角化使得我们可以直接在对角线上读出和与积的特征值 特征值公式(定理 5.81)

证明技巧清单

  1. 交换算子顺序技巧:引理 5.75 的证明中,,关键一步是利用 右边移到左边。这个技巧在本节中反复出现。

  2. 分治策略(定理 5.76):先按一个算子的特征空间分解全空间,再在每个子空间中处理另一个算子。这是”同时对角化”证明的标准范式。

  3. 在特征空间中找特征向量(定理 5.78):要找两个算子的公共特征向量,先取一个算子的特征空间,再在其中找另一个算子的特征向量。这要求特征空间在另一个算子下不变——正是引理 5.75 提供的。

  4. 投影算子 + 归纳法(定理 5.80):取公共特征向量 ,将空间分解为 ,通过投影 将算子”压缩”到 上,验证压缩后的算子仍可交换,然后对 用归纳假设。这种技术避免了商空间的抽象性。

  5. 上三角矩阵的对角线读特征值(定理 5.81):上三角矩阵的对角线元素恰好是特征值,而两个上三角矩阵的和(积)的对角线元素是对应对角线元素的和(积)。这是将算子问题转化为矩阵计算的经典策略。


五、补充理解与易混淆点

可交换算子在量子力学中的意义

在量子力学中,算子代表可观察量(observables),如位置、动量、自旋等。可交换性在量子力学中具有深刻的物理意义:

可交换 = 可同时精确测量。如果两个可观察量对应的算子 可交换(),那么存在一组共同的本征态(即公共特征向量),在这组态上可以同时确定两个可观察量的值。例如,氢原子中电子的哈密顿量(能量)和角动量平方算子可交换,因此能量和角动量大小可以同时精确测量。

不可交换 = 不确定性原理。如果 ,则两个可观察量之间存在根本的不兼容性,不可能同时精确测量。最著名的例子是位置算子 和动量算子 ,它们的交换子 ,这正是海森堡不确定性原理的数学根源:

来源:MIT 8.321 Quantum Theory I 课程讲义(同时对角化与量子测量)、Princeton CHM 305 Lecture 8(不确定性原理与交换子)、UCSB Chemistry 11 Chapter 11(交换子与可观察量的兼容性)、CSU East Bay Chemistry 352(交换子与可同时测量的可观察量)。

同时对角化的应用场景

同时对角化不仅是理论上的优美结论,在计算和应用中也有重要价值:

矩阵函数的计算。若 可同时对角化,即存在可逆矩阵 使得 ,其中 为对角矩阵,那么:

最后一个等式 仅在 可交换时成立,这在微分方程和量子力学中极为重要。

耦合系统的解耦。在线性微分方程组 中,如果矩阵对 可同时对角化,系统可以解耦为独立的单变量方程。

谱定理的推广谱定理表明正规算子可以酉对角化。对于一族两两可交换的正规算子,可以同时对角化,这是多重谱定理的基础,在泛函分析和量子场论中有核心地位。

来源:Harvard SEAS 讲义(可交换算子与矩阵指数 )、UC Davis “Spectral Theorem for Normal Linear Maps”(多重谱定理与可交换正规算子族)、UPenn CIS 515 “Spectral Theorems”(同时对角化在谱分解中的应用)。

为什么可交换性如此稀有

教材提到在元素取自 整数矩阵中,可交换对仅占约 0.3%。这个现象可以从自由度的角度理解:

一个 矩阵有 个自由参数。两个矩阵 共有 个自由参数。可交换条件 给出 个方程(矩阵等式的每个位置给出一个方程)。因此,可交换矩阵对的”自由度”约为 ,相比无约束的 自由度,可交换对在所有矩阵对中构成一个”低维”子集。

更精确地说,对于 复矩阵,可交换矩阵对构成的代数簇的维数为 (而非 ),这意味着随着 增大,可交换性越来越稀有。这也解释了为什么可交换的算子具有如此特殊的结构性质——可交换性是一个极强的约束,它将算子对限制在一个非常特殊的子集中。

来源:Keith Conrad (University of Connecticut) “Simultaneous Commutativity of Operators”(可交换算子对的代数结构与稀有性分析)、MIT 8.321 Quantum Theory I(可交换算子的约束条件讨论)。

常见误区

误区 1:"可交换的算子有相同的特征值"

意味着 有相同的特征值。

✅ 可交换性不保证 有相同的特征值。例如,(恒等算子)与任何算子可交换,但 可以有任意特征值。可交换性保证的是公共特征向量的存在性(定理 5.78),而非公共特征值。公共特征向量 满足 ,其中 一般不同。

误区 2:"可交换性保证可对角化"

可对角化,则 也可对角化。

✅ 可交换性本身不保证任何一个算子可对角化。定理 5.76 的前提是两个算子都可对角化,可交换性是它们能同时对角化的充要条件。反例:设 为任意可对角化算子, 为与 可交换但不可对角化的算子(例如 ,其中 是与 可交换的非零幂零算子),则 不可对角化。

误区 3:"和与积的特征值公式总成立"

❌ 对任意算子 的特征值等于 的特征值之和, 的特征值等于 的特征值之积。

✅ 这个公式仅在可交换时成立(定理 5.81),且要求 向量空间。不可交换时, 的特征值与 的特征值之间没有简单关系。即使在实向量空间上可交换,结论也可能不成立(见习题 10),因为实向量空间上的算子不一定有特征值。


六、习题精选

本节习题

习题号标题核心考点难度
1可交换算子的不变子空间可交换不保证共享所有不变子空间
2任意多个可对角化算子的同时对角化定理 5.76 的推广至无穷集
3null 和 range 在可交换算子下不变引理 5.75 的推广
5对偶算子的可交换性对偶与可交换的关系
6range 之和不等于 特征值配对与子空间覆盖
7可对角化与可交换的混合矩阵表示定理 5.76 的弱化版本
10实向量空间上 5.81 的反例定理 5.81 对复空间的依赖

习题 1:可交换算子的不变子空间

习题 1

给出一例: 上的两个可交换算子 ,使得 中有在 下不变但不在 下不变的子空间,以及在 下不变但不在 下不变的子空间。

习题 2:任意多个可对角化算子的同时对角化

习题 2

的子集,且 中每个元素都可对角化。证明:存在 的一个基使得 的每个元素关于它都有对角矩阵,当且仅当 中每对元素都可交换。

习题 3:null 和 range 在可交换算子下不变

习题 3

使得 。设 。 (a) 证明: 下不变。 (b) 证明: 下不变。

习题 5:对偶算子的可交换性

习题 5

证明:有限维向量空间上的一对算子可交换,当且仅当其对偶算子可交换。

习题 6:range 之和不等于

习题 6

是非零有限维复向量空间,且 可交换。证明:存在 使得

习题 7:可对角化与可交换的混合矩阵表示

习题 7

是复向量空间, 可对角化,且 可交换。证明:存在 的一个基使得 关于该基有对角矩阵而 关于该基有上三角矩阵。

习题 10:实向量空间上 5.81 的反例

习题 10

给出一例:在一有限维实向量空间上的两个可交换算子 ,使得 有特征值不等于 的特征值加上 的特征值,且 有特征值不等于 的特征值乘以 的特征值。


七、视频学习指南

视频资源

暂无对应视频。

视频精要

暂无视频精要。


八、教材原文

可交换算子