5E 可交换算子
本节概览
本节研究同一向量空间上两个算子之间的可交换性()这一核心关系。可交换性看似简单的代数条件,却蕴含着深刻的结构信息:它保证特征空间的不变性(引理 5.75),进而导出本节最重要的结果——可对角化算子可同时对角化的充要条件是可交换性(定理 5.76)。在此基础上,我们进一步得到公共特征向量的存在性(定理 5.78)、同时上三角化(定理 5.80)以及和与积的特征值公式(定理 5.81)。
逻辑链条:可交换定义 可交换矩阵 特征空间不变 同时对角化充要条件 公共特征向量 同时上三角化 和与积的特征值
前置依赖:5A 不变子空间、特征值和特征向量(特征空间、不变子空间)、5B 最小多项式(多项式作用于算子)、5C 上三角矩阵(上三角化定理 5.47)、5D 可对角化算子(可对角化条件 5.55、限制算子的可对角化 5.65)、第4章 多项式、3E 向量空间的积和商(直和分解)、3F 对偶(对偶算子)
核心主线: 是贯穿全节的唯一假设,由此逐步推导出一系列等价刻画和结构性质,最终回答”两个算子何时能共享同一组优良基”这一核心问题。
一、可交换的定义与基本性质
可交换的定义
定义 5.71:可交换(commute)
对于同一向量空间 上的两个算子 和 ,若 ,则它们可交换。 对于两个大小相同的方阵 和 ,若 ,则它们可交换。
可交换性是算子之间最基本的代数关系之一。以下是一些天然满足可交换性的例子:
- 恒等算子:若 是 上的恒等算子且 ,那么 与 上每个算子都可交换。
- 同一算子的多项式:若 是算子,那么 和 可交换。更一般地,若 ,那么 和 可交换(见 5.17 (b))。
偏微分算子:可交换性的经典实例
例 5.72:偏微分算子可交换
设 是非负整数。令 表示具有两个自变量且次数最高为 的复系数多项式构成的复向量空间。其元素是从 到 的形式如下的函数 : p(w, z) = \sum_{j+k \leq m} a_{j,k}\, w^j z^k \tag{5.73} 其中每个 , 表示定义为 的 上的函数。
定义偏微分算子 为:
和 可交换,因为:
这个例子说明了一个重要的分析学事实:对于性质良好的函数,偏微分运算的顺序是无关紧要的(Clairaut 定理 / Schwarz 定理的离散版本)。
可交换矩阵的稀有性
教材给出了一个令人惊讶的统计数据:各元素均为区间 内整数的 矩阵,两两共可凑出 对(考虑顺序),但如此多对矩阵中仅有约 0.3% 是可交换的( 对)。
这意味着可交换性是一个极强的约束条件——两个随机矩阵几乎不可能可交换。这也从侧面说明了为什么可交换的算子具有如此丰富的结构性质:可交换性本身就排除了绝大多数”一般情况”。
可交换算子对应可交换矩阵
命题 5.74:可交换算子对应可交换矩阵
设 且 是 的基。那么 和 可交换,当且仅当 和 可交换。
证明思路
[矩阵表示保持乘法运算]:利用算子乘积的矩阵等于矩阵的乘积这一基本性质。
和 可交换 和 可交换。
这个命题建立了算子语言与矩阵语言之间的桥梁:讨论算子的可交换性等价于讨论矩阵的可交换性,前提是两个矩阵关于同一个基。
二、可交换算子的核心定理
本节包含六个紧密相连的结果,构成一条从”特征空间不变”到”和与积的特征值公式”的逻辑链条。
特征空间在可交换算子下不变
引理 5.75:特征空间在可交换算子下不变
设 可交换且 。那么 在 下不变。
证明思路
[直接验证不变性条件]:要证 在 下不变,只需验证对任意 ,有 。
设 ,即 。那么:
上式即表明 。因此 在 下不变。
关键洞察:这个证明的核心只有一步——利用 将 从 的”右边”移到”左边”。可交换性使得我们可以自由调整算子的作用顺序,从而将 作用后的向量仍然保持在 的特征空间内。这个引理是本节所有后续定理的基础。
可同时对角化的充要条件
定理 5.76:可同时对角化 可交换性
同一向量空间上的两个可对角化算子关于相同的基都有对角矩阵,当且仅当这两个算子可交换。
这是本节最重要的定理,它给出了可交换性与同时对角化之间的完全等价关系。
证明思路
[充分性():可交换 同时对角化]
设 是可对角化算子且可交换。令 代表 的所有互异特征值。
[利用可对角化的直和分解]:因为 可对角化,由 5.55 (c) 有: V = E(\lambda_1, S) \oplus \cdots \oplus E(\lambda_m, S) \tag{5.77}
[特征空间在 下不变]:每个子空间 ()在 下不变(由引理 5.75)。
[限制算子仍可对角化]:因为 是可对角化的,由 5.65,对每个 ,限制算子 均可对角化。
[在每个特征空间中取 的特征向量基]:所以对每个 ,都存在由 的特征向量组成的 的基。
[合并基]:将这些基合并起来就得到了 的基(由式 (5.77) 的直和性质),且该基中每个向量既是 的特征向量(因为它属于某个 ),又是 的特征向量。于是 和 关于这个基均具有对角矩阵。
[必要性():同时对角化 可交换]
设 关于同一个基有对角矩阵。两个大小相同的对角矩阵的乘积,等于将这两个矩阵对角线上的元素对应相乘所得的对角矩阵,因此任意两个大小相同的对角矩阵都可交换。于是 和 可交换(由命题 5.74)。
定理结构的对称之美:充分性方向的证明展示了一个精妙的”分治”策略——先按 的特征空间分解 ,再在每个子空间中找 的特征向量。必要性方向则极其简洁——对角矩阵天然可交换。
可交换算子的公共特征向量
定理 5.78:可交换算子的公共特征向量
非零有限维复向量空间上的每对可交换算子都有公共的特征向量。
注意
两个可交换算子有公共特征向量,但不一定有共同的特征值。公共特征向量意味着存在某个向量 和标量 使得 且 ,但 和 一般不同。
证明思路
这个证明极其简洁——核心思想就是”在 的特征空间里找 的特征向量”。引理 5.75 保证了这个操作是合法的。
偏微分算子的公共特征向量
例 5.79:偏微分算子的公共特征向量
令 定义如例 5.72, 是可交换偏微分算子。这两个算子的唯一特征值是 (因为对任何多项式 , 的次数比 低 ,反复求导最终得到 )。
这两个特征空间的交集 是由常值函数构成的集合。常值函数既是 的特征向量又是 的特征向量,验证了定理 5.78 的结论。
可交换算子可同时上三角化
定理 5.80:可交换算子可同时上三角化
设 是有限维复向量空间, 是 上的可交换算子。那么存在 的一个基,使得 和 关于该基均有上三角矩阵。
这个定理将 5.47(单个算子的上三角化)推广到两个可交换算子的情形。注意,与定理 5.76 不同,这里不要求 和 可对角化。
证明思路
[对维数用归纳法 + 投影算子技术]
令 。对 用归纳法。
[基础情形]: 时结论成立,因为所有 矩阵都是上三角矩阵。
[归纳步骤]:设 ,假设结论对所有维数为 的复向量空间成立。
[取公共特征向量]:令 为 和 共有的特征向量(由定理 5.78)。因此 且 。
[作直和分解]:令 为 的子空间使得 (由 2.33)。
[定义投影算子]:定义线性映射 为:对各 和各 有 。
[定义 上的诱导算子]:定义 为:对每个 有 及 。
[验证诱导算子可交换]:设 。那么存在 使得 (因为 ),于是: 其中最后一个等号成立是因为 是 的特征向量且 。类似有 。因为 和 可交换,所以 。因此 和 可交换。
[应用归纳假设]:由归纳假设,存在 的基 使得 和 关于该基都有上三角矩阵。
[验证 的基满足上三角性]: 是 的基。若 ,那么存在 使得: 因为 和 关于 有上三角矩阵,所以 且 。因此: 于是 和 关于基 有上三角矩阵。
证明技巧要点:这个证明的关键创新是投影算子技术——不是直接在商空间 上工作,而是选取一个补空间 并通过投影 将 “压缩”到 上。这种方法保持了算子的线性性,同时利用 是公共特征向量这一事实来确保压缩后的算子仍然可交换。
可交换算子的和与积的特征值
定理 5.81:可交换算子的和与积的特征值
设 是有限维复向量空间, 是 上的可交换算子。那么:
- 的每个特征值都等于 的某个特征值加上 的某个特征值。
- 的每个特征值都等于 的某个特征值乘以 的某个特征值。
注意
这个定理要求 是复向量空间。在实向量空间上,结论不一定成立(见习题 10)。
证明思路
[利用同时上三角化,对角线上读特征值]
[同时上三角化]:存在 的一个基,使得 和 关于该基都有上三角矩阵(由定理 5.80)。
[矩阵运算保持上三角性]:由 3.35 和 3.43,关于该基的矩阵满足:
[对角线元素对应特征值]: 对角线上的每个元素都是 的特征值, 对角线上的每个元素都是 的特征值(由 5.41)。
[和的对角线]:矩阵加法的定义表明, 对角线上的每个元素都等于 对角线与 对角线上对应元素之和。
[积的对角线]:由于 和 都是上三角矩阵,矩阵乘法的定义表明, 对角线上的每个元素都等于 对角线与 对角线上对应元素之积。
[上三角矩阵的和与积仍为上三角]: 和 都是上三角矩阵。
[读出特征值]: 的每个特征值都在 对角线上, 的每个特征值都在 对角线上(由 5.41)。
综上所述, 的每个特征值都等于 的某个特征值加上 的某个特征值, 的每个特征值都等于 的某个特征值乘以 的某个特征值。
三、知识结构总览
graph TD A["Def 5.71 可交换 ST=TS"] --> B["Prop 5.74 可交换算子对应可交换矩阵"] A --> C["Lem 5.75 特征空间在可交换算子下不变"] C --> D["Thm 5.76 同时对角化充要条件"] C --> E["Thm 5.78 公共特征向量"] E --> F["Ex 5.79 偏微分算子的公共特征向量"] E --> G["Thm 5.80 同时上三角化"] G --> H["Thm 5.81 和与积的特征值"] D --> I["习题2 任意多个算子的同时对角化"] G --> J["习题9 任意多个算子的同时上三角化"] H --> K["习题10 实向量空间上的反例"]
四、核心思想与证明技巧
核心思想:可交换性是不变性的源泉
本节最核心的洞察是: 这一简单的代数条件,保证了算子 的结构(特征空间)在算子 下不被破坏。引理 5.75 是这一思想的精确表达:
这一不变性是一系列深刻结论的起点:
- 在可对角化情形下,不变性允许我们在每个特征空间中独立地对 对角化 同时对角化(定理 5.76)
- 在一般情形下,不变性允许我们在特征空间中找到 的特征向量 公共特征向量(定理 5.78)
- 通过归纳法,公共特征向量提供了同时上三角化的起点 同时上三角化(定理 5.80)
- 同时上三角化使得我们可以直接在对角线上读出和与积的特征值 特征值公式(定理 5.81)
证明技巧清单
交换算子顺序技巧:引理 5.75 的证明中,,关键一步是利用 将 从 右边移到左边。这个技巧在本节中反复出现。
分治策略(定理 5.76):先按一个算子的特征空间分解全空间,再在每个子空间中处理另一个算子。这是”同时对角化”证明的标准范式。
在特征空间中找特征向量(定理 5.78):要找两个算子的公共特征向量,先取一个算子的特征空间,再在其中找另一个算子的特征向量。这要求特征空间在另一个算子下不变——正是引理 5.75 提供的。
投影算子 + 归纳法(定理 5.80):取公共特征向量 ,将空间分解为 ,通过投影 将算子”压缩”到 上,验证压缩后的算子仍可交换,然后对 用归纳假设。这种技术避免了商空间的抽象性。
上三角矩阵的对角线读特征值(定理 5.81):上三角矩阵的对角线元素恰好是特征值,而两个上三角矩阵的和(积)的对角线元素是对应对角线元素的和(积)。这是将算子问题转化为矩阵计算的经典策略。
五、补充理解与易混淆点
可交换算子在量子力学中的意义
在量子力学中,算子代表可观察量(observables),如位置、动量、自旋等。可交换性在量子力学中具有深刻的物理意义:
可交换 = 可同时精确测量。如果两个可观察量对应的算子 和 可交换(),那么存在一组共同的本征态(即公共特征向量),在这组态上可以同时确定两个可观察量的值。例如,氢原子中电子的哈密顿量(能量)和角动量平方算子可交换,因此能量和角动量大小可以同时精确测量。
不可交换 = 不确定性原理。如果 ,则两个可观察量之间存在根本的不兼容性,不可能同时精确测量。最著名的例子是位置算子 和动量算子 ,它们的交换子 ,这正是海森堡不确定性原理的数学根源:。
来源:MIT 8.321 Quantum Theory I 课程讲义(同时对角化与量子测量)、Princeton CHM 305 Lecture 8(不确定性原理与交换子)、UCSB Chemistry 11 Chapter 11(交换子与可观察量的兼容性)、CSU East Bay Chemistry 352(交换子与可同时测量的可观察量)。
同时对角化的应用场景
同时对角化不仅是理论上的优美结论,在计算和应用中也有重要价值:
矩阵函数的计算。若 和 可同时对角化,即存在可逆矩阵 使得 且 ,其中 为对角矩阵,那么:
- ,
最后一个等式 仅在 和 可交换时成立,这在微分方程和量子力学中极为重要。
耦合系统的解耦。在线性微分方程组 、 中,如果矩阵对 和 可同时对角化,系统可以解耦为独立的单变量方程。
谱定理的推广。谱定理表明正规算子可以酉对角化。对于一族两两可交换的正规算子,可以同时对角化,这是多重谱定理的基础,在泛函分析和量子场论中有核心地位。
来源:Harvard SEAS 讲义(可交换算子与矩阵指数 )、UC Davis “Spectral Theorem for Normal Linear Maps”(多重谱定理与可交换正规算子族)、UPenn CIS 515 “Spectral Theorems”(同时对角化在谱分解中的应用)。
为什么可交换性如此稀有
教材提到在元素取自 的 整数矩阵中,可交换对仅占约 0.3%。这个现象可以从自由度的角度理解:
一个 矩阵有 个自由参数。两个矩阵 和 共有 个自由参数。可交换条件 给出 个方程(矩阵等式的每个位置给出一个方程)。因此,可交换矩阵对的”自由度”约为 ,相比无约束的 自由度,可交换对在所有矩阵对中构成一个”低维”子集。
更精确地说,对于 复矩阵,可交换矩阵对构成的代数簇的维数为 (而非 ),这意味着随着 增大,可交换性越来越稀有。这也解释了为什么可交换的算子具有如此特殊的结构性质——可交换性是一个极强的约束,它将算子对限制在一个非常特殊的子集中。
来源:Keith Conrad (University of Connecticut) “Simultaneous Commutativity of Operators”(可交换算子对的代数结构与稀有性分析)、MIT 8.321 Quantum Theory I(可交换算子的约束条件讨论)。
常见误区
误区 1:"可交换的算子有相同的特征值"
❌ 意味着 和 有相同的特征值。
✅ 可交换性不保证 和 有相同的特征值。例如,(恒等算子)与任何算子可交换,但 可以有任意特征值。可交换性保证的是公共特征向量的存在性(定理 5.78),而非公共特征值。公共特征向量 满足 和 ,其中 和 一般不同。
误区 2:"可交换性保证可对角化"
❌ 且 可对角化,则 也可对角化。
✅ 可交换性本身不保证任何一个算子可对角化。定理 5.76 的前提是两个算子都可对角化,可交换性是它们能同时对角化的充要条件。反例:设 为任意可对角化算子, 为与 可交换但不可对角化的算子(例如 ,其中 是与 可交换的非零幂零算子),则 但 不可对角化。
误区 3:"和与积的特征值公式总成立"
❌ 对任意算子 , 的特征值等于 和 的特征值之和, 的特征值等于 和 的特征值之积。
✅ 这个公式仅在可交换时成立(定理 5.81),且要求 是复向量空间。不可交换时, 和 的特征值与 的特征值之间没有简单关系。即使在实向量空间上可交换,结论也可能不成立(见习题 10),因为实向量空间上的算子不一定有特征值。
六、习题精选
本节习题
习题号 标题 核心考点 难度 1 可交换算子的不变子空间 可交换不保证共享所有不变子空间 中 2 任意多个可对角化算子的同时对角化 定理 5.76 的推广至无穷集 高 3 null 和 range 在可交换算子下不变 引理 5.75 的推广 中 5 对偶算子的可交换性 对偶与可交换的关系 高 6 range 之和不等于 特征值配对与子空间覆盖 高 7 可对角化与可交换的混合矩阵表示 定理 5.76 的弱化版本 中 10 实向量空间上 5.81 的反例 定理 5.81 对复空间的依赖 中
习题 1:可交换算子的不变子空间
习题 1
给出一例: 上的两个可交换算子 ,使得 中有在 下不变但不在 下不变的子空间,以及在 下不变但不在 下不变的子空间。
查看解答
取 。令 关于标准基的矩阵分别为:
和 都是对角矩阵,因此可交换(命题 5.74 的必要性方向)。
令 。因为 ,,所以 在 下不变。但 ,而 ——看起来 在 下也不变。需要更精细的构造。
令 。,,所以 在 下不变。但 ,——仍不变。
更好的做法:令 。,所以 在 下不变。但 (因为 不是 的标量倍),所以 不在 下不变。
类似地,令 。,所以 在 下不变。但 ,所以 不在 下不变。
因此 和 可交换, 在 下不变但不在 下不变, 在 下不变但不在 下不变。
习题 2:任意多个可对角化算子的同时对角化
习题 2
设 是 的子集,且 中每个元素都可对角化。证明:存在 的一个基使得 的每个元素关于它都有对角矩阵,当且仅当 中每对元素都可交换。
查看解答
必要性():若存在 的基使得 中每个元素关于它都有对角矩阵,则 中任意两个元素关于同一基有对角矩阵,由命题 5.74,它们可交换。
充分性():对 中元素个数 用归纳法。
基础情形: 时,结论平凡成立(单个可对角化算子存在对角化基)。
时:这就是定理 5.76。
归纳步骤:设 ,且结论对所有元素个数少于 的集合成立。取 ,令 。由归纳假设,存在 的基 使得 中每个元素关于该基有对角矩阵。
令 是 的互异特征值。因为 可对角化:
对每个 ,因为 和 可交换,由引理 5.75, 在 下不变。由于 关于 有对角矩阵, 可对角化,从而 可对角化(由 5.65)。
对每个 , 中所有算子限制在 上仍两两可交换。由归纳假设( 在 上的限制的元素个数更少,或者对 中元素个数用归纳),存在 的基使得 中每个元素的限制关于该基有对角矩阵。同时 ,关于任何基都是对角矩阵。
将这些基合并,得到 的基,使得 中每个元素关于该基有对角矩阵。
习题 3:null 和 range 在可交换算子下不变
习题 3
设 使得 。设 。 (a) 证明: 在 下不变。 (b) 证明: 在 下不变。
查看解答
(a) 设 ,即 。我们需要证明 ,即 。
因为 ,所以对任意正整数 ,有 (可通过对 归纳证明)。因此对任意多项式 ,有 。
于是:。
因此 ,即 在 下不变。
(b) 设 ,则存在 使得 。我们需要证明 。
(因为 )。
因为 ,所以 。因此 ,即 在 下不变。
习题 5:对偶算子的可交换性
习题 5
证明:有限维向量空间上的一对算子可交换,当且仅当其对偶算子可交换。
查看解答
习题 6:range 之和不等于
习题 6
设 是非零有限维复向量空间,且 可交换。证明:存在 使得 。
查看解答
由定理 5.78, 和 有公共特征向量 。设 且 ,其中 。
那么 ,所以 。
类似地,,所以 。
因此 。
注意到 (在有限维空间中,null 空间与对偶的 range 正交),但我们不需要内积。直接用维数公式:
由秩-零化度定理:
因为 ,所以 且 。
因此:
其中 。但这并不直接给出 的结论(当 时 )。
更好的方法:因为 且 ,取 使得 (由 Hahn-Banach 或有限维对偶基的存在性)。那么对任意 和任意 : 但这不是直接的。更简洁的论证:
反设 。那么对任意 ,存在 使得 。特别地,取 : 两边用 作用(其中 ):
但实际上更直接的证明: 意味着 不一定成立。我们换一种方法。
正确方法:考虑商空间 。算子 诱导出商空间上的单射。但更简单的是:
因为 ,所以对任意 ,存在 使得 。于是: 其中 是满足 的线性泛函。由于 ,由对偶性质, 意味着 ,所以 。
类似地,,所以对任意 ,。
因此对任意 ,。但 ,所以 。因此这个和不等于 。
习题 7:可对角化与可交换的混合矩阵表示
习题 7
设 是复向量空间, 可对角化,且 和 可交换。证明:存在 的一个基使得 关于该基有对角矩阵而 关于该基有上三角矩阵。
查看解答
习题 10:实向量空间上 5.81 的反例
习题 10
给出一例:在一有限维实向量空间上的两个可交换算子 ,使得 有特征值不等于 的特征值加上 的特征值,且 有特征值不等于 的特征值乘以 的特征值。
查看解答
取 。令 关于标准基的矩阵为:
首先验证可交换性: 所以 , 和 可交换。
的特征多项式为 ,在 上没有根,因此 在 上没有特征值。同理 也没有实特征值。
但 的矩阵为: 所以 ,其唯一特征值为 。
由于 和 没有实特征值,” 的特征值 等于 的某个特征值加上 的某个特征值”这一陈述在实数范围内无法成立(因为 和 根本没有实特征值可供选取)。
类似地,,其唯一特征值为 ,但 和 没有实特征值,所以 ” 的特征值 等于 的某个特征值乘以 的某个特征值”也无法成立。
这个反例说明定理 5.81 依赖于 是代数闭域这一事实——在实向量空间上,算子可能没有特征值,从而特征值公式无从谈起。
七、视频学习指南
视频资源
暂无对应视频。
视频精要
暂无视频精要。