8D 联系矩阵与算子的桥梁——迹
本节概览
本节建立矩阵的迹与算子的迹之间的桥梁,是连接矩阵语言和算子语言的关键工具。逻辑链条如下:
- 矩阵的迹(定义8.47, 例8.48, 定理8.49) 定义方阵对角线元素之和,证明
- 算子的迹(定义8.51, 定理8.50, 定理8.52, 例8.53) 利用换基公式证明迹不依赖基的选取,定义算子的迹,证明迹等于特征值之和
- 迹的性质(定理8.54, 8.55, 8.56, 8.57) 迹与特征多项式的关系、内积空间上的迹公式、迹的线性性、
核心主线:矩阵的迹 算子的迹(基无关性) 迹 = 特征值之和 迹的代数性质。
前置依赖:8B 广义特征空间分解(特征多项式、特征值与重数)、6B 规范正交基(规范正交基、内积空间)、7E 奇异值分解与推论(算子的伴随、)、3C 矩阵(矩阵乘法、换基公式)、5C 上三角矩阵(上三角矩阵、特征值与对角元)。
一、矩阵的迹
迹的定义
定义 8.47 矩阵的迹(trace of a matrix)
设 是各元素均属于 的方阵。 的迹,记为 ,定义为 对角线上各元素之和。
即,若 是 矩阵,则:
直觉理解
迹是最简单的矩阵函数之一——只需把对角线上的元素加起来。虽然定义极其简单,但它蕴含了关于算子的深刻信息(如特征值之和)。
例题
例 8.48 一个 矩阵的迹
设 对角线上的元素是 、 和 (以红色标出)。于是
tr(AB) = tr(BA)
矩阵乘法不满足交换律,但迹具有一种特殊的”交换不变性”:
定理 8.49 的迹等于 的迹
设 是 矩阵且 是 矩阵。那么
证明思路
[关键步骤]:直接展开对角线元素,交换求和顺序。
设
矩阵 对角线上的第 个元素等于 。于是
其中关键一步是交换双重求和的顺序,这利用了有限和的绝对收敛性。
注意
- 和 甚至可以有不同的维数( vs ),但它们的迹始终相等
- 这个性质是本节后续几乎所有结论的基础
二、算子的迹
迹不依赖基的选取
我们想要定义算子 的迹为 关于 的某个基的矩阵的迹。然而,这个定义不应依赖于基的选取。
定理 8.50 算子的矩阵的迹不依赖于基的选取
设 。设 和 是 的基。那么
证明思路
证明解读
这个证明非常优雅。换基公式给出 ,看起来 和 很不一样。但利用 的”循环不变性”, 和 像”括号”一样被消去了,直接得到 。
算子的迹的定义
因为定理8.50保证了基无关性,下面定义是合理的:
定义 8.51 算子的迹(trace of an operator)
设 。 的迹,记作 ,定义为 其中 是 的任意一个基。
为什么需要定理8.50?
如果没有定理8.50,这个定义就是”病态”的——选不同的基可能得到不同的迹值。定理8.50保证了无论选哪个基,结果都一样,因此定义是**良定义(well-defined)**的。这是数学中定义新概念时的标准做法:先证明候选定义不依赖于任意选择,再正式给出定义。
迹等于特征值之和
定理 8.52 在复向量空间上,迹等于特征值之和
设 且 。那么 等于 的特征值之和,其中各特征值出现次数等于其重数。
证明思路
[关键步骤]:选取使 具有上三角矩阵的基,对角线上恰好是所有特征值。
存在 的一个基使得 关于该基有上三角矩阵,且对角线上各元素都是 的特征值,并且各特征值出现次数等于其重数(见 8.37)。
于是由算子的迹的定义以及定理8.50(该结论让我们得以自由选取基),可得 等于 的特征值之和,其中各特征值出现次数等于其重数。
关于"重数"的说明
- 特征值 的重数定义为广义特征空间 的维数(见 定义8.23)
- 若 是 的所有互异特征值,重数分别为 ,则求和式为
- 也可将所有特征值记为 (),求和式写为
例题
例 8.53 上一个算子的迹
定义 为
关于 的标准基的矩阵是
方法一(直接计算迹):对角线元素之和为 ,所以 。
方法二(特征值之和): 的特征值是 ,重数都是 。特征值之和为 与方法一一致,正如定理8.52所言。
验证技巧
例8.53展示了一个实用的验证方法:计算迹(很容易,只需加对角线)可以用来检验特征值的计算是否正确——如果特征值之和等于迹,说明至少没有遗漏或多余的特征值。
三、迹的性质
迹与特征多项式
定理 8.54 迹与特征多项式
设 且 。令 。那么 等于 的特征多项式中 项的系数的相反数。
推导过程:
设 是 的特征值(各特征值出现的次数等于其重数)。由 定义8.26, 的特征多项式等于
将上述多项式展开:
由定理8.52,。因此特征多项式可写为:
重要观察
- 迹是 项系数的相反数
- 行列式是常数项(的 倍)
- 迹和行列式完全由特征值决定,它们是特征值的基本对称函数
- 该结论也见于9.65,但9.65无需假设
Vieta 公式的矩阵版本
特征多项式 展开后,各系数与特征值的关系正是Vieta公式:
- 系数
- 常数项
内积空间上的迹
定理 8.55 内积空间上的迹
设 是内积空间,, 是 的规范正交基。则
证明思路
[关键步骤]:规范正交基下矩阵元素与内积的关系。
注意到 第 行第 列中的元素等于 【利用 6.30(a),取 】,即可得欲证的公式。
物理意义
这个公式说明:迹等于算子 在每个规范正交基向量方向上的”分量”之和。在量子力学中,这与期望值的概念密切相关—— 可以理解为 在状态 下的期望值。
迹的线性性
定理 8.56 迹是线性的
函数 是 上的线性泛函,且使 对所有 都成立。
证明思路
迹的唯一刻画
等式 和 在 上的线性泛函中唯一刻画了迹——见习题10。
不存在 S, T 使 ST - TS = I
定理 8.57 恒等算子不等于 与 之差
不存在使得 成立的算子 。
证明思路
[关键步骤]:利用迹的线性性和交换性,证明 的迹恒为零。
设 。那么 其中两个等号都源自定理8.56(线性性 + )。
而 的迹等于 ,肯定不是 。因为 和 有不同的迹,所以它们不可能相等。
无限维的情况
这个结论在无限维向量空间上不成立(见本节习题13)。然而,对 和 附加限制条件,即可将下面结论推广至无限维向量空间,推广后的结论在量子理论中有重要应用(量子力学中的对易关系 )。
四、知识结构总览
mindmap root((8D 迹)) 矩阵的迹 定义8.47: 对角线元素之和 例8.48: 3x3矩阵 定理8.49: trAB等于trBA 算子的迹 定理8.50: 基无关性 定义8.51: 任意基的矩阵的迹 定理8.52: 迹等于特征值之和 例8.53: C3上的验证 迹的性质 定理8.54: 迹与特征多项式 定理8.55: 内积空间公式 定理8.56: 线性性加交换性 定理8.57: ST减TS不等于I 深层联系 特征值之和 行列式等于常数项 Frobenius内积 量子力学对易关系
flowchart TD A["定义8.47: 矩阵的迹 tr A = 对角线元素之和"] --> B["定理8.49: tr AB = tr BA"] B --> C["定理8.50: 迹不依赖基的选取"] C --> D["定义8.51: 算子的迹 tr T"] D --> E["定理8.52: 复空间上 tr T = 特征值之和"] E --> F["定理8.54: 迹 = 特征多项式 z^(n-1) 系数的相反数"] D --> G["定理8.55: 内积空间 tr T = Σ ⟨Te_k, e_k⟩"] D --> H["定理8.56: tr 是线性泛函 + tr ST = tr TS"] H --> I["定理8.57: ST - TS ≠ I"] F --> J["特征多项式 q(z) = z^n - tr T · z^(n-1) + ... + (-1)^n det T"]
五、核心思想与证明技巧
本节的核心方法论
从矩阵到算子的定义模式
本节展示了一个重要的数学模式——如何将矩阵的性质提升为算子的性质:
- 先在矩阵层面定义概念(矩阵的迹)
- 证明该概念在基变换下不变(定理8.50)
- 利用基无关性,将概念提升到算子层面(定义8.51)
这个模式在数学中反复出现。奇异值的定义也遵循类似的思路。
关键证明技巧总结
技巧一:交换求和顺序(定理8.49)
证明 的核心是交换双重求和的顺序: 这看似平凡,但它是本节几乎所有结论的源头。
技巧二:循环迹性质(定理8.50)
利用 ,可以将换基公式 中的 和 “消去”: 这是相似矩阵具有相同迹的直接推论。
技巧三:自由选取基(定理8.52)
一旦证明了迹是基无关的,就可以选取最方便的基来计算迹。定理8.52选取了使 具有上三角矩阵的基,对角线直接给出特征值。
技巧四:用迹证明不存在性(定理8.57)
要证明 不可能成立,只需计算两边的迹:
- 左边:(因为 )
- 右边:
迹不同,所以不可能相等。这种"不变量论证"在数学中非常强大。
六、补充理解与易混淆点
迹的直觉——“矩阵的缩放总量”
迹的几何直觉
- 迹 = 对角线元素之和 = 特征值之和(复空间)
- 直觉:迹度量了算子沿各方向平均拉伸量的总和
- 与行列式的区别:行列式度量”体积缩放因子”,迹度量”方向缩放之和”
类比:想象一个三维空间的线性变换。行列式告诉你”这个变换把单位立方体变成了多大体积的平行六面体”(一个标量),而迹告诉你”沿三个主方向的拉伸因子加起来是多少”(也是标量,但信息不同)。
迹 vs 行列式
性质 迹 行列式 特征值关系 特征多项式位置 系数的相反数 常数项(的 倍) 几何意义 缩放之和 体积缩放因子 乘法性质 线性性 是() 否
来源:Princeton COS302讲义、UT Austin线性代数讲义(Lorenzo Sadun)、MSU计算基础讲义。
tr(AB) = tr(BA) 的深刻含义
这个等式看似简单,但非常重要
应用一:证明算子的迹不依赖基的选取(定理8.50)
应用二:证明迹的交换性 (定理8.56)
应用三:证明 (定理8.57)
物理意义: 和 的”总缩放效果”相同,即使维数不同。例如, 是 矩阵, 是 矩阵,则 是 的, 是 的,但它们的迹相等。
常见错误
不意味着 !后者一般不成立。
来源:MIT 18.06讲义(Gilbert Strang)、Princeton COS302讲义。
迹与特征多项式的关系
特征多项式的完整展开
设 是 的特征值(计重数),则特征多项式 展开为
推论:迹和行列式完全由特征值决定。更一般地,特征多项式的所有系数都由特征值决定(它们是特征值的初等对称多项式)。
来源:Princeton COS302讲义、UT Austin线性代数讲义(Lorenzo Sadun)、MSU计算基础讲义。
Frobenius 内积(Hilbert-Schmidt 内积)
习题12引出的重要概念
习题12证明了: 定义了 上的一个内积。
- 由此得到的范数 称为 Frobenius 范数(或 Hilbert-Schmidt 范数)
- 这是矩阵分析中最重要的内积之一
- 注意:Frobenius 范数与 7.86 定义的算子范数 不同
- 习题11进一步说明:,即矩阵所有元素绝对值的平方和,与规范正交基的选取无关
Frobenius 范数的计算
对 , 就是把所有元素平方求和再开根号——非常直观。
来源:MIT 18.06讲义(Gilbert Strang)、Princeton COS302讲义。
常见误区
误区一:"迹依赖基的选取"
❌ 错误:选不同的基,矩阵不同,迹也不同 ✅ 正确:定理8.50保证迹是算子的内蕴性质,与基的选取无关
误区二:" "
❌ 错误:将循环性质误解为分配性质 ✅ 正确:,反例见习题8
误区三:"迹只对复方阵有意义"
❌ 错误:因为”迹=特征值之和”只在复空间成立,所以迹只在复空间有意义 ✅ 正确:迹对任意域上的方阵都有定义(定义8.47),只是”迹=特征值之和”需要复空间
误区四:" 有解"
❌ 错误:可以找到 使其对易子等于恒等算子 ✅ 正确:定理8.57证明在有限维空间上不可能(但无限维空间上可以,见习题13)
来源:MIT 18.06讲义(Gilbert Strang)、OSU Ximera线性代数教材。
七、习题精选
本节习题
习题号 标题 核心考点 难度 习题1 秩一算子的迹 内积空间上迹的计算 中 习题2 投影的迹 tr P = dim range P 中 习题4 伴随的迹 tr T* = tr T 中 习题5 正算子零迹推出零算子 正算子与迹的关系 中 习题7 由迹求第三个特征值 迹=特征值之和 中 习题10 迹的唯一刻画 线性泛函的唯一性 高 习题12 L(V,W)上的内积 Frobenius内积 高
习题1:秩一算子的迹
习题1
设 是内积空间且 。定义算子 为 。求出 的表达式。
查看解答
设 是 的规范正交基。由 8.55, 。
由 6.30(a),。
因此 。
习题2:投影的迹
习题2
设 满足 。证明 。
查看解答
设 ,。由 3.94,。
取 的基 和 的基 ,合并为 的基。
关于该基, 的矩阵为 ,其中 是 单位矩阵。
因此 。
习题4:伴随的迹
习题4
设 是内积空间且 。证明:。
查看解答
设 是 的规范正交基。由 8.55, 。
习题5:正算子零迹推出零算子
习题5
设 是内积空间。设 是正算子,且 。证明 。
查看解答
由谱定理(7.31),存在 的规范正交基 使得 ,其中 (因为 是正算子)。
由 8.55,。
因为 且 ,所以每个 ,故 。
习题7:由迹求第三个特征值
习题7
设算子 的矩阵为 。某人告诉你 和 是 的特征值。不用计算机也不动笔,求出 的第三个特征值。
查看解答
由 8.52, 等于 的特征值之和(各特征值出现次数等于其重数)。
。
设第三个特征值为 ,则 ,故 。
习题10:迹的唯一刻画
习题10
证明:迹是唯一使得 对所有 成立且满足 的线性泛函 。
查看解答
设 是 的基。对 ,定义 为 。
首先证明 :
- 若 : 是到 上的投影,由习题 2,。但 满足相同的性质(因为 和 在 上都等于1,且 …不对)。
更直接的证法:设 。取 ,则 ,。由 的性质,。但 ,且 对 。
标准证法:对 ,。类似地 …这需要更仔细的分析。
简洁证法:对 ,。由线性性,。
对 :… 不对。
正确证法:(当 且 时需验证)。实际上 。
因此 (当 )…
标准教科书证法:对 ,(因为 且 ,故差为0)。
所以 (),(由 和对称性)。
因此 。
习题12:L(V,W)上的内积
习题12
设 和 是有限维内积空间。 (a) 证明: 定义了 上的一个内积。 (b) 设 是 的规范正交基且 是 的规范正交基。证明:(a) 中所得 上的内积与 上的标准内积相同。
查看解答
(a) 需验证内积的三个条件:
- 正定性:,等号当且仅当 对所有 ,即 。
- 第一变元的线性:。数乘类似。
- 共轭对称性:(利用习题4)。
(b) 设 分别是 关于给定基的矩阵。 关于 的矩阵是 (因为 的矩阵是 , 的矩阵是 )。,这正是 上的标准内积。
八、视频学习指南
视频精要
以下视频对应 Axler 第三版的8D节内容(迹),第四版中迹的内容仍在8D节,核心内容一致。
视频 内容覆盖 对应教材 P101 Trace of an Operator (1) 矩阵的迹、、基无关性 定义8.47, 定理8.49, 8.50 P102 Trace of an Operator (2) 算子的迹、迹=特征值之和、迹与特征多项式 定义8.51, 定理8.52, 8.54 P103 Trace of an Operator (3) 内积空间上的迹、迹的线性性、 定理8.55, 8.56, 8.57 版本差异说明:第三版和第四版的8D节核心内容基本一致。第四版在习题部分增加了关于 Frobenius 内积的讨论(习题11-12),这与第三版的处理方式相同。
学习建议
- 先看 P101,理解 的证明——这是本节最重要的恒等式
- 再看 P102,重点理解”自由选取基”的证明技巧
- 最后看 P103,体会如何用迹这个”不变量”来证明不存在性结果
九、教材原文
教材原文
迹 #学习/线性代数/矩阵与算子的联系 #学习/线性代数/特征多项式