8D 联系矩阵与算子的桥梁——迹

本节概览

本节建立矩阵的迹算子的迹之间的桥梁,是连接矩阵语言和算子语言的关键工具。逻辑链条如下:

  1. 矩阵的迹(定义8.47, 例8.48, 定理8.49) 定义方阵对角线元素之和,证明
  2. 算子的迹(定义8.51, 定理8.50, 定理8.52, 例8.53) 利用换基公式证明迹不依赖基的选取,定义算子的迹,证明迹等于特征值之和
  3. 迹的性质(定理8.54, 8.55, 8.56, 8.57) 迹与特征多项式的关系、内积空间上的迹公式、迹的线性性、

核心主线:矩阵的迹 算子的迹(基无关性) 迹 = 特征值之和 迹的代数性质。

前置依赖8B 广义特征空间分解(特征多项式、特征值与重数)、6B 规范正交基(规范正交基、内积空间)、7E 奇异值分解与推论(算子的伴随、)、3C 矩阵(矩阵乘法、换基公式)、5C 上三角矩阵(上三角矩阵、特征值与对角元)。


一、矩阵的迹

迹的定义

定义 8.47 矩阵的迹(trace of a matrix)

是各元素均属于 的方阵。,记为 ,定义为 对角线上各元素之和。

即,若 矩阵,则:

直觉理解

迹是最简单的矩阵函数之一——只需把对角线上的元素加起来。虽然定义极其简单,但它蕴含了关于算子的深刻信息(如特征值之和)。

例题

例 8.48 一个 矩阵的迹

对角线上的元素是 (以红色标出)。于是

tr(AB) = tr(BA)

矩阵乘法不满足交换律,但迹具有一种特殊的”交换不变性”:

定理 8.49 的迹等于 的迹

矩阵且 矩阵。那么

证明思路

[关键步骤]:直接展开对角线元素,交换求和顺序。

矩阵 对角线上的第 个元素等于 。于是

其中关键一步是交换双重求和的顺序,这利用了有限和的绝对收敛性。

注意

  • 甚至可以有不同的维数( vs ),但它们的迹始终相等
  • 这个性质是本节后续几乎所有结论的基础

二、算子的迹

迹不依赖基的选取

我们想要定义算子 的迹为 关于 的某个基的矩阵的迹。然而,这个定义不应依赖于基的选取。

定理 8.50 算子的矩阵的迹不依赖于基的选取

。设 的基。那么

证明思路

[关键步骤]:利用换基公式 + 定理8.49的循环迹性质。

换基公式告诉我们,存在可逆的 矩阵 使得 (见3.84)。于是

其中第二行源于定理8.49,取

证明解读

这个证明非常优雅。换基公式给出 ,看起来 很不一样。但利用 的”循环不变性”, 像”括号”一样被消去了,直接得到

算子的迹的定义

因为定理8.50保证了基无关性,下面定义是合理的:

定义 8.51 算子的迹(trace of an operator)

,记作 ,定义为 其中 任意一个基。

为什么需要定理8.50?

如果没有定理8.50,这个定义就是”病态”的——选不同的基可能得到不同的迹值。定理8.50保证了无论选哪个基,结果都一样,因此定义是**良定义(well-defined)**的。这是数学中定义新概念时的标准做法:先证明候选定义不依赖于任意选择,再正式给出定义。

迹等于特征值之和

定理 8.52 在复向量空间上,迹等于特征值之和

。那么 等于 的特征值之和,其中各特征值出现次数等于其重数。

证明思路

[关键步骤]:选取使 具有上三角矩阵的基,对角线上恰好是所有特征值。

存在 的一个基使得 关于该基有上三角矩阵,且对角线上各元素都是 的特征值,并且各特征值出现次数等于其重数(见 8.37)。

于是由算子的迹的定义以及定理8.50(该结论让我们得以自由选取基),可得 等于 的特征值之和,其中各特征值出现次数等于其重数。

关于"重数"的说明

  • 特征值 重数定义为广义特征空间 的维数(见 定义8.23
  • 的所有互异特征值,重数分别为 ,则求和式为
  • 也可将所有特征值记为 ),求和式写为

例题

例 8.53 上一个算子的迹

定义

关于 的标准基的矩阵是

方法一(直接计算迹):对角线元素之和为 ,所以

方法二(特征值之和) 的特征值是 ,重数都是 。特征值之和为 与方法一一致,正如定理8.52所言。

验证技巧

例8.53展示了一个实用的验证方法:计算迹(很容易,只需加对角线)可以用来检验特征值的计算是否正确——如果特征值之和等于迹,说明至少没有遗漏或多余的特征值。


三、迹的性质

迹与特征多项式

定理 8.54 迹与特征多项式

。令 。那么 等于 的特征多项式中 项的系数的相反数

推导过程

的特征值(各特征值出现的次数等于其重数)。由 定义8.26 的特征多项式等于

将上述多项式展开:

定理8.52。因此特征多项式可写为:

重要观察

  • 迹是 项系数的相反数
  • 行列式是常数项(的 倍)
  • 迹和行列式完全由特征值决定,它们是特征值的基本对称函数
  • 该结论也见于9.65,但9.65无需假设

Vieta 公式的矩阵版本

特征多项式 展开后,各系数与特征值的关系正是Vieta公式

  • 系数
  • 常数项

内积空间上的迹

定理 8.55 内积空间上的迹

是内积空间, 的规范正交基。则

证明思路

[关键步骤]:规范正交基下矩阵元素与内积的关系。

注意到 行第 列中的元素等于 【利用 6.30(a),取 】,即可得欲证的公式。

物理意义

这个公式说明:迹等于算子 在每个规范正交基向量方向上的”分量”之和。在量子力学中,这与期望值的概念密切相关—— 可以理解为 在状态 下的期望值。

迹的线性性

定理 8.56 迹是线性的

函数 上的线性泛函,且使 对所有 都成立。

证明思路

[关键步骤]:取定一个基,将算子的性质归结为矩阵的性质。

取定 的一个基。本证明中所有算子的矩阵都是关于该基的。设

齐次性:若 ,那么 其中第二个等号来自 3.38,第三个等号由方阵的迹的定义可得。

可加性 其中第二个等号来自 3.35

上述两段说明 上的线性泛函

交换性 其中第二个和第四个等号源于 3.43关键的第三个等号则来自定理8.49

迹的唯一刻画

等式 上的线性泛函中唯一刻画了迹——见习题10。

不存在 S, T 使 ST - TS = I

定理 8.57 恒等算子不等于 之差

不存在使得 成立的算子

证明思路

[关键步骤]:利用迹的线性性和交换性,证明 的迹恒为零。

。那么 其中两个等号都源自定理8.56(线性性 + )。

的迹等于 ,肯定不是 。因为 有不同的迹,所以它们不可能相等。

无限维的情况

这个结论在无限维向量空间上不成立(见本节习题13)。然而,对 附加限制条件,即可将下面结论推广至无限维向量空间,推广后的结论在量子理论中有重要应用(量子力学中的对易关系 )。


四、知识结构总览

mindmap
  root((8D 迹))
    矩阵的迹
      定义8.47: 对角线元素之和
      例8.48: 3x3矩阵
      定理8.49: trAB等于trBA
    算子的迹
      定理8.50: 基无关性
      定义8.51: 任意基的矩阵的迹
      定理8.52: 迹等于特征值之和
      例8.53: C3上的验证
    迹的性质
      定理8.54: 迹与特征多项式
      定理8.55: 内积空间公式
      定理8.56: 线性性加交换性
      定理8.57: ST减TS不等于I
    深层联系
      特征值之和
      行列式等于常数项
      Frobenius内积
      量子力学对易关系
flowchart TD
    A["定义8.47: 矩阵的迹 tr A = 对角线元素之和"] --> B["定理8.49: tr AB = tr BA"]
    B --> C["定理8.50: 迹不依赖基的选取"]
    C --> D["定义8.51: 算子的迹 tr T"]
    D --> E["定理8.52: 复空间上 tr T = 特征值之和"]
    E --> F["定理8.54: 迹 = 特征多项式 z^(n-1) 系数的相反数"]
    D --> G["定理8.55: 内积空间 tr T = Σ ⟨Te_k, e_k⟩"]
    D --> H["定理8.56: tr 是线性泛函 + tr ST = tr TS"]
    H --> I["定理8.57: ST - TS ≠ I"]
    F --> J["特征多项式 q(z) = z^n - tr T · z^(n-1) + ... + (-1)^n det T"]

五、核心思想与证明技巧

本节的核心方法论

从矩阵到算子的定义模式

本节展示了一个重要的数学模式——如何将矩阵的性质提升为算子的性质

  1. 先在矩阵层面定义概念(矩阵的迹)
  2. 证明该概念在基变换下不变(定理8.50)
  3. 利用基无关性,将概念提升到算子层面(定义8.51)

这个模式在数学中反复出现。奇异值的定义也遵循类似的思路。

关键证明技巧总结

技巧一:交换求和顺序(定理8.49)

证明 的核心是交换双重求和的顺序: 这看似平凡,但它是本节几乎所有结论的源头。

技巧二:循环迹性质(定理8.50)

利用 ,可以将换基公式 中的 “消去”: 这是相似矩阵具有相同迹的直接推论。

技巧三:自由选取基(定理8.52)

一旦证明了迹是基无关的,就可以选取最方便的基来计算迹。定理8.52选取了使 具有上三角矩阵的基,对角线直接给出特征值。

技巧四:用迹证明不存在性(定理8.57)

要证明 不可能成立,只需计算两边的迹:

  • 左边:(因为
  • 右边:

迹不同,所以不可能相等。这种"不变量论证"在数学中非常强大。


六、补充理解与易混淆点

迹的直觉——“矩阵的缩放总量”

迹的几何直觉

  • 迹 = 对角线元素之和 = 特征值之和(复空间)
  • 直觉:迹度量了算子沿各方向平均拉伸量的总和
  • 与行列式的区别:行列式度量”体积缩放因子”,迹度量”方向缩放之和”

类比:想象一个三维空间的线性变换。行列式告诉你”这个变换把单位立方体变成了多大体积的平行六面体”(一个标量),而迹告诉你”沿三个主方向的拉伸因子加起来是多少”(也是标量,但信息不同)。

迹 vs 行列式

性质行列式
特征值关系
特征多项式位置 系数的相反数常数项(的 倍)
几何意义缩放之和体积缩放因子
乘法性质
线性性是(

来源:Princeton COS302讲义、UT Austin线性代数讲义(Lorenzo Sadun)、MSU计算基础讲义。

tr(AB) = tr(BA) 的深刻含义

这个等式看似简单,但非常重要

应用一:证明算子的迹不依赖基的选取(定理8.50)

应用二:证明迹的交换性 (定理8.56)

应用三:证明 (定理8.57)

物理意义 的”总缩放效果”相同,即使维数不同。例如, 矩阵, 矩阵,则 的, 的,但它们的迹相等。

常见错误

不意味着 !后者一般不成立。

来源:MIT 18.06讲义(Gilbert Strang)、Princeton COS302讲义。

迹与特征多项式的关系

特征多项式的完整展开

的特征值(计重数),则特征多项式 展开为

推论:迹和行列式完全由特征值决定。更一般地,特征多项式的所有系数都由特征值决定(它们是特征值的初等对称多项式)。

来源:Princeton COS302讲义、UT Austin线性代数讲义(Lorenzo Sadun)、MSU计算基础讲义。

Frobenius 内积(Hilbert-Schmidt 内积)

习题12引出的重要概念

习题12证明了: 定义了 上的一个内积。

  • 由此得到的范数 称为 Frobenius 范数(或 Hilbert-Schmidt 范数)
  • 这是矩阵分析中最重要的内积之一
  • 注意:Frobenius 范数与 7.86 定义的算子范数 不同
  • 习题11进一步说明:,即矩阵所有元素绝对值的平方和,与规范正交基的选取无关

Frobenius 范数的计算

就是把所有元素平方求和再开根号——非常直观。

来源:MIT 18.06讲义(Gilbert Strang)、Princeton COS302讲义。

常见误区

误区一:"迹依赖基的选取"

❌ 错误:选不同的基,矩阵不同,迹也不同 ✅ 正确:定理8.50保证迹是算子的内蕴性质,与基的选取无关

误区二:" "

❌ 错误:将循环性质误解为分配性质 ✅ 正确:,反例见习题8

误区三:"迹只对复方阵有意义"

❌ 错误:因为”迹=特征值之和”只在复空间成立,所以迹只在复空间有意义 ✅ 正确:迹对任意域上的方阵都有定义(定义8.47),只是”迹=特征值之和”需要复空间

误区四:" 有解"

❌ 错误:可以找到 使其对易子等于恒等算子 ✅ 正确:定理8.57证明在有限维空间上不可能(但无限维空间上可以,见习题13)

来源:MIT 18.06讲义(Gilbert Strang)、OSU Ximera线性代数教材。


七、习题精选

本节习题

习题号标题核心考点难度
习题1秩一算子的迹内积空间上迹的计算
习题2投影的迹tr P = dim range P
习题4伴随的迹tr T* = tr T
习题5正算子零迹推出零算子正算子与迹的关系
习题7由迹求第三个特征值迹=特征值之和
习题10迹的唯一刻画线性泛函的唯一性
习题12L(V,W)上的内积Frobenius内积

习题1:秩一算子的迹

习题1

是内积空间且 。定义算子 。求出 的表达式。

习题2:投影的迹

习题2

满足 。证明

习题4:伴随的迹

习题4

是内积空间且 。证明:

习题5:正算子零迹推出零算子

习题5

是内积空间。设 是正算子,且 。证明

习题7:由迹求第三个特征值

习题7

设算子 的矩阵为 。某人告诉你 的特征值。不用计算机也不动笔,求出 的第三个特征值。

习题10:迹的唯一刻画

习题10

证明:迹是唯一使得 对所有 成立且满足 的线性泛函

习题12:L(V,W)上的内积

习题12

是有限维内积空间。 (a) 证明: 定义了 上的一个内积。 (b) 设 的规范正交基且 的规范正交基。证明:(a) 中所得 上的内积与 上的标准内积相同。


八、视频学习指南

视频精要

以下视频对应 Axler 第三版的8D节内容(迹),第四版中迹的内容仍在8D节,核心内容一致。

视频内容覆盖对应教材
P101 Trace of an Operator (1)矩阵的迹、、基无关性定义8.47, 定理8.49, 8.50
P102 Trace of an Operator (2)算子的迹、迹=特征值之和、迹与特征多项式定义8.51, 定理8.52, 8.54
P103 Trace of an Operator (3)内积空间上的迹、迹的线性性、定理8.55, 8.56, 8.57

版本差异说明:第三版和第四版的8D节核心内容基本一致。第四版在习题部分增加了关于 Frobenius 内积的讨论(习题11-12),这与第三版的处理方式相同。

学习建议

  1. 先看 P101,理解 的证明——这是本节最重要的恒等式
  2. 再看 P102,重点理解”自由选取基”的证明技巧
  3. 最后看 P103,体会如何用迹这个”不变量”来证明不存在性结果

九、教材原文

教材原文


#学习/线性代数/矩阵与算子的联系 #学习/线性代数/特征多项式