第 6 章 内积空间 — 章节汇总
全章概览
第 6 章是线性代数的”几何革命”——它在前五章建立的纯代数结构(向量空间、线性映射、算子)之上,引入内积赋予空间长度、角度和正交性等几何结构。本章从内积的公理化定义出发,导出范数、正交、柯西-施瓦兹不等式等基本工具,建立规范正交基的三大计算优势与格拉姆-施密特构造过程,通过舒尔定理将上三角化升级为规范正交版本,利用里斯表示定理实现内积空间中对偶空间与原空间的自然等同,最终以正交补与正交投影理论收束,将直和分解、最小化问题和伪逆统一在正交性的框架下。
逻辑链条:内积(定义 6.2) 范数(6.7) 正交(6.10) 正交分解(6.13) 柯西-施瓦兹不等式(6.14) 三角不等式(6.17) 平行四边形等式(6.21) 规范正交组(6.22) 规范正交基(6.27) 格拉姆-施密特过程(6.32) 舒尔定理(6.38) 里斯表示定理(6.42) 正交补(6.46) 直和分解 (6.49) 正交投影 (6.55) 最小化问题(6.61) 伪逆 (6.68)
核心主线:内积赋予空间几何结构,规范正交基是最优坐标系,正交投影是几何分析的核心工具,伪逆是不可逆映射的最佳替代
一、全章知识框架思维导图
graph TB A["第6章 内积空间"] --> B["6A 内积和范数"] A --> C["6B 规范正交基"] A --> D["6C 正交补与正交投影"] B -->|"内积定义范数和正交"| C B -->|"柯西-施瓦兹不等式"| C C -->|"格拉姆-施密特过程"| D C -->|"里斯表示定理"| D B -->|"正交分解"| D C -.->|"第7章 谱定理"| E["后续章节"] D -.->|"第7章 正规算子"| F["后续章节"] D -.->|"第8章 奇异值分解"| G["后续章节"] B -.->|"第7章 伴随算子"| H["后续章节"]
二、全章核心知识点与重点公式汇总
2.1 内积和范数(6A 内积和范数)
| 定理/定义 | 内容 | 编号 |
|---|---|---|
| ==内积== | 五条公理:正性、定性、第一位置可加性、第一位置齐次性、共轭对称性 | 6.2 |
| 内积空间 | 带有内积的向量空间 | 6.4 |
| 内积的基本性质 | sesquilinear 结构:第一位置线性,第二位置共轭线性; | 6.6 |
| ==范数== | ;;$|\lambda v|= | \lambda |
| ==正交== | ; 与所有向量正交且是唯一自正交向量 | 6.10, 6.11 |
| ==毕达哥拉斯定理== | 6.12 | |
| ==正交分解== | ,, | 6.13 |
| ==柯西-施瓦兹不等式== | $ | \langle u,v\rangle |
| ==三角不等式== | ,等号 非负实数倍 | 6.17 |
| ==平行四边形等式== | 6.21 |
2.2 规范正交基(6B 规范正交基)
| 定理/定义 | 内容 | 编号 |
|---|---|---|
| ==规范正交== | :范数为 1 且两两正交 | 6.22 |
| 规范正交组线性组合的范数 | $|a_1e_1+\cdots+a_me_m|^2= | a_1 |
| 规范正交组线性无关 | 规范正交 线性无关 | 6.25 |
| ==贝塞尔不等式== | $\sum | \langle v,e_k\rangle |
| ==规范正交基== | 既是规范正交组又是基;长度 即可判定 | 6.27, 6.28 |
| ==规范正交基三大优势== | (a) 系数 ;(b) 帕塞瓦尔恒等式;(c) 内积按坐标计算 | 6.30 |
| ==格拉姆-施密特过程== | 系统性将线性无关组转化为规范正交组,保持张成空间 | 6.32 |
| 规范正交基的存在性 | 每个有限维内积空间都有规范正交基 | 6.35 |
| 可扩充性 | 每个规范正交组都可扩充为规范正交基 | 6.36 |
| 规范正交基上三角化 | 关于规范正交基有上三角矩阵 最小多项式可分解 | 6.37 |
| ==舒尔定理== | 复内积空间上每个算子都关于某个规范正交基有上三角矩阵 | 6.38 |
| ==里斯表示定理== | 每个 唯一对应 : | 6.42 |
2.3 正交补与正交投影(6C 正交补和正交投影)
| 定理/定义 | 内容 | 编号 |
|---|---|---|
| ==正交补== | 6.46 | |
| 正交补的性质 | 子空间性、、、、反序性 | 6.48 |
| ==直和分解== | 6.49 | |
| ==== | 正交补的维数公式 | 6.51 |
| ==双重正交补== | 6.52 | |
| 正交补为零/全空间判定 | 6.54 | |
| ==正交投影== | (,,) | 6.55 |
| 正交投影 9 条性质 | 线性性、恒等/零化、值域/零空间、幂等性、范数收缩、显式公式 | 6.57 |
| 里斯表示定理(正交补证明) | 利用 的正交补是一维的 | 6.58 |
| ==最短距离定理== | 最小 | 6.61 |
| 限制映射为双射 | $T | _{(\text{null},T)^\perp}\text{range},T$ 的双射 |
| ==伪逆== | $(T | _{(\text{null},T)^\perp})^{-1}W$ |
| 伪逆代数性质 | , | 6.69 |
| ==伪逆最优性== | 使 最小;有解时范数最小 | 6.70 |
三、章节学习脉络梳理
3.1 第一层:内积的公理化与基本推论(6A)
核心问题:如何在线性空间上定义”长度”和”角度”?
- 内积的五条公理(6.2)是整个理论的基石——正性和定性保证”长度”有意义,可加性和齐次性保证线性结构,共轭对称性适配复数域
- sesquilinear 结构:内积对第一变元线性、对第二变元共轭线性——这是复内积空间最本质的结构特征
- 范数 由内积导出,正交 也由内积定义
- 正交分解(6.13)是全章的枢纽——它将任意向量分解为”平行分量”和”正交分量”
- 柯西-施瓦兹不等式(6.14)由正交分解+毕达哥拉斯定理推出,是数学中最重要的不等式之一
- 三角不等式(6.17)由柯西-施瓦兹推出,注意其等号条件比柯西-施瓦兹更严格(非负实数倍)
- 平行四边形等式(6.21)刻画了内积空间的特征——不满足该等式的范数不可能由内积导出
关键收获:内积是赋予向量空间几何结构的”最小代价”工具。从五条公理出发,长度、角度、正交、距离等所有几何概念都可以严格定义。柯西-施瓦兹不等式是连接代数与几何的核心桥梁。
3.2 第二层:规范正交基——最优坐标系(6B)
核心问题:什么样的基能让计算最简单?
- 规范正交组自动线性无关(6.25)——正交性是比线性无关更强的条件
- 规范正交基三大优势(6.30):系数直接读出、帕塞瓦尔恒等式、内积按坐标计算——无需解方程组
- 贝塞尔不等式(6.26):投影只能”损失”信息,不能”创造”信息
- 格拉姆-施密特过程(6.32):从任意线性无关组系统构造规范正交组,同时保持张成空间不变
- 存在性(6.35)+ 可扩充性(6.36):规范正交基普遍存在且可扩充
- 舒尔定理(6.38):复内积空间上每个算子都关于某个规范正交基有上三角矩阵——格拉姆-施密特保持不变子空间链
- 里斯表示定理(6.42): 的自然同构——内积空间中对偶空间等同于原空间
关键收获:规范正交基是内积空间中的”最优基”,它让所有计算退化为简单的坐标运算。格拉姆-施密特过程保证了这种最优基的普遍存在性。里斯表示定理揭示了内积空间区别于一般向量空间的本质特征——对偶空间与原空间自然等同。
3.3 第三层:正交补与正交投影——几何分析的核心工具(6C)
核心问题:如何利用正交性分解空间并解决最优化问题?
- 正交补 (6.46):与子空间完全垂直的所有向量——“法向量空间”
- ==直和分解 ==(6.49):每个向量唯一分解为 分量和 分量——全章最重要的结构定理
- 维数公式 (6.51)与秩-零化度定理形式上对称
- 双重正交补 (6.52):正交补运算的”对合性”
- ==正交投影 ==(6.55):保留 分量、丢弃 分量——“垂直投影”
- 正交投影 9 条性质(6.57):幂等性 、范数收缩 、显式公式
- 最短距离定理(6.61):正交投影给出子空间中最近的向量——最小二乘法的理论基础
- ==伪逆 ==(6.68):不可逆映射的”最佳替代”——使误差最小且在所有最优解中范数最小
关键收获:正交补和正交投影将代数问题转化为几何问题。直和分解 是整个 6C 节的基石,正交投影的所有性质、最小化问题和伪逆都建立在这个分解之上。伪逆是逆映射的自然推广,在数据科学和工程计算中有广泛应用。
3.4 三节之间的深层联系
3.4.1 正交分解——全章的枢纽
正交分解(命题 6.13)是全章最核心的技术工具,它串联了几乎所有重要结果:
- 推出柯西-施瓦兹不等式(6.14):正交分解 + 毕达哥拉斯定理
- 推出三角不等式(6.17):柯西-施瓦兹 + 实部放缩
- 推出贝塞尔不等式(6.26):将 正交分解为规范正交组张成空间上的分量和正交分量
- 推出格拉姆-施密特过程(6.32):每步都是正交分解——减去投影,保留正交分量
- 推出直和分解 (6.49):利用规范正交基展开自然地将向量拆分
- 推出最短距离定理(6.61):正交分解 + 毕达哥拉斯定理 正交投影最优
3.4.2 格拉姆-施密特——万能构造器
格拉姆-施密特过程(6.32)是全章的”发动机”:
- 保证规范正交基的普遍存在性(6.35)——没有它,规范正交基的三大优势就只是空中楼阁
- 保证可扩充性(6.36)——任何规范正交组都可以扩展为规范正交基
- 保持不变子空间链——这是舒尔定理(6.38)成立的关键
- 等价于 QR 分解——数值线性代数中最基本的矩阵分解之一
3.4.3 里斯表示定理——对偶的自然化
里斯表示定理(6.42)是连接第 3 章对偶理论与第 6-7 章内积空间理论的桥梁:
- 在一般向量空间中, 需要选基(不自然,见 3F 节)
- 在内积空间中, 通过内积实现(自然同构)
- 6C 节利用正交补给出了更深刻的证明(6.58)—— 的正交补是一维的
- 第 7 章中,伴随算子 是对偶映射 在内积空间中的”化身”
3.4.4 全章核心线索图
graph TD A["内积定义<br/>6A"] --> B["范数与正交<br/>6A"] B -->|"正交分解6.13"| C["柯西-施瓦兹不等式<br/>6A"] C -->|"放缩"| D["三角不等式<br/>6A"] B -->|"规范正交组"| E["规范正交基<br/>6B"] E -->|"格拉姆-施密特6.32"| F["存在性+可扩充性<br/>6B"] F -->|"保持不变子空间链"| G["舒尔定理6.38<br/>6B"] E -->|"系数公式"| H["里斯表示定理6.42<br/>6B"] E -->|"规范正交基展开"| I["正交补与直和分解<br/>6C"] I -->|"直和分解"| J["正交投影P_U<br/>6C"] J -->|"毕达哥拉斯定理"| K["最短距离定理<br/>6C"] K -->|"最佳近似"| L["伪逆T†<br/>6C"] H -.->|"第7章 伴随算子"| M["后续章节"] G -.->|"第7章 谱定理"| N["后续章节"] L -.->|"第8章 奇异值分解"| O["后续章节"]
四、补充理解与跨章展望
4.1 第 6 章的核心方法论
第 6 章建立的方法论在后续章节和数学的许多分支中都会反复使用:
-
“正交分解”策略:将向量分解为”有用分量”和”正交分量”,然后丢弃正交分量。这一策略贯穿全章——格拉姆-施密特过程的每一步都是正交分解,正交投影是正交分解的直接应用,最小化问题的证明也依赖正交分解。这是数值线性代数和优化理论中最基本的思想。
-
“规范正交基优先”策略:在涉及内积空间的问题中,优先选取规范正交基。规范正交基让系数、范数、内积的计算全部退化为简单的坐标运算,消去所有交叉项。这一策略是第 7 章谱定理证明的核心——在规范正交基下,正规算子的矩阵具有特殊结构。
-
“伪逆”思想:当映射不可逆时,通过限制定义域(去掉零空间)和缩小值域(只关注能达到的部分)来构造”最佳替代逆”。这一思想在最小二乘法、数据拟合、机器学习中有广泛应用。第 8 章的奇异值分解(SVD)将伪逆理论推向高潮。
4.2 第 6 章与后续章节的关联地图
| 第 6 章概念 | 后续章节中的深化 |
|---|---|
| 内积 | 第 7 章:伴随算子 的定义基础 |
| 柯西-施瓦兹不等式(6.14) | 第 7 章:刻画算子范数 |
| 格拉姆-施密特过程(6.32) | 第 7 章:构造特征向量的规范正交基 |
| 舒尔定理(6.38) | 第 7 章:谱定理的证明起点——上三角矩阵的进一步简化 |
| 里斯表示定理(6.42) | 第 7 章: 的定义—— |
| 对偶空间 | 第 7 章: 变为 , 变为 |
| 正交补 | 第 7 章:正规算子的不变子空间、谱分解 |
| 正交投影 | 第 7 章:自伴算子的谱定理—— |
| 伪逆 | 第 8 章:奇异值分解(SVD)—— |
| 直和分解 | 第 7 章:(正规算子的谱分解) |
| 平行四边形等式(6.21) | 泛函分析:内积空间的刻画定理——满足平行四边形等式的范数空间可赋予内积 |
4.3 为什么第 6 章是全书最重要的章节之一?
第 6 章建立了线性代数的几何基础:
-
内积赋予几何结构:前五章的向量空间只有代数结构(加法、标量乘法),第 6 章通过内积引入了长度、角度、正交性、距离等几何概念。没有第 6 章,就无法讨论”最优近似”、“最短距离”等几何问题。
-
规范正交基是最优坐标系:规范正交基让所有计算退化为简单的坐标运算。格拉姆-施密特过程保证了这种最优基的普遍存在性。舒尔定理表明,在复内积空间中,每个算子都可以在规范正交基下表示为上三角矩阵——这是第 7 章谱定理的出发点。
-
正交投影是几何分析的核心工具:正交投影将代数问题(解方程组)转化为几何问题(找最近点)。最小二乘法、数据拟合、信号处理中的傅里叶分析,本质上都是正交投影。
-
里斯表示定理统一了对偶理论:在一般向量空间中, 和 是”不同”的空间(第 3 章);但在内积空间中, 通过内积自然实现。这使得第 3 章的对偶映射 在第 7 章变为更几何化的伴随算子 。
可以毫不夸张地说:第 6 章将前五章的纯代数理论推向了几何与代数完美融合的境界,是理解第 7 章谱定理和第 8 章奇异值分解的必要前提。
五、全章总复习题
使用说明
以下复习题覆盖第 6 章全部三节的核心知识点。建议在不查阅笔记的情况下独立完成,然后对照答案自评。每题标注了考查的节次和知识点。
A. 内积和范数(6A)
A1. 证明:对内积空间 中的 ,有 。
查看解答
。
A2. 设 是实内积空间, 满足 ,,。求 。
查看解答
由 (实空间中 ):
,故 。
即 (这正好是勾股定理 的逆命题)。
A3. 利用柯西-施瓦兹不等式证明:对 ,有 。
查看解答
令 ,。
,,。
由柯西-施瓦兹不等式:,即
两边平方得 。
B. 规范正交基(6B)
B1. 设 是 的规范正交基,。求 和 在 方向上的正交投影。
查看解答
由帕塞瓦尔恒等式(6.30(b)):,故 。
在 方向上的正交投影为 。
B2. 对 中的线性无关组 , 执行格拉姆-施密特过程,求出规范正交组 。
查看解答
第一步:。。。
第二步:。
。
。
。
B3. 设 是 上的线性泛函,。利用里斯表示定理求出对应的向量 。
查看解答
由里斯表示定理(6.42),存在唯一 使得 。
在欧几里得内积下,。
要使 对所有 成立,需要 ,,。
所以 。
C. 正交补与正交投影(6C)
C1. 设 。求 和向量 在 上的正交投影。
查看解答
求 : 。
所以 ,是过原点的平面。
求正交投影:,其中 ,。
,。
。
C2. 设 ,。求 ,并验证 。
查看解答
由定理 6.51:。
验证 :设 。由 , 对所有 。特别取 (因为 ),得 ,故 。
C3. 设 ,。求 、,并验证 。
查看解答
求 : 即 ,。得 ,。
,。
求 :,,。。
求 : ,即 。
。
验证:因为 (全空间), 是满射。。
将 投影到 上。对任意 , 是 在 上的正交投影。
D. 跨节综合题
D1. 设 是 的规范正交基,()。证明:,并求 。
查看解答
证明 的公式:由定理 6.57(i),( 是 的规范正交基)。
求 :( 的展开减去 分量)。
由命题 6.24(规范正交组线性组合的范数):
。
由帕塞瓦尔恒等式(6.30(b)),这等于 。
这也验证了毕达哥拉斯定理:。
D2. 证明:有限维内积空间 中,若 是子空间,则 。说明为什么有限维条件不可去掉。
查看解答
证明 (定理 6.52):
第一步():设 。对每个 ,( 的定义),故 。
第二步():。又 且维数相同,故相等。
有限维条件不可去掉:在无限维空间中,一般只有 ,等号不一定成立。例如,在 (连续函数空间)中,取 为多项式全体,则 (只有零函数与所有多项式正交),。
六、各节笔记索引
| 节 | 笔记链接 | 核心主题 |
|---|---|---|
| 6A | 6A 内积和范数 | 内积、范数、正交、柯西-施瓦兹不等式、三角不等式、平行四边形等式 |
| 6B | 6B 规范正交基 | 规范正交基、格拉姆-施密特过程、舒尔定理、里斯表示定理 |
| 6C | 6C 正交补和正交投影 | 正交补、直和分解、正交投影、最短距离定理、伪逆 |
七、全章核心公式
必须熟记的公式与定理
- ==柯西-施瓦兹不等式==(定理 6.14):,等号 成标量倍
- ==三角不等式==(定理 6.17):
- ==平行四边形等式==(定理 6.21):
- 规范正交基系数公式(定理 6.30(a)):
- ==帕塞瓦尔恒等式==(定理 6.30(b)):
- 内积按坐标计算(定理 6.30(c)):
- ==格拉姆-施密特公式==(定理 6.32):
- ==舒尔定理==(定理 6.38):复内积空间上每个算子都关于某个规范正交基有上三角矩阵
- ==里斯表示定理==(定理 6.42):, 唯一
- ==直和分解==(定理 6.49):
- 正交补维数(定理 6.51):
- ==双重正交补==(定理 6.52):
- ==正交投影公式==(定理 6.57(i)):
- ==最短距离定理==(定理 6.61): 最小
- ==伪逆核心等式==(定理 6.69):,
易错提醒
- 内积是 sesquilinear 的:第一位置线性,第二位置共轭线性——
- 柯西-施瓦兹等号条件是”标量倍”(任意复数),三角不等式等号条件是”非负实数倍”(更严格)
- 格拉姆-施密特过程要求输入组线性无关,否则 可能为零
- 舒尔定理要求 ,实数域上不一定成立
- 里斯表示定理中, 的 在第二位置——因为内积对第二位置共轭线性,而 是线性的
- 正交补的维数公式 依赖有限维条件
- 正交投影 的零空间是 (不是某个任意补空间),这是”正交”投影区别于普通投影的关键
- 伪逆 是逆的推广: 可逆时 ; 不可逆时 给出最佳近似解