4.1 随机变量序列的两种收敛性
本节概览
一、随机变量序列的收敛性概述
在概率论中,我们经常需要研究随机变量序列 在某种意义下”趋近”于一个随机变量 。与实数序列的极限不同,随机变量的取值具有随机性,因此需要从不同角度定义”收敛”。
函数序列的收敛回顾
设 为定义域 上的函数序列, 为 上的函数:
- 点点收敛:,
- 一致收敛:
随机变量序列收敛的分类
随机变量序列的收敛可以从两个角度理解:
- 从样本点角度:固定 ,考察数列 是否收敛到
- 从概率角度:考察事件 的概率是否趋于 1
本节重点讨论以下三种收敛:
| 收敛类型 | 记号 | 强弱 | 本节地位 |
|---|---|---|---|
| 几乎处处收敛 | 最强 | 了解 | |
| 依概率收敛 | 中 | 掌握 | |
| 按分布收敛 | 最弱 | 掌握 |
生活化类比
想象一个射击训练:射手每天射击一次, 是第 天的落点与靶心的偏差。
- 几乎处处收敛:每一天的落点都越来越接近靶心(几乎每天都如此)
- 依概率收敛:落点远离靶心的概率越来越小(偶尔可能打偏,但概率趋零)
- 按分布收敛:落点的整体分布模式趋近于某个固定分布(不关心具体哪一枪)
二、几乎处处收敛
定义
定义 4.1.1 — 几乎处处收敛(a.s. 收敛)
设 为随机变量序列, 为随机变量。若
则称 几乎处处收敛(almost surely converge)于 ,记作 。
理解要点:几乎处处收敛要求除了一个概率为零的集合外,对每一个样本点 ,数列 都收敛到 。这是最强的收敛方式,条件最为苛刻。
与依概率收敛的关系
几乎处处收敛蕴含依概率收敛(但反之不成立),这一关系将在第四节”收敛性关系总结”中详细讨论。
三、依概率收敛
定义
定义 4.1.2 — 依概率收敛(公式4.1.1)
设 为随机变量序列, 为随机变量。若对任意 ,有
则称 依概率收敛(converge in probability)于 ,记作 。
等价形式:定义中的 等价于 。
理解要点:依概率收敛不要求每一个样本点都收敛,只要求 与 的偏差超过任意给定阈值的概率趋于零。换言之, 以越来越大的概率”接近”。
退化分布情形
当极限 为常数 (即 )时,依概率收敛的定义简化为:
这是大数定律的核心表述形式:样本均值依概率收敛到总体期望。
运算性质
定理 4.1.1 — 依概率收敛的运算性质
设 ,( 为常数),则
理解要点:依概率收敛保持四则运算(在极限不为零时可做除法)。这一性质在证明大数定律的应用题中非常实用。
证明(以加法为例,乘法和除法类似)
证明(以 为例):
第一步:利用三角不等式。 对任意 :
第二步:建立概率上界。 若 ,则由三角不等式,,这意味着 或 至少有一个成立(否则两者都小于 ,加起来小于 ,矛盾)。因此
第三步:取极限。 由 和 ,右端两项都趋于 ,故
即 。
乘法和除法的证明思路类似:利用 ,再对 利用依概率收敛的有界性( 蕴含 依概率有界)即可。
四、按分布收敛(弱收敛)
定义
定义 4.1.3 — 按分布收敛 / 弱收敛(公式4.1.2-4.1.4)
设 为随机变量序列, 为随机变量, 和 分别为 和 的分布函数。
分布函数版本:若在 的每一个连续点 上,有
则称 弱收敛于 ,记作 。
随机变量版本:若 ,则称 按分布收敛于 ,记作
理解要点:
- 弱收敛只要求在 的连续点上分布函数值趋于极限,在间断点上可以不收敛
- 按分布收敛描述的是”分布形态”的趋近,而非随机变量取值的趋近
- 随机变量的分布函数唯一确定了其概率规律,因此按分布收敛是研究极限分布的核心工具
与点点收敛的区别
分布函数序列的弱收敛 点点收敛。弱收敛允许在 的间断点处不收敛,这是为了处理离散型随机变量的极限分布问题。
例 4.1.1 — 退化分布的弱收敛
设 服从退化分布,即 ,其分布函数为
取极限 (退化分布),。
在 的连续点 上:当 充分大时,,故 。
在间断点 处:,但 是 的间断点,不要求收敛。
因此 ,即 。
五、两种收敛的关系
依概率收敛蕴含按分布收敛
定理 4.1.2 — 收敛蕴含 收敛
证明
证明:
第一步:建立上界不等式。 对任意 和 ,将事件 按照与 的关系拆分为两个不相容事件:
(思路:如果 比 大很多(),而 ,则 ;否则 。)
因此
第二步:取上极限。 令 ,由 知 ,故
第三步:建立下界不等式。 类似地,将事件 拆分:
因此 ,整理得
第四步:取下极限。 令 :
第五步:令 。 结合第二步和第四步:
在 的连续点上,令 ,由夹逼定理得 。
常数极限下的等价性
定理 4.1.3 — 常数极限下 收敛与 收敛等价
证明
证明:
""方向( 收敛 收敛): 由定理 4.1.2 — 收敛蕴含 收敛直接得到,无需额外证明。
""方向( 收敛 收敛):
第一步:写出依概率收敛的定义。 要证 ,即对任意 ,。
第二步:将概率拆分为两个尾部。
(这里 是左极限。)
第三步:利用依分布收敛求极限。 意味着 在 的连续点 上成立。由于 和 都是 的连续点,故
第四步:得出结论。
即 。
反例: 收敛不蕴含 收敛
例 4.1.2 — 依分布收敛但不依概率收敛的反例
设 满足 ,。
令 (即 与 始终取相反值),则:
- 与 同分布(都是 各取 ),故
- 但 ,故 不趋于零,
理解要点:按分布收敛只关心分布形态,不关心随机变量之间的”同步性”。 与 分布相同,但每一时刻都取相反的值,因此不依概率收敛。
六、特征函数初步
本节末尾引入特征函数的概念,为后续中心极限定理的证明做准备。
复随机变量
设 和 为定义在概率空间 上的实值随机变量,则
称为复随机变量,其共轭为 ,模为 。
复随机变量的期望定义为 ,要求 和 都存在。
欧拉公式与复指数
对实随机变量 , 是一个复随机变量。由欧拉公式:
其期望为 ,且 。
若 与 独立,则 与 也独立。
特征函数的定义
定义 4.2.1 — 特征函数(公式4.2.1)
设 为随机变量,称
为 的特征函数(characteristic function)。
理解要点:
- 特征函数是 的函数,对每一个固定的 , 是一个期望值
- 由于 ,特征函数一定存在(不像矩母函数可能不存在)
- 特征函数与分布函数相互唯一确定(逆转定理),是研究极限分布的强大工具
- 特征函数的详细性质将在§4.2中展开
七、收敛性关系总结
三种收敛的强弱关系
关系图
graph TD A["几乎处处收敛<br/>a.s.收敛"] -->|"蕴含"| B["依概率收敛<br/>P收敛"] B -->|"蕴含"| C["按分布收敛<br/>L收敛"] B -.->|"等价<br/>极限为常数时"| D["常数极限"] D -.->|"等价"| C style A fill:#e8f5e9,color:#2e7d32 style B fill:#fff3e0,color:#e65100 style C fill:#e3f2fd,color:#1565c0 style D fill:#f3e5f5,color:#7b1fa2
核心要点
| 关系 | 说明 |
|---|---|
| a.s.收敛 ⇒ P收敛 | 几乎每个样本点都收敛,自然偏差的概率趋于零 |
| P收敛 ⇒ L收敛 | 收敛到确定值,分布自然趋近 |
| L收敛 ⇏ P收敛 | 反例: 与 同分布但不”同步” |
| P收敛 ⇏ a.s.收敛 | 存在反例(如”滑动窗”序列) |
| 极限为常数时 P ⇔ L | 常数是特殊的退化分布,此时两种收敛等价 |
八、知识结构总览
graph LR A["收敛性概述"] --> B["几乎处处收敛"] A --> C["依概率收敛"] A --> D["按分布收敛"] C --> E["运算性质"] C --> F["蕴含L收敛"] D --> G["弱收敛定义"] B --> H["a.s.蕴含P"] F --> I["常数极限等价"] D --> J["特征函数初步"] style A fill:#f5f5f5,color:#424242 style B fill:#e8f5e9,color:#2e7d32 style C fill:#fff3e0,color:#e65100 style D fill:#e3f2fd,color:#1565c0 style E fill:#fff3e0,color:#e65100 style F fill:#e3f2fd,color:#1565c0 style G fill:#e3f2fd,color:#1565c0 style H fill:#e8f5e9,color:#2e7d32 style I fill:#f3e5f5,color:#7b1fa2 style J fill:#fce4ec,color:#c62828
九、核心思想与证明技巧
核心思想
- 分层收敛体系:三种收敛从不同角度描述”趋近”,形成完整的强弱链条。选择哪种收敛取决于问题的需要——大数定律用 收敛,中心极限定理用 收敛
- 分布函数是桥梁:按分布收敛通过分布函数定义,将随机变量的收敛问题转化为函数序列的收敛问题
- 常数极限的特殊性:当极限为常数时, 收敛与 收敛等价,这大大简化了大数定律的表述
证明技巧
| 技巧 | 说明 | 应用场景 |
|---|---|---|
| 夹逼分布函数 | 利用 $F_n(x) \leq F(x+\varepsilon) + P( | X_n - X |
| 选取连续点 | 弱收敛只在 的连续点要求收敛 | 退化分布的弱收敛 |
| 利用独立性 | 独立随机变量的函数也独立 | 特征函数的乘法性质 |
十、补充理解与易混淆点
依概率收敛与依分布收敛的混淆
来源:茆诗松教材§4.1 + 卡方训练营讲义 + 2020北京大学431真题 + 2024清华大学432真题 + 维基百科”随机变量的收敛” + CSDN”概率论四大收敛关系图解”
误区1:" 就意味着 越来越接近 "
❌ 错误解释:按分布收敛只要求分布函数在连续点上趋近,完全不要求 和 的取值接近。反例中 与 始终相差 2,但分布相同。更一般地, 甚至不需要和 定义在同一个概率空间上——按分布收敛只关心”分布形态”的相似性。 ✅ 正确解释:按分布收敛描述的是”分布形态”的趋近,而非”取值”的趋近。只有依概率收敛才真正描述随机变量取值的接近。依分布收敛甚至不要求 和 定义在同一个概率空间上,这是它与 收敛的本质区别之一。
弱收敛中连续点要求的忽视
来源:茆诗松教材§4.1 + 卡方训练营讲义 + 2018厦门大学868真题 + 2021南开大学432真题 + 复旦大学432讲义 + duanyll.com”概统速通” + 51CTO博客”依分布收敛的定义细节”
误区2:"弱收敛要求 对所有 成立"
❌ 错误解释:弱收敛只要求在 的连续点上成立。在间断点上可以不收敛(甚至可以振荡)。 ✅ 正确解释:弱收敛的定义是 在 的每一个连续点上成立。间断点处的收敛性不做要求,这是为了统一处理离散型和连续型随机变量的极限分布。一个直观的理解是:分布函数在间断点处的”跳跃高度”由概率质量决定,而弱收敛只关心概率质量的”整体转移趋势”,不关心在单个跳跃点处的精确行为。
收敛方向(蕴含关系)的混淆
来源:茆诗松教材§4.1 + 卡方训练营讲义 + 2018复旦大学861真题 + 2020中国人民大学805真题 + 2017北京大学431真题 + 道客巴巴”依概率收敛的注记” + zhongyl0430.github.io”依分布收敛”
误区3:"按分布收敛可以推出依概率收敛"
❌ 错误解释: 收敛是三种收敛中最弱的,不能反向推出更强的收敛。 就是 收敛但不 收敛的经典反例。另一个常见的反例是 (), 与 同分布故 收敛,但 在 和 之间振荡,不依概率收敛于任何随机变量。 ✅ 正确解释:蕴含关系是单向的:a.s.收敛 ⇒ 收敛 ⇒ 收敛。只有当极限为常数时,收敛与收敛才互推。从弱收敛推到强收敛通常需要额外条件,如极限为常数、序列具有某种一致性等。
十一、习题精选
习题概览
编号 题目来源 知识点 难度 1 教材4.1-1 依概率收敛的定义验证 ★★☆ 2 教材4.1-2 弱收敛的判定 ★★☆ 3 教材4.1-3 依概率收敛的运算性质 ★★★ 4 教材4.1-4 收敛关系的判断 ★★★ 5 教材4.1-5 特征函数的计算 ★★☆ 6 教材4.1-6 退化分布的弱收敛 ★★☆ 7 2020北京大学431 依概率收敛与大数定律 ★★★ 8 2021南开大学432 经验分布函数的四种收敛 ★★★ 9 2018厦门大学868 样本方差的依概率收敛 ★★★ 10 2020中国人民大学805 依分布收敛与中心极限定理 ★★★
习题1 — 教材4.1-1:依概率收敛的定义验证
习题1 — 教材4.1-1
设 ,证明 。
查看解答
解:对任意 ,当 时,有 ,从而
当 时,
因此 ,即 。
习题2 — 教材4.1-2:弱收敛的判定
习题2 — 教材4.1-2
设 的分布函数为 ,判断 是否按分布收敛,若收敛求极限分布。
查看解答
解: 是参数为 的指数分布的分布函数。
对 :,极限为 。
对 :(当 )。
取 (退化分布在 0 处),则 的唯一间断点为 。
在 的连续点 上: 成立。
因此 ,即 。
习题3 — 教材4.1-3:依概率收敛的运算性质
习题3 — 教材4.1-3
设 ,( 为常数),证明 。
查看解答
解:对任意 ,利用三角不等式:
由 和 ,上式两项均趋于零,故
即 。
习题4 — 教材4.1-4:收敛关系的判断
习题4 — 教材4.1-4
设 为 i.i.d. 序列,,。令 ,判断 的收敛类型。
查看解答
解:
(1) 依概率收敛:由切比雪夫不等式,
故 (这是辛钦大数定律的特殊情形)。
(2) 按分布收敛:由 收敛蕴含 收敛,。
(3) 几乎处处收敛:由柯尔莫哥洛夫强大数定律,。
因此 同时具有三种收敛性,极限都是 。
习题5 — 教材4.1-5:特征函数的计算
习题5 — 教材4.1-5
设 ,求 的特征函数 。
查看解答
解:
配方:,故
由复变函数围道积分(或直接利用标准正态密度积分值为 ),上式积分等于 ,故
习题6 — 教材4.1-6:退化分布的弱收敛
习题6 — 教材4.1-6
设 ,其中 。证明 。
查看解答
解: 的分布律为 。
令 ,则 ,。
当 时:
因此 ,即 的分布律点态收敛到 的分布律,故 ,其中 。
习题7 — 2020北京大学431:依概率收敛与大数定律
习题7 — 2020北京大学431
设 相互独立且同服从 ,令 。
(1) 求 和 ;
(2) 证明 依概率收敛到某个常数 ,并求 。
查看解答
习题8 — 2021南开大学432:经验分布函数的四种收敛
习题8 — 2021南开大学432
设 为 i.i.d. 随机变量, 为其共同的分布函数。经验分布函数定义为 。证明 分别依概率收敛、依分布收敛、依概率 1 收敛、均方收敛于 。
查看解答
解:记 ,则 i.i.d. ,且 。
依概率收敛:由辛钦大数定律,。
依分布收敛:由 收敛蕴含 收敛,。
均方收敛:,均方误差为
故 。
依概率 1 收敛:由柯尔莫哥洛夫强大数定律(独立同分布场合),。
习题9 — 2018厦门大学868:样本方差的依概率收敛
习题9 — 2018厦门大学868
设 独立同分布,均值为 ,方差为 ,样本方差为 。证明: 依概率收敛于 。
查看解答
解:不妨设 (否则令 ,以 代替 ,此时 和 均保持不变)。
由辛钦大数定律:
再由依概率收敛的运算性质,,从而
进一步,由 ,利用 和依概率收敛的乘法性质,同样可得 。
习题10 — 2020中国人民大学805:依分布收敛与中心极限定理
习题10 — 2020中国人民大学805
设 服从 分布,计算其均值和方差,构造 的一个函数 ,使得 依分布收敛于标准正态分布。
查看解答
十二、教材原文
以下为教材扫描版原文,可点击翻阅。
第四章 随机变量序列的极限定理/收敛性