4.1 随机变量序列的两种收敛性

本节概览

本节是第四章极限定理的起点,引入随机变量序列收敛性的核心概念。重点讨论几乎处处收敛依概率收敛按分布收敛(弱收敛)三种收敛方式,建立它们之间的蕴含关系,并初步引入特征函数作为后续分析工具。

逻辑链条:几乎处处收敛(a.s.收敛)→ 依概率收敛( 收敛)→ 按分布收敛( 收敛)→ 收敛关系总结 → 特征函数初步

前置依赖§2.1(分布函数)、§2.2(期望)、§2.3(方差)、§3.4(协方差)

核心主线:三种收敛性从强到弱形成链条,其中依概率收敛和按分布收敛是极限定理(大数定律、中心极限定理)的理论基石。


一、随机变量序列的收敛性概述

在概率论中,我们经常需要研究随机变量序列 在某种意义下”趋近”于一个随机变量 。与实数序列的极限不同,随机变量的取值具有随机性,因此需要从不同角度定义”收敛”。

函数序列的收敛回顾

为定义域 上的函数序列, 上的函数:

  • 点点收敛
  • 一致收敛

随机变量序列收敛的分类

随机变量序列的收敛可以从两个角度理解:

  1. 从样本点角度:固定 ,考察数列 是否收敛到
  2. 从概率角度:考察事件 的概率是否趋于 1

本节重点讨论以下三种收敛:

收敛类型记号强弱本节地位
几乎处处收敛最强了解
依概率收敛掌握
按分布收敛最弱掌握

生活化类比

想象一个射击训练:射手每天射击一次, 是第 天的落点与靶心的偏差。

  • 几乎处处收敛:每一天的落点都越来越接近靶心(几乎每天都如此)
  • 依概率收敛:落点远离靶心的概率越来越小(偶尔可能打偏,但概率趋零)
  • 按分布收敛:落点的整体分布模式趋近于某个固定分布(不关心具体哪一枪)

二、几乎处处收敛

定义

定义 4.1.1 — 几乎处处收敛(a.s. 收敛)

为随机变量序列, 为随机变量。若

则称 几乎处处收敛(almost surely converge)于 ,记作

理解要点:几乎处处收敛要求除了一个概率为零的集合外,对每一个样本点 ,数列 都收敛到 。这是最强的收敛方式,条件最为苛刻。

与依概率收敛的关系

几乎处处收敛蕴含依概率收敛(但反之不成立),这一关系将在第四节”收敛性关系总结”中详细讨论。


三、依概率收敛

定义

定义 4.1.2 — 依概率收敛(公式4.1.1)

为随机变量序列, 为随机变量。若对任意 ,有

则称 依概率收敛(converge in probability)于 ,记作

等价形式:定义中的 等价于

理解要点:依概率收敛不要求每一个样本点都收敛,只要求 的偏差超过任意给定阈值的概率趋于零。换言之, 以越来越大的概率”接近”

退化分布情形

当极限 为常数 (即 )时,依概率收敛的定义简化为:

这是大数定律的核心表述形式:样本均值依概率收敛到总体期望。

运算性质

定理 4.1.1 — 依概率收敛的运算性质

为常数),则

理解要点:依概率收敛保持四则运算(在极限不为零时可做除法)。这一性质在证明大数定律的应用题中非常实用。

证明(以加法为例,乘法和除法类似)

证明(以 为例):

第一步:利用三角不等式。 对任意

第二步:建立概率上界。,则由三角不等式,,这意味着 至少有一个成立(否则两者都小于 ,加起来小于 ,矛盾)。因此

第三步:取极限。,右端两项都趋于 ,故

乘法和除法的证明思路类似:利用 ,再对 利用依概率收敛的有界性 蕴含 依概率有界)即可。


四、按分布收敛(弱收敛)

定义

定义 4.1.3 — 按分布收敛 / 弱收敛(公式4.1.2-4.1.4)

为随机变量序列, 为随机变量, 分别为 的分布函数。

分布函数版本:若在 的每一个连续点 上,有

则称 弱收敛,记作

随机变量版本:若 ,则称 按分布收敛,记作

理解要点

  • 弱收敛只要求在 的连续点上分布函数值趋于极限,在间断点上可以不收敛
  • 按分布收敛描述的是”分布形态”的趋近,而非随机变量取值的趋近
  • 随机变量的分布函数唯一确定了其概率规律,因此按分布收敛是研究极限分布的核心工具

与点点收敛的区别

分布函数序列的弱收敛 点点收敛。弱收敛允许在 的间断点处不收敛,这是为了处理离散型随机变量的极限分布问题。

例 4.1.1 — 退化分布的弱收敛

服从退化分布,即 ,其分布函数为

取极限 (退化分布),

的连续点 上:当 充分大时,,故

在间断点 处:,但 的间断点,不要求收敛。

因此 ,即


五、两种收敛的关系

依概率收敛蕴含按分布收敛

定理 4.1.2 — 收敛蕴含 收敛

证明

证明

第一步:建立上界不等式。 对任意 ,将事件 按照与 的关系拆分为两个不相容事件:

(思路:如果 大很多(),而 ,则 ;否则 。)

因此

第二步:取上极限。,由 ,故

第三步:建立下界不等式。 类似地,将事件 拆分:

因此 ,整理得

第四步:取下极限。

第五步:令 结合第二步和第四步:

的连续点上,令 ,由夹逼定理

常数极限下的等价性

定理 4.1.3 — 常数极限下 收敛与 收敛等价

证明

证明

""方向( 收敛 收敛): 由定理 4.1.2 — 收敛蕴含 收敛直接得到,无需额外证明。

""方向( 收敛 收敛):

第一步:写出依概率收敛的定义。 要证 ,即对任意

第二步:将概率拆分为两个尾部。

(这里 是左极限。)

第三步:利用依分布收敛求极限。 意味着 的连续点 上成立。由于 都是 的连续点,故

第四步:得出结论。

反例: 收敛不蕴含 收敛

例 4.1.2 — 依分布收敛但不依概率收敛的反例

满足

(即 始终取相反值),则:

  • 同分布(都是 各取 ),故
  • ,故 不趋于零,

理解要点:按分布收敛只关心分布形态,不关心随机变量之间的”同步性”。 分布相同,但每一时刻都取相反的值,因此不依概率收敛。


六、特征函数初步

本节末尾引入特征函数的概念,为后续中心极限定理的证明做准备。

复随机变量

为定义在概率空间 上的实值随机变量,则

称为复随机变量,其共轭为 ,模为

复随机变量的期望定义为 ,要求 都存在。

欧拉公式与复指数

对实随机变量 是一个复随机变量。由欧拉公式:

其期望为 ,且

独立,则 也独立。

特征函数的定义

定义 4.2.1 — 特征函数(公式4.2.1)

为随机变量,称

特征函数(characteristic function)。

理解要点

  • 特征函数是 的函数,对每一个固定的 是一个期望值
  • 由于 ,特征函数一定存在(不像矩母函数可能不存在)
  • 特征函数与分布函数相互唯一确定(逆转定理),是研究极限分布的强大工具
  • 特征函数的详细性质将在§4.2中展开

七、收敛性关系总结

三种收敛的强弱关系

关系图

graph TD
    A["几乎处处收敛<br/>a.s.收敛"] -->|"蕴含"| B["依概率收敛<br/>P收敛"]
    B -->|"蕴含"| C["按分布收敛<br/>L收敛"]
    B -.->|"等价<br/>极限为常数时"| D["常数极限"]
    D -.->|"等价"| C
    style A fill:#e8f5e9,color:#2e7d32
    style B fill:#fff3e0,color:#e65100
    style C fill:#e3f2fd,color:#1565c0
    style D fill:#f3e5f5,color:#7b1fa2

核心要点

关系说明
a.s.收敛 ⇒ P收敛几乎每个样本点都收敛,自然偏差的概率趋于零
P收敛 ⇒ L收敛收敛到确定值,分布自然趋近
L收敛 ⇏ P收敛反例: 同分布但不”同步”
P收敛 ⇏ a.s.收敛存在反例(如”滑动窗”序列)
极限为常数时 P ⇔ L常数是特殊的退化分布,此时两种收敛等价

八、知识结构总览

graph LR
    A["收敛性概述"] --> B["几乎处处收敛"]
    A --> C["依概率收敛"]
    A --> D["按分布收敛"]
    C --> E["运算性质"]
    C --> F["蕴含L收敛"]
    D --> G["弱收敛定义"]
    B --> H["a.s.蕴含P"]
    F --> I["常数极限等价"]
    D --> J["特征函数初步"]
    style A fill:#f5f5f5,color:#424242
    style B fill:#e8f5e9,color:#2e7d32
    style C fill:#fff3e0,color:#e65100
    style D fill:#e3f2fd,color:#1565c0
    style E fill:#fff3e0,color:#e65100
    style F fill:#e3f2fd,color:#1565c0
    style G fill:#e3f2fd,color:#1565c0
    style H fill:#e8f5e9,color:#2e7d32
    style I fill:#f3e5f5,color:#7b1fa2
    style J fill:#fce4ec,color:#c62828

九、核心思想与证明技巧

核心思想

  1. 分层收敛体系:三种收敛从不同角度描述”趋近”,形成完整的强弱链条。选择哪种收敛取决于问题的需要——大数定律用 收敛,中心极限定理用 收敛
  2. 分布函数是桥梁:按分布收敛通过分布函数定义,将随机变量的收敛问题转化为函数序列的收敛问题
  3. 常数极限的特殊性:当极限为常数时, 收敛与 收敛等价,这大大简化了大数定律的表述

证明技巧

技巧说明应用场景
夹逼分布函数利用 $F_n(x) \leq F(x+\varepsilon) + P(X_n - X
选取连续点弱收敛只在 的连续点要求收敛退化分布的弱收敛
利用独立性独立随机变量的函数也独立特征函数的乘法性质

十、补充理解与易混淆点

依概率收敛与依分布收敛的混淆

来源:茆诗松教材§4.1 + 卡方训练营讲义 + 2020北京大学431真题 + 2024清华大学432真题 + 维基百科”随机变量的收敛” + CSDN”概率论四大收敛关系图解”

误区1:" 就意味着 越来越接近 "

❌ 错误解释:按分布收敛只要求分布函数在连续点上趋近,完全不要求 的取值接近。反例中 始终相差 2,但分布相同。更一般地, 甚至不需要和 定义在同一个概率空间上——按分布收敛只关心”分布形态”的相似性。 ✅ 正确解释:按分布收敛描述的是”分布形态”的趋近,而非”取值”的趋近。只有依概率收敛才真正描述随机变量取值的接近。依分布收敛甚至不要求 定义在同一个概率空间上,这是它与 收敛的本质区别之一。

弱收敛中连续点要求的忽视

来源:茆诗松教材§4.1 + 卡方训练营讲义 + 2018厦门大学868真题 + 2021南开大学432真题 + 复旦大学432讲义 + duanyll.com”概统速通” + 51CTO博客”依分布收敛的定义细节”

误区2:"弱收敛要求 对所有 成立"

❌ 错误解释:弱收敛只要求在 的连续点上成立。在间断点上可以不收敛(甚至可以振荡)。 ✅ 正确解释:弱收敛的定义是 的每一个连续点上成立。间断点处的收敛性不做要求,这是为了统一处理离散型和连续型随机变量的极限分布。一个直观的理解是:分布函数在间断点处的”跳跃高度”由概率质量决定,而弱收敛只关心概率质量的”整体转移趋势”,不关心在单个跳跃点处的精确行为。

收敛方向(蕴含关系)的混淆

来源:茆诗松教材§4.1 + 卡方训练营讲义 + 2018复旦大学861真题 + 2020中国人民大学805真题 + 2017北京大学431真题 + 道客巴巴”依概率收敛的注记” + zhongyl0430.github.io”依分布收敛”

误区3:"按分布收敛可以推出依概率收敛"

❌ 错误解释: 收敛是三种收敛中最弱的,不能反向推出更强的收敛。 就是 收敛但不 收敛的经典反例。另一个常见的反例是 ), 同分布故 收敛,但 之间振荡,不依概率收敛于任何随机变量。 ✅ 正确解释:蕴含关系是单向的:a.s.收敛 ⇒ 收敛 ⇒ 收敛。只有当极限为常数时,收敛与收敛才互推。从弱收敛推到强收敛通常需要额外条件,如极限为常数、序列具有某种一致性等。


十一、习题精选

习题概览

编号题目来源知识点难度
1教材4.1-1依概率收敛的定义验证★★☆
2教材4.1-2弱收敛的判定★★☆
3教材4.1-3依概率收敛的运算性质★★★
4教材4.1-4收敛关系的判断★★★
5教材4.1-5特征函数的计算★★☆
6教材4.1-6退化分布的弱收敛★★☆
72020北京大学431依概率收敛与大数定律★★★
82021南开大学432经验分布函数的四种收敛★★★
92018厦门大学868样本方差的依概率收敛★★★
102020中国人民大学805依分布收敛与中心极限定理★★★

习题1 — 教材4.1-1:依概率收敛的定义验证

习题1 — 教材4.1-1

,证明

习题2 — 教材4.1-2:弱收敛的判定

习题2 — 教材4.1-2

的分布函数为 ,判断 是否按分布收敛,若收敛求极限分布。

习题3 — 教材4.1-3:依概率收敛的运算性质

习题3 — 教材4.1-3

为常数),证明

习题4 — 教材4.1-4:收敛关系的判断

习题4 — 教材4.1-4

为 i.i.d. 序列,。令 ,判断 的收敛类型。

习题5 — 教材4.1-5:特征函数的计算

习题5 — 教材4.1-5

,求 的特征函数

习题6 — 教材4.1-6:退化分布的弱收敛

习题6 — 教材4.1-6

,其中 。证明

习题7 — 2020北京大学431:依概率收敛与大数定律

习题7 — 2020北京大学431

相互独立且同服从 ,令

(1) 求

(2) 证明 依概率收敛到某个常数 ,并求

习题8 — 2021南开大学432:经验分布函数的四种收敛

习题8 — 2021南开大学432

为 i.i.d. 随机变量, 为其共同的分布函数。经验分布函数定义为 。证明 分别依概率收敛、依分布收敛、依概率 1 收敛、均方收敛于

习题9 — 2018厦门大学868:样本方差的依概率收敛

习题9 — 2018厦门大学868

独立同分布,均值为 ,方差为 ,样本方差为 。证明: 依概率收敛于

习题10 — 2020中国人民大学805:依分布收敛与中心极限定理

习题10 — 2020中国人民大学805

服从 分布,计算其均值和方差,构造 的一个函数 ,使得 依分布收敛于标准正态分布。


十二、教材原文

以下为教材扫描版原文,可点击翻阅。

第四章 随机变量序列的极限定理/收敛性