4.1 随机变量序列的两种收敛性

本节概览

本节是第四章极限定理的起点，引入随机变量序列收敛性的核心概念。重点讨论几乎处处收敛、依概率收敛和按分布收敛（弱收敛）三种收敛方式，建立它们之间的蕴含关系，并初步引入特征函数作为后续分析工具。

逻辑链条：几乎处处收敛（a.s.收敛）→ 依概率收敛（ $P$ 收敛）→ 按分布收敛（ $L$ 收敛）→ 收敛关系总结 → 特征函数初步

前置依赖：§2.1（分布函数）、§2.2（期望）、§2.3（方差）、§3.4（协方差）

核心主线：三种收敛性从强到弱形成链条，其中依概率收敛和按分布收敛是极限定理（大数定律、中心极限定理）的理论基石。

一、随机变量序列的收敛性概述

在概率论中，我们经常需要研究随机变量序列 ${X_{n}}_{n = 1}^{\infty}$ 在某种意义下”趋近”于一个随机变量 $X$ 。与实数序列的极限不同，随机变量的取值具有随机性，因此需要从不同角度定义”收敛”。

函数序列的收敛回顾

设 ${f_{n} (x)}$ 为定义域 $D$ 上的函数序列， $f (x)$ 为 $D$ 上的函数：

点点收敛： $\forall x_{0} \in D$ ， $f_{n} (x_{0}) \to f (x_{0})$
一致收敛： $sup_{x \in D} ∣ f_{n} (x) - f (x) ∣ \to 0$

随机变量序列收敛的分类

随机变量序列的收敛可以从两个角度理解：

从样本点角度：固定 $ω \in Ω$ ，考察数列 ${X_{n} (ω)}$ 是否收敛到 $X (ω)$
从概率角度：考察事件 ${∣ X_{n} - X ∣ < ε}$ 的概率是否趋于 1

本节重点讨论以下三种收敛：

收敛类型	记号	强弱	本节地位
几乎处处收敛	$X_{n} a.s. X$	最强	了解
依概率收敛	$X_{n} P X$	中	掌握
按分布收敛	$X_{n} L X$	最弱	掌握

生活化类比

想象一个射击训练：射手每天射击一次， $X_{n}$ 是第 $n$ 天的落点与靶心的偏差。

几乎处处收敛：每一天的落点都越来越接近靶心（几乎每天都如此）

依概率收敛：落点远离靶心的概率越来越小（偶尔可能打偏，但概率趋零）

按分布收敛：落点的整体分布模式趋近于某个固定分布（不关心具体哪一枪）

二、几乎处处收敛

定义

定义 4.1.1 — 几乎处处收敛（a.s. 收敛）

设 ${X_{n}}$ 为随机变量序列， $X$ 为随机变量。若
$P ({ω : n \to \infty lim X_{n} (ω) = X (ω)}) = 1$
则称 ${X_{n}}$ 几乎处处收敛（almost surely converge）于 $X$ ，记作 $X_{n} a.s. X$ 。

理解要点：几乎处处收敛要求除了一个概率为零的集合外，对每一个样本点 $ω$ ，数列 ${X_{n} (ω)}$ 都收敛到 $X (ω)$ 。这是最强的收敛方式，条件最为苛刻。

与依概率收敛的关系

几乎处处收敛蕴含依概率收敛（但反之不成立），这一关系将在第四节”收敛性关系总结”中详细讨论。

三、依概率收敛

定义

定义 4.1.2 — 依概率收敛（公式4.1.1）

设 ${X_{n}}$ 为随机变量序列， $X$ 为随机变量。若对任意 $ε > 0$ ，有
$n \to \infty lim P (∣ X_{n} - X ∣ \geq ε) = 0 (4.1.1)$
则称 ${X_{n}}$ 依概率收敛（converge in probability）于 $X$ ，记作 $X_{n} P X$ 。

等价形式：定义中的 $P (∣ X_{n} - X ∣ \geq ε) \to 0$ 等价于 $P (∣ X_{n} - X ∣ < ε) \to 1$ 。

理解要点：依概率收敛不要求每一个样本点都收敛，只要求 $X_{n}$ 与 $X$ 的偏差超过任意给定阈值的概率趋于零。换言之， $X_{n}$ 以越来越大的概率”接近” $X$ 。

退化分布情形

当极限 $X$ 为常数 $c$ （即 $P (X = c) = 1$ ）时，依概率收敛的定义简化为：

\forall ε > 0, n \to \infty lim P (∣ X_{n} - c ∣ \geq ε) = 0

这是大数定律的核心表述形式：样本均值依概率收敛到总体期望。

运算性质

定理 4.1.1 — 依概率收敛的运算性质

设 $X_{n} P a$ ， $Y_{n} P b$ （ $a, b$ 为常数），则
$X_{n} + Y_{n} P a + b$ $X_{n} \times Y_{n} P a \times b$ $X_{n} \div Y_{n} P a \div b (b \neq = 0)$

理解要点：依概率收敛保持四则运算（在极限不为零时可做除法）。这一性质在证明大数定律的应用题中非常实用。

证明（以加法为例，乘法和除法类似）

证明（以 $X_{n} + Y_{n} P a + b$ 为例）：

第一步：利用三角不等式。 对任意 $ε > 0$ ：
$∣ (X_{n} + Y_{n}) - (a + b) ∣ = ∣ (X_{n} - a) + (Y_{n} - b) ∣ \leq ∣ X_{n} - a ∣ + ∣ Y_{n} - b ∣$
第二步：建立概率上界。 若 $∣ (X_{n} + Y_{n}) - (a + b) ∣ \geq ε$ ，则由三角不等式， $∣ X_{n} - a ∣ + ∣ Y_{n} - b ∣ \geq ε$ ，这意味着 $∣ X_{n} - a ∣ \geq ε /2$ 或 $∣ Y_{n} - b ∣ \geq ε /2$ 至少有一个成立（否则两者都小于 $ε /2$ ，加起来小于 $ε$ ，矛盾）。因此
$P (∣ (X_{n} + Y_{n}) - (a + b) ∣ \geq ε) \leq P (∣ X_{n} - a ∣ \geq ε /2) + P (∣ Y_{n} - b ∣ \geq ε /2)$
第三步：取极限。 由 $X_{n} P a$ 和 $Y_{n} P b$ ，右端两项都趋于 $0$ ，故
$n \to \infty lim P (∣ (X_{n} + Y_{n}) - (a + b) ∣ \geq ε) = 0$
即 $X_{n} + Y_{n} P a + b$ 。

乘法和除法的证明思路类似：利用 $∣ X_{n} Y_{n} - ab ∣ = ∣ X_{n} (Y_{n} - b) + b (X_{n} - a) ∣ \leq ∣ X_{n} ∣∣ Y_{n} - b ∣ + ∣ b ∣∣ X_{n} - a ∣$ ，再对 $∣ X_{n} ∣$ 利用依概率收敛的有界性（ $X_{n} P a$ 蕴含 $X_{n}$ 依概率有界）即可。

$□$

四、按分布收敛（弱收敛）

定义

定义 4.1.3 — 按分布收敛 / 弱收敛（公式4.1.2-4.1.4）

设 ${X_{n}}$ 为随机变量序列， $X$ 为随机变量， $F_{n} (x)$ 和 $F (x)$ 分别为 $X_{n}$ 和 $X$ 的分布函数。

分布函数版本：若在 $F (x)$ 的每一个连续点 $x$ 上，有
$n \to \infty lim F_{n} (x) = F (x) (4.1.2)$
则称 ${F_{n} (x)}$ 弱收敛于 $F (x)$ ，记作 $F_{n} (x) W F (x)$ 。

随机变量版本：若 $F_{n} (x) W F (x)$ ，则称 ${X_{n}}$ 按分布收敛于 $X$ ，记作
$X_{n} L X (4.1.4)$

理解要点：

弱收敛只要求在 $F (x)$ 的连续点上分布函数值趋于极限，在间断点上可以不收敛
按分布收敛描述的是”分布形态”的趋近，而非随机变量取值的趋近
随机变量的分布函数唯一确定了其概率规律，因此按分布收敛是研究极限分布的核心工具

与点点收敛的区别

分布函数序列的弱收敛 $\neq =$ 点点收敛。弱收敛允许在 $F (x)$ 的间断点处不收敛，这是为了处理离散型随机变量的极限分布问题。

例 4.1.1 — 退化分布的弱收敛

设 $X_{n}$ 服从退化分布，即 $P (X_{n} = \frac{1}{n}) = 1$ ，其分布函数为
$F_{n} (x) = {0, 1, x < \frac{1}{n} x \geq \frac{1}{n}$
取极限 $X \equiv 0$ （退化分布）， $F (x) = 1_{[0, + \infty)} (x)$ 。

在 $F (x)$ 的连续点 $x \neq = 0$ 上：当 $n$ 充分大时， $\frac{1}{n} < x$ ，故 $F_{n} (x) = 1 = F (x)$ 。

在间断点 $x = 0$ 处： $F_{n} (0) = 0 \neq = 1 = F (0)$ ，但 $x = 0$ 是 $F (x)$ 的间断点，不要求收敛。

因此 $F_{n} (x) W F (x)$ ，即 $X_{n} L 0$ 。

五、两种收敛的关系

依概率收敛蕴含按分布收敛

定理 4.1.2 — $P$ 收敛蕴含 $L$ 收敛

$X_{n} P X ⟹ X_{n} L X$

证明

证明：

第一步：建立上界不等式。 对任意 $ε > 0$ 和 $x$ ，将事件 ${X_{n} \leq x}$ 按照与 $X$ 的关系拆分为两个不相容事件：
${X_{n} \leq x} = {X_{n} \leq x, X > x + ε} \cup {X_{n} \leq x, X \leq x + ε}$
（思路：如果 $X$ 比 $x$ 大很多（ $> x + ε$ ），而 $X_{n} \leq x$ ，则 $∣ X_{n} - X ∣ > ε$ ；否则 $X \leq x + ε$ 。）

因此
$F_{n} (x) = P (X_{n} \leq x) \leq P (∣ X_{n} - X ∣ > ε) + P (X \leq x + ε) = P (∣ X_{n} - X ∣ > ε) + F (x + ε)$
第二步：取上极限。 令 $n \to \infty$ ，由 $X_{n} P X$ 知 $P (∣ X_{n} - X ∣ > ε) \to 0$ ，故
$n \to \infty lim sup F_{n} (x) \leq F (x + ε)$
第三步：建立下界不等式。 类似地，将事件 ${X \leq x - ε}$ 拆分：
${X \leq x - ε} = {X \leq x - ε, X_{n} > x} \cup {X \leq x - ε, X_{n} \leq x}$
因此 $P (X \leq x - ε) \leq P (∣ X_{n} - X ∣ > ε) + P (X_{n} \leq x) = P (∣ X_{n} - X ∣ > ε) + F_{n} (x)$ ，整理得
$F_{n} (x) \geq P (X \leq x - ε) - P (∣ X_{n} - X ∣ > ε) = F (x - ε) - P (∣ X_{n} - X ∣ > ε)$
第四步：取下极限。 令 $n \to \infty$ ：
$n \to \infty lim inf F_{n} (x) \geq F (x - ε)$
第五步：令 $ε \to 0$ 。 结合第二步和第四步：
$F (x - ε) \leq n \to \infty lim inf F_{n} (x) \leq n \to \infty lim sup F_{n} (x) \leq F (x + ε)$
在 $F (x)$ 的连续点上，令 $ε \to 0$ ，由夹逼定理得 $lim_{n \to \infty} F_{n} (x) = F (x)$ 。

$□$

常数极限下的等价性

定理 4.1.3 — 常数极限下 $P$ 收敛与 $L$ 收敛等价

$X_{n} P c ⟺ X_{n} L c (c 为常数)$

证明

证明：

" $\Rightarrow$ "方向（ $P$ 收敛 $\Rightarrow$ $L$ 收敛）： 由定理 4.1.2 — $P$ 收敛蕴含 $L$ 收敛直接得到，无需额外证明。

" $\Leftarrow$ "方向（ $L$ 收敛 $\Rightarrow$ $P$ 收敛）：

第一步：写出依概率收敛的定义。 要证 $X_{n} P c$ ，即对任意 $ε > 0$ ， $P (∣ X_{n} - c ∣ \geq ε) \to 0$ 。

第二步：将概率拆分为两个尾部。
$P (∣ X_{n} - c ∣ \geq ε) = P (X_{n} \leq c - ε) + P (X_{n} \geq c + ε)$ $= F_{n} (c - ε) + 1 - F_{n} (c + ε^{-})$
（这里 $F_{n} (c + ε^{-}) = lim_{x ↑ c + ε} F_{n} (x)$ 是左极限。）

第三步：利用依分布收敛求极限。 $X_{n} L c$ 意味着 $F_{n} (x) \to F (x) = 1_{[c, + \infty)} (x)$ 在 $F$ 的连续点 $x \neq = c$ 上成立。由于 $c - ε < c$ 和 $c + ε > c$ 都是 $F$ 的连续点，故
$n \to \infty lim F_{n} (c - ε) = F (c - ε) = 0, n \to \infty lim F_{n} (c + ε^{-}) = F (c + ε) = 1$
第四步：得出结论。
$n \to \infty lim P (∣ X_{n} - c ∣ \geq ε) = 0 + 1 - 1 = 0$
即 $X_{n} P c$ 。

$□$

反例： $L$ 收敛不蕴含 $P$ 收敛

例 4.1.2 — 依分布收敛但不依概率收敛的反例

设 $X$ 满足 $P (X = - 1) = \frac{1}{2}$ ， $P (X = 1) = \frac{1}{2}$ 。

令 $X_{n} = - X$ （即 $X_{n}$ 与 $X$ 始终取相反值），则：

$X_{n}$ 与 $X$ 同分布（都是 $\pm 1$ 各取 $\frac{1}{2}$ ），故 $X_{n} L X$

但 $∣ X_{n} - X ∣ = ∣ - X - X ∣ = 2$ ，故 $P (∣ X_{n} - X ∣ \geq 1) = 1$ 不趋于零， $X_{n} \neq P X$

理解要点：按分布收敛只关心分布形态，不关心随机变量之间的”同步性”。 $X_{n} = - X$ 与 $X$ 分布相同，但每一时刻都取相反的值，因此不依概率收敛。

六、特征函数初步

本节末尾引入特征函数的概念，为后续中心极限定理的证明做准备。

复随机变量

设 $X (ω)$ 和 $Y (ω)$ 为定义在概率空间 $(Ω, F, P)$ 上的实值随机变量，则

Z (ω) = X (ω) + iY (ω)

称为复随机变量，其共轭为 $\overline{Z} = X - iY$ ，模为 $∣ Z ∣ = X^{2} + Y^{2}$ 。

复随机变量的期望定义为 $E (Z) = E (X) + i E (Y)$ ，要求 $E (X)$ 和 $E (Y)$ 都存在。

欧拉公式与复指数

对实随机变量 $X$ ， $e^{i X}$ 是一个复随机变量。由欧拉公式：

e^{i X} = cos X + i sin X

其期望为 $E (e^{i X}) = E (cos X) + i E (sin X)$ ，且 $∣ e^{i X} ∣ = cos^{2} X + sin^{2} X = 1$ 。

若 $X$ 与 $Y$ 独立，则 $e^{i X}$ 与 $e^{iY}$ 也独立。

特征函数的定义

定义 4.2.1 — 特征函数（公式4.2.1）

设 $X$ 为随机变量，称
$φ (t) = E (e^{i tX}), - \infty < t < + \infty (4.2.1)$
为 $X$ 的特征函数（characteristic function）。

理解要点：

特征函数是 $t$ 的函数，对每一个固定的 $t$ ， $φ (t)$ 是一个期望值
由于 $∣ e^{i tX} ∣ = 1$ ，特征函数一定存在（不像矩母函数可能不存在）
特征函数与分布函数相互唯一确定（逆转定理），是研究极限分布的强大工具
特征函数的详细性质将在§4.2中展开

七、收敛性关系总结

三种收敛的强弱关系

X_{n} a.s. X ⟹ X_{n} P X ⟹ X_{n} L X X_{n} P c ⟺ X_{n} L c (c 为常数)

关系图

graph TD
    A["几乎处处收敛<br/>a.s.收敛"] -->|"蕴含"| B["依概率收敛<br/>P收敛"]
    B -->|"蕴含"| C["按分布收敛<br/>L收敛"]
    B -.->|"等价<br/>极限为常数时"| D["常数极限"]
    D -.->|"等价"| C
    style A fill:#e8f5e9,color:#2e7d32
    style B fill:#fff3e0,color:#e65100
    style C fill:#e3f2fd,color:#1565c0
    style D fill:#f3e5f5,color:#7b1fa2

核心要点

关系	说明
a.s.收敛 ⇒ P收敛	几乎每个样本点都收敛，自然偏差的概率趋于零
P收敛 ⇒ L收敛	收敛到确定值，分布自然趋近
L收敛 ⇏ P收敛	反例： $X_{n} = - X$ 与 $X$ 同分布但不”同步”
P收敛 ⇏ a.s.收敛	存在反例（如”滑动窗”序列）
极限为常数时 P ⇔ L	常数是特殊的退化分布，此时两种收敛等价

八、知识结构总览

graph LR
    A["收敛性概述"] --> B["几乎处处收敛"]
    A --> C["依概率收敛"]
    A --> D["按分布收敛"]
    C --> E["运算性质"]
    C --> F["蕴含L收敛"]
    D --> G["弱收敛定义"]
    B --> H["a.s.蕴含P"]
    F --> I["常数极限等价"]
    D --> J["特征函数初步"]
    style A fill:#f5f5f5,color:#424242
    style B fill:#e8f5e9,color:#2e7d32
    style C fill:#fff3e0,color:#e65100
    style D fill:#e3f2fd,color:#1565c0
    style E fill:#fff3e0,color:#e65100
    style F fill:#e3f2fd,color:#1565c0
    style G fill:#e3f2fd,color:#1565c0
    style H fill:#e8f5e9,color:#2e7d32
    style I fill:#f3e5f5,color:#7b1fa2
    style J fill:#fce4ec,color:#c62828

九、核心思想与证明技巧

核心思想

分层收敛体系：三种收敛从不同角度描述”趋近”，形成完整的强弱链条。选择哪种收敛取决于问题的需要——大数定律用 $P$ 收敛，中心极限定理用 $L$ 收敛
分布函数是桥梁：按分布收敛通过分布函数定义，将随机变量的收敛问题转化为函数序列的收敛问题
常数极限的特殊性：当极限为常数时， $P$ 收敛与 $L$ 收敛等价，这大大简化了大数定律的表述

证明技巧

技巧	说明	应用场景
夹逼分布函数	利用 $F_n(x) \leq F(x+\varepsilon) + P(	X_n - X
选取连续点	弱收敛只在 $F$ 的连续点要求收敛	退化分布的弱收敛
利用独立性	独立随机变量的函数也独立	特征函数的乘法性质

十、补充理解与易混淆点

依概率收敛与依分布收敛的混淆

来源：茆诗松教材§4.1 + 卡方训练营讲义 + 2020北京大学431真题 + 2024清华大学432真题 + 维基百科”随机变量的收敛” + CSDN”概率论四大收敛关系图解”

误区1：" $X_{n} L X$ 就意味着 $X_{n}$ 越来越接近 $X$ "

❌ 错误解释：按分布收敛只要求分布函数在连续点上趋近，完全不要求 $X_{n}$ 和 $X$ 的取值接近。反例中 $X_{n} = - X$ 与 $X$ 始终相差 2，但分布相同。更一般地， $X_{n}$ 甚至不需要和 $X$ 定义在同一个概率空间上——按分布收敛只关心”分布形态”的相似性。 ✅ 正确解释：按分布收敛描述的是”分布形态”的趋近，而非”取值”的趋近。只有依概率收敛才真正描述随机变量取值的接近。依分布收敛甚至不要求 $X_{n}$ 和 $X$ 定义在同一个概率空间上，这是它与 $P$ 收敛的本质区别之一。

弱收敛中连续点要求的忽视

来源：茆诗松教材§4.1 + 卡方训练营讲义 + 2018厦门大学868真题 + 2021南开大学432真题 + 复旦大学432讲义 + duanyll.com”概统速通” + 51CTO博客”依分布收敛的定义细节”

误区2："弱收敛要求 $F_{n} (x) \to F (x)$ 对所有 $x$ 成立"

❌ 错误解释：弱收敛只要求在 $F (x)$ 的连续点上成立。在间断点上可以不收敛（甚至可以振荡）。 ✅ 正确解释：弱收敛的定义是 $lim_{n \to \infty} F_{n} (x) = F (x)$ 在 $F (x)$ 的每一个连续点上成立。间断点处的收敛性不做要求，这是为了统一处理离散型和连续型随机变量的极限分布。一个直观的理解是：分布函数在间断点处的”跳跃高度”由概率质量决定，而弱收敛只关心概率质量的”整体转移趋势”，不关心在单个跳跃点处的精确行为。

收敛方向（蕴含关系）的混淆

来源：茆诗松教材§4.1 + 卡方训练营讲义 + 2018复旦大学861真题 + 2020中国人民大学805真题 + 2017北京大学431真题 + 道客巴巴”依概率收敛的注记” + zhongyl0430.github.io”依分布收敛”

误区3："按分布收敛可以推出依概率收敛"

❌ 错误解释： $L$ 收敛是三种收敛中最弱的，不能反向推出更强的收敛。 $X_{n} = - X$ 就是 $L$ 收敛但不 $P$ 收敛的经典反例。另一个常见的反例是 $X_{n} = (- 1)^{n} X$ （ $X \sim N (0, 1)$ ）， $X_{n}$ 与 $X$ 同分布故 $L$ 收敛，但 $X_{n}$ 在 $X$ 和 $- X$ 之间振荡，不依概率收敛于任何随机变量。 ✅ 正确解释：蕴含关系是单向的：a.s.收敛 ⇒ $P$ 收敛 ⇒ $L$ 收敛。只有当极限为常数时， $P$ 收敛与 $L$ 收敛才互推。从弱收敛推到强收敛通常需要额外条件，如极限为常数、序列具有某种一致性等。

十一、习题精选

习题概览

编号题目来源知识点难度
1 教材4.1-1 依概率收敛的定义验证 ★★☆
2 教材4.1-2 弱收敛的判定 ★★☆
3 教材4.1-3 依概率收敛的运算性质 ★★★
4 教材4.1-4 收敛关系的判断 ★★★
5 教材4.1-5 特征函数的计算 ★★☆
6 教材4.1-6 退化分布的弱收敛 ★★☆
7 2020北京大学431 依概率收敛与大数定律 ★★★
8 2021南开大学432 经验分布函数的四种收敛 ★★★
9 2018厦门大学868 样本方差的依概率收敛 ★★★
10 2020中国人民大学805 依分布收敛与中心极限定理 ★★★

编号	题目来源	知识点	难度
1	教材4.1-1	依概率收敛的定义验证	★★☆
2	教材4.1-2	弱收敛的判定	★★☆
3	教材4.1-3	依概率收敛的运算性质	★★★
4	教材4.1-4	收敛关系的判断	★★★
5	教材4.1-5	特征函数的计算	★★☆
6	教材4.1-6	退化分布的弱收敛	★★☆
7	2020北京大学431	依概率收敛与大数定律	★★★
8	2021南开大学432	经验分布函数的四种收敛	★★★
9	2018厦门大学868	样本方差的依概率收敛	★★★
10	2020中国人民大学805	依分布收敛与中心极限定理	★★★

习题1 — 教材4.1-1：依概率收敛的定义验证

习题1 — 教材4.1-1

设 $X_{n} \sim U (0, \frac{1}{n})$ ，证明 $X_{n} P 0$ 。

查看解答

解：对任意 $ε > 0$ ，当 $n > \frac{1}{ε}$ 时，有 $\frac{1}{n} < ε$ ，从而
$P (∣ X_{n} - 0∣ \geq ε) = P (X_{n} \geq ε) = 0$
当 $n \leq \frac{1}{ε}$ 时，
$P (∣ X_{n} - 0∣ \geq ε) = P (X_{n} \geq ε) = \frac{\frac{1}{n} - ε}{\frac{1}{n}} = 1 - n ε$
因此 $lim_{n \to \infty} P (∣ X_{n} ∣ \geq ε) = 0$ ，即 $X_{n} P 0$ 。 $□$

习题2 — 教材4.1-2：弱收敛的判定

习题2 — 教材4.1-2

设 $X_{n}$ 的分布函数为 $F_{n} (x) = 1 - e^{- n x} \cdot 1_{(0, + \infty)} (x)$ ，判断 $X_{n}$ 是否按分布收敛，若收敛求极限分布。

查看解答

解： $F_{n} (x)$ 是参数为 $n$ 的指数分布的分布函数。

对 $x \leq 0$ ： $F_{n} (x) = 0$ ，极限为 $0$ 。

对 $x > 0$ ： $F_{n} (x) = 1 - e^{- n x} \to 1$ （当 $n \to \infty$ ）。

取 $F (x) = 1_{[0, + \infty)} (x)$ （退化分布在 0 处），则 $F (x)$ 的唯一间断点为 $x = 0$ 。

在 $F (x)$ 的连续点 $x \neq = 0$ 上： $lim_{n \to \infty} F_{n} (x) = F (x)$ 成立。

因此 $F_{n} (x) W F (x)$ ，即 $X_{n} L 0$ 。 $□$

习题3 — 教材4.1-3：依概率收敛的运算性质

习题3 — 教材4.1-3

设 $X_{n} P a$ ， $Y_{n} P b$ （ $a, b$ 为常数），证明 $X_{n} + Y_{n} P a + b$ 。

查看解答

解：对任意 $ε > 0$ ，利用三角不等式：
$P (∣ (X_{n} + Y_{n}) - (a + b) ∣ \geq ε) \leq P (∣ X_{n} - a ∣ + ∣ Y_{n} - b ∣ \geq ε)$ $\leq P (∣ X_{n} - a ∣ \geq ε /2) + P (∣ Y_{n} - b ∣ \geq ε /2)$
由 $X_{n} P a$ 和 $Y_{n} P b$ ，上式两项均趋于零，故
$n \to \infty lim P (∣ (X_{n} + Y_{n}) - (a + b) ∣ \geq ε) = 0$
即 $X_{n} + Y_{n} P a + b$ 。 $□$

习题4 — 教材4.1-4：收敛关系的判断

习题4 — 教材4.1-4

设 $X_{1}, X_{2}, \dots$ 为 i.i.d. 序列， $E (X_{1}) = μ$ ， $D (X_{1}) = σ^{2}$ 。令 $\overset{ˉ}{X}_{n} = \frac{1}{n} \sum_{i = 1}^{n} X_{i}$ ，判断 $\overset{ˉ}{X}_{n}$ 的收敛类型。

查看解答

解：

(1) 依概率收敛：由切比雪夫不等式，
$P (∣ \overset{ˉ}{X}_{n} - μ ∣ \geq ε) \leq \frac{D ( X ˉ _{n} )}{ε ^{2}} = \frac{σ ^{2}}{n ε ^{2}} \to 0$
故 $\overset{ˉ}{X}_{n} P μ$ （这是辛钦大数定律的特殊情形）。

(2) 按分布收敛：由 $P$ 收敛蕴含 $L$ 收敛， $\overset{ˉ}{X}_{n} L μ$ 。

(3) 几乎处处收敛：由柯尔莫哥洛夫强大数定律， $\overset{ˉ}{X}_{n} a.s. μ$ 。

因此 $\overset{ˉ}{X}_{n}$ 同时具有三种收敛性，极限都是 $μ$ 。 $□$

习题5 — 教材4.1-5：特征函数的计算

习题5 — 教材4.1-5

设 $X \sim N (0, 1)$ ，求 $X$ 的特征函数 $φ (t)$ 。

查看解答

解：
$φ (t) = E (e^{i tX}) = \int_{- \infty}^{+ \infty} e^{i t x} \cdot \frac{1}{2 π} e^{- x^{2} /2} d x$ $= \frac{1}{2 π} \int_{- \infty}^{+ \infty} e^{- (x^{2} - 2 i t x) /2} d x$
配方： $x^{2} - 2 i t x = (x - i t)^{2} + t^{2}$ ，故
$φ (t) = \frac{1}{2 π} e^{- t^{2} /2} \int_{- \infty}^{+ \infty} e^{- (x - i t)^{2} /2} d x$
由复变函数围道积分（或直接利用标准正态密度积分值为 $2 π$ ），上式积分等于 $2 π$ ，故
$φ (t) = e^{- t^{2} /2}$
$□$

习题6 — 教材4.1-6：退化分布的弱收敛

习题6 — 教材4.1-6

设 $X_{n} \sim b (n, p_{n})$ ，其中 $n p_{n} \to λ > 0$ 。证明 $X_{n} L Poisson (λ)$ 。

查看解答

解： $X_{n}$ 的分布律为 $P (X_{n} = k) = (k n) p_{n}^{k} (1 - p_{n})^{n - k}$ 。

令 $λ_{n} = n p_{n}$ ，则 $p_{n} = λ_{n} / n$ ， $λ_{n} \to λ$ 。
$P (X_{n} = k) = \frac{n ( n - 1 ) \dots ( n - k + 1 )}{k !} (\frac{λ _{n}}{n})^{k} (1 - \frac{λ _{n}}{n})^{n - k}$ $= \frac{λ _{n}^{k}}{k !} \cdot \frac{n}{n} \cdot \frac{n - 1}{n} \dots \frac{n - k + 1}{n} \cdot (1 - \frac{λ _{n}}{n})^{n - k}$
当 $n \to \infty$ 时：

$λ_{n}^{k} \to λ^{k}$

$\frac{n ( n - 1 ) \dots ( n - k + 1 )}{n ^{k}} \to 1$

$(1 - \frac{λ _{n}}{n})^{n - k} = (1 - \frac{λ _{n}}{n})^{n} \cdot (1 - \frac{λ _{n}}{n})^{- k} \to e^{- λ} \cdot 1 = e^{- λ}$

因此 $P (X_{n} = k) \to \frac{λ ^{k}}{k !} e^{- λ}$ ，即 $X_{n}$ 的分布律点态收敛到 $Poisson (λ)$ 的分布律，故 $X_{n} L Y$ ，其中 $Y \sim Poisson (λ)$ 。 $□$

习题7 — 2020北京大学431：依概率收敛与大数定律

习题7 — 2020北京大学431

设 $X_{1}, X_{2}, \dots, X_{n}$ 相互独立且同服从 $U (0, 1)$ ，令 $Y_{n} = \frac{1}{n} \sum_{i = 1}^{n} e^{2 X_{i}}$ 。

(1) 求 $E (Y_{n})$ 和 $Var (Y_{n})$ ；

(2) 证明 $Y_{n}$ 依概率收敛到某个常数 $y$ ，并求 $y$ 。

查看解答

解：

(1) $E (Y_{n}) = E (e^{2 X_{1}}) = \int_{0}^{1} e^{2 x} d x = \frac{1}{2} (e^{2} - 1)$ 。
$E (e^{4 X_{1}}) = \int_{0}^{1} e^{4 x} d x = \frac{1}{4} (e^{4} - 1)$ $Var (e^{2 X_{1}}) = \frac{1}{4} (e^{4} - 1) - [\frac{1}{2} (e^{2} - 1)]^{2} = \frac{1}{4} (e^{4} - 1) - \frac{1}{4} (e^{2} - 1)^{2}$ $= \frac{1}{4} [(e^{4} - 1) - (e^{4} - 2 e^{2} + 1)] = \frac{1}{4} (2 e^{2} - 2) = \frac{1}{2} (e^{2} - 1)$
因此 $Var (Y_{n}) = \frac{1}{n} Var (e^{2 X_{1}}) = \frac{e ^{2} - 1}{2 n}$ 。

(2) 由辛钦大数定律， $Y_{n} = \frac{1}{n} \sum_{i = 1}^{n} e^{2 X_{i}} P E (e^{2 X_{1}}) = \frac{1}{2} (e^{2} - 1)$ 。

故 $y = \frac{e ^{2} - 1}{2}$ 。 $□$

习题8 — 2021南开大学432：经验分布函数的四种收敛

习题8 — 2021南开大学432

设 $X_{1}, X_{2}, \dots, X_{n}$ 为 i.i.d. 随机变量， $F (x)$ 为其共同的分布函数。经验分布函数定义为 $F_{n} (x) = \frac{1}{n} \sum_{i = 1}^{n} 1_{{X_{i} \leq x}}$ 。证明 $F_{n} (x)$ 分别依概率收敛、依分布收敛、依概率 1 收敛、均方收敛于 $F (x)$ 。

查看解答

解：记 $I_{i} = 1_{{X_{i} \leq x}}$ ，则 $I_{i}$ i.i.d. $\sim b (1, F (x))$ ，且 $F_{n} (x) = \frac{1}{n} \sum_{i = 1}^{n} I_{i}$ 。

依概率收敛：由辛钦大数定律， $F_{n} (x) P E (I_{1}) = F (x)$ 。

依分布收敛：由 $P$ 收敛蕴含 $L$ 收敛， $F_{n} (x) L F (x)$ 。

均方收敛： $E (F_{n} (x)) = \frac{1}{n} \cdot n F (x) = F (x)$ ，均方误差为
$E (F_{n} (x) - F (x))^{2} = Var (F_{n} (x)) = \frac{F ( x ) ( 1 - F ( x ))}{n} \to 0$
故 $F_{n} (x) L^{2} F (x)$ 。

依概率 1 收敛：由柯尔莫哥洛夫强大数定律（独立同分布场合）， $\frac{1}{n} \sum_{i = 1}^{n} I_{i} a.s. F (x)$ 。 $□$

习题9 — 2018厦门大学868：样本方差的依概率收敛

习题9 — 2018厦门大学868

设 $X_{1}, X_{2}, \dots$ 独立同分布，均值为 $μ$ ，方差为 $σ^{2}$ ，样本方差为 $S_{n}^{2} = \frac{1}{n} \sum_{i = 1}^{n} (X_{i} - \overset{ˉ}{X}_{n})^{2}$ 。证明： $S_{n}^{2}$ 依概率收敛于 $σ^{2}$ 。

查看解答

解：不妨设 $E (X_{n}) = 0$ （否则令 $X_{n}^{'} = X_{n} - E (X_{n})$ ，以 $X_{n}^{'}$ 代替 ${X_{n}}$ ，此时 $σ^{2}$ 和 $S_{n}^{2}$ 均保持不变）。
$S_{n}^{2} = \frac{1}{n} i = 1 \sum n (X_{i} - \overset{ˉ}{X}_{n})^{2} = \frac{1}{n} i = 1 \sum n X_{i}^{2} - \overset{ˉ}{X}_{n}^{2}$
由辛钦大数定律：

$\frac{1}{n} \sum_{i = 1}^{n} X_{i}^{2} P E (X_{1}^{2}) = σ^{2}$

$\overset{ˉ}{X}_{n} = \frac{1}{n} \sum_{i = 1}^{n} X_{i} P E (X_{1}) = 0$

再由依概率收敛的运算性质， $\overset{ˉ}{X}_{n}^{2} P 0$ ，从而
$S_{n}^{2} = \frac{1}{n} i = 1 \sum n X_{i}^{2} - \overset{ˉ}{X}_{n}^{2} P σ^{2} - 0 = σ^{2}$
进一步，由 $S_{n}^{2} = \frac{n}{n - 1} \cdot \frac{1}{n} \sum_{i = 1}^{n} (X_{i} - \overset{ˉ}{X}_{n})^{2}$ ，利用 $\frac{n}{n - 1} \to 1$ 和依概率收敛的乘法性质，同样可得 $S_{n}^{2} P σ^{2}$ 。 $□$

习题10 — 2020中国人民大学805：依分布收敛与中心极限定理

习题10 — 2020中国人民大学805

设 $W$ 服从 $χ^{2} (n)$ 分布，计算其均值和方差，构造 $W$ 的一个函数 $f (w)$ ，使得 $f (W)$ 依分布收敛于标准正态分布。

查看解答

解： $W \sim χ^{2} (n)$ 可以分解为 $n$ 个独立同分布的 $χ^{2} (1)$ 随机变量之和：
$W = i = 1 \sum n X_{i}, X_{i} i.i.d. \sim χ^{2} (1)$
$χ^{2} (1)$ 的均值 $E (X_{i}) = 1$ ，方差 $Var (X_{i}) = 2$ 。

因此 $E (W) = n$ ， $Var (W) = 2 n$ 。

由林德伯格-列维中心极限定理：
$\frac{W - n}{2 n} L N (0, 1)$
令 $f (w) = \frac{w - n}{2 n}$ ，则 $f (W) L N (0, 1)$ 。 $□$

十二、教材原文

以下为教材扫描版原文，可点击翻阅。

第四章随机变量序列的极限定理/收敛性

数学笔记 Wiki

探索

4.1 随机变量序列的两种收敛性

4.1 随机变量序列的两种收敛性

一、随机变量序列的收敛性概述

函数序列的收敛回顾

随机变量序列收敛的分类

二、几乎处处收敛

定义

与依概率收敛的关系

三、依概率收敛

定义

退化分布情形

运算性质

四、按分布收敛（弱收敛）

定义

与点点收敛的区别

五、两种收敛的关系

依概率收敛蕴含按分布收敛

常数极限下的等价性

反例：L 收敛不蕴含 P 收敛

六、特征函数初步

复随机变量

欧拉公式与复指数

特征函数的定义

七、收敛性关系总结

三种收敛的强弱关系

关系图

核心要点

八、知识结构总览

九、核心思想与证明技巧

核心思想

证明技巧

十、补充理解与易混淆点

依概率收敛与依分布收敛的混淆

弱收敛中连续点要求的忽视

收敛方向（蕴含关系）的混淆

十一、习题精选

习题1 — 教材4.1-1：依概率收敛的定义验证

习题2 — 教材4.1-2：弱收敛的判定

习题3 — 教材4.1-3：依概率收敛的运算性质

习题4 — 教材4.1-4：收敛关系的判断

习题5 — 教材4.1-5：特征函数的计算

习题6 — 教材4.1-6：退化分布的弱收敛

习题7 — 2020北京大学431：依概率收敛与大数定律

习题8 — 2021南开大学432：经验分布函数的四种收敛

习题9 — 2018厦门大学868：样本方差的依概率收敛

习题10 — 2020中国人民大学805：依分布收敛与中心极限定理

十二、教材原文

关系图谱

目录

反向链接

反例： $L$ 收敛不蕴含 $P$ 收敛