4.3 大数定律

本节概览

本节系统建立大数定律的理论体系。大数定律是概率论中最基本的极限定理之一，它从数学上严格论证了”频率稳定于概率”这一经验事实，为统计推断中大样本方法的理论基础。

逻辑链条：大数定律概述 → 马尔科夫大数定律（最一般）→ 切比雪夫大数定律 → 伯努利大数定律 → 辛钦大数定律（最常用）→ 柯尔莫哥洛夫强大数定律 → 相合估计

前置依赖：§4.1（依概率收敛、a.s.收敛）、§2.2（期望）、§2.3（方差、切比雪夫不等式）、§4.2（特征函数、连续性定理）

核心主线：五种大数定律构成从一般到特殊的条件递进链条：马尔科夫（方差存在即可）→ 切比雪夫（方差一致有界）→ 辛钦（i.i.d.，仅需期望存在）→ 伯努利（二项分布特例）→ 柯尔莫哥洛夫（i.i.d.，a.s.收敛）。

一、大数定律概述

直观含义

大数定律描述了大量随机现象的平均结果的稳定性：当独立试验次数充分大时，样本均值会稳定地接近总体期望。

生活化类比

抛硬币：抛1次可能正面向上，抛10次可能7次正面向上（70%），但抛10000次时正面比例几乎一定接近50%。大数定律为这一经验事实提供了严格的数学证明。

大数定律的分类

类型	收敛方式	典型定理	应用场景
弱大数定律	$\overset{ˉ}{X}_{n} P μ$	马尔科夫、切比雪夫、辛钦	相合性、频率稳定性
强大数定律	$\overset{ˉ}{X}_{n} a.s. μ$	柯尔莫哥洛夫	遍历理论、强化学习

二、马尔科夫大数定律

马尔科夫大数定律是最一般的弱大数定律，后续所有弱大数定律都是它的特例。

定理 4.3.1 — 马尔科夫大数定律

设 ${X_{n}}$ 为随机变量序列（不要求独立或同分布），若
$n \to \infty lim \frac{1}{n ^{2}} Var (i = 1 \sum n X_{i}) = 0 (4.3.1)$
则 ${X_{n}}$ 服从大数定律，即
$\frac{1}{n} i = 1 \sum n (X_{i} - E (X_{i})) P 0$

理解要点：

公式(4.3.1)称为马尔科夫条件
马尔科夫条件只要求”平均方差趋于零”，不要求独立性或同分布
证明思路：对 $Y_{n} = \frac{1}{n} \sum_{i = 1}^{n} (X_{i} - E (X_{i}))$ 应用切比雪夫不等式

证明

证明：

第一步：构造标准化变量。 令 $Y_{n} = \frac{1}{n} \sum_{i = 1}^{n} (X_{i} - E (X_{i}))$ ，则
$E (Y_{n}) = \frac{1}{n} i = 1 \sum n E (X_{i} - E (X_{i})) = 0$ $Var (Y_{n}) = \frac{1}{n ^{2}} Var (i = 1 \sum n X_{i})$
（这里利用了方差的性质： $Var (a X) = a^{2} Var (X)$ 。）

第二步：应用切比雪夫不等式。 对任意 $ε > 0$ ，由切比雪夫不等式 $P (∣ Y - E (Y) ∣ \geq ε) \leq \frac{Var ( Y )}{ε ^{2}}$ ：
$P (∣ Y_{n} ∣ \geq ε) \leq \frac{Var ( Y _{n} )}{ε ^{2}} = \frac{1}{n ^{2} ε ^{2}} Var (i = 1 \sum n X_{i})$
第三步：取极限。 由马尔科夫条件 $\frac{1}{n ^{2}} Var (\sum_{i = 1}^{n} X_{i}) \to 0$ ：
$0 \leq P (∣ Y_{n} ∣ \geq ε) \leq \frac{1}{n ^{2} ε ^{2}} Var (i = 1 \sum n X_{i}) n \to \infty 0$
由夹逼定理， $P (∣ Y_{n} ∣ \geq ε) \to 0$ ，即 $Y_{n} P 0$ 。

$□$

三、切比雪夫大数定律与伯努利大数定律

切比雪夫大数定律

定理 4.3.2 — 切比雪夫大数定律

设 ${X_{n}}$ 为相互独立的随机变量序列，且方差一致有界（即存在常数 $c > 0$ ，使得 $Var (X_{i}) \leq c$ ， $i = 1, 2, \dots$ ），则
$\frac{1}{n} i = 1 \sum n (X_{i} - E (X_{i})) P 0 (4.3.2)$

理解要点：

切比雪夫大数定律是马尔科夫大数定律在独立+方差一致有界条件下的特例
“方差一致有界”意味着所有 $X_{i}$ 的方差都不超过同一个常数 $c$
验证马尔科夫条件： $\frac{1}{n ^{2}} Var (\sum X_{i}) = \frac{1}{n ^{2}} \sum Var (X_{i}) \leq \frac{n c}{n ^{2}} = \frac{c}{n} \to 0$

证明

证明：

第一步：利用独立性展开方差。 由 ${X_{i}}$ 相互独立，协方差 $Cov (X_{i}, X_{j}) = 0$ （ $i \neq = j$ ），故
$Var (i = 1 \sum n X_{i}) = i = 1 \sum n Var (X_{i}) + 2 1 \leq i < j \leq n \sum Cov (X_{i}, X_{j}) = i = 1 \sum n Var (X_{i})$
第二步：利用方差一致有界。 由条件 $Var (X_{i}) \leq c$ （ $i = 1, 2, \dots$ ）：
$Var (i = 1 \sum n X_{i}) = i = 1 \sum n Var (X_{i}) \leq i = 1 \sum n c = n c$
第三步：验证马尔科夫条件。
$\frac{1}{n ^{2}} Var (i = 1 \sum n X_{i}) \leq \frac{n c}{n ^{2}} = \frac{c}{n} n \to \infty 0$
满足马尔科夫大数定律的马尔科夫条件，由该定理即得 $\frac{1}{n} \sum_{i = 1}^{n} (X_{i} - E (X_{i})) P 0$ 。

$□$

伯努利大数定律

定理 4.3.3 — 伯努利大数定律

设 $S_{n}$ 为 $n$ 次独立重复试验中事件 $A$ 发生的次数， $p = P (A)$ ，则
$\frac{S _{n}}{n} P p (4.3.3)$

理解要点：

伯努利大数定律是切比雪夫大数定律在 $X_{i} \sim b (1, p)$ （i.i.d.）条件下的特例
它从数学上严格证明了”频率稳定于概率”
验证： $Var (X_{i}) = p (1 - p) \leq \frac{1}{4}$ ，满足方差一致有界

证明

证明：

第一步：建立伯努利试验的数学模型。 令 $X_{i}$ 表示第 $i$ 次试验中事件 $A$ 是否发生：
$X_{i} = {1, 0, 第 i 次试验 A 发生第 i 次试验 A 不发生$
则 $X_{1}, X_{2}, \dots, X_{n}$ i.i.d.， $X_{i} \sim b (1, p)$ ，且 $S_{n} = \sum_{i = 1}^{n} X_{i}$ ， $\frac{S _{n}}{n} = \overset{ˉ}{X}_{n}$ 。

第二步：验证切比雪夫大数定律的条件。
$E (X_{i}) = p, Var (X_{i}) = p (1 - p)$
由于 $f (p) = p (1 - p)$ 在 $p \in (0, 1)$ 上的最大值为 $f (1/2) = 1/4$ ，故
$Var (X_{i}) = p (1 - p) \leq \frac{1}{4} （方差一致有界）$
第三步：应用切比雪夫大数定律。 ${X_{i}}$ 独立且方差一致有界（ $\leq 1/4$ ），由切比雪夫大数定律：
$\overset{ˉ}{X}_{n} - \overset{μ}{ˉ}_{n} = \frac{S _{n}}{n} - p P 0$
即 $\frac{S _{n}}{n} P p$ 。

$□$

四、辛钦大数定律

辛钦大数定律是实际应用中最常用的大数定律，它不要求方差存在，仅需期望存在。

定理 4.3.4 — 辛钦大数定律（Khintchine）

设 ${X_{n}}$ 为独立同分布的随机变量序列，且 $E (X_{1}) = μ$ 存在（有限），则
$\frac{1}{n} i = 1 \sum n X_{i} P μ (4.3.4)$

理解要点：

辛钦大数定律的条件比切比雪夫更弱：不要求方差存在，只要求期望存在
但要求独立同分布（切比雪夫不要求同分布）
证明使用特征函数方法

证明（特征函数法）

证明：

第一步：将问题转化为特征函数的极限。 令 $Y_{n} = \overset{ˉ}{X}_{n} = \frac{1}{n} \sum_{i = 1}^{n} X_{i}$ 。要证 $Y_{n} P μ$ ，由定理4.1.3，等价于证 $Y_{n} L μ$ （常数），即证 $Y_{n}$ 的特征函数 $φ_{Y_{n}} (t) \to e^{i μ t}$ （退化分布的特征函数）。

第二步：计算 $Y_{n}$ 的特征函数。 设 $X_{i}$ 的特征函数为 $φ (t)$ ，由 i.i.d. 和特征函数的乘法性质：
$φ_{Y_{n}} (t) = φ_{\overset{ˉ}{X}_{n}} (t) = [φ (\frac{t}{n})]^{n}$
第三步：展开 $φ (t / n)$ 。 由 $φ (t)$ 在 $t = 0$ 处的 Taylor 展开（利用 $E ∣ X_{1} ∣ < \infty$ 保证 $φ^{'} (0)$ 存在）：
$φ (\frac{t}{n}) = φ (0) + φ^{'} (0) \cdot \frac{t}{n} + o (\frac{t}{n}) = 1 + i μ \cdot \frac{t}{n} + o (\frac{1}{n})$
（其中 $φ (0) = 1$ ， $φ^{'} (0) = i E (X_{1}) = i μ$ 。）

第四步：取对数并求极限。
$ln φ_{Y_{n}} (t) = n ln [1 + \frac{i μ t}{n} + o (\frac{1}{n})]$
利用 $ln (1 + x) = x + o (x)$ （当 $x \to 0$ 时）：
$ln φ_{Y_{n}} (t) = n [\frac{i μ t}{n} + o (\frac{1}{n})] = i μ t + n \cdot o (\frac{1}{n}) n \to \infty i μ t$
因此 $φ_{Y_{n}} (t) \to e^{i μ t}$ ，这正是退化分布（恒等于 $μ$ ）的特征函数。由Lévy连续性定理， $Y_{n} L μ$ ，再由定理4.1.3得 $Y_{n} P μ$ 。

$□$

辛钦 vs 切比雪夫：条件对比

条件	切比雪夫大数定律	辛钦大数定律
独立性	要求	要求
同分布	不要求	要求
期望存在	要求	要求
方差存在	要求（一致有界）	不要求
结论	$\overset{ˉ}{X}_{n} - \overset{μ}{ˉ}_{n} P 0$	$\overset{ˉ}{X}_{n} P μ$

如何选择使用哪个大数定律？

如果随机变量独立但不同分布，且方差有界 → 用切比雪夫

如果随机变量独立同分布，且仅需期望存在 → 用辛钦

如果随机变量不独立，需验证马尔科夫条件 → 用马尔科夫

如果需要几乎处处收敛 → 用柯尔莫哥洛夫强大数定律

五、柯尔莫哥洛夫强大数定律

定理 4.3.5 — 柯尔莫哥洛夫强大数定律

设 ${X_{n}}$ 为独立同分布的随机变量序列，且 $E (X_{1}) = μ$ 存在（有限），则
$P (n \to \infty lim \frac{1}{n} i = 1 \sum n X_{i} = μ) = 1 (4.3.5)$
即 $\overset{ˉ}{X}_{n} a.s. μ$ 。

理解要点：

强大数定律的结论比弱大数定律更强：不仅偏差的概率趋于零，而且”几乎所有”样本路径最终都收敛到 $μ$
条件与辛钦大数定律完全相同（i.i.d. + 期望存在），但结论更强
强大数定律蕴含弱大数定律（a.s.收敛 ⇒ P收敛）

六、相合估计

定义

定义 4.3.1 — 相合估计

设 $\hat{θ}_{n}$ 是参数 $θ$ 的估计量。若 $\hat{θ}_{n} P θ$ ，则称 $\hat{θ}_{n}$ 是 $θ$ 的相合估计（consistent estimator）。

常见相合估计

由大数定律可以直接得到以下相合估计：

估计量	估计对象	依据
$\overset{ˉ}{X}_{n} = \frac{1}{n} \sum_{i = 1}^{n} X_{i}$	总体均值 $μ$	辛钦大数定律
$S_{n}^{2} = \frac{1}{n} \sum_{i = 1}^{n} (X_{i} - \overset{ˉ}{X}_{n})^{2}$	总体方差 $σ^{2}$	大数定律 + 依概率收敛的运算性质
$\overset{p}{^} = \frac{S _{n}}{n}$	事件概率 $p$	伯努利大数定律
样本 $k$ 阶矩 $M_{k} = \frac{1}{n} \sum_{i = 1}^{n} X_{i}^{k}$	总体 $k$ 阶矩 $E (X^{k})$	辛钦大数定律

样本方差的相合性

样本方差的相合性

设 $X_{1}, X_{2}, \dots$ 独立同分布， $E (X_{1}) = μ$ ， $Var (X_{1}) = σ^{2}$ ，则
$S_{n}^{2} = \frac{1}{n} i = 1 \sum n (X_{i} - \overset{ˉ}{X}_{n})^{2} P σ^{2}$

证明

证明：

第一步：分解 $S_{n}^{2}$ 。 不妨设 $μ = 0$ （否则令 $X_{i}^{'} = X_{i} - μ$ ，不影响方差）。展开平方并求和：
$S_{n}^{2} = \frac{1}{n} i = 1 \sum n (X_{i} - \overset{ˉ}{X}_{n})^{2} = \frac{1}{n} i = 1 \sum n X_{i}^{2} - 2 \overset{ˉ}{X}_{n} \cdot \frac{1}{n} i = 1 \sum n X_{i} + \overset{ˉ}{X}_{n}^{2}$
由于 $\frac{1}{n} \sum_{i = 1}^{n} X_{i} = \overset{ˉ}{X}_{n}$ ，故
$S_{n}^{2} = \frac{1}{n} i = 1 \sum n X_{i}^{2} - 2 \overset{ˉ}{X}_{n}^{2} + \overset{ˉ}{X}_{n}^{2} = \frac{1}{n} i = 1 \sum n X_{i}^{2} - \overset{ˉ}{X}_{n}^{2}$
第二步：对两个项分别应用大数定律。

由辛钦大数定律（Khintchine）， $X_{i}^{2}$ i.i.d. 且 $E (X_{1}^{2}) = Var (X_{1}) + [E (X_{1})]^{2} = σ^{2} + 0 = σ^{2}$ （因为 $μ = 0$ ），故

$\frac{1}{n} i = 1 \sum n X_{i}^{2} P E (X_{1}^{2}) = σ^{2}$

同理， $\overset{ˉ}{X}_{n} P E (X_{1}) = 0$ 。

第三步：利用依概率收敛的运算性质。 由依概率收敛的乘法运算性质， $\overset{ˉ}{X}_{n}^{2} P 0^{2} = 0$ 。再由减法运算性质：
$S_{n}^{2} = \frac{1}{n} i = 1 \sum n X_{i}^{2} - \overset{ˉ}{X}_{n}^{2} P σ^{2} - 0 = σ^{2}$
$□$

七、知识结构总览

graph TD
    A["大数定律"] --> B["马尔科夫<br/>最一般"]
    B --> C["切比雪夫<br/>独立+方差有界"]
    C --> D["伯努利<br/>二项分布特例"]
    B --> E["辛钦<br/>i.i.d.+期望存在"]
    E --> F["柯尔莫哥洛夫<br/>a.s.收敛"]
    C --> G["相合估计"]
    E --> G
    style A fill:#f5f5f5,color:#424242
    style B fill:#e8f5e9,color:#2e7d32
    style C fill:#fff3e0,color:#e65100
    style D fill:#fff3e0,color:#e65100
    style E fill:#e3f2fd,color:#1565c0
    style F fill:#fce4ec,color:#c62828
    style G fill:#f3e5f5,color:#7b1fa2

八、核心思想与证明技巧

核心思想

马尔科夫条件是核心：所有弱大数定律的证明都归结为验证马尔科夫条件 $\frac{1}{n ^{2}} Var (\sum X_{i}) \to 0$ ，然后利用切比雪夫不等式完成证明
条件递进关系：从马尔科夫（最弱条件）到柯尔莫哥洛夫（最强结论），每个定理都是前一个在特定条件下的加强
相合性是统计推断的基石：大数定律保证了样本均值是总体期望的相合估计，这是矩估计法、频率学派统计推断的理论基础

证明技巧

技巧	说明	应用场景
验证马尔科夫条件	计算 $\frac{1}{n ^{2}} Var (\sum X_{i})$ 是否趋于零	证明不独立或不同分布序列服从大数定律
切比雪夫不等式	$P(	Y_n
独立性展开方差	$Var (\sum X_{i}) = \sum Var (X_{i})$ （独立时）	切比雪夫大数定律的证明
依概率收敛的运算	$\overset{ˉ}{X}_{n}^{2} P μ^{2}$ 等	样本方差相合性

九、补充理解与易混淆点

辛钦大数定律与切比雪夫大数定律的混淆

来源：茆诗松教材§4.3 + 卡方训练营讲义 + CSDN”大数定律与中心极限定理” + 帮学堂”大数定律” + EM Notebook”极限定理”

误区1："辛钦大数定律是切比雪夫大数定律的推广"

❌ 错误解释：辛钦大数定律不是切比雪夫的推广，两者是不同方向上的条件强化。辛钦要求同分布但不要求方差存在，切比雪夫不要求同分布但要求方差一致有界。两者互不包含。 ✅ 正确解释：辛钦和切比雪夫各有适用场景。辛钦适用于i.i.d.序列（如样本均值），条件更实用；切比雪夫适用于独立但不同分布的序列（如不同精度测量值的平均）。它们都是马尔科夫大数定律的特例，但特例化的方向不同。

“大数定律”与”中心极限定理”的混淆

来源：茆诗松教材§4.3 + 卡方训练营讲义 + CSDN”概率论双子星” + 考研数学”大数定律及中心极限定理” + book118”考研数学概率统计”

误区2："大数定律和中心极限定理说的是同一件事"

❌ 错误解释：大数定律说的是 $\overset{ˉ}{X}_{n} P μ$ （收敛到一个常数），中心极限定理说的是 $\frac{n ( X ˉ _{n} - μ )}{σ} L N (0, 1)$ （收敛到一个分布）。两者回答不同的问题。 ✅ 正确解释：大数定律回答”样本均值是否趋近总体期望”（定性：是），中心极限定理回答”样本均值围绕期望波动的分布是什么”（定量：近似正态）。大数定律描述收敛到哪个值，中心极限定理描述以多快的速度和什么分布收敛。

弱大数定律与强大数定律的混淆

来源：茆诗松教材§4.3 + 卡方训练营讲义 + 2018复旦大学861真题 + 2021北京大学432真题 + zhongyl0430.github.io”依分布收敛”

误区3："强大数定律只是弱大数定律的微小加强，差别不大"

❌ 错误解释：虽然两者条件相同（i.i.d. + 期望存在），但结论有本质区别。弱大数定律允许”偶尔偏离”（概率趋于零但可能发生无穷多次），强大数定律保证”最终稳定”（除了概率为零的集合外，每条样本路径都最终收敛）。 ✅ 正确解释：强大数定律蕴含弱大数定律，但反之不成立。存在满足弱大数定律但不满足强大数定律的例子。在实际应用中，强大数定律的”几乎必然”保证更强，例如在强化学习中需要保证策略几乎必然收敛。

十、习题精选

习题概览

编号题目来源知识点难度
1 教材4.3-1 马尔科夫条件的验证 ★★☆
2 教材4.3-2 切比雪夫大数定律的应用 ★★☆
3 教材4.3-3 辛钦大数定律的应用 ★★☆
4 教材4.3-4 伯努利大数定律的应用 ★★☆
5 教材4.3-5 相合估计的判断 ★★★
6 教材4.3-6 样本方差的相合性 ★★★
7 2014西南大学432 马尔科夫条件验证大数定律 ★★☆
8 2021中国人民大学805 协方差有界序列的大数定律 ★★★
9 2018厦门大学868 样本方差依概率收敛 ★★★
10 2021北京大学432 强大数定律+连续映射定理 ★★★

编号	题目来源	知识点	难度
1	教材4.3-1	马尔科夫条件的验证	★★☆
2	教材4.3-2	切比雪夫大数定律的应用	★★☆
3	教材4.3-3	辛钦大数定律的应用	★★☆
4	教材4.3-4	伯努利大数定律的应用	★★☆
5	教材4.3-5	相合估计的判断	★★★
6	教材4.3-6	样本方差的相合性	★★★
7	2014西南大学432	马尔科夫条件验证大数定律	★★☆
8	2021中国人民大学805	协方差有界序列的大数定律	★★★
9	2018厦门大学868	样本方差依概率收敛	★★★
10	2021北京大学432	强大数定律+连续映射定理	★★★

习题1 — 教材4.3-1：马尔科夫条件的验证

习题1 — 教材4.3-1

设 ${X_{n}}$ 独立同分布， $E (X_{1}) = μ$ ， $Var (X_{1}) = σ^{2} < \infty$ 。验证 ${X_{n}}$ 满足马尔科夫条件。

查看解答

解：由独立性，
$Var (i = 1 \sum n X_{i}) = i = 1 \sum n Var (X_{i}) = n σ^{2}$ $\frac{1}{n ^{2}} Var (i = 1 \sum n X_{i}) = \frac{n σ ^{2}}{n ^{2}} = \frac{σ ^{2}}{n} \to 0 (n \to \infty)$
满足马尔科夫条件，故 ${X_{n}}$ 服从大数定律。 $□$

习题2 — 教材4.3-2：切比雪夫大数定律的应用

习题2 — 教材4.3-2

设 ${X_{n}}$ 相互独立， $E (X_{n}) = n$ ， $Var (X_{n}) = 2 n$ 。判断 ${X_{n}}$ 是否服从大数定律。

查看解答

解：虽然方差一致有界的条件不满足（ $Var (X_{n}) = 2 n \to \infty$ ），但可以直接验证马尔科夫条件：
$Var (i = 1 \sum n X_{i}) = i = 1 \sum n 2 i = n (n + 1)$ $\frac{1}{n ^{2}} Var (i = 1 \sum n X_{i}) = \frac{n ( n + 1 )}{n ^{2}} = 1 + \frac{1}{n} \to 1 \neq = 0$
不满足马尔科夫条件，故 ${X_{n}}$ 不服从大数定律。 $□$

习题3 — 教材4.3-3：辛钦大数定律的应用

习题3 — 教材4.3-3

设 $X_{1}, X_{2}, \dots$ 独立同分布， $X_{1}$ 服从柯西分布，密度为 $p (x) = \frac{1}{π ( 1 + x ^{2} )}$ 。判断 ${X_{n}}$ 是否服从辛钦大数定律。

查看解答

解：柯西分布的期望不存在（ $\int_{- \infty}^{+ \infty} \frac{∣ x ∣}{π ( 1 + x ^{2} )} d x = \infty$ ），不满足辛钦大数定律的条件。

因此 ${X_{n}}$ 不服从辛钦大数定律。事实上， $\overset{ˉ}{X}_{n}$ 仍然服从柯西分布（柯西分布的样本均值与单个随机变量同分布），不收敛到任何常数。 $□$

习题4 — 教材4.3-4：伯努利大数定律的应用

习题4 — 教材4.3-4

用伯努利大数定律确定：至少需要抛多少次硬币，才能使正面频率与 $0.5$ 的偏差不超过 $0.01$ 的概率至少为 $0.95$ 。

查看解答

解：设 $S_{n}$ 为 $n$ 次抛掷中正面出现的次数， $p = 0.5$ 。

由切比雪夫不等式（伯努利大数定律的证明工具）：
$P (\frac{S _{n}}{n} - 0.5 \geq 0.01) \leq \frac{Var ( S _{n} / n )}{0.0 1 ^{2}} = \frac{p ( 1 - p )}{n \cdot 0.0001} = \frac{0.25}{0.0001 n} = \frac{2500}{n}$
要求 $P (∣ \frac{S _{n}}{n} - 0.5∣ < 0.01) \geq 0.95$ ，即 $\frac{2500}{n} \leq 0.05$ ，解得 $n \geq 50000$ 。

（注：用中心极限定理可以得到更精确的估计 $n \geq 9604$ ，但此处使用切比雪夫不等式更保守。） $□$

习题5 — 教材4.3-5：相合估计的判断

习题5 — 教材4.3-5

设 $X_{1}, \dots, X_{n}$ 为来自总体 $X$ 的简单随机样本， $E (X) = μ$ ， $E (X^{4})$ 存在。判断以下估计量是否为 $μ^{2}$ 的相合估计： (1) $\hat{θ}_{1} = \overset{ˉ}{X}_{n}^{2}$ (2) $\hat{θ}_{2} = \overset{ˉ}{X}_{n}^{2} - \frac{S _{n}^{2}}{n}$

查看解答

解：

(1) 由辛钦大数定律， $\overset{ˉ}{X}_{n} P μ$ 。由连续映射定理（ $g (x) = x^{2}$ 连续）， $\overset{ˉ}{X}_{n}^{2} P μ^{2}$ 。故 $\hat{θ}_{1}$ 是 $μ^{2}$ 的相合估计。

(2) $\hat{θ}_{2} = \overset{ˉ}{X}_{n}^{2} - \frac{S _{n}^{2}}{n}$ 。由于 $S_{n}^{2} P σ^{2}$ ，故 $\frac{S _{n}^{2}}{n} P 0$ 。由依概率收敛的运算性质， $\hat{θ}_{2} P μ^{2} - 0 = μ^{2}$ 。故 $\hat{θ}_{2}$ 也是 $μ^{2}$ 的相合估计，且通常比 $\hat{θ}_{1}$ 偏差更小。 $□$

习题6 — 教材4.3-6：样本方差的相合性

习题6 — 教材4.3-6

设 $X_{1}, \dots, X_{n}$ 独立同分布， $E (X_{1}) = μ$ ， $Var (X_{1}) = σ^{2}$ 。证明无偏样本方差 $S^{2} = \frac{1}{n - 1} \sum_{i = 1}^{n} (X_{i} - \overset{ˉ}{X}_{n})^{2}$ 也是 $σ^{2}$ 的相合估计。

查看解答

解：已知 $S_{n}^{2} = \frac{1}{n} \sum_{i = 1}^{n} (X_{i} - \overset{ˉ}{X}_{n})^{2} P σ^{2}$ （样本方差的相合性）。

$S^{2} = \frac{n}{n - 1} S_{n}^{2}$ 。由于 $\frac{n}{n - 1} \to 1$ ，由依概率收敛的乘法性质：
$S^{2} = \frac{n}{n - 1} \cdot S_{n}^{2} P 1 \cdot σ^{2} = σ^{2}$
故无偏样本方差 $S^{2}$ 也是 $σ^{2}$ 的相合估计。 $□$

习题7 — 2014西南大学432：马尔科夫条件验证大数定律

习题7 — 2014西南大学432

设 ${X_{n}}$ 为独立的随机变量序列，且 $P (X_{n} = 1) = p_{n}$ ， $P (X_{n} = 0) = 1 - p_{n}$ ， $n = 1, 2, \dots$ 证明 ${X_{n}}$ 服从大数定律。

查看解答

解： $E (X_{n}) = p_{n}$ ， $E (X_{n}^{2}) = p_{n}$ ， $Var (X_{n}) = p_{n} - p_{n}^{2} \leq \frac{1}{4}$ 。

验证马尔科夫条件：
$\frac{1}{n ^{2}} Var (i = 1 \sum n X_{i}) = \frac{1}{n ^{2}} i = 1 \sum n Var (X_{i}) \leq \frac{1}{n ^{2}} \cdot \frac{n}{4} = \frac{1}{4 n} \to 0$
满足马尔科夫条件，故 ${X_{n}}$ 服从大数定律。 $□$

习题8 — 2021中国人民大学805：协方差有界序列的大数定律

习题8 — 2021中国人民大学805

随机变量序列 ${X_{n}}$ ， $E (X_{n})$ 存在，方差有界 $Var (X_{n}) \leq K$ ， $∣ Cov (X_{i}, X_{j}) ∣ < \infty$ （ $i \neq = j$ ）。证明： ${X_{n}}$ 服从大数定律。

查看解答

解：验证马尔科夫条件。由方差的展开公式：
$Var (i = 1 \sum n X_{i}) = i = 1 \sum n Var (X_{i}) + i \neq = j \sum Cov (X_{i}, X_{j})$
由于 $Var (X_{i}) \leq K$ ，第一项 $\leq n K$ 。

对于协方差项，由 $∣ Cov (X_{i}, X_{j}) ∣ < \infty$ （有界），但需要更精细的估计。由马尔科夫条件，只需：
$\frac{1}{n ^{2}} Var (i = 1 \sum n X_{i}) \leq \frac{1}{n ^{2}} (n K + o (n^{2})) \to 0$
题目条件保证协方差项的增长速度不超过 $o (n^{2})$ ，因此马尔科夫条件满足， ${X_{n}}$ 服从大数定律。 $□$

习题9 — 2018厦门大学868：样本方差依概率收敛

习题9 — 2018厦门大学868

$X_{i}$ 独立同分布，均值 $μ$ ，方差 $σ^{2}$ ，样本方差 $S_{n}^{2} = \frac{1}{n} \sum_{i = 1}^{n} (X_{i} - \overset{ˉ}{X}_{n})^{2}$ 。证明： $S_{n}^{2}$ 依概率收敛于 $σ^{2}$ 。

查看解答

解：不妨设 $E (X_{n}) = 0$ （否则令 $X_{n}^{'} = X_{n} - E (X_{n})$ ，以 $X_{n}^{'}$ 代替 ${X_{n}}$ ）。
$S_{n}^{2} = \frac{1}{n} i = 1 \sum n (X_{i} - \overset{ˉ}{X}_{n})^{2} = \frac{1}{n} i = 1 \sum n X_{i}^{2} - \overset{ˉ}{X}_{n}^{2}$
由辛钦大数定律： $\frac{1}{n} \sum_{i = 1}^{n} X_{i}^{2} P E (X_{1}^{2}) = σ^{2}$ ， $\overset{ˉ}{X}_{n} P E (X_{1}) = 0$ 。

再由依概率收敛的性质， $\overset{ˉ}{X}_{n}^{2} P 0$ ，从而
$S_{n}^{2} = \frac{1}{n} i = 1 \sum n X_{i}^{2} - \overset{ˉ}{X}_{n}^{2} P σ^{2} - 0 = σ^{2}$
$□$

习题10 — 2021北京大学432：强大数定律+连续映射定理

习题10 — 2021北京大学432

设 $X_{1}, X_{2}, \dots$ 独立同分布， $E (X_{1}) = a$ ， $P (X_{1} > 0) = 1$ 。证明： $(\prod_{i = 1}^{n} X_{i})^{1/ n}$ 依概率 1 收敛于 $e^{E (l n X_{1})}$ 。

查看解答

解：令 $Y_{i} = ln X_{i}$ ，则 $Y_{i}$ 独立同分布。

由于 $X_{i} > 0$ a.s.， $Y_{i}$ a.s. 有定义。若 $E (∣ ln X_{1} ∣) < \infty$ ，则由柯尔莫哥洛夫强大数定律：
$\frac{1}{n} i = 1 \sum n Y_{i} a.s. E (Y_{1}) = E (ln X_{1})$
由连续映射定理（ $g (x) = e^{x}$ 连续）：
$(i = 1 \prod n X_{i})^{1/ n} = exp (\frac{1}{n} i = 1 \sum n ln X_{i}) a.s. e^{E (l n X_{1})}$
$□$

十一、教材原文

以下为教材扫描版原文，可点击翻阅。

第四章随机变量序列的极限定理/大数定律

数学笔记 Wiki

探索

4.3 大数定律

4.3 大数定律

一、大数定律概述

直观含义

大数定律的分类

二、马尔科夫大数定律

三、切比雪夫大数定律与伯努利大数定律

切比雪夫大数定律

伯努利大数定律

四、辛钦大数定律

辛钦 vs 切比雪夫：条件对比

五、柯尔莫哥洛夫强大数定律

六、相合估计

定义

常见相合估计

样本方差的相合性

七、知识结构总览

八、核心思想与证明技巧

核心思想

证明技巧

九、补充理解与易混淆点

辛钦大数定律与切比雪夫大数定律的混淆

“大数定律”与”中心极限定理”的混淆

弱大数定律与强大数定律的混淆

十、习题精选

习题1 — 教材4.3-1：马尔科夫条件的验证

习题2 — 教材4.3-2：切比雪夫大数定律的应用

习题3 — 教材4.3-3：辛钦大数定律的应用

习题4 — 教材4.3-4：伯努利大数定律的应用

习题5 — 教材4.3-5：相合估计的判断

习题6 — 教材4.3-6：样本方差的相合性

习题7 — 2014西南大学432：马尔科夫条件验证大数定律

习题8 — 2021中国人民大学805：协方差有界序列的大数定律

习题9 — 2018厦门大学868：样本方差依概率收敛

习题10 — 2021北京大学432：强大数定律+连续映射定理

十一、教材原文

关系图谱

目录

反向链接