5.5 充分统计量

本节概览

本节系统介绍充分统计量的概念、判定方法（因子分解定理）及其性质。充分统计量是数理统计中最重要的概念之一，它回答了一个核心问题：如何对样本进行最优压缩而不损失关于参数的信息？

逻辑链条：充分性直观概念 → 定义 → 因子分解定理 → 性质 → 应用

前置依赖：§5.3（统计量定义）、§5.4（正态总体抽样定理）

模块一：充分性的直观概念

Fisher vs Eddington 争论

在统计学发展早期，R.A. Fisher 与 Eddington 就如何估计正态分布的散度发生过一场著名争论：

Eddington 主张使用平均绝对偏差 $d = \frac{1}{n} \sum_{i = 1}^{n} ∣ X_{i} - \overset{ˉ}{X} ∣$
Fisher 主张使用样本标准差 $s = \frac{1}{n - 1} \sum_{i = 1}^{n} (X_{i} - \overset{ˉ}{X})^{2}$

Fisher 的核心论据是： $s$ 是正态分布参数 $σ$ 的充分统计量，而 $d$ 不是。这意味着 $s$ 包含了样本中关于 $σ$ 的全部信息，而 $d$ 丢失了部分信息。使用 $d$ 做推断时，其效率不如 $s$ 。

核心思想：充分性 = 样本加工不损失信息

充分统计量（sufficient statistic）的直观含义是：统计量 $T = T (X_{1}, \dots, X_{n})$ 对样本进行了”加工”，但这种加工没有丢失任何关于参数 $θ$ 的信息。

换句话说，一旦知道了 $T$ 的值，原始样本 $(X_{1}, \dots, X_{n})$ 的具体取值就不再提供关于 $θ$ 的额外信息了。

例 5.5.1 — 打靶命中率

设某人打靶的命中率为 $θ$ ，独立射击 $n$ 次， $X_{i}$ 表示第 $i$ 次射击的结果（命中=1，脱靶=0）。

样本为 $(X_{1}, X_{2}, \dots, X_{n})$ ，参数为 $θ$ 。

考虑统计量 $T = \sum_{i = 1}^{n} X_{i}$ （总命中次数）。

直观理解：如果我们知道 $T = t$ （命中了 $t$ 次），那么原始样本中每个 $X_{i}$ 的具体值（谁命中、谁脱靶）已经不再提供关于 $θ$ 的额外信息——因为给定 $T = t$ 后，样本的条件分布（即哪些位置是1、哪些位置是0的排列方式）与 $θ$ 无关。

因此， $T = \sum_{i = 1}^{n} X_{i}$ 是 $θ$ 的充分统计量。

模块二：充分统计量的定义

定义 5.5.1 — 充分统计量

设 $X_{1}, X_{2}, \dots, X_{n}$ 是来自分布 $F (x; θ)$ 的样本， $T = T (X_{1}, X_{2}, \dots, X_{n})$ 是一个统计量。如果在给定 $T = t$ 的条件下，样本 $(X_{1}, X_{2}, \dots, X_{n})$ 的==条件分布不依赖于参数 $θ$ ==，则称 $T$ 是 $θ$ 的充分统计量。

用数学语言表述：对任意的 $t$ 和 $θ$ ，
$P (X_{1} = x_{1}, \dots, X_{n} = x_{n} ∣ T = t; θ) = P (X_{1} = x_{1}, \dots, X_{n} = x_{n} ∣ T = t)$
即条件分布与 $θ$ 无关。

概率层面的分析

这个定义的本质是：

条件分布含 $θ$ 的信息：如果给定 $T = t$ 后，样本的条件分布仍然依赖于 $θ$ ，说明 $T$ 没有提取出样本中关于 $θ$ 的全部信息，原始样本还能提供额外信息 → $T$ 不充分。
条件分布不含 $θ$ 的信息：如果给定 $T = t$ 后，条件分布与 $θ$ 无关，说明 $T$ 已经提取了样本中关于 $θ$ 的全部信息 → $T$ 充分。

例 5.5.2 — 二点分布 $b (1, θ)$ 的充分统计量

设 $X_{1}, X_{2}, \dots, X_{n}$ 是来自二点分布 $b (1, θ)$ 的 i.i.d. 样本，其中 $0 < θ < 1$ 。

结论： $T = \sum_{i = 1}^{n} X_{i}$ 是 $θ$ 的充分统计量。

证明

第一步：计算条件概率

样本的联合分布为
$P (X_{1} = x_{1}, \dots, X_{n} = x_{n}; θ) = i = 1 \prod n θ^{x_{i}} (1 - θ)^{1 - x_{i}} = θ^{\sum x_{i}} (1 - θ)^{n - \sum x_{i}}$
由于 $T = \sum_{i = 1}^{n} X_{i} \sim b (n, θ)$ ，所以
$P (T = t; θ) = (t n) θ^{t} (1 - θ)^{n - t}$
第二步：化简条件概率

当 $T = t$ 时， $\sum_{i = 1}^{n} x_{i} = t$ ，因此
$P (X_{1} = x_{1}, \dots, X_{n} = x_{n} ∣ T = t; θ) = \frac{P ( X _{1} = x _{1} , \dots , X _{n} = x _{n} ; θ )}{P ( T = t ; θ )}$ $= \frac{θ ^{t} ( 1 - θ ) ^{n - t}}{( t n ) θ ^{t} ( 1 - θ ) ^{n - t}} = \frac{1}{( t n )}$
第三步：与 $θ$ 无关

条件概率 $P (X_{1} = x_{1}, \dots, X_{n} = x_{n} ∣ T = t) = \frac{1}{( t n )}$ 完全不依赖于 $θ$ ，只依赖于 $n$ 和 $t$ 。

因此， $T = \sum_{i = 1}^{n} X_{i}$ 是 $θ$ 的充分统计量。 $□$

反例：当 $n > 2$ 时， $S = X_{1} + X_{2}$ 不是 $θ$ 的充分统计量。因为给定 $S = s$ 后， $(X_{3}, \dots, X_{n})$ 的边际分布仍然依赖于 $θ$ ，条件分布中仍含有 $θ$ 的信息。

例 5.5.3 — 正态分布 $N (μ, 1)$ 的充分统计量

设 $X_{1}, X_{2}, \dots, X_{n}$ 是来自 $N (μ, 1)$ 的 i.i.d. 样本。

结论： $T = \overset{ˉ}{X} = \frac{1}{n} \sum_{i = 1}^{n} X_{i}$ 是 $μ$ 的充分统计量。

证明

第一步：作变量变换

令 $T = \overset{ˉ}{X}$ ，并取 $U_{i} = X_{i} - \overset{ˉ}{X}$ （ $i = 1, 2, \dots, n - 1$ ）作为辅助变量。注意 $\sum_{i = 1}^{n} U_{i} = 0$ ，所以只需取 $n - 1$ 个 $U_{i}$ 。

该变换的 Jacobi 行列式为常数（与 $μ$ 无关）。

第二步：计算条件密度

$(T, U_{1}, \dots, U_{n - 1})$ 的联合密度为
$f (t, u_{1}, \dots, u_{n - 1}; μ) = (2 π)^{- n /2} exp {- \frac{1}{2} i = 1 \sum n (x_{i} - μ)^{2}} \cdot ∣ J ∣$
展开 $\sum_{i = 1}^{n} (x_{i} - μ)^{2} = \sum_{i = 1}^{n} (x_{i} - \overset{x}{ˉ} + \overset{x}{ˉ} - μ)^{2} = \sum_{i = 1}^{n} (x_{i} - \overset{x}{ˉ})^{2} + n (\overset{x}{ˉ} - μ)^{2}$ ：
$= (2 π)^{- n /2} exp {- \frac{1}{2} [i = 1 \sum n u_{i}^{2} + n (t - μ)^{2}]} \cdot ∣ J ∣$
$T$ 的边际密度为 $T \sim N (μ, 1/ n)$ ：
$f_{T} (t; μ) = \frac{n}{2 π} exp {- \frac{n}{2} (t - μ)^{2}}$
因此条件密度为
$f (u_{1}, \dots, u_{n - 1} ∣ T = t; μ) = \frac{f ( t , u _{1} , \dots , u _{n - 1} ; μ )}{f _{T} ( t ; μ )}$ $= (2 π)^{- (n - 1) /2} n^{- 1/2} exp {- \frac{1}{2} i = 1 \sum n u_{i}^{2}} \cdot ∣ J ∣$
第三步：与 $μ$ 无关

条件密度中不含 $μ$ ，因此 $T = \overset{ˉ}{X}$ 是 $μ$ 的充分统计量。 $□$

模块三：因子分解定理

概率函数

为了统一处理离散型和连续型分布，我们引入概率函数（probability function）的概念：

p (x; θ) = {P (X = x; θ), f (x; θ), 离散型 连续型

这样，联合概率函数统一写为 $p (x_{1}, \dots, x_{n}; θ) = \prod_{i = 1}^{n} p (x_{i}; θ)$ 。

Neyman-Fisher 因子分解定理

定理 5.5.1 — Neyman-Fisher 因子分解定理

设 $X_{1}, X_{2}, \dots, X_{n}$ 是来自分布 $p (x; θ)$ 的 i.i.d. 样本， $θ \in Θ$ 。则统计量 $T = T (X_{1}, \dots, X_{n})$ 是 $θ$ 的充分统计量的充要条件是：存在两个非负函数 $g$ 和 $h$ ，使得联合概率函数可以分解为
$p (x_{1}, \dots, x_{n}; θ) = g (T (x_{1}, \dots, x_{n}), θ) \cdot h (x_{1}, \dots, x_{n})$
其中：

$g (t, θ)$ 仅通过 $T$ 的值和 $θ$ 依赖于样本

$h (x_{1}, \dots, x_{n})$ 不依赖于参数 $θ$

这个定理将充分性的判断从”计算条件分布”简化为”验证因子分解”，大大降低了操作难度。

必要性证明

证明（必要性： $T$ 充分 ⟹ 因子分解成立）

第一步：条件概率定义

设 $T$ 是 $θ$ 的充分统计量，则给定 $T = t$ 时，样本的条件分布不依赖于 $θ$ 。由条件概率公式，
$p (x_{1}, \dots, x_{n}; θ) = p (x_{1}, \dots, x_{n} ∣ T = t; θ) \cdot p_{T} (t; θ)$
第二步：令 $g$ 和 $h$

令 $g (t, θ) = p_{T} (t; θ)$ （ $T$ 的边际概率函数，依赖于 $θ$ ），令 $h (x_{1}, \dots, x_{n}) = p (x_{1}, \dots, x_{n} ∣ T = t; θ)$ （条件概率函数，不依赖于 $θ$ ）。

第三步：得因子分解

则 $p (x_{1}, \dots, x_{n}; θ) = g (T (x_{1}, \dots, x_{n}), θ) \cdot h (x_{1}, \dots, x_{n})$ ，因子分解成立。 $□$

充分性证明

证明（充分性：因子分解成立 ⟹ $T$ 充分）

第一步：计算 $P (T = t; θ)$

设联合概率函数满足因子分解 $p (x_{1}, \dots, x_{n}; θ) = g (T (x_{1}, \dots, x_{n}), θ) \cdot h (x_{1}, \dots, x_{n})$ 。

对 $T = t$ 的所有可能取值集合 $A_{t} = {(x_{1}, \dots, x_{n}) : T (x_{1}, \dots, x_{n}) = t}$ 求和（离散）或积分（连续）：
$p_{T} (t; θ) = (x_{1}, \dots, x_{n}) \in A_{t} \sum g (t, θ) \cdot h (x_{1}, \dots, x_{n}) = g (t, θ) \cdot A_{t} \sum h (x_{1}, \dots, x_{n})$
令 $H (t) = \sum_{A_{t}} h (x_{1}, \dots, x_{n})$ （不依赖于 $θ$ ），则 $p_{T} (t; θ) = g (t, θ) \cdot H (t)$ 。

第二步：计算条件分布
$p (x_{1}, \dots, x_{n} ∣ T = t; θ) = \frac{p ( x _{1} , \dots , x _{n} ; θ )}{p _{T} ( t ; θ )} = \frac{g ( t , θ ) \cdot h ( x _{1} , \dots , x _{n} )}{g ( t , θ ) \cdot H ( t )} = \frac{h ( x _{1} , \dots , x _{n} )}{H ( t )}$
第三步：与 $θ$ 无关

条件分布 $p (x_{1}, \dots, x_{n} ∣ T = t) = \frac{h ( x _{1} , \dots , x _{n} )}{H ( t )}$ 中不含 $θ$ ，因此 $T$ 是 $θ$ 的充分统计量。 $□$

因子分解定理的应用

例 5.5.4 — 均匀分布 $U (0, θ)$ 的充分统计量

设 $X_{1}, X_{2}, \dots, X_{n}$ 是来自 $U (0, θ)$ 的 i.i.d. 样本， $θ > 0$ 。

联合密度为
$f (x_{1}, \dots, x_{n}; θ) = i = 1 \prod n \frac{1}{θ} \cdot 1_{(0, θ)} (x_{i}) = \frac{1}{θ ^{n}} \cdot 1_{(0, θ)} (x_{(n)}) \cdot i = 1 \prod n 1_{(0, \infty)} (x_{i})$
其中 $x_{(n)} = max {x_{1}, \dots, x_{n}}$ 。

因子分解：令 $g (t, θ) = \frac{1}{θ ^{n}} \cdot 1_{(0, θ)} (t)$ ， $h (x_{1}, \dots, x_{n}) = \prod_{i = 1}^{n} 1_{(0, \infty)} (x_{i})$ 。

由于 $g$ 仅通过 $T = X_{(n)}$ 依赖于样本， $h$ 不含 $θ$ ，因此 $T = X_{(n)}$ 是 $θ$ 的充分统计量。

例 5.5.5 — 正态分布 $N (μ, σ^{2})$ 的充分统计量

设 $X_{1}, X_{2}, \dots, X_{n}$ 是来自 $N (μ, σ^{2})$ 的 i.i.d. 样本。

联合密度为
$f (x_{1}, \dots, x_{n}; μ, σ^{2}) = (2 π σ^{2})^{- n /2} exp {- \frac{1}{2 σ ^{2}} i = 1 \sum n (x_{i} - μ)^{2}}$
关键恒等式：
$i = 1 \sum n (x_{i} - μ)^{2} = i = 1 \sum n (x_{i} - \overset{x}{ˉ} + \overset{x}{ˉ} - μ)^{2} = i = 1 \sum n (x_{i} - \overset{x}{ˉ})^{2} + n (\overset{x}{ˉ} - μ)^{2}$ $= (n - 1) s^{2} + n (\overset{x}{ˉ} - μ)^{2}$
因此联合密度可写为
$f = (2 π σ^{2})^{- n /2} exp {- \frac{( n - 1 ) s ^{2}}{2 σ ^{2}} - \frac{n ( x ˉ - μ ) ^{2}}{2 σ ^{2}}}$ $= g (\overset{x}{ˉ}, s^{2}; μ, σ^{2}) (2 π σ^{2})^{- n /2} exp {- \frac{( n - 1 ) s ^{2} + n ( x ˉ - μ ) ^{2}}{2 σ ^{2}}} \cdot h (x_{1}, \dots, x_{n}) 1$
$g$ 仅通过 $(\overset{ˉ}{X}, S^{2})$ 依赖于样本， $h \equiv 1$ 不含参数。因此 $(\overset{ˉ}{X}, S^{2})$ 是 $(μ, σ^{2})$ 的充分统计量。

模块四：充分统计量的性质

定理 5.5.2 — 充分统计量的一一变换

若 $T$ 是 $θ$ 的充分统计量，且 $S = φ (T)$ 是 $T$ 的一一对应变换（即 $φ$ 有反函数 $φ^{- 1}$ ），则 $S$ 也是 $θ$ 的充分统计量。

证明

第一步： $T$ 充分有因子分解

由 $T$ 是充分统计量，存在 $g, h$ 使得
$p (x_{1}, \dots, x_{n}; θ) = g (T (x_{1}, \dots, x_{n}), θ) \cdot h (x_{1}, \dots, x_{n})$
第二步：令 $g^{*}$ 得到 $S$ 的因子分解

令 $g^{*} (s, θ) = g (φ^{- 1} (s), θ)$ ，则
$p (x_{1}, \dots, x_{n}; θ) = g^{*} (S (x_{1}, \dots, x_{n}), θ) \cdot h (x_{1}, \dots, x_{n})$
$g^{*}$ 仅通过 $S$ 依赖于样本， $h$ 不含 $θ$ ，因此 $S$ 也是 $θ$ 的充分统计量。 $□$

推论：充分统计量的一一变换仍是充分统计量。例如，若 $\overset{ˉ}{X}$ 是充分统计量，则 $\sum_{i = 1}^{n} X_{i} = n \overset{ˉ}{X}$ 也是充分统计量。

充分性原则

充分性原则（sufficiency principle）：统计推断应基于充分统计量进行。如果 $T$ 是 $θ$ 的充分统计量，那么任何不基于 $T$ 的推断方法都可以改进为基于 $T$ 的方法，且不会损失信息。

这是 Rao-Blackwell 定理和 Lehmann-Scheffé 定理的理论基础。

模块五：常见分布的充分统计量汇总

分布	密度/概率函数 $p (x; θ)$	参数	充分统计量
二点分布 $b (1, θ)$	$θ^{x} (1 - θ)^{1 - x}$	$θ$	$T = \sum X_{i}$
二项分布 $b (n, θ)$	$(x n) θ^{x} (1 - θ)^{n - x}$	$θ$	$T = X$ （自身）
泊松分布 $P (λ)$	$\frac{λ ^{x} e ^{- λ}}{x !}$	$λ$	$T = \sum X_{i}$
几何分布 $G e (θ)$	$θ (1 - θ)^{x - 1}$	$θ$	$T = \sum X_{i}$
负二项分布 $N b (r, θ)$	$(r - 1 x - 1) θ^{r} (1 - θ)^{x - r}$	$θ$	$T = \sum X_{i}$
指数分布 $E x p (λ)$	$λ e^{- λ x}$	$λ$	$T = \sum X_{i}$
均匀分布 $U (0, θ)$	$\frac{1}{θ} 1_{(0, θ)} (x)$	$θ$	$T = X_{(n)}$
均匀分布 $U (θ_{1}, θ_{2})$	$\frac{1}{θ _{2} - θ _{1}} 1_{(θ_{1}, θ_{2})} (x)$	$θ_{1}, θ_{2}$	$T = (X_{(1)}, X_{(n)})$
正态分布 $N (μ, σ_{0}^{2})$ （ $σ_{0}^{2}$ 已知）	$\frac{1}{2 π σ _{0}} e^{- \frac{( x - μ ) ^{2}}{2 σ _{0}^{2}}}$	$μ$	$T = \overset{ˉ}{X}$
正态分布 $N (μ_{0}, σ^{2})$ （ $μ_{0}$ 已知）	$\frac{1}{2 π σ} e^{- \frac{( x - μ _{0} ) ^{2}}{2 σ ^{2}}}$	$σ^{2}$	$T = \sum (X_{i} - μ_{0})^{2}$
正态分布 $N (μ, σ^{2})$	$\frac{1}{2 π σ} e^{- \frac{( x - μ ) ^{2}}{2 σ ^{2}}}$	$μ, σ^{2}$	$T = (\overset{ˉ}{X}, S^{2})$
Gamma 分布 $G a (α, λ)$	$\frac{λ ^{α}}{Γ ( α )} x^{α - 1} e^{- λ x}$	$α, λ$	$T = (\sum X_{i}, \prod X_{i})$
Beta 分布 $B e (a, b)$	$\frac{Γ ( a + b )}{Γ ( a ) Γ ( b )} x^{a - 1} (1 - x)^{b - 1}$	$a, b$	$T = (\sum ln X_{i}, \sum ln (1 - X_{i}))$
幂分布	$θ x^{θ - 1}, 0 < x < 1$	$θ$	$T = \prod X_{i}$ （或 $\sum ln X_{i}$ ）

指数族分布的充分统计量

指数族分布（exponential family）的概率函数具有如下标准形式：

p (x; θ) = C (θ) exp {j = 1 \sum k Q_{j} (θ) T_{j} (x)} h (x)

对于 i.i.d. 样本 $X_{1}, \dots, X_{n}$ ，联合概率函数为

p (x_{1}, \dots, x_{n}; θ) = C (θ)^{n} exp {j = 1 \sum k Q_{j} (θ) i = 1 \sum n T_{j} (x_{i})} i = 1 \prod n h (x_{i})

由因子分解定理，充分统计量为

T = (i = 1 \sum n T_{1} (X_{i}), i = 1 \sum n T_{2} (X_{i}), \dots, i = 1 \sum n T_{k} (X_{i}))

这是指数族分布的一个重要性质：充分统计量的维数等于自然参数空间的维数 $k$ 。

模块六：知识结构总览

graph TD
    A[充分性直观概念<br/>样本加工不损失信息] --> B[充分统计量定义<br/>条件分布不含θ]
    B --> C[因子分解定理<br/>Neyman-Fisher]
    C --> D[充分统计量性质<br/>一一变换保持充分性]
    C --> E[常见分布充分统计量<br/>指数族统一框架]
    D --> F[充分性原则<br/>推断应基于充分统计量]
    E --> G[应用<br/>参数估计与假设检验]
    B --> H[例题验证<br/>二点分布/正态分布/均匀分布]
    C --> H

模块七：核心思想与技巧

因子分解定理使用技巧

使用因子分解定理判断充分统计量时，关键步骤如下：

写出联合概率函数 $p (x_{1}, \dots, x_{n}; θ) = \prod_{i = 1}^{n} p (x_{i}; θ)$
提取含 $θ$ 的部分：将联合概率函数中所有含 $θ$ 的因子集中起来
检查含 $θ$ 部分是否仅通过某个统计量 $T$ 依赖于样本：
- 如果是，则 $T$ 是充分统计量
- 如果不是，则可能需要更高维的统计量，或不存在低维充分统计量
分离不含 $θ$ 的部分作为 $h (x_{1}, \dots, x_{n})$

充分统计量判断流程图

graph TD
    A[给定统计量T] --> B{T能否提取样本中全部关于参数的信息?}
    B -->|用定义| C[计算条件分布]
    B -->|用因子分解| D[尝试分解联合概率函数]
    C --> E{条件分布含参数?}
    D --> F{g仅通过T依赖样本?}
    E -->|否| G[T是充分统计量]
    E -->|是| H[T不是充分统计量]
    F -->|是| G
    F -->|否| H

模块八：补充理解与易混淆点

充分统计量与完备统计量混淆

来源：茆诗松§5.5 p264 + 维基教科书《常见分布族与充分统计量》 + CSDN《概率论与数理统计教程(五)》 + 卡方核心笔记 + bookdown《统计考研复习参考》Ch5

误区1："充分统计量就是最好的统计量"

❌ 错误解释：认为充分统计量自动具有完备性，是最优的。

✅ 正确解释：充分性≠完备性。充分统计量只保证”不损失信息”，但完备统计量还要求”充分统计量本身的分布不依赖于参数 $θ$ “。存在充分但不完备的统计量。在实际应用中，我们希望找到既充分又完备的统计量。

因子分解定理中 $g$ 和 $h$ 的角色混淆

来源：茆诗松§5.5 p262-263 + CSDN《概率论与数理统计教程(五)》 + UIC《Neyman-Fisher Theorem》 + IISc《Lecture 9: Sufficient Statistics》 + 卡方核心笔记

误区2："因子分解定理中 $h (x)$ 可以含参数 $θ$ "

❌ 错误解释：认为 $h (x_{1}, \dots, x_{n})$ 中可以包含参数 $θ$ 。

✅ 正确解释：在因子分解 $f = g \cdot h$ 中，== $h (x)$ 绝对不能含有参数 $θ$ ==。 $h (x)$ 只依赖于样本值，与 $θ$ 无关。所有与 $θ$ 有关的信息都必须通过 $g (T (x), θ)$ 中的 $T (x)$ 来传递。如果 $h$ 中含 $θ$ ，则分解无效，不能据此判断充分性。

充分统计量维数与参数维数的关系

来源：茆诗松§5.5习题12解答 + 维基教科书《常见分布族与充分统计量》 + CSDN《概率论与数理统计教程(五)》 + 卡方核心笔记 + bookdown《统计考研复习参考》Ch5

误区3："充分统计量的维数一定等于未知参数的维数"

❌ 错误解释：认为一维参数的充分统计量一定是一维的。

✅ 正确解释：充分统计量的维数不一定等于参数的维数。例如 $U (θ, 2 θ)$ 的参数 $θ$ 是一维的，但充分统计量是 $(X_{(1)}, X_{(n)})$ （二维）。又如 $N (μ, σ^{2})$ 的参数 $(μ, σ^{2})$ 是二维的，充分统计量 $(\overset{ˉ}{X}, S^{2})$ 也是二维的——此时维数恰好相等，但这不是一般规律。

模块九：习题精选

习题概览

共 10 道习题：6 道教材习题 + 4 道补充题。

编号来源主题难度
1 教材 5.5-1 几何分布充分统计量 ★★☆
2 教材 5.5-2 泊松分布充分统计量 ★★☆
3 教材 5.5-4 $N (μ, 1)$ 充分统计量 ★★☆
4 教材 5.5-5 幂分布充分统计量 ★★★
5 教材 5.5-10 $N (μ, σ^{2})$ 单参数情形 ★★★
6 教材 5.5-11 $U (θ_{1}, θ_{2})$ 充分统计量 ★★★
7 补充（教材5.5-3）离散分布次序统计量与频数 ★★★
8 补充（教材5.5-15）指数族分布充分统计量 ★★★
9 补充（教材5.5-17）二元正态分布充分统计量 ★★★★
10 补充（教材5.5-19）两参数指数分布充分统计量 ★★★

编号	来源	主题	难度
1	教材 5.5-1	几何分布充分统计量	★★☆
2	教材 5.5-2	泊松分布充分统计量	★★☆
3	教材 5.5-4	$N (μ, 1)$ 充分统计量	★★☆
4	教材 5.5-5	幂分布充分统计量	★★★
5	教材 5.5-10	$N (μ, σ^{2})$ 单参数情形	★★★
6	教材 5.5-11	$U (θ_{1}, θ_{2})$ 充分统计量	★★★
7	补充（教材5.5-3）	离散分布次序统计量与频数	★★★
8	补充（教材5.5-15）	指数族分布充分统计量	★★★
9	补充（教材5.5-17）	二元正态分布充分统计量	★★★★
10	补充（教材5.5-19）	两参数指数分布充分统计量	★★★

习题1（教材 5.5-1）：几何分布 $G e (θ)$ 的充分统计量

习题 1

设 $X_{1}, X_{2}, \dots, X_{n}$ 是来自几何分布 $G e (θ)$ 的 i.i.d. 样本，其概率函数为
$P (X = x; θ) = θ (1 - θ)^{x - 1}, x = 1, 2, 3, \dots$
求 $θ$ 的充分统计量。

查看解答

解：写出联合概率函数
$P (X_{1} = x_{1}, \dots, X_{n} = x_{n}; θ) = i = 1 \prod n θ (1 - θ)^{x_{i} - 1} = θ^{n} (1 - θ)^{\sum_{i = 1}^{n} (x_{i} - 1)}$ $= θ^{n} (1 - θ)^{\sum x_{i} - n}$
令 $T = \sum_{i = 1}^{n} X_{i}$ ，则
$P = g (T, θ) θ^{n} (1 - θ)^{T - n} \cdot h (x_{1}, \dots, x_{n}) 1$
$g$ 仅通过 $T$ 依赖于样本， $h$ 不含 $θ$ 。因此 $T = \sum_{i = 1}^{n} X_{i}$ 是 $θ$ 的充分统计量。

补充： $T = \sum X_{i} \sim N b (n, θ)$ （负二项分布），给定 $T = t$ 时，
$P (X_{1} = x_{1}, \dots, X_{n} = x_{n} ∣ T = t) = \frac{1}{( t n + t - 1 )}$
与 $θ$ 无关，验证了充分性。

习题2（教材 5.5-2）：泊松分布 $P (λ)$ 的充分统计量

习题 2

设 $X_{1}, X_{2}, \dots, X_{n}$ 是来自泊松分布 $P (λ)$ 的 i.i.d. 样本。求 $λ$ 的充分统计量。

查看解答

解：联合概率函数为
$P (X_{1} = x_{1}, \dots, X_{n} = x_{n}; λ) = i = 1 \prod n \frac{λ ^{x_{i}} e ^{- λ}}{x _{i} !} = \frac{λ ^{\sum x_{i}} e ^{- nλ}}{\prod _{i = 1}^{n} x _{i} !}$
令 $T = \sum_{i = 1}^{n} X_{i}$ ，则
$P = g (T, λ) λ^{T} e^{- nλ} \cdot h (x_{1}, \dots, x_{n}) \frac{1}{\prod _{i = 1}^{n} x _{i} !}$
$g$ 仅通过 $T$ 依赖于样本， $h$ 不含 $λ$ 。因此 $T = \sum_{i = 1}^{n} X_{i}$ 是 $λ$ 的充分统计量。

补充： $T \sim P (nλ)$ ，给定 $T = t$ 时，
$P (X_{1} = x_{1}, \dots, X_{n} = x_{n} ∣ T = t) = \frac{t !}{n ^{t} \prod _{i = 1}^{n} x _{i} !}$
与 $λ$ 无关。

习题3（教材 5.5-4）： $N (μ, 1)$ 的充分统计量

习题 3

设 $X_{1}, X_{2}, \dots, X_{n}$ 是来自 $N (μ, 1)$ 的 i.i.d. 样本。证明 $T = \sum_{i = 1}^{n} X_{i}$ （或等价地 $\overset{ˉ}{X}$ ）是 $μ$ 的充分统计量。

查看解答

证明：联合密度为
$f (x_{1}, \dots, x_{n}; μ) = (2 π)^{- n /2} exp {- \frac{1}{2} i = 1 \sum n (x_{i} - μ)^{2}}$
展开 $\sum (x_{i} - μ)^{2} = \sum x_{i}^{2} - 2 μ \sum x_{i} + n μ^{2}$ ，令 $T = \sum x_{i}$ ：
$f = (2 π)^{- n /2} exp {- \frac{1}{2} \sum x_{i}^{2} + μ T - \frac{n μ ^{2}}{2}}$ $= g (T, μ) exp {μ T - \frac{n μ ^{2}}{2}} \cdot h (x_{1}, \dots, x_{n}) (2 π)^{- n /2} exp {- \frac{1}{2} \sum x_{i}^{2}}$
$g$ 仅通过 $T = \sum X_{i}$ 依赖于样本， $h$ 不含 $μ$ 。因此 $T = \sum_{i = 1}^{n} X_{i}$ 是 $μ$ 的充分统计量。

由定理 5.5.2， $\overset{ˉ}{X} = T / n$ 也是 $μ$ 的充分统计量。 $□$

习题4（教材 5.5-5）：幂分布的充分统计量

习题 4

设 $X_{1}, X_{2}, \dots, X_{n}$ 是来自幂分布的 i.i.d. 样本，密度函数为
$p (x; θ) = θ x^{θ - 1}, 0 < x < 1, θ > 0$
求 $θ$ 的充分统计量。

查看解答

解：联合密度为
$f (x_{1}, \dots, x_{n}; θ) = i = 1 \prod n θ x_{i}^{θ - 1} = θ^{n} (i = 1 \prod n x_{i})^{θ - 1}$
令 $T = \prod_{i = 1}^{n} X_{i}$ ，则
$f = g (T, θ) θ^{n} \cdot T^{θ - 1} \cdot h (x_{1}, \dots, x_{n}) 1$
$g$ 仅通过 $T$ 依赖于样本， $h$ 不含 $θ$ 。因此 $T = \prod_{i = 1}^{n} X_{i}$ 是 $θ$ 的充分统计量。

等价形式：取对数 $ln T = \sum_{i = 1}^{n} ln X_{i}$ ，由定理 5.5.2（一一变换）， $T^{'} = \sum_{i = 1}^{n} ln X_{i}$ 也是 $θ$ 的充分统计量。

习题5（教材 5.5-10）： $N (μ, σ^{2})$ 单参数情形

习题 5

设 $X_{1}, X_{2}, \dots, X_{n}$ 是来自 $N (μ, σ^{2})$ 的 i.i.d. 样本。

(1) 当 $μ$ 已知时，求 $σ^{2}$ 的充分统计量。

(2) 当 $σ^{2}$ 已知时，求 $μ$ 的充分统计量。

查看解答

解 (1)： $μ$ 已知时，联合密度为
$f = (2 π σ^{2})^{- n /2} exp {- \frac{1}{2 σ ^{2}} i = 1 \sum n (x_{i} - μ)^{2}}$
令 $T = \sum_{i = 1}^{n} (X_{i} - μ)^{2}$ ，则
$f = g (T, σ^{2}) (2 π σ^{2})^{- n /2} exp {- \frac{T}{2 σ ^{2}}} \cdot h (x_{1}, \dots, x_{n}) 1$
因此 $T = \sum_{i = 1}^{n} (X_{i} - μ)^{2}$ 是 $σ^{2}$ 的充分统计量。

解 (2)： $σ^{2}$ 已知时，联合密度为
$f = (2 π σ^{2})^{- n /2} exp {- \frac{1}{2 σ ^{2}} i = 1 \sum n (x_{i} - μ)^{2}}$
展开 $\sum (x_{i} - μ)^{2} = \sum x_{i}^{2} - 2 μ \sum x_{i} + n μ^{2}$ ，令 $T = \overset{ˉ}{X} = \frac{1}{n} \sum X_{i}$ ：
$f = g (T, μ) (2 π σ^{2})^{- n /2} exp {- \frac{1}{2 σ ^{2}} \sum x_{i}^{2} + \frac{n μ}{σ ^{2}} T - \frac{n μ ^{2}}{2 σ ^{2}}} \cdot h (x_{1}, \dots, x_{n}) 1$
注意 $\sum x_{i}^{2} = \sum (x_{i} - \overset{x}{ˉ})^{2} + n \overset{x}{ˉ}^{2}$ ，其中 $\sum (x_{i} - \overset{x}{ˉ})^{2}$ 不含 $μ$ ，可以归入 $h$ 。因此 $T = \overset{ˉ}{X}$ 是 $μ$ 的充分统计量。

习题6（教材 5.5-11）： $U (θ_{1}, θ_{2})$ 的充分统计量

习题 6

设 $X_{1}, X_{2}, \dots, X_{n}$ 是来自均匀分布 $U (θ_{1}, θ_{2})$ 的 i.i.d. 样本， $- \infty < θ_{1} < θ_{2} < + \infty$ 。求 $(θ_{1}, θ_{2})$ 的充分统计量。

查看解答

解：联合密度为
$f (x_{1}, \dots, x_{n}; θ_{1}, θ_{2}) = i = 1 \prod n \frac{1}{θ _{2} - θ _{1}} 1_{(θ_{1}, θ_{2})} (x_{i}) = \frac{1}{( θ _{2} - θ _{1} ) ^{n}} 1_{(θ_{1}, θ_{2})} (x_{(1)}) 1_{(θ_{1}, θ_{2})} (x_{(n)})$
其中 $x_{(1)} = min {x_{1}, \dots, x_{n}}$ ， $x_{(n)} = max {x_{1}, \dots, x_{n}}$ 。

指示函数 $1_{(θ_{1}, θ_{2})} (x_{(1)}) 1_{(θ_{1}, θ_{2})} (x_{(n)})$ 等价于 $1_{θ_{1} < x_{(1)}} \cdot 1_{x_{(n)} < θ_{2}}$ 。

令 $T = (X_{(1)}, X_{(n)})$ ，则
$f = g (T, θ_{1}, θ_{2}) \frac{1}{( θ _{2} - θ _{1} ) ^{n}} 1_{θ_{1} < x_{(1)}} 1_{x_{(n)} < θ_{2}} \cdot h (x_{1}, \dots, x_{n}) 1$
$g$ 仅通过 $(X_{(1)}, X_{(n)})$ 依赖于样本， $h$ 不含参数。因此 $T = (X_{(1)}, X_{(n)})$ 是 $(θ_{1}, θ_{2})$ 的充分统计量。

习题7（补充，教材 5.5-3）：离散分布次序统计量与频数的充分性

习题 7

设 $X_{1}, X_{2}, \dots, X_{n}$ 是来自离散分布的 i.i.d. 样本， $X_{i}$ 取值为 $a_{1}, a_{2}, \dots, a_{k}$ ，对应概率为 $p_{1} (θ), p_{2} (θ), \dots, p_{k} (θ)$ 。证明：

(1) 次序统计量 $(X_{(1)}, X_{(2)}, \dots, X_{(n)})$ 是 $θ$ 的充分统计量。

(2) 频数向量 $(n_{1}, n_{2}, \dots, n_{k})$ （其中 $n_{j} = # {i : X_{i} = a_{j}}$ ）也是 $θ$ 的充分统计量。

查看解答

证明 (1)：联合概率函数为
$P (X_{1} = x_{1}, \dots, X_{n} = x_{n}; θ) = i = 1 \prod n p_{j_{i}} (θ)$
其中 $j_{i}$ 满足 $x_{i} = a_{j_{i}}$ 。

令 $T = (X_{(1)}, \dots, X_{(n)})$ （次序统计量），则
$P = g (T, θ) i = 1 \prod n p_{j_{i}} (θ) \cdot h (x_{1}, \dots, x_{n}) 1$
$g$ 仅通过次序统计量 $T$ 依赖于样本（因为乘积中每个因子的值由 $T$ 完全确定）， $h$ 不含 $θ$ 。因此次序统计量是充分统计量。

证明 (2)：设频数 $n_{j} = # {i : X_{i} = a_{j}}$ ，则 $\sum_{j = 1}^{k} n_{j} = n$ 。
$P = j = 1 \prod k p_{j} (θ)^{n_{j}}$
令 $T^{'} = (n_{1}, n_{2}, \dots, n_{k})$ ，则
$P = g (T^{'}, θ) j = 1 \prod k p_{j} (θ)^{n_{j}} \cdot h (x_{1}, \dots, x_{n}) 1$
$g$ 仅通过频数向量 $T^{'}$ 依赖于样本， $h$ 不含 $θ$ 。因此频数向量也是充分统计量。 $□$

习题8（补充，教材 5.5-15）：指数族分布的充分统计量

习题 8

设 $X_{1}, X_{2}, \dots, X_{n}$ 是来自指数族分布的 i.i.d. 样本，其概率函数为
$p (x; θ) = C (θ) exp {j = 1 \sum k Q_{j} (θ) T_{j} (x)} h (x)$
证明充分统计量为 $T = (\sum_{i = 1}^{n} T_{1} (X_{i}), \dots, \sum_{i = 1}^{n} T_{k} (X_{i}))$ 。

查看解答

证明：联合概率函数为
$p (x_{1}, \dots, x_{n}; θ) = i = 1 \prod n [C (θ) exp {j = 1 \sum k Q_{j} (θ) T_{j} (x_{i})} h (x_{i})]$ $= C (θ)^{n} exp {j = 1 \sum k Q_{j} (θ) i = 1 \sum n T_{j} (x_{i})} i = 1 \prod n h (x_{i})$
令 $S_{j} = \sum_{i = 1}^{n} T_{j} (X_{i})$ （ $j = 1, 2, \dots, k$ ）， $T = (S_{1}, \dots, S_{k})$ ，则
$p = g (T, θ) C (θ)^{n} exp {j = 1 \sum k Q_{j} (θ) S_{j}} \cdot h^{*} (x_{1}, \dots, x_{n}) i = 1 \prod n h (x_{i})$
$g$ 仅通过 $T = (S_{1}, \dots, S_{k})$ 依赖于样本， $h^{*}$ 不含 $θ$ 。因此 $T$ 是 $θ$ 的充分统计量。 $□$

习题9（补充，教材 5.5-17）：二元正态分布的充分统计量

习题 9

设 $(X_{1}, Y_{1}), (X_{2}, Y_{2}), \dots, (X_{n}, Y_{n})$ 是来自二元正态分布 $N (μ_{1}, μ_{2}, σ_{1}^{2}, σ_{2}^{2}, ρ)$ 的 i.i.d. 样本。求五个参数 $(μ_{1}, μ_{2}, σ_{1}^{2}, σ_{2}^{2}, ρ)$ 的充分统计量。

查看解答

解：二元正态分布的联合密度为
$f (x, y) = \frac{1}{2 π σ _{1} σ _{2} 1 - ρ ^{2}} exp {- \frac{1}{2 ( 1 - ρ ^{2} )} [\frac{( x - μ _{1} ) ^{2}}{σ _{1}^{2}} - \frac{2 ρ ( x - μ _{1} ) ( y - μ _{2} )}{σ _{1} σ _{2}} + \frac{( y - μ _{2} ) ^{2}}{σ _{2}^{2}}]}$
样本的联合密度中，指数部分展开后，所有含参数的项可以整理为以下五个统计量的函数：

$\sum_{i = 1}^{n} X_{i}$ （含 $μ_{1}$ ）

$\sum_{i = 1}^{n} X_{i}^{2}$ （含 $σ_{1}^{2}$ ）

$\sum_{i = 1}^{n} Y_{i}$ （含 $μ_{2}$ ）

$\sum_{i = 1}^{n} Y_{i}^{2}$ （含 $σ_{2}^{2}$ ）

$\sum_{i = 1}^{n} X_{i} Y_{i}$ （含 $ρ$ ）

因此，五个参数的充分统计量为
$T = (i = 1 \sum n X_{i}, i = 1 \sum n X_{i}^{2}, i = 1 \sum n Y_{i}, i = 1 \sum n Y_{i}^{2}, i = 1 \sum n X_{i} Y_{i})$

习题10（补充，教材 5.5-19）：两参数指数分布的充分统计量

习题 10

设 $X_{1}, X_{2}, \dots, X_{n}$ 是来自两参数指数分布的 i.i.d. 样本，密度函数为
$p (x; θ, μ) = \frac{1}{θ} e^{- (x - μ) / θ}, x > μ, θ > 0$
求 $(θ, μ)$ 的充分统计量。

查看解答

解：联合密度为
$f (x_{1}, \dots, x_{n}; θ, μ) = i = 1 \prod n \frac{1}{θ} e^{- (x_{i} - μ) / θ} 1_{x_{i} > μ}$ $= \frac{1}{θ ^{n}} exp {- \frac{1}{θ} i = 1 \sum n (x_{i} - μ)} 1_{x_{(1)} > μ}$ $= \frac{1}{θ ^{n}} exp {- \frac{\sum x _{i} - n μ}{θ}} 1_{x_{(1)} > μ}$
令 $T_{1} = X_{(1)} = min {X_{1}, \dots, X_{n}}$ ， $T_{2} = \sum_{i = 1}^{n} X_{i}$ ，则
$f = g (T_{1}, T_{2}; θ, μ) \frac{1}{θ ^{n}} exp {- \frac{T _{2} - n μ}{θ}} 1_{T_{1} > μ} \cdot h (x_{1}, \dots, x_{n}) 1$
$g$ 仅通过 $(T_{1}, T_{2})$ 依赖于样本， $h$ 不含参数。因此 $(X_{(1)}, \sum_{i = 1}^{n} X_{i})$ 是 $(θ, μ)$ 的充分统计量。

由定理 5.5.2， $(X_{(1)}, \overset{ˉ}{X})$ 也是 $(θ, μ)$ 的充分统计量。

模块十：教材原文

第五章统计量及其分布/充分统计量

数学笔记 Wiki

探索

5.5 充分统计量

5.5 充分统计量

模块一：充分性的直观概念

Fisher vs Eddington 争论

核心思想：充分性 = 样本加工不损失信息

模块二：充分统计量的定义

概率层面的分析

模块三：因子分解定理

概率函数

Neyman-Fisher 因子分解定理

必要性证明

充分性证明

因子分解定理的应用

模块四：充分统计量的性质

充分性原则

模块五：常见分布的充分统计量汇总

指数族分布的充分统计量

模块六：知识结构总览

模块七：核心思想与技巧

因子分解定理使用技巧

充分统计量判断流程图

模块八：补充理解与易混淆点

充分统计量与完备统计量混淆

因子分解定理中 g 和 h 的角色混淆

充分统计量维数与参数维数的关系

模块九：习题精选

习题1（教材 5.5-1）：几何分布 Ge(θ) 的充分统计量

习题2（教材 5.5-2）：泊松分布 P(λ) 的充分统计量

习题3（教材 5.5-4）：N(μ,1) 的充分统计量

习题4（教材 5.5-5）：幂分布的充分统计量

习题5（教材 5.5-10）：N(μ,σ2) 单参数情形

习题6（教材 5.5-11）：U(θ1​,θ2​) 的充分统计量

习题7（补充，教材 5.5-3）：离散分布次序统计量与频数的充分性

习题8（补充，教材 5.5-15）：指数族分布的充分统计量

习题9（补充，教材 5.5-17）：二元正态分布的充分统计量

习题10（补充，教材 5.5-19）：两参数指数分布的充分统计量

模块十：教材原文

关系图谱

目录

反向链接

因子分解定理中 $g$ 和 $h$ 的角色混淆

习题1（教材 5.5-1）：几何分布 $G e (θ)$ 的充分统计量

习题2（教材 5.5-2）：泊松分布 $P (λ)$ 的充分统计量

习题3（教材 5.5-4）： $N (μ, 1)$ 的充分统计量

习题5（教材 5.5-10）： $N (μ, σ^{2})$ 单参数情形

习题6（教材 5.5-11）： $U (θ_{1}, θ_{2})$ 的充分统计量