6.4 最小方差无偏估计

本节概览

本节在§6.1无偏性的基础上，进一步回答”在所有无偏估计中，哪个最好？“这一核心问题。主要内容包括三个层次：

问题提出：无偏估计不唯一，需要引入一致最小方差无偏估计（UMVUE）的概念来选择最优者

理论工具：Rao-Blackwell定理（用充分统计量改善估计）和Lehmann-Scheffé定理（充分完备统计量的函数即为UMVUE）

应用方法：三种求解方法及常见分布的UMVUE汇总

逻辑链条：问题提出 → UMVUE定义 → Rao-Blackwell定理 → Lehmann-Scheffé定理 → 充分完备统计量 → 求解方法 → 应用汇总

前置依赖：§6.1（无偏性、MSE分解）、§5.5（充分统计量、因子分解定理）

核心主线：UMVUE是无偏估计中的”最优”估计。Rao-Blackwell定理告诉我们：用充分统计量改善无偏估计，方差不会增大；Lehmann-Scheffé定理进一步指出：充分完备统计量的无偏函数就是UMVUE。

一、从无偏估计到最优无偏估计

无偏估计的方差可以不同

在§6.1中我们已经知道，同一个参数可以有无穷多个无偏估计。例如， $X_{1}, X_{2}, \dots, X_{n}$ 来自总体 $X$ ， $E (X) = μ$ ，则 $\overset{ˉ}{X}$ 、 $X_{1}$ 、 $\frac{1}{3} X_{1} + \frac{2}{3} X_{2}$ 都是 $μ$ 的无偏估计。

但它们的方差不同：

Var (\overset{ˉ}{X}) = \frac{σ ^{2}}{n}, Var (X_{1}) = σ^{2}, Var (\frac{1}{3} X_{1} + \frac{2}{3} X_{2}) = \frac{5 σ ^{2}}{9}

显然 $Var (\overset{ˉ}{X}) < Var (X_{1})$ （ $n \geq 2$ ），所以 $\overset{ˉ}{X}$ 比 $X_{1}$ 更”集中”在真值附近。

引入最小方差无偏估计的需求

核心问题：在所有无偏估计中，能否找到一个方差最小的？

回忆§6.1五、均方误差的MSE分解：

MSE (\hat{θ}) = Var (\hat{θ}) + [Bias (\hat{θ})]^{2}

对于无偏估计， $Bias = 0$ ，所以 $MSE = Var$ 。因此在无偏估计类中，方差最小等价于均方误差最小。

例 6.4.1 — 均匀分布中不同无偏估计的比较

设 $X_{1}, X_{2}, \dots, X_{n}$ 来自 $U (0, θ)$ ， $θ > 0$ 。

已知 $\hat{θ} = \frac{n + 1}{n} X_{(n)}$ 是 $θ$ 的无偏估计（见§6.1），其方差为
$Var (\hat{θ}) = \frac{θ ^{2}}{n ( n + 2 )}$
考虑更一般的估计量 $\hat{θ}_{α} = α \cdot X_{(n)}$ ，其中 $α$ 为常数。其均方误差为
$MSE (\hat{θ}_{α}) = α^{2} Var (X_{(n)}) + (α E (X_{(n)}) - θ)^{2}$ $= α^{2} \cdot \frac{n θ ^{2}}{( n + 1 ) ^{2} ( n + 2 )} + (α \cdot \frac{n θ}{n + 1} - θ)^{2}$
令 $\frac{d}{d α} MSE (\hat{θ}_{α}) = 0$ ，解得最优 $α_{0} = \frac{n + 2}{n + 1}$ ，此时
$MSE (\hat{θ}_{α_{0}}) = \frac{θ ^{2}}{( n + 1 ) ^{2}} < \frac{θ ^{2}}{n ( n + 2 )} = MSE (\hat{θ})$
这说明：虽然 $\hat{θ}_{α_{0}}$ 是有偏估计，但其MSE更小。然而如果我们限定在无偏估计类中， $\hat{θ} = \frac{n + 1}{n} X_{(n)}$ 仍然是最好的选择之一。

二、UMVUE的定义

一致最小方差无偏估计

定义 6.4.1 — 一致最小方差无偏估计（UMVUE）

设 $\hat{θ}^{*} = \hat{θ}^{*} (X_{1}, X_{2}, \dots, X_{n})$ 是参数 $θ$ 的一个无偏估计量。若对 $θ$ 的任意无偏估计量 $\tilde{θ}$ ，都有
$Var_{θ} (\hat{θ}^{*}) \leq Var_{θ} (\tilde{θ}), \forall θ \in Θ$
则称 $\hat{θ}^{*}$ 是 $θ$ 的一致最小方差无偏估计（Uniformly Minimum Variance Unbiased Estimator，简称 UMVUE）。

关键词解析：

一致（Uniformly）：不等式对所有 $θ \in Θ$ 成立，不是只对某个特定 $θ$ 成立
最小方差：在所有无偏估计中，方差最小
无偏：限定在无偏估计类中比较

UMVUE的唯一性

定理 6.4.1 — UMVUE的唯一性

若 $\hat{θ}_{1}^{*}$ 和 $\hat{θ}_{2}^{*}$ 都是 $g (θ)$ 的 UMVUE，则
$P_{θ} (\hat{θ}_{1}^{*} = \hat{θ}_{2}^{*}) = 1, \forall θ \in Θ$
即 UMVUE 若存在，则在概率1的意义下唯一。

证明

证明： 第一步：构造差估计量

令 $\hat{θ}^{*} = \hat{θ}_{1}^{*} - \hat{θ}_{2}^{*}$ ，则
$E (\hat{θ}^{*}) = E (\hat{θ}_{1}^{*}) - E (\hat{θ}_{2}^{*}) = g (θ) - g (θ) = 0$
即 $\hat{θ}^{*}$ 是 $0$ 的无偏估计。

第二步：利用UMVUE性质

由于 $\hat{θ}_{1}^{*}$ 是 UMVUE，而 $0$ 也是 $g (θ)$ 的无偏估计（不， $0$ 不是 $g (θ)$ 的无偏估计）。

重新考虑：令 $W = \hat{θ}_{1}^{*} - \hat{θ}_{2}^{*}$ ，则 $E (W) = 0$ 。

第三步：利用方差关系
$Var (\hat{θ}_{1}^{*}) = Var (\hat{θ}_{2}^{*} + W) = Var (\hat{θ}_{2}^{*}) + Var (W) + 2 Cov (\hat{θ}_{2}^{*}, W)$
考虑 $\hat{θ}_{3}^{*} = \hat{θ}_{1}^{*} - W = \hat{θ}_{2}^{*}$ ，这没有新信息。

更直接地：由 $E (W) = 0$ ，考虑估计量 $\hat{θ}_{1}^{*} - c W$ （ $c$ 为任意常数），它也是 $g (θ)$ 的无偏估计。由 UMVUE 的最小方差性：
$Var (\hat{θ}_{1}^{*}) \leq Var (\hat{θ}_{1}^{*} - c W) = Var (\hat{θ}_{1}^{*}) + c^{2} Var (W) - 2 c Cov (\hat{θ}_{1}^{*}, W)$
这要求 $c^{2} Var (W) - 2 c Cov (\hat{θ}_{1}^{*}, W) \geq 0$ 对一切 $c$ 成立。

第四步：推出 $Var (W) = 0$

由二次函数非负的条件，判别式 $\leq 0$ ：
$4 [Cov (\hat{θ}_{1}^{*}, W)]^{2} - 4 Var (W) \cdot 0 \leq 0$
即 $Cov (\hat{θ}_{1}^{*}, W) = 0$ 。

因此 $c^{2} Var (W) \geq 0$ 对一切 $c$ 成立，且取 $c = 1$ 时 $Var (W) \geq 0$ 。

但由 $\hat{θ}_{1}^{*}$ 是 UMVUE， $Var (\hat{θ}_{1}^{*}) \leq Var (\hat{θ}_{2}^{*})$ ；同理 $Var (\hat{θ}_{2}^{*}) \leq Var (\hat{θ}_{1}^{*})$ 。

所以 $Var (\hat{θ}_{1}^{*}) = Var (\hat{θ}_{2}^{*})$ ，代入方差展开式得 $Var (W) = 0$ 。

第五步：得出结论

$Var (W) = 0$ 且 $E (W) = 0$ ，由 Chebyshev 不等式， $P (W = 0) = 1$ ，即 $P (\hat{θ}_{1}^{*} = \hat{θ}_{2}^{*}) = 1$ 。

$□$

UMVUE的等价判定条件

定理 6.4.2 — UMVUE的零估计量判定

无偏估计 $\hat{θ}^{*}$ 是 UMVUE 的充要条件是：对任意满足 $E_{θ} [l (X)] = 0$ （ $\forall θ \in Θ$ ）且 $Var_{θ} (l (X)) < + \infty$ 的统计量 $l (X)$ ，都有
$Cov_{θ} (\hat{θ}^{*}, l (X)) = E_{θ} [\hat{θ}^{*} \cdot l (X)] = 0, \forall θ \in Θ$

例 6.4.2 — 指数分布均值的UMVUE

设 $X_{1}, X_{2}, \dots, X_{n}$ 来自指数分布 $Exp (1/ θ)$ （即 $f (x) = \frac{1}{θ} e^{- x / θ}$ ， $x > 0$ ）， $θ > 0$ 。

令 $T = \sum_{i = 1}^{n} X_{i}$ ，则 $T \sim Ga (n, 1/ θ)$ ， $E (T) = n θ$ 。

因此 $\overset{ˉ}{X} = T / n$ 是 $θ$ 的无偏估计。

可以验证 $\overset{ˉ}{X}$ 是充分完备统计量 $T$ 的函数，由 Lehmann-Scheffé 定理（下文详述）， $\overset{ˉ}{X}$ 是 $θ$ 的 UMVUE。

三、Rao-Blackwell定理

定理陈述

定理 6.4.3 — Rao-Blackwell定理

设 $X_{1}, X_{2}, \dots, X_{n}$ 来自分布 $f (x; θ)$ ， $T = T (X_{1}, X_{2}, \dots, X_{n})$ 是 $θ$ 的充分统计量。设 $\hat{θ}$ 是 $g (θ)$ 的一个无偏估计，且 $Var_{θ} (\hat{θ}) < \infty$ 。定义
$\tilde{θ} = E (\hat{θ} ∣ T)$
则：

$\tilde{θ}$ 仍是 $g (θ)$ 的无偏估计

$Var_{θ} (\tilde{θ}) \leq Var_{θ} (\hat{θ})$ ，等号成立当且仅当 $\hat{θ}$ 本身就是 $T$ 的函数（即 $\hat{θ}$ 已经是充分统计量的函数）

进一步，若 $T$ 是最小充分统计量，则 $\tilde{θ}$ 不依赖于初始 $\hat{θ}$ 的选择。

完整证明

证明

证明：

第一步：证明无偏性

由条件期望的塔牌性质（全期望公式）：
$E (\tilde{θ}) = E [E (\hat{θ} ∣ T)] = E (\hat{θ}) = g (θ)$
因此 $\tilde{θ}$ 是 $g (θ)$ 的无偏估计。

第二步：方差分解

利用条件方差公式：
$Var (\hat{θ}) = Var (E (\hat{θ} ∣ T)) + E (Var (\hat{θ} ∣ T))$
即
$Var (\hat{θ}) = Var (\tilde{θ}) + E (Var (\hat{θ} ∣ T))$
第三步：分析方差关系

由于 $E (Var (\hat{θ} ∣ T)) \geq 0$ （方差非负），故
$Var (\tilde{θ}) = Var (\hat{θ}) - E (Var (\hat{θ} ∣ T)) \leq Var (\hat{θ})$
第四步：等号条件

等号成立当且仅当 $E (Var (\hat{θ} ∣ T)) = 0$ ，即 $Var (\hat{θ} ∣ T) = 0$ （a.s.），这意味着在给定 $T$ 的条件下， $\hat{θ}$ 几乎处处为常数，即 $\hat{θ}$ 是 $T$ 的函数。

$□$

直观理解

生活化类比：想象你是一个侦探，要估计嫌疑人的身高 $θ$ 。你手头有两类线索：

原始估计 $\hat{θ}$ ：基于零散的、可能冗余的线索做出的初步判断
充分统计量 $T$ ：所有线索的”精华摘要”——包含了样本中关于 $θ$ 的全部信息

Rao-Blackwell定理告诉我们：与其用零散线索做判断，不如先整理出精华摘要 $T$ ，再基于 $T$ 做判断。这样做的结果 $\tilde{θ} = E (\hat{θ} ∣ T)$ 不会更差，而且通常更好。

数学上， $Var (\hat{θ}) = Var (\tilde{θ}) + E (Var (\hat{θ} ∣ T))$ ，第二项 $E (Var (\hat{θ} ∣ T))$ 就是”零散线索中无法被充分统计量解释的随机波动”，把它去掉后方差自然更小。

例 6.4.3 — 二项分布参数平方的UMVUE（Rao-Blackwell方法）

设 $X_{1}, X_{2}, \dots, X_{n}$ 来自二点分布 $b (1, p)$ ，求 $p^{2}$ 的 UMVUE。

解：

第一步：找一个无偏估计

注意到 $E (X_{1} X_{2}) = P (X_{1} = 1, X_{2} = 1) = p \cdot p = p^{2}$ 。

所以 $\hat{θ}_{1} = X_{1} X_{2}$ 是 $p^{2}$ 的一个无偏估计。

第二步：找充分统计量

由因子分解定理， $T = \sum_{i = 1}^{n} X_{i}$ 是 $p$ 的充分统计量（也是完备统计量）。

第三步：用Rao-Blackwell改善
$\tilde{θ} = E (\hat{θ}_{1} ∣ T = t) = P (X_{1} = 1, X_{2} = 1 ∣ T = t)$ $= \frac{P ( X _{1} = 1 , X _{2} = 1 , \sum _{i = 3}^{n} X _{i} = t - 2 )}{P ( T = t )}$ $= \frac{p \cdot p \cdot ( t - 2 n - 2 ) p ^{t - 2} ( 1 - p ) ^{n - t}}{( t n ) p ^{t} ( 1 - p ) ^{n - t}}$ $= \frac{( t - 2 n - 2 )}{( t n )} = \frac{t ( t - 1 )}{n ( n - 1 )}$
第四步：写出UMVUE

将 $t = \sum_{i = 1}^{n} x_{i}$ 代入：
$\hat{θ}^{*} = \frac{T ( T - 1 )}{n ( n - 1 )} = \frac{X ˉ ( X ˉ - \frac{1}{n} )}{1 - \frac{1}{n}} \cdot \frac{1}{n}$
即 $\hat{θ}^{*} = \frac{T ( T - 1 )}{n ( n - 1 )}$ 是 $p^{2}$ 的 UMVUE。

验证方差减小： $Var (\hat{θ}^{*}) < Var (\hat{θ}_{1})$ （因为 $\hat{θ}_{1}$ 不是 $T$ 的函数）。

四、Lehmann-Scheffé定理

定理陈述

定理 6.4.4 — Lehmann-Scheffé定理

设 $T$ 是参数 $θ$ 的一个充分完备统计量。若 $\hat{θ} = \hat{θ} (T)$ 是 $g (θ)$ 的某个无偏估计，且 $\hat{θ}$ 是 $T$ 的函数，则 $\hat{θ}$ 是 $g (θ)$ 的UMVUE，且在概率1的意义下唯一。

完整证明

证明

证明：

第一步：设 $\tilde{θ}$ 为 $g (θ)$ 的任意无偏估计

设 $\tilde{θ}$ 是 $g (θ)$ 的任意无偏估计，我们需要证明 $Var (\hat{θ}) \leq Var (\tilde{θ})$ 。

第二步：对 $\tilde{θ}$ 做Rao-Blackwell改善

令 $\tilde{θ}^{*} = E (\tilde{θ} ∣ T)$ 。由 Rao-Blackwell 定理：

$\tilde{θ}^{*}$ 是 $g (θ)$ 的无偏估计

$Var (\tilde{θ}^{*}) \leq Var (\tilde{θ})$

$\tilde{θ}^{*}$ 是 $T$ 的函数

第三步：利用完备性证明唯一性

由于 $\hat{θ}$ 和 $\tilde{θ}^{*}$ 都是 $g (θ)$ 的无偏估计，且都是 $T$ 的函数，故
$E (\hat{θ} - \tilde{θ}^{*}) = g (θ) - g (θ) = 0, \forall θ \in Θ$
由 $T$ 的完备性：若 $E_{θ} [h (T)] = 0$ （ $\forall θ$ ），则 $P (h (T) = 0) = 1$ 。

令 $h (T) = \hat{θ} - \tilde{θ}^{*}$ ，则 $E [h (T)] = 0$ ，由完备性得
$P (\hat{θ} = \tilde{θ}^{*}) = 1$
第四步：得出结论

因此 $Var (\hat{θ}) = Var (\tilde{θ}^{*}) \leq Var (\tilde{θ})$ 。

由于 $\tilde{θ}$ 是任意的，故 $\hat{θ}$ 是 UMVUE，且在概率1意义下唯一。

$□$

与Rao-Blackwell定理的关系

	Rao-Blackwell定理	Lehmann-Scheffé定理
条件	充分统计量	充分完备统计量
结论	改善后的估计方差更小	改善后的估计是UMVUE
唯一性	不保证	保证（概率1意义下）
作用	”改善”工具	”找到最优”工具

逻辑关系：Lehmann-Scheffé定理 = Rao-Blackwell定理 + 完备性。Rao-Blackwell定理只能保证”改善”，但不知道改善到什么程度；加上完备性后，可以保证改善后的结果是唯一的、最优的。

例 6.4.4 — 正态总体方差的UMVUE

设 $X_{1}, X_{2}, \dots, X_{n} \sim N (μ, σ^{2})$ ， $μ$ 未知，求 $σ^{2}$ 的 UMVUE。

解：

第一步：找充分完备统计量

由指数族理论， $(\overset{ˉ}{X}, \sum_{i = 1}^{n} (X_{i} - \overset{ˉ}{X})^{2})$ 是 $(μ, σ^{2})$ 的充分完备统计量。

第二步：找一个无偏估计

$S^{2} = \frac{1}{n - 1} \sum_{i = 1}^{n} (X_{i} - \overset{ˉ}{X})^{2}$ 是 $σ^{2}$ 的无偏估计（§6.1已证）。

第三步：验证是充分完备统计量的函数

$S^{2}$ 是 $\sum_{i = 1}^{n} (X_{i} - \overset{ˉ}{X})^{2}$ 的函数，而后者是充分完备统计量的分量。

结论：由 Lehmann-Scheffé 定理， $S^{2}$ 是 $σ^{2}$ 的 UMVUE。

五、充分完备统计量

完备统计量的定义

定义 6.4.2 — 完备统计量

设 $T = T (X_{1}, X_{2}, \dots, X_{n})$ 是参数 $θ$ 的统计量。若对任意满足
$E_{θ} [h (T)] = 0, \forall θ \in Θ$
的函数 $h$ ，都有
$P_{θ} (h (T) = 0) = 1, \forall θ \in Θ$
则称 $T$ 是 $θ$ 的完备统计量。

直观理解：完备性意味着统计量 $T$ 中不包含”多余信息”——不存在非零函数 $h$ 使得 $h (T)$ 的期望恒为零。换句话说， $T$ 的分布族足够”丰富”，不会”丢失”关于 $θ$ 的信息。

生活化类比：如果 $T$ 是一份案件摘要，完备性意味着——如果两个不同的侦探从同一份摘要中得出了”期望差异为零”的结论，那他们实际上看到的是同一个东西（概率为1）。摘要足够完整，不会产生”虚假的零差异”。

充分完备统计量

定义 6.4.3 — 充分完备统计量

若统计量 $T$ 既是 $θ$ 的充分统计量，又是 $θ$ 的完备统计量，则称 $T$ 为 $θ$ 的充分完备统计量。

常见分布的充分完备统计量

分布	参数	充分完备统计量
$N (μ, σ^{2})$ （ $σ^{2}$ 已知）	$μ$	$\overset{ˉ}{X} = \frac{1}{n} \sum X_{i}$
$N (μ, σ^{2})$ （ $μ$ 未知）	$σ^{2}$	$\sum_{i = 1}^{n} (X_{i} - \overset{ˉ}{X})^{2}$
$N (μ, σ^{2})$ （均未知）	$(μ, σ^{2})$	$(\overset{ˉ}{X}, \sum (X_{i} - \overset{ˉ}{X})^{2})$
$P (λ)$	$λ$	$\sum_{i = 1}^{n} X_{i}$
$b (1, p)$	$p$	$\sum_{i = 1}^{n} X_{i}$
$Exp (1/ θ)$	$θ$	$\sum_{i = 1}^{n} X_{i}$
$U (0, θ)$	$θ$	$X_{(n)} = max {X_{i}}$

指数族分布的完备性

定理 6.4.5 — 指数族的完备性

若总体分布属于满秩指数族，则其自然充分统计量是完备的，从而也是充分完备的。

满秩指数族的形式为：
$f (x; θ) = h (x) exp {j = 1 \sum k c_{j} (θ) T_{j} (x) - d (θ)}$
其中参数空间 $Θ$ 包含一个 $k$ 维开集。

意义：这个定理大大简化了寻找充分完备统计量的工作。对于常见的指数族分布（正态、泊松、二项、指数、Gamma等），充分完备统计量可以直接由因子分解定理读出。

例 6.4.5 — 均匀分布的充分完备统计量

设 $X_{1}, X_{2}, \dots, X_{n}$ 来自 $U (0, θ)$ ， $θ > 0$ 。

$U (0, θ)$ 不是指数族分布（支撑集依赖于参数 $θ$ ），所以不能用指数族的完备性定理。

但可以验证 $X_{(n)}$ 是 $θ$ 的充分完备统计量：

充分性：由因子分解定理， $f (x_{1}, \dots, x_{n}; θ) = \frac{1}{θ ^{n}} I_{{x_{(n)} \leq θ}}$ ， $T = X_{(n)}$ 是充分统计量

完备性：需要验证若 $E_{θ} [h (X_{(n)})] = 0$ （ $\forall θ > 0$ ），则 $h \equiv 0$ （a.s.）。 $X_{(n)}$ 的密度为 $f_{X_{(n)}} (t) = \frac{n t ^{n - 1}}{θ ^{n}}$ ， $0 < t < θ$ ，故

$E_{θ} [h (X_{(n)})] = \int_{0}^{θ} h (t) \cdot \frac{n t ^{n - 1}}{θ ^{n}} d t = 0, \forall θ > 0$
两边对 $θ$ 求导，利用 Leibniz 积分规则，可得 $h (θ) = 0$ （a.s.），故 $X_{(n)}$ 是完备的。

六、UMVUE的求解方法总结

方法一：直接法（定义法）

适用场景：参数空间简单，可以直接计算方差并比较。

步骤：

找到 $g (θ)$ 的一个无偏估计 $\hat{θ}^{*}$
证明对任意无偏估计 $\tilde{θ}$ ，有 $Cov (\hat{θ}^{*}, \tilde{θ} - \hat{θ}^{*}) = 0$
由此推出 $Var (\hat{θ}^{*}) \leq Var (\tilde{θ})$

局限性：需要验证所有无偏估计，通常难以实现。

方法二：Rao-Blackwell + Lehmann-Scheffé法

适用场景：已知充分完备统计量，能找到一个无偏估计。

步骤：

找到 $θ$ 的充分完备统计量 $T$
找到 $g (θ)$ 的一个（粗糙的）无偏估计 $\hat{θ}_{0}$
计算 $\hat{θ}^{*} = E (\hat{θ}_{0} ∣ T)$
由 Lehmann-Scheffé 定理， $\hat{θ}^{*}$ 即为 UMVUE

方法三：充分完备统计量法

适用场景：能直接猜出充分完备统计量的某个函数是无偏估计。

步骤：

找到 $θ$ 的充分完备统计量 $T$
构造 $T$ 的函数 $\hat{θ}^{*} = φ (T)$ ，使得 $E (\hat{θ}^{*}) = g (θ)$
由 Lehmann-Scheffé 定理， $\hat{θ}^{*}$ 即为 UMVUE

求解流程图

graph TD
    A[求参数的最优无偏估计] --> B{是否存在充分完备统计量}
    B -->|是| C{能否直接构造统计量的函数使其无偏}
    C -->|是| D[方法三：直接验证充分完备性]
    C -->|否| E[方法二：找无偏估计再做条件期望改善]
    B -->|否| F{能否用定义法}
    F -->|是| G[方法一：直接证明方差最小]
    F -->|否| H[最优无偏估计可能不存在]
    D --> I[得到最优无偏估计]
    E --> I
    G --> I

七、常见分布的UMVUE

正态分布

例 6.4.6 — 正态总体均值的UMVUE

设 $X_{1}, X_{2}, \dots, X_{n} \sim N (μ, σ^{2})$ ， $σ^{2}$ 已知。

$\overset{ˉ}{X}$ 是 $μ$ 的无偏估计，且是充分完备统计量 $\overset{ˉ}{X}$ 自身的函数，故 $\overset{ˉ}{X}$ 是 $μ$ 的 UMVUE。
$Var (\overset{ˉ}{X}) = \frac{σ ^{2}}{n}$

例 6.4.7 — 正态总体方差的UMVUE

设 $X_{1}, X_{2}, \dots, X_{n} \sim N (μ, σ^{2})$ ， $μ$ 未知。

$S^{2} = \frac{1}{n - 1} \sum_{i = 1}^{n} (X_{i} - \overset{ˉ}{X})^{2}$ 是 $σ^{2}$ 的无偏估计，且是充分完备统计量 $\sum (X_{i} - \overset{ˉ}{X})^{2}$ 的函数，故 $S^{2}$ 是 $σ^{2}$ 的 UMVUE。
$Var (S^{2}) = \frac{2 σ ^{4}}{n - 1}$
注意： $S^{2}$ 的方差 $\frac{2 σ ^{4}}{n - 1}$ 大于 C-R 下界 $\frac{2 σ ^{4}}{n}$ 。这说明 UMVUE 不一定达到 C-R 下界。

泊松分布

例 6.4.8 — 泊松分布参数的UMVUE

设 $X_{1}, X_{2}, \dots, X_{n} \sim P (λ)$ 。

$\overset{ˉ}{X}$ 是 $λ$ 的无偏估计， $T = \sum X_{i}$ 是充分完备统计量， $\overset{ˉ}{X} = T / n$ 是 $T$ 的函数，故 $\overset{ˉ}{X}$ 是 $λ$ 的 UMVUE。
$Var (\overset{ˉ}{X}) = \frac{λ}{n}$
恰好等于 C-R 下界，所以 $\overset{ˉ}{X}$ 也是 $λ$ 的有效估计。

二项分布

设 $X_{1}, X_{2}, \dots, X_{n} \sim b (1, p)$ ， $T = \sum X_{i} \sim b (n, p)$ 。

待估参数	UMVUE	方差
$p$	$\overset{ˉ}{X} = T / n$	$\frac{p ( 1 - p )}{n}$
$p^{2}$	$\frac{T ( T - 1 )}{n ( n - 1 )}$	复杂表达式
$p^{k}$	$\frac{( T ) _{k}}{( n ) _{k}}$ （下降阶乘）	—

其中 $(T)_{k} = T (T - 1) \dots (T - k + 1)$ ， $(n)_{k} = n (n - 1) \dots (n - k + 1)$ 。

指数分布

设 $X_{1}, X_{2}, \dots, X_{n} \sim Exp (1/ θ)$ ， $T = \sum X_{i} \sim Ga (n, 1/ θ)$ 。

待估参数	UMVUE	方差
$θ$	$\overset{ˉ}{X} = T / n$	$\frac{θ ^{2}}{n}$

均匀分布（UMVUE不存在的例子）

设 $X_{1}, X_{2}, \dots, X_{n} \sim U (0, θ)$ 。

$θ$ 的 UMVUE： $\hat{θ}^{*} = \frac{n + 1}{n} X_{(n)}$ （存在）
但对于某些参数函数，UMVUE 可能不存在

汇总表格

分布	参数	UMVUE	是否达到C-R下界
$N (μ, σ^{2})$ （ $σ^{2}$ 已知）	$μ$	$\overset{ˉ}{X}$	是
$N (μ, σ^{2})$ （ $μ$ 未知）	$σ^{2}$	$S^{2}$	否
$P (λ)$	$λ$	$\overset{ˉ}{X}$	是
$b (1, p)$	$p$	$\overset{ˉ}{X}$	是
$Exp (1/ θ)$	$θ$	$\overset{ˉ}{X}$	否
$U (0, θ)$	$θ$	$\frac{n + 1}{n} X_{(n)}$	C-R不等式不适用

八、知识结构总览

graph TD
    A[最小方差无偏估计] --> B[问题动机]
    A --> C[核心定义]
    A --> D[理论工具]
    A --> E[求解方法]
    A --> F[应用汇总]

    B --> B1[无偏估计不唯一]
    B --> B2[方差不同需比较]
    B --> B3[限定无偏类中找最优]

    C --> C1[一致最小方差无偏估计]
    C --> C2[概率意义下唯一]

    D --> D1[劳布莱克定理]
    D --> D2[莱曼谢菲定理]
    D --> D3[充分完备统计量]

    D1 --> D1a[充分统计量]
    D1 --> D1b[条件期望降低方差]
    D1 --> D1c[改善但不保证最优]

    D2 --> D2a[充分完备统计量的函数]
    D2 --> D2b[保证最优且唯一]
    D2 --> D2c[依赖完备性]

    D3 --> D3a[完备性定义]
    D3 --> D3b[指数族的完备性]
    D3 --> D3c[常见分布判定]

    E --> E1[直接法]
    E --> E2[条件期望改善法]
    E --> E3[充分完备统计量法]

    F --> F1[正态分布]
    F --> F2[泊松分布]
    F --> F3[二项分布]
    F --> F4[指数分布]
    F --> F5[均匀分布]

九、核心思想与解题技巧

核心思想

“压缩”思想（Rao-Blackwell）：用充分统计量”压缩”原始估计，去掉冗余信息，降低方差
“唯一性”思想（完备性）：完备性保证压缩后的结果是唯一的，不会有多个不同的”最优”
“两步走”策略：先找无偏估计，再用充分统计量改善——这是求UMVUE最实用的方法

解题技巧

判断UMVUE的标准流程：
- 找充分完备统计量 $T$
- 找 $g (θ)$ 的一个无偏估计
- 用 Rao-Blackwell 改善（取条件期望）
- 由 Lehmann-Scheffé 定理确认是 UMVUE
常见充分完备统计量：
- 指数族：自然充分统计量
- 均匀分布：最大次序统计量 $X_{(n)}$ 或最小次序统计量 $X_{(1)}$
条件期望的计算技巧：
- 离散情形： $E (\hat{θ}_{0} ∣ T = t) = \sum_{x} \hat{θ}_{0} (x) P (X = x ∣ T = t)$
- 常转化为概率计算：如 $E (X_{1} X_{2} ∣ T) = P (X_{1} = 1, X_{2} = 1 ∣ T)$
UMVUE不一定达到C-R下界：
- 正态总体 $σ^{2}$ 的 UMVUE 是 $S^{2}$ ，但 $Var (S^{2}) = \frac{2 σ ^{4}}{n - 1} > \frac{2 σ ^{4}}{n}$ （C-R下界）
- 原因：C-R正则条件不满足，或不存在有效估计
UMVUE可能不存在：
- 如果不存在充分完备统计量，则 Lehmann-Scheffé 方法不适用
- 此时需要用其他方法（如定义法）判断

十、补充理解与易混淆点

误区一：UMVUE一定达到C-R下界

来源：茆诗松《概率论与数理统计》 + 卡方训练营 + University of Wisconsin-Madison Stat 610讲义 + Banglajol统计学期刊 + Fiveable统计学习

误区1："UMVUE的方差一定等于Cramér-Rao下界"

❌ 错误解释：UMVUE是”最优”的无偏估计，C-R下界是无偏估计方差的”下界”，所以UMVUE应该恰好达到C-R下界。 ✅ 正确解释：UMVUE的方差不一定达到C-R下界。C-R不等式成立需要满足正则条件（如支撑集不依赖参数），而很多分布不满足这些条件。例如正态总体 $N (μ, σ^{2})$ 中 $σ^{2}$ 的 UMVUE 为 $S^{2}$ ，其方差 $\frac{2 σ ^{4}}{n - 1}$ 严格大于 C-R 下界 $\frac{2 σ ^{4}}{n}$ 。UMVUE在无偏估计类中方差最小，但这个最小值可以大于C-R下界。

误区二：Rao-Blackwell改善后一定是UMVUE

来源：茆诗松《概率论与数理统计》 + PMC统计学论文 + 卡方训练营 + Berkeley Stat 210A课程讲义 + CSDN数据科学博客

误区2："对无偏估计用Rao-Blackwell定理改善后，得到的一定是UMVUE"

❌ 错误解释：Rao-Blackwell定理能降低方差，反复改善最终就能得到UMVUE。 ✅ 正确解释：Rao-Blackwell定理只保证方差不增大，但不保证得到的是UMVUE。要保证改善后的结果是UMVUE，需要充分统计量同时具有完备性（即Lehmann-Scheffé定理的条件）。如果充分统计量不是完备的，改善后的估计可能仍然不是UMVUE。此外，如果使用的是非最小充分统计量，改善后的结果可能依赖于初始估计的选择。

误区三：极大似然估计一定是UMVUE

来源：茆诗松《概率论与数理统计》 + WPI ECE531课程讲义 + Duke大学统计课程 + 卡方训练营 + Stack Exchange Cross Validated

误区3："极大似然估计（MLE）一定是UMVUE"

❌ 错误解释：MLE是”最好的”估计方法，所以它一定是最优无偏估计。 ✅ 正确解释：MLE和UMVUE是两个不同的概念，它们之间没有必然的包含关系。MLE不一定是无偏的（如正态总体方差的MLE $\overset{σ}{^}^{2} = \frac{1}{n} \sum (X_{i} - \overset{ˉ}{X})^{2}$ 是有偏的），即使MLE是无偏的，也不一定方差最小。例如在某些分布中，MLE虽然无偏但不是充分完备统计量的函数，因此不是UMVUE。反之，UMVUE也不一定是MLE。不过，在很多常见情况下（如指数族），MLE恰好就是UMVUE。

误区四：UMVUE一定比有偏估计好

来源：茆诗松《概率论与数理统计》 + Fiveable统计学习 + Galili & Meilijson PMC论文 + 卡方训练营 + CSDN数据科学博客

误区4："UMVUE总是比任何有偏估计更好"

❌ 错误解释：UMVUE在无偏估计中方差最小，所以它比所有有偏估计都好。 ✅ 正确解释：UMVUE只在无偏估计类中是最优的，但跳出无偏的限制后，有偏估计的MSE可能更小。例如§6.1中讨论过， $\frac{n - 1}{n + 1} S^{2}$ 虽然是 $σ^{2}$ 的有偏估计，但其MSE为 $\frac{2 σ ^{4}}{n + 1}$ ，小于UMVUE $S^{2}$ 的MSE $\frac{2 σ ^{4}}{n - 1}$ 。评价估计量应综合考虑MSE（偏差-方差权衡），而非仅看无偏性。

误区五：完备统计量一定存在

来源：茆诗松《概率论与数理统计》 + Berkeley Stat 210A课程讲义 + University of Wisconsin-Madison Stat 610讲义 + 卡方训练营 + Wikipedia完备统计量条目

误区5："对于任何分布和参数，都存在充分完备统计量"

❌ 错误解释：充分完备统计量是求UMVUE的标准工具，所以它总是存在的。 ✅ 正确解释：充分完备统计量不一定存在。例如，考虑柯西分布 $f (x; θ) = \frac{1}{π [ 1 + ( x - θ ) ^{2} ]}$ ，其位置参数 $θ$ 没有有限维的充分统计量（更不用说充分完备统计量）。对于非指数族分布，充分完备统计量的存在性需要逐一验证。如果充分完备统计量不存在，则 Lehmann-Scheffé 方法不适用，UMVUE可能不存在或需要用其他方法寻找。

十一、习题精选

习题概览

共10道习题：6道教材习题 + 4道补充题（教材补充题）。

编号来源主题难度
习题1 教材6.4-1 UMVUE判定中
习题2 教材6.4-2 Rao-Blackwell方法中高
习题3 教材6.4-3 充分完备统计量与UMVUE 中高
习题4 教材6.4-4 正态总体UMVUE 中
习题5 教材6.4-5 泊松分布UMVUE 高
习题6 教材6.4-6 UMVUE唯一性证明高
习题7 补充（教材6.4-7）二项分布参数函数UMVUE ★★★
习题8 补充（教材6.4-8）指数分布UMVUE与C-R下界 ★★★
习题9 补充（教材6.4-9）均匀分布UMVUE综合 ★★★★
习题10 补充（教材6.4-10）充分完备统计量验证 ★★★★

编号	来源	主题	难度
习题1	教材6.4-1	UMVUE判定	中
习题2	教材6.4-2	Rao-Blackwell方法	中高
习题3	教材6.4-3	充分完备统计量与UMVUE	中高
习题4	教材6.4-4	正态总体UMVUE	中
习题5	教材6.4-5	泊松分布UMVUE	高
习题6	教材6.4-6	UMVUE唯一性证明	高
习题7	补充（教材6.4-7）	二项分布参数函数UMVUE	★★★
习题8	补充（教材6.4-8）	指数分布UMVUE与C-R下界	★★★
习题9	补充（教材6.4-9）	均匀分布UMVUE综合	★★★★
习题10	补充（教材6.4-10）	充分完备统计量验证	★★★★

教材习题

习题1（教材6.4-1）

设 $X_{1}, X_{2}, \dots, X_{n}$ 是来自正态总体 $N (μ, σ^{2})$ 的样本， $μ$ 未知， $σ^{2}$ 已知。证明 $\overset{ˉ}{X}$ 是 $μ$ 的 UMVUE。

查看解答

证明：

第一步：找充分完备统计量

正态分布 $N (μ, σ^{2})$ （ $σ^{2}$ 已知）属于指数族，其自然充分统计量为 $T = \sum_{i = 1}^{n} X_{i} = n \overset{ˉ}{X}$ 。由于是满秩指数族， $T$ 也是完备的。

第二步：验证无偏性

$E (\overset{ˉ}{X}) = μ$ ， $\overset{ˉ}{X}$ 是 $μ$ 的无偏估计。

第三步：验证是T的函数

$\overset{ˉ}{X} = T / n$ ，是 $T$ 的函数。

结论：由 Lehmann-Scheffé 定理， $\overset{ˉ}{X}$ 是 $μ$ 的 UMVUE。

$□$

习题2（教材6.4-2）

设 $X_{1}, X_{2}, \dots, X_{n}$ 来自泊松分布 $P (λ)$ ，用 Rao-Blackwell 方法求 $λ^{2}$ 的 UMVUE。

查看解答

解：

第一步：找一个无偏估计

注意到 $E [X_{1} (X_{1} - 1)] = E (X_{1}^{2}) - E (X_{1}) = (λ^{2} + λ) - λ = λ^{2}$ 。

所以 $\hat{θ}_{0} = X_{1} (X_{1} - 1)$ 是 $λ^{2}$ 的一个无偏估计。

第二步：找充分完备统计量

$T = \sum_{i = 1}^{n} X_{i}$ 是 $λ$ 的充分完备统计量（泊松分布属于指数族）。

第三步：计算条件期望
$\tilde{θ} = E [X_{1} (X_{1} - 1) ∣ T = t]$
由于 $X_{1} ∣ T = t \sim b (1, \frac{t}{n})$ （对称性），
$E [X_{1} (X_{1} - 1) ∣ T = t] = E (X_{1}^{2} ∣ T = t) - E (X_{1} ∣ T = t)$ $= [Var (X_{1} ∣ T) + (E (X_{1} ∣ T))^{2}] - \frac{t}{n}$ $= [\frac{t}{n} (1 - \frac{t}{n}) + \frac{t ^{2}}{n ^{2}}] - \frac{t}{n}$ $= \frac{t}{n} - \frac{t ^{2}}{n ^{2}} + \frac{t ^{2}}{n ^{2}} - \frac{t}{n} + \frac{t ( t - 1 )}{n ^{2}}$
更直接地，利用多项式展开：
$E [X_{1} (X_{1} - 1) ∣ T = t] = x_{1} = 0 \sum t x_{1} (x_{1} - 1) (x _{1} t) (\frac{1}{n})^{x_{1}} (1 - \frac{1}{n})^{t - x_{1}}$
这等价于 $t (t - 1) / n^{2}$ 的二阶阶乘矩。

结果： $\hat{θ}^{*} = \frac{T ( T - 1 )}{n ^{2}}$ 是 $λ^{2}$ 的 UMVUE。

习题3（教材6.4-3）

设 $X_{1}, X_{2}, \dots, X_{n}$ 来自均匀分布 $U (0, θ)$ ， $θ > 0$ 。

(1) 证明 $X_{(n)}$ 是 $θ$ 的充分完备统计量。

(2) 求 $θ$ 的 UMVUE。

查看解答

解：

(1) 充分性： $f (x_{1}, \dots, x_{n}; θ) = θ^{- n} I_{{x_{(n)} \leq θ}}$ ，由因子分解定理， $T = X_{(n)}$ 是充分统计量。

完备性： $X_{(n)}$ 的密度为 $f_{T} (t) = \frac{n t ^{n - 1}}{θ ^{n}}$ ， $0 < t < θ$ 。设 $E_{θ} [h (T)] = 0$ ，即
$\int_{0}^{θ} h (t) \cdot \frac{n t ^{n - 1}}{θ ^{n}} d t = 0, \forall θ > 0$
令 $u = t / θ$ ， $\int_{0}^{1} h (θ u) \cdot n u^{n - 1} d u = 0$ 。两边对 $θ$ 求导可得 $h (θ) = 0$ （a.s.），故完备。

(2) $E (X_{(n)}) = \frac{n}{n + 1} θ$ ，故 $\hat{θ}^{*} = \frac{n + 1}{n} X_{(n)}$ 是 $θ$ 的无偏估计，且是 $X_{(n)}$ 的函数。由 Lehmann-Scheffé 定理， $\hat{θ}^{*}$ 是 $θ$ 的 UMVUE。

习题4（教材6.4-4）

设 $X_{1}, X_{2}, \dots, X_{n} \sim N (μ, σ^{2})$ ， $μ$ 和 $σ^{2}$ 均未知。证明 $S^{2} = \frac{1}{n - 1} \sum_{i = 1}^{n} (X_{i} - \overset{ˉ}{X})^{2}$ 是 $σ^{2}$ 的 UMVUE，并求其方差。该方差是否等于 C-R 下界？

查看解答

证明：

第一步： $(\overset{ˉ}{X}, \sum (X_{i} - \overset{ˉ}{X})^{2})$ 是 $(μ, σ^{2})$ 的充分完备统计量（正态分布属于满秩指数族）。

第二步： $S^{2} = \frac{1}{n - 1} \sum (X_{i} - \overset{ˉ}{X})^{2}$ 是 $\sum (X_{i} - \overset{ˉ}{X})^{2}$ 的函数，且 $E (S^{2}) = σ^{2}$ （§6.1已证）。

第三步：由 Lehmann-Scheffé 定理， $S^{2}$ 是 $σ^{2}$ 的 UMVUE。

方差： $\frac{( n - 1 ) S ^{2}}{σ ^{2}} \sim χ^{2} (n - 1)$ ，故
$Var (S^{2}) = \frac{σ ^{4}}{( n - 1 ) ^{2}} \cdot 2 (n - 1) = \frac{2 σ ^{4}}{n - 1}$
C-R下界： $I (σ^{2}) = \frac{1}{2 σ ^{4}}$ ，C-R下界为 $\frac{1}{n I ( σ ^{2} )} = \frac{2 σ ^{4}}{n}$ 。

比较： $\frac{2 σ ^{4}}{n - 1} > \frac{2 σ ^{4}}{n}$ ，所以 $S^{2}$ 的方差不等于 C-R 下界。

$□$

习题5（教材6.4-5）

设 $X_{1}, X_{2}, \dots, X_{n} \sim P (λ)$ ，求 $P (X = 0) = e^{- λ}$ 的 UMVUE。

查看解答

解：

第一步：找充分完备统计量

$T = \sum_{i = 1}^{n} X_{i}$ 是 $λ$ 的充分完备统计量。

第二步：找一个无偏估计

考虑指示函数 $\hat{θ}_{0} = I_{{X_{1} = 0}}$ ，则
$E (\hat{θ}_{0}) = P (X_{1} = 0) = e^{- λ}$
所以 $\hat{θ}_{0}$ 是 $e^{- λ}$ 的无偏估计。

第三步：计算条件期望
$\hat{θ}^{*} = E (I_{{X_{1} = 0}} ∣ T = t) = P (X_{1} = 0 ∣ T = t)$
由对称性， $X_{1} ∣ T = t \sim b (1, t / n)$ （当 $t \geq 0$ 时），但这里 $X_{1}$ 取非负整数值。

更准确地：
$P (X_{1} = 0 ∣ T = t) = \frac{P ( X _{1} = 0 ) \cdot P ( \sum _{i = 2}^{n} X _{i} = t )}{P ( T = t )}$ $= \frac{e ^{- λ} \cdot \frac{[( n - 1 ) λ ] ^{t}}{t !} e ^{- (n - 1) λ}}{\frac{( nλ ) ^{t}}{t !} e ^{- nλ}} = (\frac{n - 1}{n})^{t}$
结论： $\hat{θ}^{*} = (\frac{n - 1}{n})^{T} = (1 - \frac{1}{n})^{\sum X_{i}}$ 是 $e^{- λ}$ 的 UMVUE。

习题6（教材6.4-6）

设 $\hat{θ}_{1}^{*}$ 和 $\hat{θ}_{2}^{*}$ 都是 $g (θ)$ 的 UMVUE，证明 $P (\hat{θ}_{1}^{*} = \hat{θ}_{2}^{*}) = 1$ 。

查看解答

证明：

令 $W = \hat{θ}_{1}^{*} - \hat{θ}_{2}^{*}$ ，则 $E (W) = g (θ) - g (θ) = 0$ 。

考虑估计量 $\hat{θ}_{c} = \hat{θ}_{1}^{*} - c W$ （ $c$ 为任意常数），则 $E (\hat{θ}_{c}) = g (θ)$ ，也是无偏估计。

由 $\hat{θ}_{1}^{*}$ 是 UMVUE：
$Var (\hat{θ}_{1}^{*}) \leq Var (\hat{θ}_{c}) = Var (\hat{θ}_{1}^{*}) + c^{2} Var (W) - 2 c Cov (\hat{θ}_{1}^{*}, W)$
即 $c^{2} Var (W) - 2 c Cov (\hat{θ}_{1}^{*}, W) \geq 0$ 对一切 $c$ 成立。

由二次函数非负的条件，判别式 $\leq 0$ ： $[Cov (\hat{θ}_{1}^{*}, W)]^{2} \leq 0$ ，故 $Cov (\hat{θ}_{1}^{*}, W) = 0$ 。

因此 $c^{2} Var (W) \geq 0$ 对一切 $c$ 成立。取 $c = 1$ ： $Var (W) \geq 0$ 。

但由对称性， $Var (\hat{θ}_{1}^{*}) \leq Var (\hat{θ}_{2}^{*})$ 且 $Var (\hat{θ}_{2}^{*}) \leq Var (\hat{θ}_{1}^{*})$ ，故 $Var (\hat{θ}_{1}^{*}) = Var (\hat{θ}_{2}^{*})$ 。

由 $Var (\hat{θ}_{1}^{*}) = Var (\hat{θ}_{2}^{*} + W) = Var (\hat{θ}_{2}^{*}) + Var (W) + 2 Cov (\hat{θ}_{2}^{*}, W)$

注意 $Cov (\hat{θ}_{2}^{*}, W) = Cov (\hat{θ}_{2}^{*}, \hat{θ}_{1}^{*} - \hat{θ}_{2}^{*}) = Cov (\hat{θ}_{2}^{*}, \hat{θ}_{1}^{*}) - Var (\hat{θ}_{2}^{*})$

而 $Cov (\hat{θ}_{1}^{*}, W) = Var (\hat{θ}_{1}^{*}) - Cov (\hat{θ}_{1}^{*}, \hat{θ}_{2}^{*}) = 0$

所以 $Cov (\hat{θ}_{1}^{*}, \hat{θ}_{2}^{*}) = Var (\hat{θ}_{1}^{*}) = Var (\hat{θ}_{2}^{*})$

代入： $Var (\hat{θ}_{1}^{*}) = Var (\hat{θ}_{2}^{*}) + Var (W) + Var (\hat{θ}_{2}^{*}) - Var (\hat{θ}_{2}^{*})$

即 $Var (\hat{θ}_{1}^{*}) = Var (\hat{θ}_{2}^{*}) + Var (W)$

由于 $Var (\hat{θ}_{1}^{*}) = Var (\hat{θ}_{2}^{*})$ ，得 $Var (W) = 0$ 。

又 $E (W) = 0$ ，故 $P (W = 0) = 1$ ，即 $P (\hat{θ}_{1}^{*} = \hat{θ}_{2}^{*}) = 1$ 。

$□$

补充题

习题7（补充，教材6.4-7）

设 $X_{1}, X_{2}, \dots, X_{n}$ 来自二点分布 $b (1, p)$ ， $T = \sum_{i = 1}^{n} X_{i}$ 。求 $p (1 - p)$ 的 UMVUE。

查看解答

解：

第一步：找无偏估计

$E (X_{1}) = p$ ， $E (X_{1}^{2}) = p$ ，故 $E (X_{1}) - E (X_{1}^{2}) = 0$ ，不行。

考虑 $E (X_{1} (1 - X_{2})) = E (X_{1}) E (1 - X_{2}) = p (1 - p)$ 。

所以 $\hat{θ}_{0} = X_{1} (1 - X_{2})$ 是 $p (1 - p)$ 的无偏估计。

第二步：充分完备统计量

$T = \sum X_{i}$ 是 $p$ 的充分完备统计量。

第三步：条件期望
$E (X_{1} (1 - X_{2}) ∣ T = t) = E (X_{1} ∣ T = t) - E (X_{1} X_{2} ∣ T = t)$ $= \frac{t}{n} - \frac{t ( t - 1 )}{n ( n - 1 )} = \frac{t ( n - 1 ) - t ( t - 1 )}{n ( n - 1 )}$ $= \frac{t ( n - t )}{n ( n - 1 )}$
结论： $\hat{θ}^{*} = \frac{T ( n - T )}{n ( n - 1 )}$ 是 $p (1 - p)$ 的 UMVUE。

习题8（补充，教材6.4-8）

设 $X_{1}, X_{2}, \dots, X_{n}$ 来自指数分布 $Exp (1/ θ)$ （密度 $f (x) = \frac{1}{θ} e^{- x / θ}$ ， $x > 0$ ）， $θ > 0$ 。

(1) 求 $θ$ 的 UMVUE。

(2) 该 UMVUE 是否达到 C-R 下界？

查看解答

解：

(1) $T = \sum_{i = 1}^{n} X_{i} \sim Ga (n, 1/ θ)$ ，是 $θ$ 的充分完备统计量。

$\overset{ˉ}{X} = T / n$ ， $E (\overset{ˉ}{X}) = θ$ ，是 $T$ 的函数。

由 Lehmann-Scheffé 定理， $\overset{ˉ}{X}$ 是 $θ$ 的 UMVUE， $Var (\overset{ˉ}{X}) = \frac{θ ^{2}}{n}$ 。

(2) 计算 Fisher 信息量：
$f (x; θ) = \frac{1}{θ} e^{- x / θ}, ln f = - ln θ - \frac{x}{θ}$ $\frac{\partial}{\partial θ} ln f = - \frac{1}{θ} + \frac{x}{θ ^{2}}$ $\frac{\partial ^{2}}{\partial θ ^{2}} ln f = \frac{1}{θ ^{2}} - \frac{2 x}{θ ^{3}}$ $I (θ) = - E [\frac{1}{θ ^{2}} - \frac{2 X}{θ ^{3}}] = - \frac{1}{θ ^{2}} + \frac{2 θ}{θ ^{3}} = \frac{1}{θ ^{2}}$
C-R 下界： $\frac{1}{n I ( θ )} = \frac{θ ^{2}}{n}$ 。

$Var (\overset{ˉ}{X}) = \frac{θ ^{2}}{n} = \frac{1}{n I ( θ )}$ ，恰好达到 C-R 下界。

习题9（补充，教材6.4-9）

设 $X_{1}, X_{2}, \dots, X_{n}$ 来自均匀分布 $U (0, θ)$ ， $θ > 0$ 。

(1) 求 $θ^{2}$ 的 UMVUE。

(2) 求 $\frac{1}{θ}$ 的 UMVUE。

查看解答

解：

已知 $X_{(n)}$ 是 $θ$ 的充分完备统计量， $X_{(n)}$ 的密度为 $f (t) = \frac{n t ^{n - 1}}{θ ^{n}}$ ， $0 < t < θ$ 。

(1) 求 $φ (T)$ 使 $E [φ (T)] = θ^{2}$ ：
$E [φ (T)] = \int_{0}^{θ} φ (t) \cdot \frac{n t ^{n - 1}}{θ ^{n}} d t = θ^{2}$
令 $u = t / θ$ ：
$\int_{0}^{1} φ (θ u) \cdot n u^{n - 1} d u = θ^{2}$
取 $φ (θ u) = c θ^{2}$ （猜测为常数倍），则 $c θ^{2} \int_{0}^{1} n u^{n - 1} d u = c θ^{2} = θ^{2}$ ，故 $c = 1$ 。

但 $φ (θ u) = θ^{2}$ 意味着 $φ (t) = \frac{t ^{2}}{u ^{2}} = \frac{t ^{2}}{( t / θ ) ^{2}} = θ^{2}$ ，这不是 $T$ 的函数。

正确做法：设 $φ (t) = c t^{2}$ ，则
$E [c T^{2}] = c \int_{0}^{θ} t^{2} \cdot \frac{n t ^{n - 1}}{θ ^{n}} d t = \frac{c n}{θ ^{n}} \int_{0}^{θ} t^{n + 1} d t = \frac{c n}{θ ^{n}} \cdot \frac{θ ^{n + 2}}{n + 2} = \frac{c n θ ^{2}}{n + 2}$
令 $\frac{c n}{n + 2} = 1$ ，得 $c = \frac{n + 2}{n}$ 。

结论： $\hat{θ}^{*} = \frac{n + 2}{n} X_{(n)}^{2}$ 是 $θ^{2}$ 的 UMVUE。

(2) 设 $φ (t) = c / t$ ，则
$E [\frac{c}{T}] = c \int_{0}^{θ} \frac{1}{t} \cdot \frac{n t ^{n - 1}}{θ ^{n}} d t = \frac{c n}{θ ^{n}} \int_{0}^{θ} t^{n - 2} d t$
当 $n \geq 2$ 时， $= \frac{c n}{θ ^{n}} \cdot \frac{θ ^{n - 1}}{n - 1} = \frac{c n}{( n - 1 ) θ}$

令 $\frac{c n}{n - 1} = 1$ ，得 $c = \frac{n - 1}{n}$ 。

结论： $\hat{θ}^{*} = \frac{n - 1}{n} \cdot \frac{1}{X _{(n)}}$ 是 $\frac{1}{θ}$ 的 UMVUE（ $n \geq 2$ ）。

习题10（补充，教材6.4-10）

设 $X_{1}, X_{2}, \dots, X_{n}$ 来自正态总体 $N (μ, σ^{2})$ ， $μ$ 和 $σ^{2}$ 均未知。求 $μ / σ$ 的 UMVUE（提示：利用 $t$ 分布的性质）。

查看解答

解：

$(\overset{ˉ}{X}, S^{2})$ 是 $(μ, σ^{2})$ 的充分完备统计量。UMVUE（如果存在）一定是 $(\overset{ˉ}{X}, S^{2})$ 的函数。

考虑 $\overset{ˉ}{X} / S$ ，计算其期望：
$\frac{X ˉ - μ}{S / n} \sim t (n - 1)$
设 $T_{n - 1}$ 服从自由度为 $n - 1$ 的 $t$ 分布，则
$E (\frac{X ˉ}{S}) = E (\frac{X ˉ - μ + μ}{S}) = E (\frac{X ˉ - μ}{S}) + \frac{μ}{σ} E (\frac{σ}{S})$
由于 $t$ 分布关于 $0$ 对称， $E (\frac{X ˉ - μ}{S}) = 0$ 。

又 $\frac{( n - 1 ) S ^{2}}{σ ^{2}} \sim χ^{2} (n - 1)$ ，故 $\frac{σ}{S} = \frac{n - 1}{χ ^{2} ( n - 1 )}$ 。
$E (\frac{n - 1}{χ ^{2} ( n - 1 )}) = n - 1 \cdot E (\frac{1}{χ ^{2} ( n - 1 )})$
利用 $χ^{2} (n - 1)$ 的矩：
$E (\frac{1}{χ ^{2} ( n - 1 )}) = \frac{Γ ( \frac{n - 2}{2} )}{2 Γ ( \frac{n - 1}{2} )}$
因此
$E (\frac{X ˉ}{S}) = \frac{μ}{σ} \cdot n - 1 \cdot \frac{Γ ( \frac{n - 2}{2} )}{2 Γ ( \frac{n - 1}{2} )}$
令 $c_{n} = n - 1 \cdot \frac{Γ ( \frac{n - 2}{2} )}{2 Γ ( \frac{n - 1}{2} )}$ ，则
$E (\frac{X ˉ}{S}) = c_{n} \cdot \frac{μ}{σ}$
因此 $\frac{μ}{σ}$ 的 UMVUE 为 $\hat{θ}^{*} = \frac{1}{c _{n}} \cdot \frac{X ˉ}{S}$ 。

十二、教材原文

第六章参数估计/最小方差无偏估计

数学笔记 Wiki

探索

6.4 最小方差无偏估计

6.4 最小方差无偏估计

一、从无偏估计到最优无偏估计

无偏估计的方差可以不同

引入最小方差无偏估计的需求

二、UMVUE的定义

一致最小方差无偏估计

UMVUE的唯一性

UMVUE的等价判定条件

三、Rao-Blackwell定理

定理陈述

完整证明

直观理解

四、Lehmann-Scheffé定理

定理陈述

完整证明

与Rao-Blackwell定理的关系

五、充分完备统计量

完备统计量的定义

充分完备统计量

常见分布的充分完备统计量

指数族分布的完备性

六、UMVUE的求解方法总结

方法一：直接法（定义法）

方法二：Rao-Blackwell + Lehmann-Scheffé法

方法三：充分完备统计量法

求解流程图

七、常见分布的UMVUE

正态分布

泊松分布

二项分布

指数分布

均匀分布（UMVUE不存在的例子）

汇总表格

八、知识结构总览

九、核心思想与解题技巧

核心思想

解题技巧

十、补充理解与易混淆点

误区一：UMVUE一定达到C-R下界

误区二：Rao-Blackwell改善后一定是UMVUE

误区三：极大似然估计一定是UMVUE

误区四：UMVUE一定比有偏估计好

误区五：完备统计量一定存在

十一、习题精选

教材习题

补充题

十二、教材原文

关系图谱

目录

反向链接