6.4 最小方差无偏估计
本节概览
本节在§6.1无偏性的基础上,进一步回答”在所有无偏估计中,哪个最好?“这一核心问题。主要内容包括三个层次:
- 问题提出:无偏估计不唯一,需要引入一致最小方差无偏估计(UMVUE)的概念来选择最优者
- 理论工具:Rao-Blackwell定理(用充分统计量改善估计)和Lehmann-Scheffé定理(充分完备统计量的函数即为UMVUE)
- 应用方法:三种求解方法及常见分布的UMVUE汇总
逻辑链条:问题提出 → UMVUE定义 → Rao-Blackwell定理 → Lehmann-Scheffé定理 → 充分完备统计量 → 求解方法 → 应用汇总
前置依赖:§6.1(无偏性、MSE分解)、§5.5(充分统计量、因子分解定理)
核心主线:UMVUE是无偏估计中的”最优”估计。Rao-Blackwell定理告诉我们:用充分统计量改善无偏估计,方差不会增大;Lehmann-Scheffé定理进一步指出:充分完备统计量的无偏函数就是UMVUE。
一、从无偏估计到最优无偏估计
无偏估计的方差可以不同
在§6.1中我们已经知道,同一个参数可以有无穷多个无偏估计。例如, 来自总体 ,,则 、、 都是 的无偏估计。
但它们的方差不同:
显然 (),所以 比 更”集中”在真值附近。
引入最小方差无偏估计的需求
核心问题:在所有无偏估计中,能否找到一个方差最小的?
回忆§6.1五、均方误差的MSE分解:
对于无偏估计,,所以 。因此在无偏估计类中,方差最小等价于均方误差最小。
例 6.4.1 — 均匀分布中不同无偏估计的比较
设 来自 ,。
已知 是 的无偏估计(见§6.1),其方差为
考虑更一般的估计量 ,其中 为常数。其均方误差为
令 ,解得最优 ,此时
这说明:虽然 是有偏估计,但其MSE更小。然而如果我们限定在无偏估计类中, 仍然是最好的选择之一。
二、UMVUE的定义
一致最小方差无偏估计
定义 6.4.1 — 一致最小方差无偏估计(UMVUE)
设 是参数 的一个无偏估计量。若对 的任意无偏估计量 ,都有
则称 是 的一致最小方差无偏估计(Uniformly Minimum Variance Unbiased Estimator,简称 UMVUE)。
关键词解析:
- 一致(Uniformly):不等式对所有 成立,不是只对某个特定 成立
- 最小方差:在所有无偏估计中,方差最小
- 无偏:限定在无偏估计类中比较
UMVUE的唯一性
定理 6.4.1 — UMVUE的唯一性
若 和 都是 的 UMVUE,则
即 UMVUE 若存在,则在概率1的意义下唯一。
证明
证明: 第一步:构造差估计量
令 ,则
即 是 的无偏估计。
第二步:利用UMVUE性质
由于 是 UMVUE,而 也是 的无偏估计(不, 不是 的无偏估计)。
重新考虑:令 ,则 。
第三步:利用方差关系
考虑 ,这没有新信息。
更直接地:由 ,考虑估计量 ( 为任意常数),它也是 的无偏估计。由 UMVUE 的最小方差性:
这要求 对一切 成立。
第四步:推出
由二次函数非负的条件,判别式 :
即 。
因此 对一切 成立,且取 时 。
但由 是 UMVUE,;同理 。
所以 ,代入方差展开式得 。
第五步:得出结论
且 ,由 Chebyshev 不等式,,即 。
UMVUE的等价判定条件
定理 6.4.2 — UMVUE的零估计量判定
无偏估计 是 UMVUE 的充要条件是:对任意满足 ()且 的统计量 ,都有
例 6.4.2 — 指数分布均值的UMVUE
设 来自指数分布 (即 ,),。
令 ,则 ,。
因此 是 的无偏估计。
可以验证 是充分完备统计量 的函数,由 Lehmann-Scheffé 定理(下文详述), 是 的 UMVUE。
三、Rao-Blackwell定理
定理陈述
定理 6.4.3 — Rao-Blackwell定理
设 来自分布 , 是 的充分统计量。设 是 的一个无偏估计,且 。定义
则:
- 仍是 的无偏估计
- ,等号成立当且仅当 本身就是 的函数(即 已经是充分统计量的函数)
进一步,若 是最小充分统计量,则 不依赖于初始 的选择。
完整证明
证明
证明:
第一步:证明无偏性
由条件期望的塔牌性质(全期望公式):
因此 是 的无偏估计。
第二步:方差分解
利用条件方差公式:
即
第三步:分析方差关系
由于 (方差非负),故
第四步:等号条件
等号成立当且仅当 ,即 (a.s.),这意味着在给定 的条件下, 几乎处处为常数,即 是 的函数。
直观理解
生活化类比:想象你是一个侦探,要估计嫌疑人的身高 。你手头有两类线索:
- 原始估计 :基于零散的、可能冗余的线索做出的初步判断
- 充分统计量 :所有线索的”精华摘要”——包含了样本中关于 的全部信息
Rao-Blackwell定理告诉我们:与其用零散线索做判断,不如先整理出精华摘要 ,再基于 做判断。这样做的结果 不会更差,而且通常更好。
数学上,,第二项 就是”零散线索中无法被充分统计量解释的随机波动”,把它去掉后方差自然更小。
例 6.4.3 — 二项分布参数平方的UMVUE(Rao-Blackwell方法)
设 来自二点分布 ,求 的 UMVUE。
解:
第一步:找一个无偏估计
注意到 。
所以 是 的一个无偏估计。
第二步:找充分统计量
由因子分解定理, 是 的充分统计量(也是完备统计量)。
第三步:用Rao-Blackwell改善
第四步:写出UMVUE
将 代入:
即 是 的 UMVUE。
验证方差减小:(因为 不是 的函数)。
四、Lehmann-Scheffé定理
定理陈述
定理 6.4.4 — Lehmann-Scheffé定理
设 是参数 的一个充分完备统计量。若 是 的某个无偏估计,且 是 的函数,则 是 的UMVUE,且在概率1的意义下唯一。
完整证明
证明
证明:
第一步:设 为 的任意无偏估计
设 是 的任意无偏估计,我们需要证明 。
第二步:对 做Rao-Blackwell改善
令 。由 Rao-Blackwell 定理:
- 是 的无偏估计
- 是 的函数
第三步:利用完备性证明唯一性
由于 和 都是 的无偏估计,且都是 的函数,故
由 的完备性:若 (),则 。
令 ,则 ,由完备性得
第四步:得出结论
因此 。
由于 是任意的,故 是 UMVUE,且在概率1意义下唯一。
与Rao-Blackwell定理的关系
| Rao-Blackwell定理 | Lehmann-Scheffé定理 | |
|---|---|---|
| 条件 | 充分统计量 | 充分完备统计量 |
| 结论 | 改善后的估计方差更小 | 改善后的估计是UMVUE |
| 唯一性 | 不保证 | 保证(概率1意义下) |
| 作用 | ”改善”工具 | ”找到最优”工具 |
逻辑关系:Lehmann-Scheffé定理 = Rao-Blackwell定理 + 完备性。Rao-Blackwell定理只能保证”改善”,但不知道改善到什么程度;加上完备性后,可以保证改善后的结果是唯一的、最优的。
例 6.4.4 — 正态总体方差的UMVUE
设 , 未知,求 的 UMVUE。
解:
第一步:找充分完备统计量
由指数族理论, 是 的充分完备统计量。
第二步:找一个无偏估计
是 的无偏估计(§6.1已证)。
第三步:验证是充分完备统计量的函数
是 的函数,而后者是充分完备统计量的分量。
结论:由 Lehmann-Scheffé 定理, 是 的 UMVUE。
五、充分完备统计量
完备统计量的定义
定义 6.4.2 — 完备统计量
设 是参数 的统计量。若对任意满足
的函数 ,都有
则称 是 的完备统计量。
直观理解:完备性意味着统计量 中不包含”多余信息”——不存在非零函数 使得 的期望恒为零。换句话说, 的分布族足够”丰富”,不会”丢失”关于 的信息。
生活化类比:如果 是一份案件摘要,完备性意味着——如果两个不同的侦探从同一份摘要中得出了”期望差异为零”的结论,那他们实际上看到的是同一个东西(概率为1)。摘要足够完整,不会产生”虚假的零差异”。
充分完备统计量
定义 6.4.3 — 充分完备统计量
若统计量 既是 的充分统计量,又是 的完备统计量,则称 为 的充分完备统计量。
常见分布的充分完备统计量
| 分布 | 参数 | 充分完备统计量 |
|---|---|---|
| (已知) | ||
| (未知) | ||
| (均未知) | ||
指数族分布的完备性
定理 6.4.5 — 指数族的完备性
若总体分布属于满秩指数族,则其自然充分统计量是完备的,从而也是充分完备的。
满秩指数族的形式为:
其中参数空间 包含一个 维开集。
意义:这个定理大大简化了寻找充分完备统计量的工作。对于常见的指数族分布(正态、泊松、二项、指数、Gamma等),充分完备统计量可以直接由因子分解定理读出。
例 6.4.5 — 均匀分布的充分完备统计量
设 来自 ,。
不是指数族分布(支撑集依赖于参数 ),所以不能用指数族的完备性定理。
但可以验证 是 的充分完备统计量:
- 充分性:由因子分解定理,, 是充分统计量
- 完备性:需要验证若 (),则 (a.s.)。 的密度为 ,,故
两边对 求导,利用 Leibniz 积分规则,可得 (a.s.),故 是完备的。
六、UMVUE的求解方法总结
方法一:直接法(定义法)
适用场景:参数空间简单,可以直接计算方差并比较。
步骤:
- 找到 的一个无偏估计
- 证明对任意无偏估计 ,有
- 由此推出
局限性:需要验证所有无偏估计,通常难以实现。
方法二:Rao-Blackwell + Lehmann-Scheffé法
适用场景:已知充分完备统计量,能找到一个无偏估计。
步骤:
- 找到 的充分完备统计量
- 找到 的一个(粗糙的)无偏估计
- 计算
- 由 Lehmann-Scheffé 定理, 即为 UMVUE
方法三:充分完备统计量法
适用场景:能直接猜出充分完备统计量的某个函数是无偏估计。
步骤:
- 找到 的充分完备统计量
- 构造 的函数 ,使得
- 由 Lehmann-Scheffé 定理, 即为 UMVUE
求解流程图
graph TD A[求参数的最优无偏估计] --> B{是否存在充分完备统计量} B -->|是| C{能否直接构造统计量的函数使其无偏} C -->|是| D[方法三:直接验证充分完备性] C -->|否| E[方法二:找无偏估计再做条件期望改善] B -->|否| F{能否用定义法} F -->|是| G[方法一:直接证明方差最小] F -->|否| H[最优无偏估计可能不存在] D --> I[得到最优无偏估计] E --> I G --> I
七、常见分布的UMVUE
正态分布
例 6.4.6 — 正态总体均值的UMVUE
设 , 已知。
是 的无偏估计,且是充分完备统计量 自身的函数,故 是 的 UMVUE。
例 6.4.7 — 正态总体方差的UMVUE
设 , 未知。
是 的无偏估计,且是充分完备统计量 的函数,故 是 的 UMVUE。
注意: 的方差 大于 C-R 下界 。这说明 UMVUE 不一定达到 C-R 下界。
泊松分布
例 6.4.8 — 泊松分布参数的UMVUE
设 。
是 的无偏估计, 是充分完备统计量, 是 的函数,故 是 的 UMVUE。
恰好等于 C-R 下界,所以 也是 的有效估计。
二项分布
设 ,。
| 待估参数 | UMVUE | 方差 |
|---|---|---|
| 复杂表达式 | ||
| (下降阶乘) | — |
其中 ,。
指数分布
设 ,。
| 待估参数 | UMVUE | 方差 |
|---|---|---|
均匀分布(UMVUE不存在的例子)
设 。
- 的 UMVUE:(存在)
- 但对于某些参数函数,UMVUE 可能不存在
汇总表格
| 分布 | 参数 | UMVUE | 是否达到C-R下界 |
|---|---|---|---|
| (已知) | 是 | ||
| (未知) | 否 | ||
| 是 | |||
| 是 | |||
| 否 | |||
| C-R不等式不适用 |
八、知识结构总览
graph TD A[最小方差无偏估计] --> B[问题动机] A --> C[核心定义] A --> D[理论工具] A --> E[求解方法] A --> F[应用汇总] B --> B1[无偏估计不唯一] B --> B2[方差不同需比较] B --> B3[限定无偏类中找最优] C --> C1[一致最小方差无偏估计] C --> C2[概率意义下唯一] D --> D1[劳布莱克定理] D --> D2[莱曼谢菲定理] D --> D3[充分完备统计量] D1 --> D1a[充分统计量] D1 --> D1b[条件期望降低方差] D1 --> D1c[改善但不保证最优] D2 --> D2a[充分完备统计量的函数] D2 --> D2b[保证最优且唯一] D2 --> D2c[依赖完备性] D3 --> D3a[完备性定义] D3 --> D3b[指数族的完备性] D3 --> D3c[常见分布判定] E --> E1[直接法] E --> E2[条件期望改善法] E --> E3[充分完备统计量法] F --> F1[正态分布] F --> F2[泊松分布] F --> F3[二项分布] F --> F4[指数分布] F --> F5[均匀分布]
九、核心思想与解题技巧
核心思想
- “压缩”思想(Rao-Blackwell):用充分统计量”压缩”原始估计,去掉冗余信息,降低方差
- “唯一性”思想(完备性):完备性保证压缩后的结果是唯一的,不会有多个不同的”最优”
- “两步走”策略:先找无偏估计,再用充分统计量改善——这是求UMVUE最实用的方法
解题技巧
-
判断UMVUE的标准流程:
- 找充分完备统计量
- 找 的一个无偏估计
- 用 Rao-Blackwell 改善(取条件期望)
- 由 Lehmann-Scheffé 定理确认是 UMVUE
-
常见充分完备统计量:
- 指数族:自然充分统计量
- 均匀分布:最大次序统计量 或最小次序统计量
-
条件期望的计算技巧:
- 离散情形:
- 常转化为概率计算:如
-
UMVUE不一定达到C-R下界:
- 正态总体 的 UMVUE 是 ,但 (C-R下界)
- 原因:C-R正则条件不满足,或不存在有效估计
-
UMVUE可能不存在:
- 如果不存在充分完备统计量,则 Lehmann-Scheffé 方法不适用
- 此时需要用其他方法(如定义法)判断
十、补充理解与易混淆点
误区一:UMVUE一定达到C-R下界
来源:茆诗松《概率论与数理统计》 + 卡方训练营 + University of Wisconsin-Madison Stat 610讲义 + Banglajol统计学期刊 + Fiveable统计学习
误区1:"UMVUE的方差一定等于Cramér-Rao下界"
❌ 错误解释:UMVUE是”最优”的无偏估计,C-R下界是无偏估计方差的”下界”,所以UMVUE应该恰好达到C-R下界。 ✅ 正确解释:UMVUE的方差不一定达到C-R下界。C-R不等式成立需要满足正则条件(如支撑集不依赖参数),而很多分布不满足这些条件。例如正态总体 中 的 UMVUE 为 ,其方差 严格大于 C-R 下界 。UMVUE在无偏估计类中方差最小,但这个最小值可以大于C-R下界。
误区二:Rao-Blackwell改善后一定是UMVUE
来源:茆诗松《概率论与数理统计》 + PMC统计学论文 + 卡方训练营 + Berkeley Stat 210A课程讲义 + CSDN数据科学博客
误区2:"对无偏估计用Rao-Blackwell定理改善后,得到的一定是UMVUE"
❌ 错误解释:Rao-Blackwell定理能降低方差,反复改善最终就能得到UMVUE。 ✅ 正确解释:Rao-Blackwell定理只保证方差不增大,但不保证得到的是UMVUE。要保证改善后的结果是UMVUE,需要充分统计量同时具有完备性(即Lehmann-Scheffé定理的条件)。如果充分统计量不是完备的,改善后的估计可能仍然不是UMVUE。此外,如果使用的是非最小充分统计量,改善后的结果可能依赖于初始估计的选择。
误区三:极大似然估计一定是UMVUE
来源:茆诗松《概率论与数理统计》 + WPI ECE531课程讲义 + Duke大学统计课程 + 卡方训练营 + Stack Exchange Cross Validated
误区3:"极大似然估计(MLE)一定是UMVUE"
❌ 错误解释:MLE是”最好的”估计方法,所以它一定是最优无偏估计。 ✅ 正确解释:MLE和UMVUE是两个不同的概念,它们之间没有必然的包含关系。MLE不一定是无偏的(如正态总体方差的MLE 是有偏的),即使MLE是无偏的,也不一定方差最小。例如在某些分布中,MLE虽然无偏但不是充分完备统计量的函数,因此不是UMVUE。反之,UMVUE也不一定是MLE。不过,在很多常见情况下(如指数族),MLE恰好就是UMVUE。
误区四:UMVUE一定比有偏估计好
来源:茆诗松《概率论与数理统计》 + Fiveable统计学习 + Galili & Meilijson PMC论文 + 卡方训练营 + CSDN数据科学博客
误区4:"UMVUE总是比任何有偏估计更好"
❌ 错误解释:UMVUE在无偏估计中方差最小,所以它比所有有偏估计都好。 ✅ 正确解释:UMVUE只在无偏估计类中是最优的,但跳出无偏的限制后,有偏估计的MSE可能更小。例如§6.1中讨论过, 虽然是 的有偏估计,但其MSE为 ,小于UMVUE 的MSE 。评价估计量应综合考虑MSE(偏差-方差权衡),而非仅看无偏性。
误区五:完备统计量一定存在
来源:茆诗松《概率论与数理统计》 + Berkeley Stat 210A课程讲义 + University of Wisconsin-Madison Stat 610讲义 + 卡方训练营 + Wikipedia完备统计量条目
误区5:"对于任何分布和参数,都存在充分完备统计量"
❌ 错误解释:充分完备统计量是求UMVUE的标准工具,所以它总是存在的。 ✅ 正确解释:充分完备统计量不一定存在。例如,考虑柯西分布 ,其位置参数 没有有限维的充分统计量(更不用说充分完备统计量)。对于非指数族分布,充分完备统计量的存在性需要逐一验证。如果充分完备统计量不存在,则 Lehmann-Scheffé 方法不适用,UMVUE可能不存在或需要用其他方法寻找。
十一、习题精选
习题概览
共10道习题:6道教材习题 + 4道补充题(教材补充题)。
编号 来源 主题 难度 习题1 教材6.4-1 UMVUE判定 中 习题2 教材6.4-2 Rao-Blackwell方法 中高 习题3 教材6.4-3 充分完备统计量与UMVUE 中高 习题4 教材6.4-4 正态总体UMVUE 中 习题5 教材6.4-5 泊松分布UMVUE 高 习题6 教材6.4-6 UMVUE唯一性证明 高 习题7 补充(教材6.4-7) 二项分布参数函数UMVUE ★★★ 习题8 补充(教材6.4-8) 指数分布UMVUE与C-R下界 ★★★ 习题9 补充(教材6.4-9) 均匀分布UMVUE综合 ★★★★ 习题10 补充(教材6.4-10) 充分完备统计量验证 ★★★★
教材习题
习题1(教材6.4-1)
设 是来自正态总体 的样本, 未知, 已知。证明 是 的 UMVUE。
查看解答
证明:
第一步:找充分完备统计量
正态分布 (已知)属于指数族,其自然充分统计量为 。由于是满秩指数族, 也是完备的。
第二步:验证无偏性
, 是 的无偏估计。
第三步:验证是T的函数
,是 的函数。
结论:由 Lehmann-Scheffé 定理, 是 的 UMVUE。
习题2(教材6.4-2)
设 来自泊松分布 ,用 Rao-Blackwell 方法求 的 UMVUE。
查看解答
解:
第一步:找一个无偏估计
注意到 。
所以 是 的一个无偏估计。
第二步:找充分完备统计量
是 的充分完备统计量(泊松分布属于指数族)。
第三步:计算条件期望
由于 (对称性),
更直接地,利用多项式展开:
这等价于 的二阶阶乘矩。
结果: 是 的 UMVUE。
习题3(教材6.4-3)
设 来自均匀分布 ,。
(1) 证明 是 的充分完备统计量。
(2) 求 的 UMVUE。
查看解答
解:
(1) 充分性:,由因子分解定理, 是充分统计量。
完备性: 的密度为 ,。设 ,即
令 ,。两边对 求导可得 (a.s.),故完备。
(2) ,故 是 的无偏估计,且是 的函数。由 Lehmann-Scheffé 定理, 是 的 UMVUE。
习题4(教材6.4-4)
设 , 和 均未知。证明 是 的 UMVUE,并求其方差。该方差是否等于 C-R 下界?
查看解答
证明:
第一步: 是 的充分完备统计量(正态分布属于满秩指数族)。
第二步: 是 的函数,且 (§6.1已证)。
第三步:由 Lehmann-Scheffé 定理, 是 的 UMVUE。
方差:,故
C-R下界:,C-R下界为 。
比较:,所以 的方差不等于 C-R 下界。
习题5(教材6.4-5)
设 ,求 的 UMVUE。
查看解答
解:
第一步:找充分完备统计量
是 的充分完备统计量。
第二步:找一个无偏估计
考虑指示函数 ,则
所以 是 的无偏估计。
第三步:计算条件期望
由对称性,(当 时),但这里 取非负整数值。
更准确地:
结论: 是 的 UMVUE。
习题6(教材6.4-6)
设 和 都是 的 UMVUE,证明 。
查看解答
证明:
令 ,则 。
考虑估计量 ( 为任意常数),则 ,也是无偏估计。
由 是 UMVUE:
即 对一切 成立。
由二次函数非负的条件,判别式 :,故 。
因此 对一切 成立。取 :。
但由对称性, 且 ,故 。
由
注意
而
所以
代入:
即
由于 ,得 。
又 ,故 ,即 。
补充题
习题7(补充,教材6.4-7)
设 来自二点分布 ,。求 的 UMVUE。
查看解答
解:
第一步:找无偏估计
,,故 ,不行。
考虑 。
所以 是 的无偏估计。
第二步:充分完备统计量
是 的充分完备统计量。
第三步:条件期望
结论: 是 的 UMVUE。
习题8(补充,教材6.4-8)
设 来自指数分布 (密度 ,),。
(1) 求 的 UMVUE。
(2) 该 UMVUE 是否达到 C-R 下界?
查看解答
解:
(1) ,是 的充分完备统计量。
,,是 的函数。
由 Lehmann-Scheffé 定理, 是 的 UMVUE,。
(2) 计算 Fisher 信息量:
C-R 下界:。
,恰好达到 C-R 下界。
习题9(补充,教材6.4-9)
设 来自均匀分布 ,。
(1) 求 的 UMVUE。
(2) 求 的 UMVUE。
查看解答
解:
已知 是 的充分完备统计量, 的密度为 ,。
(1) 求 使 :
令 :
取 (猜测为常数倍),则 ,故 。
但 意味着 ,这不是 的函数。
正确做法:设 ,则
令 ,得 。
结论: 是 的 UMVUE。
(2) 设 ,则
当 时,
令 ,得 。
结论: 是 的 UMVUE()。
习题10(补充,教材6.4-10)
设 来自正态总体 , 和 均未知。求 的 UMVUE(提示:利用 分布的性质)。
查看解答
解:
是 的充分完备统计量。UMVUE(如果存在)一定是 的函数。
考虑 ,计算其期望:
设 服从自由度为 的 分布,则
由于 分布关于 对称,。
又 ,故 。
利用 的矩:
因此
令 ,则
因此 的 UMVUE 为 。
十二、教材原文
第六章 参数估计/最小方差无偏估计