6.4 最小方差无偏估计

本节概览

本节在§6.1无偏性的基础上,进一步回答”在所有无偏估计中,哪个最好?“这一核心问题。主要内容包括三个层次:

  1. 问题提出:无偏估计不唯一,需要引入一致最小方差无偏估计(UMVUE)的概念来选择最优者
  2. 理论工具Rao-Blackwell定理(用充分统计量改善估计)和Lehmann-Scheffé定理(充分完备统计量的函数即为UMVUE)
  3. 应用方法三种求解方法常见分布的UMVUE汇总

逻辑链条问题提出UMVUE定义Rao-Blackwell定理Lehmann-Scheffé定理充分完备统计量求解方法应用汇总

前置依赖§6.1(无偏性、MSE分解)、§5.5(充分统计量、因子分解定理)

核心主线:UMVUE是无偏估计中的”最优”估计。Rao-Blackwell定理告诉我们:用充分统计量改善无偏估计,方差不会增大;Lehmann-Scheffé定理进一步指出:充分完备统计量的无偏函数就是UMVUE。


一、从无偏估计到最优无偏估计

无偏估计的方差可以不同

§6.1中我们已经知道,同一个参数可以有无穷多个无偏估计。例如, 来自总体 ,则 都是 的无偏估计。

但它们的方差不同:

显然 ),所以 更”集中”在真值附近。

引入最小方差无偏估计的需求

核心问题:在所有无偏估计中,能否找到一个方差最小的?

回忆§6.1五、均方误差的MSE分解:

对于无偏估计,,所以 。因此在无偏估计类中,方差最小等价于均方误差最小

例 6.4.1 — 均匀分布中不同无偏估计的比较

来自

已知 的无偏估计(见§6.1),其方差为

考虑更一般的估计量 ,其中 为常数。其均方误差为

,解得最优 ,此时

这说明:虽然 是有偏估计,但其MSE更小。然而如果我们限定在无偏估计类中 仍然是最好的选择之一。


二、UMVUE的定义

一致最小方差无偏估计

定义 6.4.1 — 一致最小方差无偏估计(UMVUE)

是参数 的一个无偏估计量。若对 任意无偏估计量 ,都有

则称 一致最小方差无偏估计(Uniformly Minimum Variance Unbiased Estimator,简称 UMVUE)。

关键词解析

  • 一致(Uniformly):不等式对所有 成立,不是只对某个特定 成立
  • 最小方差:在所有无偏估计中,方差最小
  • 无偏:限定在无偏估计类中比较

UMVUE的唯一性

定理 6.4.1 — UMVUE的唯一性

都是 的 UMVUE,则

即 UMVUE 若存在,则在概率1的意义下唯一。

证明

证明第一步:构造差估计量

,则

的无偏估计。

第二步:利用UMVUE性质

由于 是 UMVUE,而 也是 的无偏估计(不, 不是 的无偏估计)。

重新考虑:令 ,则

第三步:利用方差关系

考虑 ,这没有新信息。

更直接地:由 ,考虑估计量 为任意常数),它也是 的无偏估计。由 UMVUE 的最小方差性:

这要求 对一切 成立。

第四步:推出

由二次函数非负的条件,判别式

因此 对一切 成立,且取

但由 是 UMVUE,;同理

所以 ,代入方差展开式得

第五步:得出结论

,由 Chebyshev 不等式,,即

UMVUE的等价判定条件

定理 6.4.2 — UMVUE的零估计量判定

无偏估计 是 UMVUE 的充要条件是:对任意满足 )且 的统计量 ,都有

例 6.4.2 — 指数分布均值的UMVUE

来自指数分布 (即 ),

,则

因此 的无偏估计。

可以验证 是充分完备统计量 的函数,由 Lehmann-Scheffé 定理(下文详述), 的 UMVUE。


三、Rao-Blackwell定理

定理陈述

定理 6.4.3 — Rao-Blackwell定理

来自分布 充分统计量。设 的一个无偏估计,且 。定义

则:

  1. 仍是 的无偏估计
  2. ,等号成立当且仅当 本身就是 的函数(即 已经是充分统计量的函数)

进一步,若 最小充分统计量,则 不依赖于初始 的选择。

完整证明

证明

证明

第一步:证明无偏性

由条件期望的塔牌性质(全期望公式):

因此 的无偏估计。

第二步:方差分解

利用条件方差公式:

第三步:分析方差关系

由于 (方差非负),故

第四步:等号条件

等号成立当且仅当 ,即 (a.s.),这意味着在给定 的条件下, 几乎处处为常数,即 的函数。

直观理解

生活化类比:想象你是一个侦探,要估计嫌疑人的身高 。你手头有两类线索:

  • 原始估计 :基于零散的、可能冗余的线索做出的初步判断
  • 充分统计量 :所有线索的”精华摘要”——包含了样本中关于 的全部信息

Rao-Blackwell定理告诉我们:与其用零散线索做判断,不如先整理出精华摘要 ,再基于 做判断。这样做的结果 不会更差,而且通常更好。

数学上,,第二项 就是”零散线索中无法被充分统计量解释的随机波动”,把它去掉后方差自然更小。

例 6.4.3 — 二项分布参数平方的UMVUE(Rao-Blackwell方法)

来自二点分布 ,求 的 UMVUE。

第一步:找一个无偏估计

注意到

所以 的一个无偏估计。

第二步:找充分统计量

由因子分解定理, 的充分统计量(也是完备统计量)。

第三步:用Rao-Blackwell改善

第四步:写出UMVUE

代入:

的 UMVUE。

验证方差减小(因为 不是 的函数)。


四、Lehmann-Scheffé定理

定理陈述

定理 6.4.4 — Lehmann-Scheffé定理

是参数 的一个充分完备统计量。若 的某个无偏估计,且 的函数,则 UMVUE,且在概率1的意义下唯一。

完整证明

证明

证明

第一步:设 的任意无偏估计

的任意无偏估计,我们需要证明

第二步:对 做Rao-Blackwell改善

。由 Rao-Blackwell 定理:

  • 的无偏估计
  • 的函数

第三步:利用完备性证明唯一性

由于 都是 的无偏估计,且都是 的函数,故

的完备性:若 ),则

,则 ,由完备性得

第四步:得出结论

因此

由于 是任意的,故 是 UMVUE,且在概率1意义下唯一。

与Rao-Blackwell定理的关系

Rao-Blackwell定理Lehmann-Scheffé定理
条件充分统计量充分完备统计量
结论改善后的估计方差更小改善后的估计是UMVUE
唯一性不保证保证(概率1意义下)
作用”改善”工具”找到最优”工具

逻辑关系:Lehmann-Scheffé定理 = Rao-Blackwell定理 + 完备性。Rao-Blackwell定理只能保证”改善”,但不知道改善到什么程度;加上完备性后,可以保证改善后的结果是唯一的、最优的

例 6.4.4 — 正态总体方差的UMVUE

未知,求 的 UMVUE。

第一步:找充分完备统计量

由指数族理论, 的充分完备统计量。

第二步:找一个无偏估计

的无偏估计(§6.1已证)。

第三步:验证是充分完备统计量的函数

的函数,而后者是充分完备统计量的分量。

结论:由 Lehmann-Scheffé 定理, 的 UMVUE。


五、充分完备统计量

完备统计量的定义

定义 6.4.2 — 完备统计量

是参数 的统计量。若对任意满足

的函数 ,都有

则称 完备统计量

直观理解:完备性意味着统计量 中不包含”多余信息”——不存在非零函数 使得 的期望恒为零。换句话说, 的分布族足够”丰富”,不会”丢失”关于 的信息。

生活化类比:如果 是一份案件摘要,完备性意味着——如果两个不同的侦探从同一份摘要中得出了”期望差异为零”的结论,那他们实际上看到的是同一个东西(概率为1)。摘要足够完整,不会产生”虚假的零差异”。

充分完备统计量

定义 6.4.3 — 充分完备统计量

若统计量 既是 充分统计量,又是 完备统计量,则称 充分完备统计量

常见分布的充分完备统计量

分布参数充分完备统计量
已知)
未知)
(均未知)

指数族分布的完备性

定理 6.4.5 — 指数族的完备性

若总体分布属于满秩指数族,则其自然充分统计量是完备的,从而也是充分完备的。

满秩指数族的形式为:

其中参数空间 包含一个 维开集。

意义:这个定理大大简化了寻找充分完备统计量的工作。对于常见的指数族分布(正态、泊松、二项、指数、Gamma等),充分完备统计量可以直接由因子分解定理读出。

例 6.4.5 — 均匀分布的充分完备统计量

来自

不是指数族分布(支撑集依赖于参数 ),所以不能用指数族的完备性定理。

但可以验证 的充分完备统计量:

  • 充分性:由因子分解定理, 是充分统计量
  • 完备性:需要验证若 ),则 (a.s.)。 的密度为 ,故

两边对 求导,利用 Leibniz 积分规则,可得 (a.s.),故 是完备的。


六、UMVUE的求解方法总结

方法一:直接法(定义法)

适用场景:参数空间简单,可以直接计算方差并比较。

步骤

  1. 找到 的一个无偏估计
  2. 证明对任意无偏估计 ,有
  3. 由此推出

局限性:需要验证所有无偏估计,通常难以实现。

方法二:Rao-Blackwell + Lehmann-Scheffé法

适用场景:已知充分完备统计量,能找到一个无偏估计。

步骤

  1. 找到 的充分完备统计量
  2. 找到 的一个(粗糙的)无偏估计
  3. 计算
  4. 由 Lehmann-Scheffé 定理, 即为 UMVUE

方法三:充分完备统计量法

适用场景:能直接猜出充分完备统计量的某个函数是无偏估计。

步骤

  1. 找到 的充分完备统计量
  2. 构造 的函数 ,使得
  3. 由 Lehmann-Scheffé 定理, 即为 UMVUE

求解流程图

graph TD
    A[求参数的最优无偏估计] --> B{是否存在充分完备统计量}
    B -->|是| C{能否直接构造统计量的函数使其无偏}
    C -->|是| D[方法三:直接验证充分完备性]
    C -->|否| E[方法二:找无偏估计再做条件期望改善]
    B -->|否| F{能否用定义法}
    F -->|是| G[方法一:直接证明方差最小]
    F -->|否| H[最优无偏估计可能不存在]
    D --> I[得到最优无偏估计]
    E --> I
    G --> I

七、常见分布的UMVUE

正态分布

例 6.4.6 — 正态总体均值的UMVUE

已知。

的无偏估计,且是充分完备统计量 自身的函数,故 的 UMVUE。

例 6.4.7 — 正态总体方差的UMVUE

未知。

的无偏估计,且是充分完备统计量 的函数,故 的 UMVUE。

注意 的方差 大于 C-R 下界 。这说明 UMVUE 不一定达到 C-R 下界

泊松分布

例 6.4.8 — 泊松分布参数的UMVUE

的无偏估计, 是充分完备统计量, 的函数,故 的 UMVUE。

恰好等于 C-R 下界,所以 也是 的有效估计。

二项分布

待估参数UMVUE方差
复杂表达式
(下降阶乘)

其中

指数分布

待估参数UMVUE方差

均匀分布(UMVUE不存在的例子)

  • 的 UMVUE:(存在)
  • 但对于某些参数函数,UMVUE 可能不存在

汇总表格

分布参数UMVUE是否达到C-R下界
已知)
未知)
C-R不等式不适用

八、知识结构总览

graph TD
    A[最小方差无偏估计] --> B[问题动机]
    A --> C[核心定义]
    A --> D[理论工具]
    A --> E[求解方法]
    A --> F[应用汇总]

    B --> B1[无偏估计不唯一]
    B --> B2[方差不同需比较]
    B --> B3[限定无偏类中找最优]

    C --> C1[一致最小方差无偏估计]
    C --> C2[概率意义下唯一]

    D --> D1[劳布莱克定理]
    D --> D2[莱曼谢菲定理]
    D --> D3[充分完备统计量]

    D1 --> D1a[充分统计量]
    D1 --> D1b[条件期望降低方差]
    D1 --> D1c[改善但不保证最优]

    D2 --> D2a[充分完备统计量的函数]
    D2 --> D2b[保证最优且唯一]
    D2 --> D2c[依赖完备性]

    D3 --> D3a[完备性定义]
    D3 --> D3b[指数族的完备性]
    D3 --> D3c[常见分布判定]

    E --> E1[直接法]
    E --> E2[条件期望改善法]
    E --> E3[充分完备统计量法]

    F --> F1[正态分布]
    F --> F2[泊松分布]
    F --> F3[二项分布]
    F --> F4[指数分布]
    F --> F5[均匀分布]

九、核心思想与解题技巧

核心思想

  1. “压缩”思想(Rao-Blackwell):用充分统计量”压缩”原始估计,去掉冗余信息,降低方差
  2. “唯一性”思想(完备性):完备性保证压缩后的结果是唯一的,不会有多个不同的”最优”
  3. “两步走”策略:先找无偏估计,再用充分统计量改善——这是求UMVUE最实用的方法

解题技巧

  1. 判断UMVUE的标准流程

    • 找充分完备统计量
    • 的一个无偏估计
    • 用 Rao-Blackwell 改善(取条件期望)
    • 由 Lehmann-Scheffé 定理确认是 UMVUE
  2. 常见充分完备统计量

    • 指数族:自然充分统计量
    • 均匀分布:最大次序统计量 或最小次序统计量
  3. 条件期望的计算技巧

    • 离散情形:
    • 常转化为概率计算:如
  4. UMVUE不一定达到C-R下界

    • 正态总体 的 UMVUE 是 ,但 (C-R下界)
    • 原因:C-R正则条件不满足,或不存在有效估计
  5. UMVUE可能不存在

    • 如果不存在充分完备统计量,则 Lehmann-Scheffé 方法不适用
    • 此时需要用其他方法(如定义法)判断

十、补充理解与易混淆点

误区一:UMVUE一定达到C-R下界

来源:茆诗松《概率论与数理统计》 + 卡方训练营 + University of Wisconsin-Madison Stat 610讲义 + Banglajol统计学期刊 + Fiveable统计学习

误区1:"UMVUE的方差一定等于Cramér-Rao下界"

❌ 错误解释:UMVUE是”最优”的无偏估计,C-R下界是无偏估计方差的”下界”,所以UMVUE应该恰好达到C-R下界。 ✅ 正确解释:UMVUE的方差不一定达到C-R下界。C-R不等式成立需要满足正则条件(如支撑集不依赖参数),而很多分布不满足这些条件。例如正态总体 的 UMVUE 为 ,其方差 严格大于 C-R 下界 。UMVUE在无偏估计类中方差最小,但这个最小值可以大于C-R下界。

误区二:Rao-Blackwell改善后一定是UMVUE

来源:茆诗松《概率论与数理统计》 + PMC统计学论文 + 卡方训练营 + Berkeley Stat 210A课程讲义 + CSDN数据科学博客

误区2:"对无偏估计用Rao-Blackwell定理改善后,得到的一定是UMVUE"

❌ 错误解释:Rao-Blackwell定理能降低方差,反复改善最终就能得到UMVUE。 ✅ 正确解释:Rao-Blackwell定理只保证方差不增大,但不保证得到的是UMVUE。要保证改善后的结果是UMVUE,需要充分统计量同时具有完备性(即Lehmann-Scheffé定理的条件)。如果充分统计量不是完备的,改善后的估计可能仍然不是UMVUE。此外,如果使用的是非最小充分统计量,改善后的结果可能依赖于初始估计的选择。

误区三:极大似然估计一定是UMVUE

来源:茆诗松《概率论与数理统计》 + WPI ECE531课程讲义 + Duke大学统计课程 + 卡方训练营 + Stack Exchange Cross Validated

误区3:"极大似然估计(MLE)一定是UMVUE"

❌ 错误解释:MLE是”最好的”估计方法,所以它一定是最优无偏估计。 ✅ 正确解释:MLE和UMVUE是两个不同的概念,它们之间没有必然的包含关系。MLE不一定是无偏的(如正态总体方差的MLE 是有偏的),即使MLE是无偏的,也不一定方差最小。例如在某些分布中,MLE虽然无偏但不是充分完备统计量的函数,因此不是UMVUE。反之,UMVUE也不一定是MLE。不过,在很多常见情况下(如指数族),MLE恰好就是UMVUE。

误区四:UMVUE一定比有偏估计好

来源:茆诗松《概率论与数理统计》 + Fiveable统计学习 + Galili & Meilijson PMC论文 + 卡方训练营 + CSDN数据科学博客

误区4:"UMVUE总是比任何有偏估计更好"

❌ 错误解释:UMVUE在无偏估计中方差最小,所以它比所有有偏估计都好。 ✅ 正确解释:UMVUE只在无偏估计类中是最优的,但跳出无偏的限制后,有偏估计的MSE可能更小。例如§6.1中讨论过, 虽然是 的有偏估计,但其MSE为 ,小于UMVUE 的MSE 。评价估计量应综合考虑MSE(偏差-方差权衡),而非仅看无偏性。

误区五:完备统计量一定存在

来源:茆诗松《概率论与数理统计》 + Berkeley Stat 210A课程讲义 + University of Wisconsin-Madison Stat 610讲义 + 卡方训练营 + Wikipedia完备统计量条目

误区5:"对于任何分布和参数,都存在充分完备统计量"

❌ 错误解释:充分完备统计量是求UMVUE的标准工具,所以它总是存在的。 ✅ 正确解释:充分完备统计量不一定存在。例如,考虑柯西分布 ,其位置参数 没有有限维的充分统计量(更不用说充分完备统计量)。对于非指数族分布,充分完备统计量的存在性需要逐一验证。如果充分完备统计量不存在,则 Lehmann-Scheffé 方法不适用,UMVUE可能不存在或需要用其他方法寻找。


十一、习题精选

习题概览

共10道习题:6道教材习题 + 4道补充题(教材补充题)。

编号来源主题难度
习题1教材6.4-1UMVUE判定
习题2教材6.4-2Rao-Blackwell方法中高
习题3教材6.4-3充分完备统计量与UMVUE中高
习题4教材6.4-4正态总体UMVUE
习题5教材6.4-5泊松分布UMVUE
习题6教材6.4-6UMVUE唯一性证明
习题7补充(教材6.4-7)二项分布参数函数UMVUE★★★
习题8补充(教材6.4-8)指数分布UMVUE与C-R下界★★★
习题9补充(教材6.4-9)均匀分布UMVUE综合★★★★
习题10补充(教材6.4-10)充分完备统计量验证★★★★

教材习题

习题1(教材6.4-1)

是来自正态总体 的样本, 未知, 已知。证明 的 UMVUE。

习题2(教材6.4-2)

来自泊松分布 ,用 Rao-Blackwell 方法求 的 UMVUE。

习题3(教材6.4-3)

来自均匀分布

(1) 证明 的充分完备统计量。

(2) 求 的 UMVUE。

习题4(教材6.4-4)

均未知。证明 的 UMVUE,并求其方差。该方差是否等于 C-R 下界?

习题5(教材6.4-5)

,求 的 UMVUE。

习题6(教材6.4-6)

都是 的 UMVUE,证明

补充题

习题7(补充,教材6.4-7)

来自二点分布 。求 的 UMVUE。

习题8(补充,教材6.4-8)

来自指数分布 (密度 ),

(1) 求 的 UMVUE。

(2) 该 UMVUE 是否达到 C-R 下界?

习题9(补充,教材6.4-9)

来自均匀分布

(1) 求 的 UMVUE。

(2) 求 的 UMVUE。

习题10(补充,教材6.4-10)

来自正态总体 均未知。求 的 UMVUE(提示:利用 分布的性质)。


十二、教材原文

第六章 参数估计/最小方差无偏估计