5.5 充分统计量

本节概览

本节系统介绍充分统计量的概念、判定方法(因子分解定理)及其性质。充分统计量是数理统计中最重要的概念之一,它回答了一个核心问题:如何对样本进行最优压缩而不损失关于参数的信息?

逻辑链条充分性直观概念定义因子分解定理性质应用

前置依赖§5.3(统计量定义)、§5.4(正态总体抽样定理)


模块一:充分性的直观概念

Fisher vs Eddington 争论

在统计学发展早期,R.A. Fisher 与 Eddington 就如何估计正态分布的散度发生过一场著名争论:

  • Eddington 主张使用平均绝对偏差
  • Fisher 主张使用样本标准差

Fisher 的核心论据是: 是正态分布参数 充分统计量,而 不是。这意味着 包含了样本中关于 的全部信息,而 丢失了部分信息。使用 做推断时,其效率不如

核心思想:充分性 = 样本加工不损失信息

充分统计量(sufficient statistic)的直观含义是:统计量 对样本进行了”加工”,但这种加工没有丢失任何关于参数 的信息

换句话说,一旦知道了 的值,原始样本 的具体取值就不再提供关于 的额外信息了。

例 5.5.1 — 打靶命中率

设某人打靶的命中率为 ,独立射击 次, 表示第 次射击的结果(命中=1,脱靶=0)。

样本为 ,参数为

考虑统计量 (总命中次数)。

直观理解:如果我们知道 (命中了 次),那么原始样本中每个 的具体值(谁命中、谁脱靶)已经不再提供关于 的额外信息——因为给定 后,样本的条件分布(即哪些位置是1、哪些位置是0的排列方式)与 无关。

因此, 的充分统计量。


模块二:充分统计量的定义

定义 5.5.1 — 充分统计量

是来自分布 的样本, 是一个统计量。如果在给定 的条件下,样本 的==条件分布不依赖于参数 ==,则称 充分统计量

用数学语言表述:对任意的

即条件分布与 无关。

概率层面的分析

这个定义的本质是:

  1. 条件分布含 的信息:如果给定 后,样本的条件分布仍然依赖于 ,说明 没有提取出样本中关于 的全部信息,原始样本还能提供额外信息 → 不充分
  2. 条件分布不含 的信息:如果给定 后,条件分布与 无关,说明 已经提取了样本中关于 的全部信息 → 充分

例 5.5.2 — 二点分布 的充分统计量

是来自二点分布 的 i.i.d. 样本,其中

结论 的充分统计量。

证明

第一步:计算条件概率

样本的联合分布为

由于 ,所以

第二步:化简条件概率

时,,因此

第三步:与 无关

条件概率 完全不依赖于 ,只依赖于

因此, 的充分统计量。

反例:当 时, 不是 的充分统计量。因为给定 后, 的边际分布仍然依赖于 ,条件分布中仍含有 的信息。

例 5.5.3 — 正态分布 的充分统计量

是来自 的 i.i.d. 样本。

结论 的充分统计量。

证明

第一步:作变量变换

,并取 )作为辅助变量。注意 ,所以只需取

该变换的 Jacobi 行列式为常数(与 无关)。

第二步:计算条件密度

的联合密度为

展开

的边际密度为

因此条件密度为

第三步:与 无关

条件密度中不含 ,因此 的充分统计量。


模块三:因子分解定理

概率函数

为了统一处理离散型和连续型分布,我们引入概率函数(probability function)的概念:

这样,联合概率函数统一写为

Neyman-Fisher 因子分解定理

定理 5.5.1 — Neyman-Fisher 因子分解定理

是来自分布 的 i.i.d. 样本,。则统计量 充分统计量充要条件是:存在两个非负函数 ,使得联合概率函数可以分解为

其中:

  • 仅通过 的值和 依赖于样本
  • 不依赖于参数

这个定理将充分性的判断从”计算条件分布”简化为”验证因子分解”,大大降低了操作难度。

必要性证明

证明(必要性: 充分 ⟹ 因子分解成立)

第一步:条件概率定义

的充分统计量,则给定 时,样本的条件分布不依赖于 。由条件概率公式,

第二步:令

的边际概率函数,依赖于 ),令 (条件概率函数,不依赖于 )。

第三步:得因子分解

,因子分解成立。

充分性证明

证明(充分性:因子分解成立 ⟹ 充分)

第一步:计算

设联合概率函数满足因子分解

的所有可能取值集合 求和(离散)或积分(连续):

(不依赖于 ),则

第二步:计算条件分布

第三步:与 无关

条件分布 中不含 ,因此 的充分统计量。

因子分解定理的应用

例 5.5.4 — 均匀分布 的充分统计量

是来自 的 i.i.d. 样本,

联合密度为

其中

因子分解:令

由于 仅通过 依赖于样本, 不含 ,因此 的充分统计量。

例 5.5.5 — 正态分布 的充分统计量

是来自 的 i.i.d. 样本。

联合密度为

关键恒等式:

因此联合密度可写为

仅通过 依赖于样本, 不含参数。因此 充分统计量


模块四:充分统计量的性质

定理 5.5.2 — 充分统计量的一一变换

的充分统计量,且 的一一对应变换(即 有反函数 ),则 也是 的充分统计量。

证明

第一步: 充分有因子分解

是充分统计量,存在 使得

第二步:令 得到 的因子分解

,则

仅通过 依赖于样本, 不含 ,因此 也是 的充分统计量。

推论:充分统计量的一一变换仍是充分统计量。例如,若 是充分统计量,则 也是充分统计量。

充分性原则

充分性原则(sufficiency principle):统计推断应基于充分统计量进行。如果 的充分统计量,那么任何不基于 的推断方法都可以改进为基于 的方法,且不会损失信息。

这是 Rao-Blackwell 定理和 Lehmann-Scheffé 定理的理论基础。


模块五:常见分布的充分统计量汇总

分布密度/概率函数 参数充分统计量
二点分布
二项分布 (自身)
泊松分布
几何分布
负二项分布
指数分布
均匀分布
均匀分布
正态分布 已知)
正态分布 已知)
正态分布
Gamma 分布
Beta 分布
幂分布(或

指数族分布的充分统计量

指数族分布(exponential family)的概率函数具有如下标准形式:

对于 i.i.d. 样本 ,联合概率函数为

由因子分解定理,充分统计量为

这是指数族分布的一个重要性质:充分统计量的维数等于自然参数空间的维数


模块六:知识结构总览

graph TD
    A[充分性直观概念<br/>样本加工不损失信息] --> B[充分统计量定义<br/>条件分布不含θ]
    B --> C[因子分解定理<br/>Neyman-Fisher]
    C --> D[充分统计量性质<br/>一一变换保持充分性]
    C --> E[常见分布充分统计量<br/>指数族统一框架]
    D --> F[充分性原则<br/>推断应基于充分统计量]
    E --> G[应用<br/>参数估计与假设检验]
    B --> H[例题验证<br/>二点分布/正态分布/均匀分布]
    C --> H

模块七:核心思想与技巧

因子分解定理使用技巧

使用因子分解定理判断充分统计量时,关键步骤如下:

  1. 写出联合概率函数
  2. 提取含 的部分:将联合概率函数中所有含 的因子集中起来
  3. 检查含 部分是否仅通过某个统计量 依赖于样本
    • 如果是,则 是充分统计量
    • 如果不是,则可能需要更高维的统计量,或不存在低维充分统计量
  4. 分离不含 的部分作为

充分统计量判断流程图

graph TD
    A[给定统计量T] --> B{T能否提取样本中全部关于参数的信息?}
    B -->|用定义| C[计算条件分布]
    B -->|用因子分解| D[尝试分解联合概率函数]
    C --> E{条件分布含参数?}
    D --> F{g仅通过T依赖样本?}
    E -->|否| G[T是充分统计量]
    E -->|是| H[T不是充分统计量]
    F -->|是| G
    F -->|否| H

模块八:补充理解与易混淆点

充分统计量与完备统计量混淆

来源:茆诗松§5.5 p264 + 维基教科书《常见分布族与充分统计量》 + CSDN《概率论与数理统计教程(五)》 + 卡方核心笔记 + bookdown《统计考研复习参考》Ch5

误区1:"充分统计量就是最好的统计量"

错误解释:认为充分统计量自动具有完备性,是最优的。

正确解释充分性≠完备性。充分统计量只保证”不损失信息”,但完备统计量还要求”充分统计量本身的分布不依赖于参数 “。存在充分但不完备的统计量。在实际应用中,我们希望找到既充分又完备的统计量。

因子分解定理中 的角色混淆

来源:茆诗松§5.5 p262-263 + CSDN《概率论与数理统计教程(五)》 + UIC《Neyman-Fisher Theorem》 + IISc《Lecture 9: Sufficient Statistics》 + 卡方核心笔记

误区2:"因子分解定理中 可以含参数 "

错误解释:认为 中可以包含参数

正确解释:在因子分解 中,== 绝对不能含有参数 ==。 只依赖于样本值,与 无关。所有与 有关的信息都必须通过 中的 来传递。如果 中含 ,则分解无效,不能据此判断充分性。

充分统计量维数与参数维数的关系

来源:茆诗松§5.5习题12解答 + 维基教科书《常见分布族与充分统计量》 + CSDN《概率论与数理统计教程(五)》 + 卡方核心笔记 + bookdown《统计考研复习参考》Ch5

误区3:"充分统计量的维数一定等于未知参数的维数"

错误解释:认为一维参数的充分统计量一定是一维的。

正确解释:充分统计量的维数不一定等于参数的维数。例如 的参数 是一维的,但充分统计量是 (二维)。又如 的参数 是二维的,充分统计量 也是二维的——此时维数恰好相等,但这不是一般规律。


模块九:习题精选

习题概览

共 10 道习题:6 道教材习题 + 4 道补充题。

编号来源主题难度
1教材 5.5-1几何分布充分统计量★★☆
2教材 5.5-2泊松分布充分统计量★★☆
3教材 5.5-4 充分统计量★★☆
4教材 5.5-5幂分布充分统计量★★★
5教材 5.5-10 单参数情形★★★
6教材 5.5-11 充分统计量★★★
7补充(教材5.5-3)离散分布次序统计量与频数★★★
8补充(教材5.5-15)指数族分布充分统计量★★★
9补充(教材5.5-17)二元正态分布充分统计量★★★★
10补充(教材5.5-19)两参数指数分布充分统计量★★★

习题1(教材 5.5-1):几何分布 的充分统计量

习题 1

是来自几何分布 的 i.i.d. 样本,其概率函数为

的充分统计量。


习题2(教材 5.5-2):泊松分布 的充分统计量

习题 2

是来自泊松分布 的 i.i.d. 样本。求 的充分统计量。


习题3(教材 5.5-4): 的充分统计量

习题 3

是来自 的 i.i.d. 样本。证明 (或等价地 )是 的充分统计量。


习题4(教材 5.5-5):幂分布的充分统计量

习题 4

是来自幂分布的 i.i.d. 样本,密度函数为

的充分统计量。


习题5(教材 5.5-10): 单参数情形

习题 5

是来自 的 i.i.d. 样本。

(1) 当 已知时,求 的充分统计量。

(2) 当 已知时,求 的充分统计量。


习题6(教材 5.5-11): 的充分统计量

习题 6

是来自均匀分布 的 i.i.d. 样本,。求 的充分统计量。


习题7(补充,教材 5.5-3):离散分布次序统计量与频数的充分性

习题 7

是来自离散分布的 i.i.d. 样本, 取值为 ,对应概率为 。证明:

(1) 次序统计量 的充分统计量。

(2) 频数向量 (其中 )也是 的充分统计量。


习题8(补充,教材 5.5-15):指数族分布的充分统计量

习题 8

是来自指数族分布的 i.i.d. 样本,其概率函数为

证明充分统计量为


习题9(补充,教材 5.5-17):二元正态分布的充分统计量

习题 9

是来自二元正态分布 的 i.i.d. 样本。求五个参数 的充分统计量。


习题10(补充,教材 5.5-19):两参数指数分布的充分统计量

习题 10

是来自两参数指数分布的 i.i.d. 样本,密度函数为

的充分统计量。


模块十:教材原文


第五章 统计量及其分布/充分统计量