5.5 充分统计量
本节系统介绍充分统计量 的概念、判定方法(因子分解定理)及其性质。充分统计量是数理统计中最重要的概念之一,它回答了一个核心问题:如何对样本进行最优压缩而不损失关于参数的信息?
逻辑链条 :充分性直观概念 → 定义 → 因子分解定理 → 性质 → 应用
前置依赖 :§5.3 (统计量定义)、§5.4 (正态总体抽样定理)
模块一:充分性的直观概念
Fisher vs Eddington 争论
在统计学发展早期,R.A. Fisher 与 Eddington 就如何估计正态分布的散度发生过一场著名争论:
Eddington 主张使用平均绝对偏差 d = n 1 ∑ i = 1 n ∣ X i − X ˉ ∣
Fisher 主张使用样本标准差 s = n − 1 1 ∑ i = 1 n ( X i − X ˉ ) 2
Fisher 的核心论据是:s 是正态分布参数 σ 的充分统计量 ,而 d 不是。这意味着 s 包含了样本中关于 σ 的全部信息,而 d 丢失了部分信息。使用 d 做推断时,其效率不如 s 。
核心思想:充分性 = 样本加工不损失信息
充分统计量 (sufficient statistic)的直观含义是:统计量 T = T ( X 1 , … , X n ) 对样本进行了”加工”,但这种加工没有丢失任何关于参数 θ 的信息 。
换句话说,一旦知道了 T 的值,原始样本 ( X 1 , … , X n ) 的具体取值就不再提供关于 θ 的额外信息了。
设某人打靶的命中率为 θ ,独立射击 n 次,X i 表示第 i 次射击的结果(命中=1,脱靶=0)。
样本为 ( X 1 , X 2 , … , X n ) ,参数为 θ 。
考虑统计量 T = ∑ i = 1 n X i (总命中次数)。
直观理解 :如果我们知道 T = t (命中了 t 次),那么原始样本中每个 X i 的具体值(谁命中、谁脱靶)已经不再提供关于 θ 的额外信息——因为给定 T = t 后,样本的条件分布(即哪些位置是1、哪些位置是0的排列方式)与 θ 无关。
因此,T = ∑ i = 1 n X i 是 θ 的充分统计量。
模块二:充分统计量的定义
设 X 1 , X 2 , … , X n 是来自分布 F ( x ; θ ) 的样本,T = T ( X 1 , X 2 , … , X n ) 是一个统计量。如果在给定 T = t 的条件下,样本 ( X 1 , X 2 , … , X n ) 的==条件分布不依赖于参数 θ ==,则称 T 是 θ 的充分统计量 。
用数学语言表述:对任意的 t 和 θ ,
P ( X 1 = x 1 , … , X n = x n ∣ T = t ; θ ) = P ( X 1 = x 1 , … , X n = x n ∣ T = t )
即条件分布与 θ 无关。
概率层面的分析
这个定义的本质是:
条件分布含 θ 的信息 :如果给定 T = t 后,样本的条件分布仍然依赖于 θ ,说明 T 没有提取出样本中关于 θ 的全部信息,原始样本还能提供额外信息 → T 不充分 。
条件分布不含 θ 的信息 :如果给定 T = t 后,条件分布与 θ 无关,说明 T 已经提取了样本中关于 θ 的全部信息 → T 充分 。
例 5.5.2 — 二点分布 b ( 1 , θ ) 的充分统计量
设 X 1 , X 2 , … , X n 是来自二点分布 b ( 1 , θ ) 的 i.i.d. 样本,其中 0 < θ < 1 。
结论 :T = ∑ i = 1 n X i 是 θ 的充分统计量。
第一步:计算条件概率
样本的联合分布为
P ( X 1 = x 1 , … , X n = x n ; θ ) = i = 1 ∏ n θ x i ( 1 − θ ) 1 − x i = θ ∑ x i ( 1 − θ ) n − ∑ x i
由于 T = ∑ i = 1 n X i ∼ b ( n , θ ) ,所以
P ( T = t ; θ ) = ( t n ) θ t ( 1 − θ ) n − t
第二步:化简条件概率
当 T = t 时,∑ i = 1 n x i = t ,因此
P ( X 1 = x 1 , … , X n = x n ∣ T = t ; θ ) = P ( T = t ; θ ) P ( X 1 = x 1 , … , X n = x n ; θ )
= ( t n ) θ t ( 1 − θ ) n − t θ t ( 1 − θ ) n − t = ( t n ) 1
第三步:与 θ 无关
条件概率 P ( X 1 = x 1 , … , X n = x n ∣ T = t ) = ( t n ) 1 完全不依赖于 θ ,只依赖于 n 和 t 。
因此,T = ∑ i = 1 n X i 是 θ 的充分统计量。 □
反例 :当 n > 2 时,S = X 1 + X 2 不是 θ 的充分统计量。因为给定 S = s 后,( X 3 , … , X n ) 的边际分布仍然依赖于 θ ,条件分布中仍含有 θ 的信息。
例 5.5.3 — 正态分布 N ( μ , 1 ) 的充分统计量
设 X 1 , X 2 , … , X n 是来自 N ( μ , 1 ) 的 i.i.d. 样本。
结论 :T = X ˉ = n 1 ∑ i = 1 n X i 是 μ 的充分统计量。
第一步:作变量变换
令 T = X ˉ ,并取 U i = X i − X ˉ (i = 1 , 2 , … , n − 1 )作为辅助变量。注意 ∑ i = 1 n U i = 0 ,所以只需取 n − 1 个 U i 。
该变换的 Jacobi 行列式为常数(与 μ 无关)。
第二步:计算条件密度
( T , U 1 , … , U n − 1 ) 的联合密度为
f ( t , u 1 , … , u n − 1 ; μ ) = ( 2 π ) − n /2 exp { − 2 1 i = 1 ∑ n ( x i − μ ) 2 } ⋅ ∣ J ∣
展开 ∑ i = 1 n ( x i − μ ) 2 = ∑ i = 1 n ( x i − x ˉ + x ˉ − μ ) 2 = ∑ i = 1 n ( x i − x ˉ ) 2 + n ( x ˉ − μ ) 2 :
= ( 2 π ) − n /2 exp { − 2 1 [ i = 1 ∑ n u i 2 + n ( t − μ ) 2 ] } ⋅ ∣ J ∣
T 的边际密度为 T ∼ N ( μ , 1/ n ) :
f T ( t ; μ ) = 2 π n exp { − 2 n ( t − μ ) 2 }
因此条件密度为
f ( u 1 , … , u n − 1 ∣ T = t ; μ ) = f T ( t ; μ ) f ( t , u 1 , … , u n − 1 ; μ )
= ( 2 π ) − ( n − 1 ) /2 n − 1/2 exp { − 2 1 i = 1 ∑ n u i 2 } ⋅ ∣ J ∣
第三步:与 μ 无关
条件密度中不含 μ ,因此 T = X ˉ 是 μ 的充分统计量。 □
模块三:因子分解定理
概率函数
为了统一处理离散型和连续型分布,我们引入概率函数 (probability function)的概念:
p ( x ; θ ) = { P ( X = x ; θ ) , f ( x ; θ ) , 离散型 连续型
这样,联合概率函数统一写为 p ( x 1 , … , x n ; θ ) = ∏ i = 1 n p ( x i ; θ ) 。
Neyman-Fisher 因子分解定理
定理 5.5.1 — Neyman-Fisher 因子分解定理
设 X 1 , X 2 , … , X n 是来自分布 p ( x ; θ ) 的 i.i.d. 样本,θ ∈ Θ 。则统计量 T = T ( X 1 , … , X n ) 是 θ 的充分统计量 的充要条件 是:存在两个非负函数 g 和 h ,使得联合概率函数可以分解为
p ( x 1 , … , x n ; θ ) = g ( T ( x 1 , … , x n ) , θ ) ⋅ h ( x 1 , … , x n )
其中:
g ( t , θ ) 仅通过 T 的值和 θ 依赖于样本
h ( x 1 , … , x n ) 不依赖于参数 θ
这个定理将充分性的判断从”计算条件分布”简化为”验证因子分解”,大大降低了操作难度。
必要性证明
第一步:条件概率定义
设 T 是 θ 的充分统计量,则给定 T = t 时,样本的条件分布不依赖于 θ 。由条件概率公式,
p ( x 1 , … , x n ; θ ) = p ( x 1 , … , x n ∣ T = t ; θ ) ⋅ p T ( t ; θ )
第二步:令 g 和 h
令 g ( t , θ ) = p T ( t ; θ ) (T 的边际概率函数,依赖于 θ ),令 h ( x 1 , … , x n ) = p ( x 1 , … , x n ∣ T = t ; θ ) (条件概率函数,不依赖于 θ )。
第三步:得因子分解
则 p ( x 1 , … , x n ; θ ) = g ( T ( x 1 , … , x n ) , θ ) ⋅ h ( x 1 , … , x n ) ,因子分解成立。 □
充分性证明
第一步:计算 P ( T = t ; θ )
设联合概率函数满足因子分解 p ( x 1 , … , x n ; θ ) = g ( T ( x 1 , … , x n ) , θ ) ⋅ h ( x 1 , … , x n ) 。
对 T = t 的所有可能取值集合 A t = {( x 1 , … , x n ) : T ( x 1 , … , x n ) = t } 求和(离散)或积分(连续):
p T ( t ; θ ) = ( x 1 , … , x n ) ∈ A t ∑ g ( t , θ ) ⋅ h ( x 1 , … , x n ) = g ( t , θ ) ⋅ A t ∑ h ( x 1 , … , x n )
令 H ( t ) = ∑ A t h ( x 1 , … , x n ) (不依赖于 θ ),则 p T ( t ; θ ) = g ( t , θ ) ⋅ H ( t ) 。
第二步:计算条件分布
p ( x 1 , … , x n ∣ T = t ; θ ) = p T ( t ; θ ) p ( x 1 , … , x n ; θ ) = g ( t , θ ) ⋅ H ( t ) g ( t , θ ) ⋅ h ( x 1 , … , x n ) = H ( t ) h ( x 1 , … , x n )
第三步:与 θ 无关
条件分布 p ( x 1 , … , x n ∣ T = t ) = H ( t ) h ( x 1 , … , x n ) 中不含 θ ,因此 T 是 θ 的充分统计量。 □
因子分解定理的应用
例 5.5.4 — 均匀分布 U ( 0 , θ ) 的充分统计量
设 X 1 , X 2 , … , X n 是来自 U ( 0 , θ ) 的 i.i.d. 样本,θ > 0 。
联合密度为
f ( x 1 , … , x n ; θ ) = i = 1 ∏ n θ 1 ⋅ 1 ( 0 , θ ) ( x i ) = θ n 1 ⋅ 1 ( 0 , θ ) ( x ( n ) ) ⋅ i = 1 ∏ n 1 ( 0 , ∞ ) ( x i )
其中 x ( n ) = max { x 1 , … , x n } 。
因子分解 :令 g ( t , θ ) = θ n 1 ⋅ 1 ( 0 , θ ) ( t ) ,h ( x 1 , … , x n ) = ∏ i = 1 n 1 ( 0 , ∞ ) ( x i ) 。
由于 g 仅通过 T = X ( n ) 依赖于样本,h 不含 θ ,因此 T = X ( n ) 是 θ 的充分统计量。
例 5.5.5 — 正态分布 N ( μ , σ 2 ) 的充分统计量
设 X 1 , X 2 , … , X n 是来自 N ( μ , σ 2 ) 的 i.i.d. 样本。
联合密度为
f ( x 1 , … , x n ; μ , σ 2 ) = ( 2 π σ 2 ) − n /2 exp { − 2 σ 2 1 i = 1 ∑ n ( x i − μ ) 2 }
关键恒等式:
i = 1 ∑ n ( x i − μ ) 2 = i = 1 ∑ n ( x i − x ˉ + x ˉ − μ ) 2 = i = 1 ∑ n ( x i − x ˉ ) 2 + n ( x ˉ − μ ) 2
= ( n − 1 ) s 2 + n ( x ˉ − μ ) 2
因此联合密度可写为
f = ( 2 π σ 2 ) − n /2 exp { − 2 σ 2 ( n − 1 ) s 2 − 2 σ 2 n ( x ˉ − μ ) 2 }
= g ( x ˉ , s 2 ; μ , σ 2 ) ( 2 π σ 2 ) − n /2 exp { − 2 σ 2 ( n − 1 ) s 2 + n ( x ˉ − μ ) 2 } ⋅ h ( x 1 , … , x n ) 1
g 仅通过 ( X ˉ , S 2 ) 依赖于样本,h ≡ 1 不含参数。因此 ( X ˉ , S 2 ) 是 ( μ , σ 2 ) 的充分统计量 。
模块四:充分统计量的性质
若 T 是 θ 的充分统计量,且 S = φ ( T ) 是 T 的一一对应变换(即 φ 有反函数 φ − 1 ),则 S 也是 θ 的充分统计量。
第一步:T 充分有因子分解
由 T 是充分统计量,存在 g , h 使得
p ( x 1 , … , x n ; θ ) = g ( T ( x 1 , … , x n ) , θ ) ⋅ h ( x 1 , … , x n )
第二步:令 g ∗ 得到 S 的因子分解
令 g ∗ ( s , θ ) = g ( φ − 1 ( s ) , θ ) ,则
p ( x 1 , … , x n ; θ ) = g ∗ ( S ( x 1 , … , x n ) , θ ) ⋅ h ( x 1 , … , x n )
g ∗ 仅通过 S 依赖于样本,h 不含 θ ,因此 S 也是 θ 的充分统计量。 □
推论 :充分统计量的一一变换仍是充分统计量。例如,若 X ˉ 是充分统计量,则 ∑ i = 1 n X i = n X ˉ 也是充分统计量。
充分性原则
充分性原则 (sufficiency principle):统计推断应基于充分统计量进行。如果 T 是 θ 的充分统计量,那么任何不基于 T 的推断方法都可以改进为基于 T 的方法,且不会损失信息。
这是 Rao-Blackwell 定理和 Lehmann-Scheffé 定理的理论基础。
模块五:常见分布的充分统计量汇总
分布 密度/概率函数 p ( x ; θ ) 参数 充分统计量 二点分布 b ( 1 , θ ) θ x ( 1 − θ ) 1 − x θ T = ∑ X i 二项分布 b ( n , θ ) ( x n ) θ x ( 1 − θ ) n − x θ T = X (自身)泊松分布 P ( λ ) x ! λ x e − λ λ T = ∑ X i 几何分布 G e ( θ ) θ ( 1 − θ ) x − 1 θ T = ∑ X i 负二项分布 N b ( r , θ ) ( r − 1 x − 1 ) θ r ( 1 − θ ) x − r θ T = ∑ X i 指数分布 E x p ( λ ) λ e − λ x λ T = ∑ X i 均匀分布 U ( 0 , θ ) θ 1 1 ( 0 , θ ) ( x ) θ T = X ( n ) 均匀分布 U ( θ 1 , θ 2 ) θ 2 − θ 1 1 1 ( θ 1 , θ 2 ) ( x ) θ 1 , θ 2 T = ( X ( 1 ) , X ( n ) ) 正态分布 N ( μ , σ 0 2 ) (σ 0 2 已知) 2 π σ 0 1 e − 2 σ 0 2 ( x − μ ) 2 μ T = X ˉ 正态分布 N ( μ 0 , σ 2 ) (μ 0 已知) 2 π σ 1 e − 2 σ 2 ( x − μ 0 ) 2 σ 2 T = ∑ ( X i − μ 0 ) 2 正态分布 N ( μ , σ 2 ) 2 π σ 1 e − 2 σ 2 ( x − μ ) 2 μ , σ 2 T = ( X ˉ , S 2 ) Gamma 分布 G a ( α , λ ) Γ ( α ) λ α x α − 1 e − λ x α , λ T = ( ∑ X i , ∏ X i ) Beta 分布 B e ( a , b ) Γ ( a ) Γ ( b ) Γ ( a + b ) x a − 1 ( 1 − x ) b − 1 a , b T = ( ∑ ln X i , ∑ ln ( 1 − X i )) 幂分布 θ x θ − 1 , 0 < x < 1 θ T = ∏ X i (或 ∑ ln X i )
指数族分布的充分统计量
指数族分布 (exponential family)的概率函数具有如下标准形式:
p ( x ; θ ) = C ( θ ) exp { j = 1 ∑ k Q j ( θ ) T j ( x ) } h ( x )
对于 i.i.d. 样本 X 1 , … , X n ,联合概率函数为
p ( x 1 , … , x n ; θ ) = C ( θ ) n exp { j = 1 ∑ k Q j ( θ ) i = 1 ∑ n T j ( x i ) } i = 1 ∏ n h ( x i )
由因子分解定理,充分统计量为
T = ( i = 1 ∑ n T 1 ( X i ) , i = 1 ∑ n T 2 ( X i ) , … , i = 1 ∑ n T k ( X i ) )
这是指数族分布的一个重要性质:充分统计量的维数等于自然参数空间的维数 k 。
模块六:知识结构总览
graph TD
A[充分性直观概念<br/>样本加工不损失信息] --> B[充分统计量定义<br/>条件分布不含θ]
B --> C[因子分解定理<br/>Neyman-Fisher]
C --> D[充分统计量性质<br/>一一变换保持充分性]
C --> E[常见分布充分统计量<br/>指数族统一框架]
D --> F[充分性原则<br/>推断应基于充分统计量]
E --> G[应用<br/>参数估计与假设检验]
B --> H[例题验证<br/>二点分布/正态分布/均匀分布]
C --> H
模块七:核心思想与技巧
因子分解定理使用技巧
使用因子分解定理判断充分统计量时,关键步骤如下:
写出联合概率函数 p ( x 1 , … , x n ; θ ) = ∏ i = 1 n p ( x i ; θ )
提取含 θ 的部分 :将联合概率函数中所有含 θ 的因子集中起来
检查含 θ 部分是否仅通过某个统计量 T 依赖于样本 :
如果是,则 T 是充分统计量
如果不是,则可能需要更高维的统计量,或不存在低维充分统计量
分离不含 θ 的部分 作为 h ( x 1 , … , x n )
充分统计量判断流程图
graph TD
A[给定统计量T] --> B{T能否提取样本中全部关于参数的信息?}
B -->|用定义| C[计算条件分布]
B -->|用因子分解| D[尝试分解联合概率函数]
C --> E{条件分布含参数?}
D --> F{g仅通过T依赖样本?}
E -->|否| G[T是充分统计量]
E -->|是| H[T不是充分统计量]
F -->|是| G
F -->|否| H
模块八:补充理解与易混淆点
充分统计量与完备统计量混淆
来源 :茆诗松§5.5 p264 + 维基教科书《常见分布族与充分统计量》 + CSDN《概率论与数理统计教程(五)》 + 卡方核心笔记 + bookdown《统计考研复习参考》Ch5
❌ 错误解释 :认为充分统计量自动具有完备性,是最优的。
✅ 正确解释 :充分性≠完备性 。充分统计量只保证”不损失信息”,但完备统计量还要求”充分统计量本身的分布不依赖于参数 θ “。存在充分但不完备的统计量。在实际应用中,我们希望找到既充分又完备 的统计量。
因子分解定理中 g 和 h 的角色混淆
来源 :茆诗松§5.5 p262-263 + CSDN《概率论与数理统计教程(五)》 + UIC《Neyman-Fisher Theorem》 + IISc《Lecture 9: Sufficient Statistics》 + 卡方核心笔记
误区2:"因子分解定理中 h ( x ) 可以含参数 θ "
❌ 错误解释 :认为 h ( x 1 , … , x n ) 中可以包含参数 θ 。
✅ 正确解释 :在因子分解 f = g ⋅ h 中,==h ( x ) 绝对不能含有参数 θ ==。h ( x ) 只依赖于样本值,与 θ 无关。所有与 θ 有关的信息都必须通过 g ( T ( x ) , θ ) 中的 T ( x ) 来传递。如果 h 中含 θ ,则分解无效,不能据此判断充分性。
充分统计量维数与参数维数的关系
来源 :茆诗松§5.5习题12解答 + 维基教科书《常见分布族与充分统计量》 + CSDN《概率论与数理统计教程(五)》 + 卡方核心笔记 + bookdown《统计考研复习参考》Ch5
误区3:"充分统计量的维数一定等于未知参数的维数"
❌ 错误解释 :认为一维参数的充分统计量一定是一维的。
✅ 正确解释 :充分统计量的维数不一定等于参数的维数 。例如 U ( θ , 2 θ ) 的参数 θ 是一维的,但充分统计量是 ( X ( 1 ) , X ( n ) ) (二维)。又如 N ( μ , σ 2 ) 的参数 ( μ , σ 2 ) 是二维的,充分统计量 ( X ˉ , S 2 ) 也是二维的——此时维数恰好相等,但这不是一般规律。
模块九:习题精选
共 10 道习题:6 道教材习题 + 4 道补充题。
编号 来源 主题 难度 1 教材 5.5-1 几何分布充分统计量 ★★☆ 2 教材 5.5-2 泊松分布充分统计量 ★★☆ 3 教材 5.5-4 N ( μ , 1 ) 充分统计量★★☆ 4 教材 5.5-5 幂分布充分统计量 ★★★ 5 教材 5.5-10 N ( μ , σ 2 ) 单参数情形★★★ 6 教材 5.5-11 U ( θ 1 , θ 2 ) 充分统计量★★★ 7 补充(教材5.5-3) 离散分布次序统计量与频数 ★★★ 8 补充(教材5.5-15) 指数族分布充分统计量 ★★★ 9 补充(教材5.5-17) 二元正态分布充分统计量 ★★★★ 10 补充(教材5.5-19) 两参数指数分布充分统计量 ★★★
习题1(教材 5.5-1):几何分布 G e ( θ ) 的充分统计量
设 X 1 , X 2 , … , X n 是来自几何分布 G e ( θ ) 的 i.i.d. 样本,其概率函数为
P ( X = x ; θ ) = θ ( 1 − θ ) x − 1 , x = 1 , 2 , 3 , …
求 θ 的充分统计量。
解 :写出联合概率函数
P ( X 1 = x 1 , … , X n = x n ; θ ) = i = 1 ∏ n θ ( 1 − θ ) x i − 1 = θ n ( 1 − θ ) ∑ i = 1 n ( x i − 1 )
= θ n ( 1 − θ ) ∑ x i − n
令 T = ∑ i = 1 n X i ,则
P = g ( T , θ ) θ n ( 1 − θ ) T − n ⋅ h ( x 1 , … , x n ) 1
g 仅通过 T 依赖于样本,h 不含 θ 。因此 T = ∑ i = 1 n X i 是 θ 的充分统计量。
补充 :T = ∑ X i ∼ N b ( n , θ ) (负二项分布),给定 T = t 时,
P ( X 1 = x 1 , … , X n = x n ∣ T = t ) = ( t n + t − 1 ) 1
与 θ 无关,验证了充分性。
习题2(教材 5.5-2):泊松分布 P ( λ ) 的充分统计量
设 X 1 , X 2 , … , X n 是来自泊松分布 P ( λ ) 的 i.i.d. 样本。求 λ 的充分统计量。
解 :联合概率函数为
P ( X 1 = x 1 , … , X n = x n ; λ ) = i = 1 ∏ n x i ! λ x i e − λ = ∏ i = 1 n x i ! λ ∑ x i e − nλ
令 T = ∑ i = 1 n X i ,则
P = g ( T , λ ) λ T e − nλ ⋅ h ( x 1 , … , x n ) ∏ i = 1 n x i ! 1
g 仅通过 T 依赖于样本,h 不含 λ 。因此 T = ∑ i = 1 n X i 是 λ 的充分统计量。
补充 :T ∼ P ( nλ ) ,给定 T = t 时,
P ( X 1 = x 1 , … , X n = x n ∣ T = t ) = n t ∏ i = 1 n x i ! t !
与 λ 无关。
习题3(教材 5.5-4):N ( μ , 1 ) 的充分统计量
设 X 1 , X 2 , … , X n 是来自 N ( μ , 1 ) 的 i.i.d. 样本。证明 T = ∑ i = 1 n X i (或等价地 X ˉ )是 μ 的充分统计量。
证明 :联合密度为
f ( x 1 , … , x n ; μ ) = ( 2 π ) − n /2 exp { − 2 1 i = 1 ∑ n ( x i − μ ) 2 }
展开 ∑ ( x i − μ ) 2 = ∑ x i 2 − 2 μ ∑ x i + n μ 2 ,令 T = ∑ x i :
f = ( 2 π ) − n /2 exp { − 2 1 ∑ x i 2 + μ T − 2 n μ 2 }
= g ( T , μ ) exp { μ T − 2 n μ 2 } ⋅ h ( x 1 , … , x n ) ( 2 π ) − n /2 exp { − 2 1 ∑ x i 2 }
g 仅通过 T = ∑ X i 依赖于样本,h 不含 μ 。因此 T = ∑ i = 1 n X i 是 μ 的充分统计量。
由定理 5.5.2,X ˉ = T / n 也是 μ 的充分统计量。 □
习题4(教材 5.5-5):幂分布的充分统计量
设 X 1 , X 2 , … , X n 是来自幂分布的 i.i.d. 样本,密度函数为
p ( x ; θ ) = θ x θ − 1 , 0 < x < 1 , θ > 0
求 θ 的充分统计量。
解 :联合密度为
f ( x 1 , … , x n ; θ ) = i = 1 ∏ n θ x i θ − 1 = θ n ( i = 1 ∏ n x i ) θ − 1
令 T = ∏ i = 1 n X i ,则
f = g ( T , θ ) θ n ⋅ T θ − 1 ⋅ h ( x 1 , … , x n ) 1
g 仅通过 T 依赖于样本,h 不含 θ 。因此 T = ∏ i = 1 n X i 是 θ 的充分统计量。
等价形式 :取对数 ln T = ∑ i = 1 n ln X i ,由定理 5.5.2(一一变换),T ′ = ∑ i = 1 n ln X i 也是 θ 的充分统计量。
习题5(教材 5.5-10):N ( μ , σ 2 ) 单参数情形
设 X 1 , X 2 , … , X n 是来自 N ( μ , σ 2 ) 的 i.i.d. 样本。
(1) 当 μ 已知时,求 σ 2 的充分统计量。
(2) 当 σ 2 已知时,求 μ 的充分统计量。
解 (1) :μ 已知时,联合密度为
f = ( 2 π σ 2 ) − n /2 exp { − 2 σ 2 1 i = 1 ∑ n ( x i − μ ) 2 }
令 T = ∑ i = 1 n ( X i − μ ) 2 ,则
f = g ( T , σ 2 ) ( 2 π σ 2 ) − n /2 exp { − 2 σ 2 T } ⋅ h ( x 1 , … , x n ) 1
因此 T = ∑ i = 1 n ( X i − μ ) 2 是 σ 2 的充分统计量。
解 (2) :σ 2 已知时,联合密度为
f = ( 2 π σ 2 ) − n /2 exp { − 2 σ 2 1 i = 1 ∑ n ( x i − μ ) 2 }
展开 ∑ ( x i − μ ) 2 = ∑ x i 2 − 2 μ ∑ x i + n μ 2 ,令 T = X ˉ = n 1 ∑ X i :
f = g ( T , μ ) ( 2 π σ 2 ) − n /2 exp { − 2 σ 2 1 ∑ x i 2 + σ 2 n μ T − 2 σ 2 n μ 2 } ⋅ h ( x 1 , … , x n ) 1
注意 ∑ x i 2 = ∑ ( x i − x ˉ ) 2 + n x ˉ 2 ,其中 ∑ ( x i − x ˉ ) 2 不含 μ ,可以归入 h 。因此 T = X ˉ 是 μ 的充分统计量。
习题6(教材 5.5-11):U ( θ 1 , θ 2 ) 的充分统计量
设 X 1 , X 2 , … , X n 是来自均匀分布 U ( θ 1 , θ 2 ) 的 i.i.d. 样本,− ∞ < θ 1 < θ 2 < + ∞ 。求 ( θ 1 , θ 2 ) 的充分统计量。
解 :联合密度为
f ( x 1 , … , x n ; θ 1 , θ 2 ) = i = 1 ∏ n θ 2 − θ 1 1 1 ( θ 1 , θ 2 ) ( x i ) = ( θ 2 − θ 1 ) n 1 1 ( θ 1 , θ 2 ) ( x ( 1 ) ) 1 ( θ 1 , θ 2 ) ( x ( n ) )
其中 x ( 1 ) = min { x 1 , … , x n } ,x ( n ) = max { x 1 , … , x n } 。
指示函数 1 ( θ 1 , θ 2 ) ( x ( 1 ) ) 1 ( θ 1 , θ 2 ) ( x ( n ) ) 等价于 1 θ 1 < x ( 1 ) ⋅ 1 x ( n ) < θ 2 。
令 T = ( X ( 1 ) , X ( n ) ) ,则
f = g ( T , θ 1 , θ 2 ) ( θ 2 − θ 1 ) n 1 1 θ 1 < x ( 1 ) 1 x ( n ) < θ 2 ⋅ h ( x 1 , … , x n ) 1
g 仅通过 ( X ( 1 ) , X ( n ) ) 依赖于样本,h 不含参数。因此 T = ( X ( 1 ) , X ( n ) ) 是 ( θ 1 , θ 2 ) 的充分统计量。
习题7(补充,教材 5.5-3):离散分布次序统计量与频数的充分性
设 X 1 , X 2 , … , X n 是来自离散分布的 i.i.d. 样本,X i 取值为 a 1 , a 2 , … , a k ,对应概率为 p 1 ( θ ) , p 2 ( θ ) , … , p k ( θ ) 。证明:
(1) 次序统计量 ( X ( 1 ) , X ( 2 ) , … , X ( n ) ) 是 θ 的充分统计量。
(2) 频数向量 ( n 1 , n 2 , … , n k ) (其中 n j = # { i : X i = a j } )也是 θ 的充分统计量。
证明 (1) :联合概率函数为
P ( X 1 = x 1 , … , X n = x n ; θ ) = i = 1 ∏ n p j i ( θ )
其中 j i 满足 x i = a j i 。
令 T = ( X ( 1 ) , … , X ( n ) ) (次序统计量),则
P = g ( T , θ ) i = 1 ∏ n p j i ( θ ) ⋅ h ( x 1 , … , x n ) 1
g 仅通过次序统计量 T 依赖于样本(因为乘积中每个因子的值由 T 完全确定),h 不含 θ 。因此次序统计量是充分统计量。
证明 (2) :设频数 n j = # { i : X i = a j } ,则 ∑ j = 1 k n j = n 。
P = j = 1 ∏ k p j ( θ ) n j
令 T ′ = ( n 1 , n 2 , … , n k ) ,则
P = g ( T ′ , θ ) j = 1 ∏ k p j ( θ ) n j ⋅ h ( x 1 , … , x n ) 1
g 仅通过频数向量 T ′ 依赖于样本,h 不含 θ 。因此频数向量也是充分统计量。 □
习题8(补充,教材 5.5-15):指数族分布的充分统计量
设 X 1 , X 2 , … , X n 是来自指数族分布的 i.i.d. 样本,其概率函数为
p ( x ; θ ) = C ( θ ) exp { j = 1 ∑ k Q j ( θ ) T j ( x ) } h ( x )
证明充分统计量为 T = ( ∑ i = 1 n T 1 ( X i ) , … , ∑ i = 1 n T k ( X i ) ) 。
证明 :联合概率函数为
p ( x 1 , … , x n ; θ ) = i = 1 ∏ n [ C ( θ ) exp { j = 1 ∑ k Q j ( θ ) T j ( x i ) } h ( x i ) ]
= C ( θ ) n exp { j = 1 ∑ k Q j ( θ ) i = 1 ∑ n T j ( x i ) } i = 1 ∏ n h ( x i )
令 S j = ∑ i = 1 n T j ( X i ) (j = 1 , 2 , … , k ),T = ( S 1 , … , S k ) ,则
p = g ( T , θ ) C ( θ ) n exp { j = 1 ∑ k Q j ( θ ) S j } ⋅ h ∗ ( x 1 , … , x n ) i = 1 ∏ n h ( x i )
g 仅通过 T = ( S 1 , … , S k ) 依赖于样本,h ∗ 不含 θ 。因此 T 是 θ 的充分统计量。 □
习题9(补充,教材 5.5-17):二元正态分布的充分统计量
设 ( X 1 , Y 1 ) , ( X 2 , Y 2 ) , … , ( X n , Y n ) 是来自二元正态分布 N ( μ 1 , μ 2 , σ 1 2 , σ 2 2 , ρ ) 的 i.i.d. 样本。求五个参数 ( μ 1 , μ 2 , σ 1 2 , σ 2 2 , ρ ) 的充分统计量。
解 :二元正态分布的联合密度为
f ( x , y ) = 2 π σ 1 σ 2 1 − ρ 2 1 exp { − 2 ( 1 − ρ 2 ) 1 [ σ 1 2 ( x − μ 1 ) 2 − σ 1 σ 2 2 ρ ( x − μ 1 ) ( y − μ 2 ) + σ 2 2 ( y − μ 2 ) 2 ] }
样本的联合密度中,指数部分展开后,所有含参数的项可以整理为以下五个统计量的函数:
∑ i = 1 n X i (含 μ 1 )
∑ i = 1 n X i 2 (含 σ 1 2 )
∑ i = 1 n Y i (含 μ 2 )
∑ i = 1 n Y i 2 (含 σ 2 2 )
∑ i = 1 n X i Y i (含 ρ )
因此,五个参数的充分统计量为
T = ( i = 1 ∑ n X i , i = 1 ∑ n X i 2 , i = 1 ∑ n Y i , i = 1 ∑ n Y i 2 , i = 1 ∑ n X i Y i )
习题10(补充,教材 5.5-19):两参数指数分布的充分统计量
设 X 1 , X 2 , … , X n 是来自两参数指数分布的 i.i.d. 样本,密度函数为
p ( x ; θ , μ ) = θ 1 e − ( x − μ ) / θ , x > μ , θ > 0
求 ( θ , μ ) 的充分统计量。
解 :联合密度为
f ( x 1 , … , x n ; θ , μ ) = i = 1 ∏ n θ 1 e − ( x i − μ ) / θ 1 x i > μ
= θ n 1 exp { − θ 1 i = 1 ∑ n ( x i − μ ) } 1 x ( 1 ) > μ
= θ n 1 exp { − θ ∑ x i − n μ } 1 x ( 1 ) > μ
令 T 1 = X ( 1 ) = min { X 1 , … , X n } ,T 2 = ∑ i = 1 n X i ,则
f = g ( T 1 , T 2 ; θ , μ ) θ n 1 exp { − θ T 2 − n μ } 1 T 1 > μ ⋅ h ( x 1 , … , x n ) 1
g 仅通过 ( T 1 , T 2 ) 依赖于样本,h 不含参数。因此 ( X ( 1 ) , ∑ i = 1 n X i ) 是 ( θ , μ ) 的充分统计量。
由定理 5.5.2,( X ( 1 ) , X ˉ ) 也是 ( θ , μ ) 的充分统计量。
模块十:教材原文
第五章 统计量及其分布/充分统计量