7.4 似然比检验与分布拟合检验

本节概览

本节介绍两种重要的检验方法：似然比检验和卡方检验。似然比检验是一种具有优良统计性质的通用检验方法，其核心思想是比较原假设和备择假设下的似然函数之比。卡方拟合优度检验用于检验总体分布是否服从某个指定分布，独立性检验（列联表卡方检验）用于检验两个分类变量是否独立。

逻辑链条：似然比思想 → 最优检验 → 广义似然比 → 拟合优度 → 独立性检验 → 汇总

前置依赖：§7.1（假设检验基本概念）、§6.3（MLE、似然函数）、§5.4（卡方分布）、§7.3（大样本检验）

核心主线：似然比检验的核心是”比较两个假设下数据的似然程度”。Neyman-Pearson引理证明了简单假设下似然比检验是最优检验（MP检验）。广义似然比检验将此思想推广到复合假设。卡方检验是广义似然比检验在大样本下的渐近等价形式，广泛应用于分布拟合和独立性检验。

一、似然比检验的基本思想

在§7.1中，我们介绍了假设检验的基本框架：给定原假设 $H_{0}$ 和备择假设 $H_{1}$ ，构造检验统计量，确定拒绝域，使得犯第一类错误的概率不超过显著性水平 $α$ 。然而，§7.1和§7.2中的检验方法都是针对特定分布和特定参数设计的，缺乏统一的构造思路。似然比检验提供了一种通用的检验构造方法，其核心思想非常直观：比较数据在原假设下和在全参数空间下的似然程度。

似然比统计量

定义 7.4.1 — 似然比统计量

设样本 $X_{1}, X_{2}, \dots, X_{n}$ 的联合密度（或概率函数）为 $f (x_{1}, x_{2}, \dots, x_{n}; θ)$ ，参数 $θ \in Θ$ 。考虑假设检验问题
$H_{0} : θ \in Θ_{0} vs H_{1} : θ \in Θ_{1} = Θ ∖ Θ_{0}$
其中 $Θ_{0} \subset Θ$ 。定义似然比统计量为
$Λ = \frac{sup _{θ \in Θ_{0}} L ( θ )}{sup _{θ \in Θ} L ( θ )} = \frac{sup _{θ \in Θ_{0}} \prod _{i = 1}^{n} f ( x _{i} ; θ )}{sup _{θ \in Θ} \prod _{i = 1}^{n} f ( x _{i} ; θ )}$
其中 $L (θ) = \prod_{i = 1}^{n} f (x_{i}; θ)$ 为似然函数。

似然比统计量的基本性质：

取值范围：由于 $Θ_{0} \subset Θ$ ，分子是分母的某个子集上的上确界，因此

0 ⩽ Λ ⩽ 1

直观含义：
- $Λ$ 接近 $1$ ：数据在 $H_{0}$ 下的最大似然与在全参数空间下的最大似然几乎相同，说明 $H_{0}$ 对数据的解释能力与无限制模型相当，不拒绝 $H_{0}$ 。
- $Λ$ 接近 $0$ ：数据在 $H_{0}$ 下的最大似然远小于在全参数空间下的最大似然，说明 $H_{0}$ 对数据的解释能力很差，拒绝 $H_{0}$ 。
拒绝域：似然比检验的拒绝域形如

W = {Λ ⩽ c}

其中临界值 $c$ 由显著性水平 $α$ 确定： $P_{θ_{0}} (Λ ⩽ c) = α$ 。

直观理解

可以用一个生活类比来理解似然比检验的思想：

类比：假设你是一名侦探，要判断嫌疑人是否有罪（ $H_{0}$ ：无罪 vs $H_{1}$ ：有罪）。你收集了证据（数据），现在要评估这些证据在”无罪”假设下的合理性。如果证据在”有罪”假设下很容易解释，但在”无罪”假设下几乎不可能出现（ $Λ$ 很小），你就倾向于拒绝”无罪”假设。

关键公式：等价地，可以使用对数似然比

ln Λ = θ \in Θ_{0} sup ln L (θ) - θ \in Θ sup ln L (θ)

由于对数函数是单调递增的， $Λ ⩽ c$ 等价于 $ln Λ ⩽ ln c$ 。实际计算中，对数似然比更为方便。

例题 7.4.1

设 $X_{1}, X_{2}, \dots, X_{n} \sim iid N (μ, σ^{2})$ ，其中 $σ^{2}$ 已知。考虑检验问题
$H_{0} : μ = μ_{0} vs H_{1} : μ \neq = μ_{0}$
求似然比统计量。

解：似然函数为
$L (μ) = (2 π σ^{2})^{- n /2} exp {- \frac{1}{2 σ ^{2}} i = 1 \sum n (x_{i} - μ)^{2}}$
在 $H_{0}$ 下， $μ = μ_{0}$ ，似然函数值为
$L (μ_{0}) = (2 π σ^{2})^{- n /2} exp {- \frac{1}{2 σ ^{2}} i = 1 \sum n (x_{i} - μ_{0})^{2}}$
在全参数空间 $Θ = (- \infty, + \infty)$ 上，MLE为 $\overset{μ}{^} = \overset{ˉ}{X}$ ，最大似然值为
$L (\overset{μ}{^}) = (2 π σ^{2})^{- n /2} exp {- \frac{1}{2 σ ^{2}} i = 1 \sum n (x_{i} - \overset{x}{ˉ})^{2}}$
因此似然比为
$Λ = \frac{L ( μ _{0} )}{L ( μ ^ )} = exp {- \frac{n}{2 σ ^{2}} (\overset{x}{ˉ} - μ_{0})^{2}}$
取对数得
$ln Λ = - \frac{n}{2 σ ^{2}} (\overset{x}{ˉ} - μ_{0})^{2}$
因此 $Λ ⩽ c$ 等价于 $∣ \overset{x}{ˉ} - μ_{0} ∣ ⩾ d$ ，这正是§7.2中的 $u$ 检验的拒绝域。这说明 $u$ 检验本质上是似然比检验。

二、Neyman-Pearson引理

Neyman-Pearson引理（N-P引理）是假设检验理论中最基本、最重要的定理之一。它证明了在简单假设检验问题中，似然比检验是最优势检验（Most Powerful test，简称MP检验）。

最优势检验

定义 7.4.2 — 最优势检验（MP检验）

考虑简单假设检验问题
$H_{0} : θ = θ_{0} vs H_{1} : θ = θ_{1}$
设 $ϕ$ 是一个检验函数（即拒绝 $H_{0}$ 的概率），满足水平条件
$E_{θ_{0}} [ϕ (X)] ⩽ α$
如果对任何其他满足水平条件的检验函数 $ϕ^{*}$ ，都有
$E_{θ_{1}} [ϕ (X)] ⩾ E_{θ_{1}} [ϕ^{*} (X)]$
则称 $ϕ$ 为水平 $α$ 的最优势检验（MP检验）。

检验函数的含义：检验函数 $ϕ (x)$ 表示在观测值为 $x$ 时拒绝 $H_{0}$ 的概率。对于非随机化检验， $ϕ (x) \in {0, 1}$ ；对于随机化检验， $ϕ (x) \in [0, 1]$ 。

Neyman-Pearson引理

定理 7.4.1 — Neyman-Pearson引理

设 $X_{1}, X_{2}, \dots, X_{n}$ 的联合密度为 $f (x; θ)$ ，考虑简单假设检验问题
$H_{0} : θ = θ_{0} vs H_{1} : θ = θ_{1}$
设似然比为
$Λ (x) = \frac{f ( x ; θ _{0} )}{f ( x ; θ _{1} )}$
则对给定的显著性水平 $α \in (0, 1)$ ：

（1）存在性：存在常数 $k ⩾ 0$ 和 $r \in [0, 1]$ ，使得检验函数
$ϕ (x) = ⎩ ⎨ ⎧ 1, r, 0, Λ (x) < k Λ (x) = k Λ (x) > k$
是水平 $α$ 的MP检验。

（2）充分性：任何满足上述形式的检验函数都是水平 $α$ 的MP检验。

（3）必要性：如果 $ϕ^{*}$ 是水平 $α$ 的MP检验，则 $ϕ^{*}$ 几乎处处具有上述形式（除去一个零测集外）。

证明

证明：

第一步：构造检验函数并验证水平条件。定义
$ϕ (x) = ⎩ ⎨ ⎧ 1, r, 0, f (x; θ_{1}) > k \cdot f (x; θ_{0}) f (x; θ_{1}) = k \cdot f (x; θ_{0}) f (x; θ_{1}) < k \cdot f (x; θ_{0})$
这里等价地使用了 $1/Λ (x) = f (x; θ_{1}) / f (x; θ_{0})$ 的形式。选择 $k$ 和 $r$ 使得
$E_{θ_{0}} [ϕ (X)] = α$
这样的 $k$ 和 $r$ 总是存在的（通过调节 $k$ ，再在边界上用 $r$ 微调）。

第二步：证明 $ϕ$ 是MP检验。设 $ϕ^{*}$ 是任意一个水平 $α$ 的检验函数，即 $E_{θ_{0}} [ϕ^{*} (X)] ⩽ α$ 。我们需要证明 $E_{θ_{1}} [ϕ (X)] ⩾ E_{θ_{1}} [ϕ^{*} (X)]$ 。

考虑积分差
$E_{θ_{1}} [ϕ (X)] - E_{θ_{1}} [ϕ^{*} (X)] = \int [ϕ (x) - ϕ^{*} (x)] f (x; θ_{1}) d x$
将样本空间分为三个区域：

$S_{1} = {x : f (x; θ_{1}) > k \cdot f (x; θ_{0})}$ ：此时 $ϕ (x) = 1 ⩾ ϕ^{*} (x)$ ，且 $f (x; θ_{1}) - k \cdot f (x; θ_{0}) > 0$ ，因此

$[ϕ (x) - ϕ^{*} (x)] [f (x; θ_{1}) - k \cdot f (x; θ_{0})] ⩾ 0$

$S_{2} = {x : f (x; θ_{1}) < k \cdot f (x; θ_{0})}$ ：此时 $ϕ (x) = 0 ⩽ ϕ^{*} (x)$ ，且 $f (x; θ_{1}) - k \cdot f (x; θ_{0}) < 0$ ，因此

$[ϕ (x) - ϕ^{*} (x)] [f (x; θ_{1}) - k \cdot f (x; θ_{0})] ⩾ 0$

$S_{3} = {x : f (x; θ_{1}) = k \cdot f (x; θ_{0})}$ ：此时 $f (x; θ_{1}) - k \cdot f (x; θ_{0}) = 0$ ，因此

$[ϕ (x) - ϕ^{*} (x)] [f (x; θ_{1}) - k \cdot f (x; θ_{0})] = 0$
因此，对所有 $x$ ，都有
$[ϕ (x) - ϕ^{*} (x)] [f (x; θ_{1}) - k \cdot f (x; θ_{0})] ⩾ 0$
积分得
$\int [ϕ (x) - ϕ^{*} (x)] [f (x; θ_{1}) - k \cdot f (x; θ_{0})] d x ⩾ 0$
展开即
$\int [ϕ (x) - ϕ^{*} (x)] f (x; θ_{1}) d x ⩾ k \int [ϕ (x) - ϕ^{*} (x)] f (x; θ_{0}) d x$
即
$E_{θ_{1}} [ϕ (X)] - E_{θ_{1}} [ϕ^{*} (X)] ⩾ k [E_{θ_{0}} [ϕ (X)] - E_{θ_{0}} [ϕ^{*} (X)]]$
由于 $E_{θ_{0}} [ϕ (X)] = α$ 且 $E_{θ_{0}} [ϕ^{*} (X)] ⩽ α$ ，右端 $⩾ k (α - α) = 0$ 。又因为 $k ⩾ 0$ ，所以
$E_{θ_{1}} [ϕ (X)] - E_{θ_{1}} [ϕ^{*} (X)] ⩾ 0$
第三步：必要性的证明。如果 $ϕ^{*}$ 是水平 $α$ 的MP检验，且 $ϕ$ 也是水平 $α$ 的MP检验，则必有 $E_{θ_{1}} [ϕ^{*} (X)] = E_{θ_{1}} [ϕ (X)]$ 。由第二步的不等式取等号的条件， $ϕ^{*}$ 必须几乎处处与 $ϕ$ 具有相同的形式。 $□$

似然比检验的等价形式

在实际应用中，似然比检验可以有多种等价形式，选择最便于计算的形式即可：

等价形式	拒绝域	说明
似然比	$Λ ⩽ c$	原始形式
对数似然比	$ln Λ ⩽ c^{'}$	取对数，计算更方便
似然比倒数	$1/Λ ⩾ c^{''}$	有时更自然
检验统计量的单调函数	$T (X) ⩾ c^{'''}$ 或 $T (X) ⩽ c^{'''}$	最常用的形式

例题 7.4.2

设 $X_{1}, X_{2}, \dots, X_{n} \sim iid N (μ, 1)$ ，考虑检验
$H_{0} : μ = 0 vs H_{1} : μ = 1$
求水平 $α = 0.05$ 的MP检验。

解：似然比为
$Λ (x) = \frac{f ( x ; 0 )}{f ( x ; 1 )} = \frac{( 2 π ) ^{- n /2} exp { - \frac{1}{2} \sum x _{i}^{2} }}{( 2 π ) ^{- n /2} exp { - \frac{1}{2} \sum ( x _{i} - 1 ) ^{2} }} = exp {- \frac{1}{2} \sum x_{i}^{2} + \frac{1}{2} \sum (x_{i} - 1)^{2}}$
化简：
$\sum (x_{i} - 1)^{2} - \sum x_{i}^{2} = \sum (x_{i}^{2} - 2 x_{i} + 1) - \sum x_{i}^{2} = - 2 n \overset{x}{ˉ} + n$
因此
$Λ (x) = exp {- n \overset{x}{ˉ} + \frac{n}{2}}$
$Λ ⩽ c$ 等价于 $- n \overset{x}{ˉ} + n /2 ⩽ ln c$ ，即 $\overset{x}{ˉ} ⩾ 1/2 - (ln c) / n$ 。

在 $H_{0}$ 下， $\overset{ˉ}{X} \sim N (0, 1/ n)$ ，因此拒绝域为
$W = {\overset{ˉ}{X} ⩾ \frac{1}{n} \cdot u_{0.95}} = {\overset{ˉ}{X} ⩾ \frac{1.645}{n}}$
这正是直觉上合理的：当样本均值显著大于 $0$ 时，拒绝 $μ = 0$ 而接受 $μ = 1$ 。

三、广义似然比检验

N-P引理只适用于简单假设（ $H_{0}$ 和 $H_{1}$ 都是单点集），但实际问题中更常见的是复合假设（参数空间是一个集合）。广义似然比检验（Generalized Likelihood Ratio Test，GLRT）将似然比检验的思想推广到复合假设。

广义似然比统计量

定义 7.4.3 — 广义似然比统计量

设 $X_{1}, X_{2}, \dots, X_{n}$ 的联合密度为 $f (x_{1}, \dots, x_{n}; θ)$ ， $θ \in Θ$ 。考虑复合假设检验问题
$H_{0} : θ \in Θ_{0} vs H_{1} : θ \in Θ_{1} = Θ ∖ Θ_{0}$
定义广义似然比统计量为
$Λ = \frac{sup _{θ \in Θ_{0}} L ( θ )}{sup _{θ \in Θ} L ( θ )} = \frac{L ( θ ^ _{0} )}{L ( θ ^ )}$
其中 $\hat{θ}_{0} = ar g sup_{θ \in Θ_{0}} L (θ)$ 为 $H_{0}$ 下的最大似然估计（约束MLE）， $\hat{θ} = ar g sup_{θ \in Θ} L (θ)$ 为无约束MLE。

广义似然比检验的拒绝域为 ${Λ ⩽ c}$ 。

与简单似然比的区别：

简单似然比： $Θ_{0} = {θ_{0}}$ ， $Θ_{1} = {θ_{1}}$ ，分子分母都是单点值。
广义似然比： $Θ_{0}$ 和 $Θ$ 都是集合，分子分母都是上确界（通常用MLE代替）。

Wilks定理（渐近分布）

定理 7.4.2 — Wilks定理（广义似然比检验的渐近分布）

在一定的正则条件下，当 $H_{0}$ 成立且样本量 $n \to \infty$ 时，
$- 2 ln Λ d χ^{2} (r)$
其中 $r = dim (Θ) - dim (Θ_{0})$ 为参数空间维数之差（即自由度）。

因此，对于大样本，水平 $α$ 的近似拒绝域为
$W = {- 2 ln Λ ⩾ χ_{1 - α}^{2} (r)}$

证明

证明：（以下给出证明的要点和关键步骤）

第一步：对数似然函数的Taylor展开。设 $θ_{0} \in Θ_{0}$ 为真参数值， $\hat{θ}$ 为全空间MLE， $\hat{θ}_{0}$ 为约束MLE。在 $θ_{0}$ 处对对数似然函数 $l (θ) = ln L (θ)$ 进行二阶Taylor展开：
$l (\hat{θ}) \approx l (θ_{0}) + \nabla l (θ_{0})^{T} (\hat{θ} - θ_{0}) + \frac{1}{2} (\hat{θ} - θ_{0})^{T} \cdot I (θ_{0}) \cdot (\hat{θ} - θ_{0})$
其中 $I (θ_{0}) = - \nabla^{2} l (θ_{0})$ 为Fisher信息矩阵。

第二步：MLE的渐近正态性。由MLE理论，
$n (\hat{θ} - θ_{0}) d N (0, I (θ_{0})^{- 1})$
且 $\nabla l (θ_{0}) / n d N (0, I (θ_{0}))$ 。

第三步：似然比统计量的渐近展开。类似地，
$l (\hat{θ}_{0}) \approx l (θ_{0}) + \frac{1}{2} (\hat{θ}_{0} - θ_{0})^{T} \cdot I (θ_{0}) \cdot (\hat{θ}_{0} - θ_{0})$
因此，
$- 2 ln Λ = - 2 [l (\hat{θ}_{0}) - l (\hat{θ})] \approx (\hat{θ} - \hat{θ}_{0})^{T} \cdot I (θ_{0}) \cdot (\hat{θ} - \hat{θ}_{0})$
第四步：利用二次型的渐近分布。在 $H_{0}$ 下， $\hat{θ}_{0}$ 和 $\hat{θ}$ 都收敛到 $θ_{0}$ 。可以证明
$(\hat{θ} - \hat{θ}_{0})^{T} \cdot I (θ_{0}) \cdot (\hat{θ} - \hat{θ}_{0}) d χ^{2} (r)$
其中 $r = dim (Θ) - dim (Θ_{0})$ 。这是因为约束 $θ \in Θ_{0}$ 相当于施加了 $r$ 个独立约束，每个约束贡献一个自由度。 $□$

广义似然比检验与前面各节检验的关系

广义似然比检验是一个统一的框架，前面各节中的检验方法大多可以看作广义似然比检验的特例：

检验方法	检验问题	广义似然比检验等价形式
$u$ 检验	$H_{0} : μ = μ_{0}$ （ $σ^{2}$ 已知）	$- 2 ln Λ = n (\overset{ˉ}{X} - μ_{0})^{2} / σ^{2} \sim χ^{2} (1)$
$t$ 检验	$H_{0} : μ = μ_{0}$ （ $σ^{2}$ 未知）	$- 2 ln Λ \approx t^{2}$ （渐近等价）
$χ^{2}$ 检验	$H_{0} : σ^{2} = σ_{0}^{2}$ （ $μ$ 未知）	$- 2 ln Λ \approx (n - 1) S^{2} / σ_{0}^{2}$
$F$ 检验	$H_{0} : σ_{1}^{2} = σ_{2}^{2}$	$- 2 ln Λ \approx F$ 统计量

例题 7.4.3

设 $X_{1}, X_{2}, \dots, X_{n} \sim iid N (μ, σ^{2})$ ， $μ$ 和 $σ^{2}$ 均未知。考虑检验
$H_{0} : μ = μ_{0} vs H_{1} : μ \neq = μ_{0}$
求广义似然比检验。

解：参数空间 $Θ = {(μ, σ^{2}) : μ \in R, σ^{2} > 0}$ ， $Θ_{0} = {(μ_{0}, σ^{2}) : σ^{2} > 0}$ 。

全空间MLE： $\overset{μ}{^} = \overset{ˉ}{X}$ ， $\overset{σ}{^}^{2} = \frac{1}{n} \sum_{i = 1}^{n} (X_{i} - \overset{ˉ}{X})^{2}$ 。

约束MLE（ $H_{0}$ 下）： $\overset{μ}{^}_{0} = μ_{0}$ ， $\overset{σ}{^}_{0}^{2} = \frac{1}{n} \sum_{i = 1}^{n} (X_{i} - μ_{0})^{2}$ 。

似然比为
$Λ = \frac{L ( μ _{0} , σ ^ _{0}^{2} )}{L ( μ ^ , σ ^ ^{2} )} = (\frac{σ ^ ^{2}}{σ ^ _{0}^{2}})^{n /2}$
注意到
$\overset{σ}{^}_{0}^{2} = \frac{1}{n} i = 1 \sum n (X_{i} - μ_{0})^{2} = \frac{1}{n} i = 1 \sum n [(X_{i} - \overset{ˉ}{X}) + (\overset{ˉ}{X} - μ_{0})]^{2} = \overset{σ}{^}^{2} + (\overset{ˉ}{X} - μ_{0})^{2}$
因此
$Λ = (\frac{σ ^ ^{2}}{σ ^ ^{2} + ( X ˉ - μ _{0} ) ^{2}})^{n /2} = (1 + \frac{( X ˉ - μ _{0} ) ^{2}}{σ ^ ^{2}})^{- n /2} = (1 + \frac{T ^{2}}{n - 1})^{- n /2}$
其中 $T = \frac{n ( X ˉ - μ _{0} )}{S}$ 为 $t$ 统计量。 $Λ$ 是 $T^{2}$ 的单调递减函数，因此拒绝域 ${Λ ⩽ c}$ 等价于 ${∣ T ∣ ⩾ c^{'}}$ ，这正是[[7.2 正态总体参数的假设检验| $t$ 检验]]。

四、卡方拟合优度检验

在实际问题中，我们经常需要检验总体分布是否服从某个特定的分布。例如：骰子是否均匀？数据是否服从正态分布？这种问题属于分布拟合检验，卡方拟合优度检验是最常用的方法。

卡方拟合优度检验

定义 7.4.4 — 卡方拟合优度检验

设 $X_{1}, X_{2}, \dots, X_{n}$ 为来自总体 $X$ 的样本， $F_{0} (x)$ 为某个已知的分布函数。检验问题为
$H_{0} : F (x) = F_{0} (x) vs H_{1} : F (x) \neq = F_{0} (x)$
检验步骤：

（1）分组：将实数轴分为 $k$ 个互不相交的区间 $A_{1}, A_{2}, \dots, A_{k}$ ，使得 $⋃_{i = 1}^{k} A_{i} = R$ 。

（2）统计实际频数：记 $O_{i}$ 为样本落入区间 $A_{i}$ 的实际频数（观测频数）， $\sum_{i = 1}^{k} O_{i} = n$ 。

（3）计算理论频数：在 $H_{0}$ 下，样本落入 $A_{i}$ 的概率为
$p_{i} = P_{H_{0}} (X \in A_{i}) = F_{0} (A_{i} 的右端点) - F_{0} (A_{i} 的左端点)$
理论频数（期望频数）为 $E_{i} = n p_{i}$ 。

（4）计算检验统计量：
$χ^{2} = i = 1 \sum k \frac{( O _{i} - E _{i} ) ^{2}}{E _{i}}$
（5）确定拒绝域：当 $H_{0}$ 成立时， $χ^{2}$ 近似服从 $χ^{2} (k - 1 - m)$ 分布，其中 $m$ 为用样本估计的 $F_{0}$ 中未知参数的个数。拒绝域为
$W = {χ^{2} ⩾ χ_{1 - α}^{2} (k - 1 - m)}$

Pearson定理

定理 7.4.3 — Pearson定理

设 $H_{0} : F (x) = F_{0} (x)$ 成立，其中 $F_{0} (x)$ 完全已知（不含未知参数，即 $m = 0$ ）。当 $n \to \infty$ 时，
$χ^{2} = i = 1 \sum k \frac{( O _{i} - E _{i} ) ^{2}}{E _{i}} d χ^{2} (k - 1)$
如果 $F_{0} (x)$ 中含有 $m$ 个未知参数，需要先用样本估计这些参数（通常用MLE），此时自由度为 $k - 1 - m$ 。

证明

证明：（以下给出 $m = 0$ 情况下的证明要点）

第一步：建立多项分布模型。在 $H_{0}$ 下，每个样本点落入区间 $A_{i}$ 的概率为 $p_{i}$ 。记 $N_{i}$ 为落入 $A_{i}$ 的样本点数，则 $(N_{1}, N_{2}, \dots, N_{k}) \sim Multinomial (n; p_{1}, p_{2}, \dots, p_{k})$ 。

第二步：标准化。由中心极限定理的多维版本，当 $n \to \infty$ 时，
$n (\frac{N _{i}}{n} - p_{i})_{i = 1}^{k} d N_{k} (0, Σ)$
其中 $Σ = diag (p_{1}, \dots, p_{k}) - p p^{T}$ ， $p = (p_{1}, \dots, p_{k})^{T}$ 。

第三步：二次型的分布。 $Σ$ 的秩为 $k - 1$ （因为 $\sum p_{i} = 1$ ），因此
$χ^{2} = i = 1 \sum k \frac{( N _{i} - n p _{i} ) ^{2}}{n p _{i}} = n i = 1 \sum k \frac{( N _{i} / n - p _{i} ) ^{2}}{p _{i}}$
可以表示为正态随机向量的二次型。由二次型的分布理论，当 $n \to \infty$ 时，
$χ^{2} d χ^{2} (k - 1)$
第四步：含未知参数的情况。当 $F_{0}$ 中含有 $m$ 个未知参数时，用MLE $\hat{θ}$ 替换后，每个估计量消耗一个自由度，因此自由度从 $k - 1$ 减少到 $k - 1 - m$ 。这一结论由 Fisher (1924) 严格证明。 $□$

分组方法与注意事项

卡方拟合优度检验的检验功效与分组方式密切相关：

注意事项	说明
每组期望频数 $⩾ 5$	这是保证 $χ^{2}$ 近似精度的基本要求
通常取 $k = 5 \sim 15$	分组太少会损失信息，太多会导致期望频数过小
各组概率 $p_{i}$ 不宜过小	建议 $p_{i} ⩾ 0.05$
期望频数不足时合并相邻组	将期望频数 $< 5$ 的组与相邻组合并
分组方式应事先确定	不应先看数据再决定分组（否则影响检验的有效性）

例题 7.4.4

某工厂声称其产品的不合格率服从 $p = 0.1$ 的二项分布。随机抽取 200 件产品进行检验，按每件产品的不合格特征分为4类，各类的观测频数如下：

类别 $A_{1}$ $A_{2}$ $A_{3}$ $A_{4}$
观测频数 $O_{i}$ 120 55 18 7
理论概率 $p_{i}$ 0.6561 0.2916 0.0486 0.0037

在 $α = 0.05$ 下检验 $H_{0}$ : 产品分类服从 $p = 0.1$ 的二项分布。

解：

（1）计算理论频数： $E_{i} = n \times p_{i} = 200 \times p_{i}$ 。

类别 $A_{1}$ $A_{2}$ $A_{3}$ $A_{4}$
$E_{i}$ 131.22 58.32 9.72 0.74

注意 $E_{4} = 0.74 < 5$ ，需要将 $A_{3}$ 和 $A_{4}$ 合并。

（2）合并后的计算：

类别 $A_{1}$ $A_{2}$ $A_{3} \cup A_{4}$
$O_{i}$ 120 55 25
$E_{i}$ 131.22 58.32 10.46

（3）计算 $χ^{2}$ 统计量：
$χ^{2} = \frac{( 120 - 131.22 ) ^{2}}{131.22} + \frac{( 55 - 58.32 ) ^{2}}{58.32} + \frac{( 25 - 10.46 ) ^{2}}{10.46}$ $= \frac{125.89}{131.22} + \frac{11.02}{58.32} + \frac{211.21}{10.46} = 0.96 + 0.19 + 20.19 = 21.34$
（4）查表判断：自由度 $= k - 1 = 3 - 1 = 2$ ， $χ_{0.95}^{2} (2) = 5.991$ 。

因为 $χ^{2} = 21.34 > 5.991$ ，所以拒绝 $H_{0}$ ，即产品分类不服从 $p = 0.1$ 的二项分布。

类别	$A_{1}$	$A_{2}$	$A_{3}$	$A_{4}$
观测频数 $O_{i}$	120	55	18	7
理论概率 $p_{i}$	0.6561	0.2916	0.0486	0.0037

类别	$A_{1}$	$A_{2}$	$A_{3}$	$A_{4}$
$E_{i}$	131.22	58.32	9.72	0.74

类别	$A_{1}$	$A_{2}$	$A_{3} \cup A_{4}$
$O_{i}$	120	55	25
$E_{i}$	131.22	58.32	10.46

例题 7.4.5

在某公路上，50分钟内记录每15秒区间内到达的车辆数，得到如下数据：

到达车辆数 $k$ 0 1 2 3 4 $⩾ 5$
观测频数 $O_{k}$ 4 14 23 16 8 5

在 $α = 0.05$ 下检验到达车辆数是否服从泊松分布。

解：

（1）估计参数。泊松分布 $P (λ)$ 中 $λ$ 未知，先估计：
$\hat{λ} = \overset{x}{ˉ} = \frac{0 \times 4 + 1 \times 14 + 2 \times 23 + 3 \times 16 + 4 \times 8 + 5 \times 5}{70} = \frac{161}{70} \approx 2.3$
（2）计算理论概率和期望频数。 $p_{k} = e^{- 2.3} \cdot 2. 3^{k} / k!$ ， $E_{k} = 70 \cdot p_{k}$ 。

$k$ 0 1 2 3 4 $⩾ 5$
$p_{k}$ 0.1003 0.2306 0.2652 0.2033 0.1169 0.0837
$E_{k}$ 7.02 16.14 18.56 14.23 8.18 5.86

所有 $E_{k} ⩾ 5$ ，无需合并。

（3）计算 $χ^{2}$ 统计量：
$χ^{2} = \frac{( 4 - 7.02 ) ^{2}}{7.02} + \frac{( 14 - 16.14 ) ^{2}}{16.14} + \frac{( 23 - 18.56 ) ^{2}}{18.56} + \frac{( 16 - 14.23 ) ^{2}}{14.23} + \frac{( 8 - 8.18 ) ^{2}}{8.18} + \frac{( 5 - 5.86 ) ^{2}}{5.86}$ $= 1.30 + 0.28 + 1.06 + 0.22 + 0.004 + 0.13 = 2.99$
（4）查表判断：自由度 $= k - 1 - m = 6 - 1 - 1 = 4$ ， $χ_{0.95}^{2} (4) = 9.488$ 。

因为 $χ^{2} = 2.99 < 9.488$ ，所以不拒绝 $H_{0}$ ，即数据与泊松分布无显著差异。

到达车辆数 $k$	0	1	2	3	4	$⩾ 5$
观测频数 $O_{k}$	4	14	23	16	8	5

$k$	0	1	2	3	4	$⩾ 5$
$p_{k}$	0.1003	0.2306	0.2652	0.2033	0.1169	0.0837
$E_{k}$	7.02	16.14	18.56	14.23	8.18	5.86

五、独立性检验

独立性检验是卡方检验的另一个重要应用，用于检验两个分类变量之间是否相互独立。数据通常以列联表（Contingency Table）的形式呈现。

列联表与独立性检验

定义 7.4.5 — 列联表与独立性检验

设有两个分类变量 $X$ 和 $Y$ ， $X$ 有 $r$ 个水平， $Y$ 有 $c$ 个水平。从总体中随机抽取 $n$ 个个体，按 $(X, Y)$ 的取值分类，得到 $r \times c$ 列联表：

$Y_{1}$ $Y_{2}$ $\dots$ $Y_{c}$ 行合计
$X_{1}$ $O_{11}$ $O_{12}$ $\dots$ $O_{1 c}$ $O_{1 \cdot}$
$X_{2}$ $O_{21}$ $O_{22}$ $\dots$ $O_{2 c}$ $O_{2 \cdot}$
$⋮$ $⋮$ $⋮$ $⋱$ $⋮$ $⋮$
$X_{r}$ $O_{r 1}$ $O_{r 2}$ $\dots$ $O_{rc}$ $O_{r \cdot}$
列合计 $O_{\cdot 1}$ $O_{\cdot 2}$ $\dots$ $O_{\cdot c}$ $n$

其中 $O_{ij}$ 为 $(X_{i}, Y_{j})$ 的观测频数， $O_{i \cdot} = \sum_{j = 1}^{c} O_{ij}$ ， $O_{\cdot j} = \sum_{i = 1}^{r} O_{ij}$ 。

检验问题为
$H_{0} : X 与 Y 独立 vs H_{1} : X 与 Y 不独立$
检验统计量：
$χ^{2} = i = 1 \sum r j = 1 \sum c \frac{( O _{ij} - E _{ij} ) ^{2}}{E _{ij}}$
其中期望频数为
$E_{ij} = \frac{O _{i \cdot} \cdot O _{\cdot j}}{n}$
在 $H_{0}$ 成立且 $n$ 充分大时， $χ^{2} d χ^{2} ((r - 1) (c - 1))$ 。

	$Y_{1}$	$Y_{2}$	$\dots$	$Y_{c}$	行合计
$X_{1}$	$O_{11}$	$O_{12}$	$\dots$	$O_{1 c}$	$O_{1 \cdot}$
$X_{2}$	$O_{21}$	$O_{22}$	$\dots$	$O_{2 c}$	$O_{2 \cdot}$
$⋮$	$⋮$	$⋮$	$⋱$	$⋮$	$⋮$
$X_{r}$	$O_{r 1}$	$O_{r 2}$	$\dots$	$O_{rc}$	$O_{r \cdot}$
列合计	$O_{\cdot 1}$	$O_{\cdot 2}$	$\dots$	$O_{\cdot c}$	$n$

期望频数的推导：在 $H_{0}$ （ $X$ 与 $Y$ 独立）下，

P (X = X_{i}, Y = Y_{j}) = P (X = X_{i}) \cdot P (Y = Y_{j}) \approx \frac{O _{i \cdot}}{n} \cdot \frac{O _{\cdot j}}{n}

因此期望频数

E_{ij} = n \cdot P (X = X_{i}, Y = Y_{j}) \approx n \cdot \frac{O _{i \cdot}}{n} \cdot \frac{O _{\cdot j}}{n} = \frac{O _{i \cdot} \cdot O _{\cdot j}}{n}

独立性检验的渐近分布

定理 7.4.4 — 独立性检验的渐近分布

在 $H_{0}$ （ $X$ 与 $Y$ 独立）成立且 $n \to \infty$ 时，
$χ^{2} = i = 1 \sum r j = 1 \sum c \frac{( O _{ij} - E _{ij} ) ^{2}}{E _{ij}} d χ^{2} ((r - 1) (c - 1))$
自由度为 $(r - 1) (c - 1)$ 的直观理解： $r \times c$ 列联表有 $rc$ 个格子，但受到行合计和列合计的约束（ $\sum_{j} O_{ij} = O_{i \cdot}$ 给出 $r$ 个约束， $\sum_{i} O_{ij} = O_{\cdot j}$ 给出 $c$ 个约束，但 $\sum_{i} O_{i \cdot} = \sum_{j} O_{\cdot j} = n$ 使得总约束数为 $r + c - 1$ ），因此自由度为 $rc - (r + c - 1) = (r - 1) (c - 1)$ 。

例题 7.4.6（ $2 \times 2$ 列联表）

调查200名患者，研究某种新药是否有效，得到如下 $2 \times 2$ 列联表：

有效无效合计
用药组 60 40 100
对照组 35 65 100
合计 95 105 200

在 $α = 0.05$ 下检验药物是否有效。

解： $H_{0}$ : 药物与疗效独立 vs $H_{1}$ : 药物与疗效不独立。

（1）计算期望频数：
$E_{11} = \frac{100 \times 95}{200} = 47.5, E_{12} = \frac{100 \times 105}{200} = 52.5$ $E_{21} = \frac{100 \times 95}{200} = 47.5, E_{22} = \frac{100 \times 105}{200} = 52.5$
（2）计算 $χ^{2}$ 统计量：
$χ^{2} = \frac{( 60 - 47.5 ) ^{2}}{47.5} + \frac{( 40 - 52.5 ) ^{2}}{52.5} + \frac{( 35 - 47.5 ) ^{2}}{47.5} + \frac{( 65 - 52.5 ) ^{2}}{52.5}$ $= \frac{156.25}{47.5} + \frac{156.25}{52.5} + \frac{156.25}{47.5} + \frac{156.25}{52.5}$ $= 3.289 + 2.976 + 3.289 + 2.976 = 12.53$
（3）查表判断：自由度 $= (2 - 1) (2 - 1) = 1$ ， $χ_{0.95}^{2} (1) = 3.841$ 。

因为 $χ^{2} = 12.53 > 3.841$ ，所以拒绝 $H_{0}$ ，即药物与疗效有关（药物有效）。

注：对于 $2 \times 2$ 列联表，也可以使用 Yates 连续性修正：
$χ_{Yates}^{2} = i = 1 \sum 2 j = 1 \sum 2 \frac{( ∣ O _{ij} - E _{ij} ∣ - 0.5 ) ^{2}}{E _{ij}}$

	有效	无效	合计
用药组	60	40	100
对照组	35	65	100
合计	95	105	200

例题 7.4.7（ $r \times c$ 列联表）

调查不同年龄段人群对某项政策的满意度，得到如下 $3 \times 3$ 列联表：

满意一般不满意合计
青年 30 40 30 100
中年 45 35 20 100
老年 55 25 20 100
合计 130 100 70 300

在 $α = 0.05$ 下检验满意度与年龄是否独立。

解： $H_{0}$ : 满意度与年龄独立 vs $H_{1}$ : 满意度与年龄不独立。

（1）计算期望频数：
$E_{11} = \frac{100 \times 130}{300} = 43.33, E_{12} = \frac{100 \times 100}{300} = 33.33, E_{13} = \frac{100 \times 70}{300} = 23.33$ $E_{21} = 43.33, E_{22} = 33.33, E_{23} = 23.33$ $E_{31} = 43.33, E_{32} = 33.33, E_{33} = 23.33$
（2）计算 $χ^{2}$ 统计量：
$χ^{2} = i = 1 \sum 3 j = 1 \sum 3 \frac{( O _{ij} - E _{ij} ) ^{2}}{E _{ij}}$ $= \frac{( 30 - 43.33 ) ^{2}}{43.33} + \frac{( 40 - 33.33 ) ^{2}}{33.33} + \frac{( 30 - 23.33 ) ^{2}}{23.33} + \frac{( 45 - 43.33 ) ^{2}}{43.33} + \frac{( 35 - 33.33 ) ^{2}}{33.33} + \frac{( 20 - 23.33 ) ^{2}}{23.33} + \frac{( 55 - 43.33 ) ^{2}}{43.33} + \frac{( 25 - 33.33 ) ^{2}}{33.33} + \frac{( 20 - 23.33 ) ^{2}}{23.33}$ $= 4.10 + 1.33 + 1.91 + 0.06 + 0.08 + 0.48 + 3.14 + 2.08 + 0.48 = 13.66$
（3）查表判断：自由度 $= (3 - 1) (3 - 1) = 4$ ， $χ_{0.95}^{2} (4) = 9.488$ 。

因为 $χ^{2} = 13.66 > 9.488$ ，所以拒绝 $H_{0}$ ，即满意度与年龄有关。

	满意	一般	不满意	合计
青年	30	40	30	100
中年	45	35	20	100
老年	55	25	20	100
合计	130	100	70	300

六、卡方检验汇总

三种卡方检验的对比

检验类型	检验问题	检验统计量	自由度	应用场景
拟合优度检验	$H_{0}$ : 总体分布为 $F_{0} (x)$	$\sum \frac{( O _{i} - E _{i} ) ^{2}}{E _{i}}$	$k - 1 - m$	检验数据是否服从某分布
独立性检验	$H_{0}$ : 两变量独立	$\sum\sum \frac{( O _{ij} - E _{ij} ) ^{2}}{E _{ij}}$	$(r - 1) (c - 1)$	检验两分类变量的独立性
齐性检验	$H_{0}$ : 多个总体分布相同	$\sum\sum \frac{( O _{ij} - E _{ij} ) ^{2}}{E _{ij}}$	$(r - 1) (c - 1)$	检验多个总体比例是否一致

注：独立性检验和齐性检验的统计量和自由度完全相同，但抽样方式不同：

独立性检验：从单一总体中抽取 $n$ 个个体，然后按两个变量交叉分类。
齐性检验：从 $r$ 个总体中分别抽取样本，比较各总体中各水平的比例。

卡方检验的适用条件

样本量充分大：保证 $χ^{2}$ 近似分布的精度。
期望频数要求：所有 $E_{i} ⩾ 1$ ，且至少 $80%$ 的 $E_{i} ⩾ 5$ （Cochran准则）。
独立性：各观测值相互独立。
互斥完备：每个观测值恰好落入一个类别。
固定样本量（对于独立性检验）：总样本量 $n$ 在抽样前确定。

卡方检验与似然比检验的关系

卡方检验与似然比检验之间存在深刻的联系：

渐近等价性：对于多项分布数据，Pearson $χ^{2}$ 统计量和似然比 $χ^{2}$ 统计量（ $G^{2} = 2 \sum O_{i} ln (O_{i} / E_{i})$ ）在 $H_{0}$ 下具有相同的渐近 $χ^{2}$ 分布，且渐近等价。
数值关系： $G^{2} ⩽ χ_{Pearson}^{2}$ （对于同样的数据），当 $H_{0}$ 成立时两者差距很小。
统一框架：卡方检验可以看作广义似然比检验在离散数据（多项分布）下的具体实现。Pearson $χ^{2}$ 统计量是似然比 $χ^{2}$ 统计量的二阶Taylor展开近似。

七、知识结构总览

graph TB
    A[似然比检验与分布拟合检验] --> B[似然比检验]
    A --> C[卡方检验]
    B --> D[基本思想]
    B --> E[Neyman-Pearson引理]
    B --> F[广义似然比检验]
    D --> D1[似然比统计量]
    D --> D2[拒绝域确定]
    E --> E1[简单假设MP检验]
    E --> E2[最优性证明]
    F --> F1[复合假设推广]
    F --> F2[Wilks定理]
    C --> G[拟合优度检验]
    C --> H[独立性检验]
    G --> G1[Pearson定理]
    G --> G2[分组与注意事项]
    H --> H1[列联表分析]
    H --> H2[期望频数计算]
    F2 --> I[渐近卡方分布]
    I --> G
    I --> H

八、核心思想与解题技巧

似然比检验解题步骤

似然比检验的标准解题流程

写出似然函数 $L (θ) = \prod_{i = 1}^{n} f (x_{i}; θ)$ 。

求全空间MLE $\hat{θ} = ar g max_{θ \in Θ} L (θ)$ 。

求约束MLE $\hat{θ}_{0} = ar g max_{θ \in Θ_{0}} L (θ)$ 。

计算似然比 $Λ = L (\hat{θ}_{0}) / L (\hat{θ})$ 。

化简：利用单调变换将 $Λ ⩽ c$ 转化为更简单的检验统计量。

确定拒绝域：利用Wilks定理（ $- 2 ln Λ \sim χ^{2} (r)$ ）或精确分布。

计算统计量值并判断。

卡方检验解题步骤

卡方检验的标准解题流程

拟合优度检验：

建立假设 $H_{0}$ : 总体分布为 $F_{0} (x)$ 。

如有未知参数，用MLE估计。

分组并统计观测频数 $O_{i}$ 。

计算理论概率 $p_{i}$ 和期望频数 $E_{i} = n p_{i}$ 。

检查期望频数，必要时合并。

计算 $χ^{2} = \sum (O_{i} - E_{i})^{2} / E_{i}$ 。

查 $χ_{1 - α}^{2} (k - 1 - m)$ 表并判断。

独立性检验：

建立假设 $H_{0}$ : 两变量独立。

列出列联表，计算行合计和列合计。

计算期望频数 $E_{ij} = O_{i \cdot} \cdot O_{\cdot j} / n$ 。

检查期望频数，必要时合并。

计算 $χ^{2} = \sum\sum (O_{ij} - E_{ij})^{2} / E_{ij}$ 。

查 $χ_{1 - α}^{2} ((r - 1) (c - 1))$ 表并判断。

常见题型总结

题型	关键步骤	易错点
求似然比统计量	分别求约束和无约束MLE	忘记约束条件
证明某检验是似然比检验	化简 $Λ$ ，利用单调性	忽略等价形式
卡方拟合优度检验	正确计算 $p_{i}$ 和 $E_{i}$	忘记合并期望频数 $< 5$ 的组
独立性检验	正确计算 $E_{ij}$	混淆观测频数和期望频数
自由度计算	$k - 1 - m$ 或 $(r - 1) (c - 1)$	忘记减去估计参数个数 $m$

九、补充理解与易混淆点

误区一：“似然比检验总是最优的”

正确理解：N-P引理仅保证在简单假设（ $H_{0} : θ = θ_{0}$ vs $H_{1} : θ = θ_{1}$ ）下，似然比检验是MP检验。对于复合假设，广义似然比检验不一定最优，只是在大样本下具有优良性质（渐近最优）。在有限样本下，可能存在比GLRT更好的检验。

来源：茆诗松《概率论与数理统计》第七章、Lehmann & Romano “Testing Statistical Hypotheses” Ch. 3、Casella & Berger “Statistical Inference” §8.3、RPI论文：GLRT并非总是最优、Bookey书评摘要

误区二：“卡方检验的分组越多越好”

正确理解：分组数 $k$ 影响检验的自由度和功效。分组太少会损失信息（自由度低），分组太多会导致期望频数过小，使 $χ^{2}$ 近似失效。通常取 $k$ 使得每组期望频数 $⩾ 5$ ，同时 $k$ 不宜超过 15-20。

来源：茆诗松《概率论与数理统计》第七章、Pearson (1900) 原论文、Minitab官方文档、NIST Dataplot文档、LibreTexts统计教材

误区三：“列联表卡方检验要求样本量很大”

正确理解：卡方检验的要求不是”样本量大”，而是==每格期望频数 $⩾ 5$ ==（更宽松的要求是：所有 $E_{ij} ⩾ 1$ ，且至少 $80%$ 的 $E_{ij} ⩾ 5$ ）。对于 $2 \times 2$ 列联表，当期望频数不满足要求时，应使用Fisher精确检验。

来源：茆诗松《概率论与数理统计》第七章、Cochran (1952) 经典文献、The Analysis Factor博客、UT Austin统计服务、StatCalculators

误区四：“拟合优度检验的p值很小就说明分布完全不对”

正确理解： $p$ 值小只说明在 $H_{0}$ 成立的条件下，观测到当前或更极端数据的概率很低，即数据与假设分布不一致。这不意味着假设分布”完全不对”——可能只是样本量很大使得微小差异也被检测出来，也可能是因为分组方式不当。应结合效应量（如残差分析）综合判断。

来源：茆诗松《概率论与数理统计》第七章、§7.1（p值含义）、Cohen (1994) “The Earth Is Round (p < .05)“、Minitab官方文档、NIST Dataplot文档

误区五：“似然比检验和卡方检验是两种不同的方法”

正确理解：卡方检验本质上是似然比检验在大样本下的渐近等价形式。对于多项分布数据，Pearson $χ^{2}$ 统计量 $\sum (O_{i} - E_{i})^{2} / E_{i}$ 是似然比 $χ^{2}$ 统计量 $G^{2} = 2 \sum O_{i} ln (O_{i} / E_{i})$ 的二阶Taylor展开近似。两者在 $H_{0}$ 下渐近等价，具有相同的极限分布。

来源：茆诗松《概率论与数理统计》第七章、UCSD CSE 291讲义、UChicago STAT 244讲义、Casella & Berger “Statistical Inference” §10.5、Agresti “Categorical Data Analysis” Ch. 3

十、习题精选

习题概览

教材习题（6题）：习题1-6（似然比检验、卡方拟合优度检验、独立性检验） 考研真题（4题）：真题7-10（卡方检验综合应用）

编号题目类型难度来源
1 似然比统计量计算 $⋆ ⋆$ 教材
2 N-P引理应用 $⋆ ⋆ ⋆$ 教材
3 广义似然比检验 $⋆ ⋆ ⋆$ 教材
4 卡方拟合优度检验 $⋆ ⋆$ 教材
5 独立性检验 $⋆ ⋆$ 教材
6 卡方检验综合 $⋆ ⋆ ⋆$ 教材
7 卡方拟合优度 $⋆ ⋆$ 考研真题
8 列联表独立性 $⋆ ⋆ ⋆$ 考研真题
9 泊松分布拟合 $⋆ ⋆ ⋆$ 考研真题
10 正态分布拟合 $⋆ ⋆ ⋆$ 考研真题

编号	题目类型	难度	来源
1	似然比统计量计算	$⋆ ⋆$	教材
2	N-P引理应用	$⋆ ⋆ ⋆$	教材
3	广义似然比检验	$⋆ ⋆ ⋆$	教材
4	卡方拟合优度检验	$⋆ ⋆$	教材
5	独立性检验	$⋆ ⋆$	教材
6	卡方检验综合	$⋆ ⋆ ⋆$	教材
7	卡方拟合优度	$⋆ ⋆$	考研真题
8	列联表独立性	$⋆ ⋆ ⋆$	考研真题
9	泊松分布拟合	$⋆ ⋆ ⋆$	考研真题
10	正态分布拟合	$⋆ ⋆ ⋆$	考研真题

教材习题

习题1：设 $X_{1}, X_{2}, \dots, X_{n} \sim iid Exp (λ)$ ，考虑检验 $H_{0} : λ = λ_{0}$ vs $H_{1} : λ = λ_{1}$ （ $λ_{1} > λ_{0}$ ）。求似然比检验的拒绝域。

解：指数分布的密度为 $f (x; λ) = λ e^{- λ x}$ （ $x > 0$ ）。

似然函数为

L (λ) = λ^{n} exp {- λ i = 1 \sum n x_{i}} = λ^{n} e^{- λn \overset{x}{ˉ}}

似然比为

Λ = \frac{L ( λ _{0} )}{L ( λ _{1} )} = (\frac{λ _{0}}{λ _{1}})^{n} exp {- (λ_{0} - λ_{1}) n \overset{x}{ˉ}}

由于 $λ_{1} > λ_{0}$ ， $λ_{0} - λ_{1} < 0$ ，因此 $Λ$ 是 $\overset{x}{ˉ}$ 的单调递增函数。

$Λ ⩽ c$ 等价于 $\overset{x}{ˉ} ⩽ c^{'}$ 。

在 $H_{0}$ 下， $2 n λ_{0} \overset{ˉ}{X} \sim χ^{2} (2 n)$ （因为 $X_{i} \sim Exp (λ_{0})$ 等价于 $2 λ_{0} X_{i} \sim χ^{2} (2)$ ）。

拒绝域为

W = {\overset{ˉ}{X} ⩽ \frac{χ _{α}^{2} ( 2 n )}{2 n λ _{0}}}

习题2：设 $X_{1}, X_{2}, \dots, X_{n} \sim iid U (0, θ)$ ，考虑检验 $H_{0} : θ = θ_{0}$ vs $H_{1} : θ = θ_{1}$ （ $θ_{1} > θ_{0}$ ）。求水平 $α$ 的MP检验。

解：均匀分布 $U (0, θ)$ 的密度为 $f (x; θ) = 1/ θ$ （ $0 < x < θ$ ）。

似然函数为

L (θ) = {θ^{- n}, 0, 0 < x_{(n)} < θ 其他

其中 $x_{(n)} = max {x_{1}, \dots, x_{n}}$ 。

似然比为

Λ = \frac{L ( θ _{0} )}{L ( θ _{1} )} = ⎩ ⎨ ⎧ (θ_{1} / θ_{0})^{n}, + \infty, 0, x_{(n)} ⩽ θ_{0} θ_{0} < x_{(n)} ⩽ θ_{1} x_{(n)} > θ_{1}

当 $θ_{1} > θ_{0}$ 时， $Λ ⩽ c$ 等价于 $x_{(n)} > θ_{0}$ （当 $c < (θ_{1} / θ_{0})^{n}$ 时）。

在 $H_{0}$ 下， $X_{(n)}$ 的分布函数为 $F (t) = (t / θ_{0})^{n}$ （ $0 < t < θ_{0}$ ）。

因此 $P_{θ_{0}} (X_{(n)} > θ_{0}) = 0$ ，直接取 $c = (θ_{1} / θ_{0})^{n}$ ，拒绝域为

W = {X_{(n)} > θ_{0}}

此时犯第一类错误的概率为 $0 ⩽ α$ 。如果需要精确达到水平 $α$ ，可以使用随机化检验。

习题3：设 $X_{1}, X_{2}, \dots, X_{n} \sim iid N (μ, σ^{2})$ ， $μ$ 和 $σ^{2}$ 均未知。考虑检验 $H_{0} : σ^{2} = σ_{0}^{2}$ vs $H_{1} : σ^{2} \neq = σ_{0}^{2}$ 。求广义似然比检验。

解：全空间MLE： $\overset{μ}{^} = \overset{ˉ}{X}$ ， $\overset{σ}{^}^{2} = \frac{1}{n} \sum (X_{i} - \overset{ˉ}{X})^{2}$ 。

约束MLE（ $H_{0}$ 下）： $\overset{μ}{^}_{0} = \overset{ˉ}{X}$ ， $\overset{σ}{^}_{0}^{2} = σ_{0}^{2}$ 。

似然比为

Λ = \frac{L ( X ˉ , σ _{0}^{2} )}{L ( X ˉ , σ ^ ^{2} )} = \frac{( 2 π σ _{0}^{2} ) ^{- n /2} exp { - \frac{1}{2 σ _{0}^{2}} \sum ( X _{i} - X ˉ ) ^{2} }}{( 2 π σ ^ ^{2} ) ^{- n /2} exp { - \frac{n}{2} }} = (\frac{σ ^ ^{2}}{σ _{0}^{2}})^{n /2} exp {- \frac{n σ ^ ^{2}}{2 σ _{0}^{2}} + \frac{n}{2}}

令 $u = n \overset{σ}{^}^{2} / σ_{0}^{2} = \frac{1}{σ _{0}^{2}} \sum (X_{i} - \overset{ˉ}{X})^{2}$ ，则

Λ = (\frac{u}{n})^{n /2} e^{- u /2 + n /2}

$Λ$ 是 $u$ 的函数，先减后增，在 $u = n$ 处取最大值 $1$ 。 $Λ ⩽ c$ 等价于 $u ⩽ c_{1}$ 或 $u ⩾ c_{2}$ 。

在 $H_{0}$ 下， $u / σ_{0}^{2} = \sum (X_{i} - \overset{ˉ}{X})^{2} / σ_{0}^{2} \sim χ^{2} (n - 1)$ 。

因此拒绝域为

W = {\frac{\sum ( X _{i} - X ˉ ) ^{2}}{σ _{0}^{2}} ⩽ χ_{α /2}^{2} (n - 1) 或 \frac{\sum ( X _{i} - X ˉ ) ^{2}}{σ _{0}^{2}} ⩾ χ_{1 - α /2}^{2} (n - 1)}

这与§7.2中的 $χ^{2}$ 检验一致。

习题4：掷一枚骰子120次，各面出现的次数如下：

点数	1	2	3	4	5	6
频数	25	17	15	23	24	16

在 $α = 0.05$ 下检验骰子是否均匀。

解： $H_{0}$ : 骰子均匀（各面概率均为 $1/6$ ）。

理论频数 $E_{i} = 120 \times 1/6 = 20$ 。

χ^{2} = \frac{( 25 - 20 ) ^{2}}{20} + \frac{( 17 - 20 ) ^{2}}{20} + \frac{( 15 - 20 ) ^{2}}{20} + \frac{( 23 - 20 ) ^{2}}{20} + \frac{( 24 - 20 ) ^{2}}{20} + \frac{( 16 - 20 ) ^{2}}{20} = \frac{25 + 9 + 25 + 9 + 16 + 16}{20} = \frac{100}{20} = 5.0

自由度 $= 6 - 1 = 5$ ， $χ_{0.95}^{2} (5) = 11.070$ 。

因为 $χ^{2} = 5.0 < 11.070$ ，所以不拒绝 $H_{0}$ ，即骰子是均匀的。

习题5：调查300名大学生，研究性别与是否喜欢运动的关系：

	喜欢	不喜欢	合计
男	90	60	150
女	70	80	150
合计	160	140	300

在 $α = 0.01$ 下检验性别与运动偏好是否独立。

解： $H_{0}$ : 性别与运动偏好独立。

E_{11} = \frac{150 \times 160}{300} = 80, E_{12} = \frac{150 \times 140}{300} = 70 E_{21} = \frac{150 \times 160}{300} = 80, E_{22} = \frac{150 \times 140}{300} = 70 χ^{2} = \frac{( 90 - 80 ) ^{2}}{80} + \frac{( 60 - 70 ) ^{2}}{70} + \frac{( 70 - 80 ) ^{2}}{80} + \frac{( 80 - 70 ) ^{2}}{70} = \frac{100}{80} + \frac{100}{70} + \frac{100}{80} + \frac{100}{70} = 1.25 + 1.43 + 1.25 + 1.43 = 5.36

自由度 $= (2 - 1) (2 - 1) = 1$ ， $χ_{0.99}^{2} (1) = 6.635$ 。

因为 $χ^{2} = 5.36 < 6.635$ ，所以不拒绝 $H_{0}$ ，即性别与运动偏好无显著关联。

习题6：从某工厂生产的产品中随机抽取100件，测量其直径（单位：mm），得到如下频数分布：

区间	(9.5, 9.7)	(9.7, 9.9)	(9.9, 10.1)	(10.1, 10.3)	(10.3, 10.5)
频数	5	15	35	30	15

样本均值 $\overset{x}{ˉ} = 10.06$ ，样本标准差 $s = 0.18$ 。在 $α = 0.05$ 下检验直径是否服从正态分布。

解： $H_{0}$ : 直径 $\sim N (μ, σ^{2})$ ，其中 $μ$ 和 $σ^{2}$ 未知。

用样本估计： $\overset{μ}{^} = 10.06$ ， $\overset{σ}{^} = 0.18$ 。

计算各区间的理论概率（标准化后查正态分布表）：

设 $Z = (X - 10.06) /0.18$ 。

区间	$Z$ 区间	$p_{i}$	$E_{i} = 100 p_{i}$
$(- \infty, 9.7)$	$(- \infty, - 2)$	0.0228	2.28
$(9.7, 9.9)$	$(- 2, - 0.89)$	0.1536	15.36
$(9.9, 10.1)$	$(- 0.89, 0.22)$	0.4107	41.07
$(10.1, 10.3)$	$(0.22, 1.33)$	0.3230	32.30
$(10.3, + \infty)$	$(1.33, + \infty)$	0.0918	9.18

第一组 $E_{1} = 2.28 < 5$ ，将第一、二组合并：

合并区间	$O_{i}$	$E_{i}$
$(- \infty, 9.9)$	20	17.64
$(9.9, 10.1)$	35	41.07
$(10.1, 10.3)$	30	32.30
$(10.3, + \infty)$	15	9.18

χ^{2} = \frac{( 20 - 17.64 ) ^{2}}{17.64} + \frac{( 35 - 41.07 ) ^{2}}{41.07} + \frac{( 30 - 32.30 ) ^{2}}{32.30} + \frac{( 15 - 9.18 ) ^{2}}{9.18} = 0.316 + 0.897 + 0.164 + 3.690 = 5.067

自由度 $= 4 - 1 - 2 = 1$ ， $χ_{0.95}^{2} (1) = 3.841$ 。

因为 $χ^{2} = 5.067 > 3.841$ ，所以拒绝 $H_{0}$ ，即直径不服从正态分布。

考研真题

真题7（卡方拟合优度检验）：某电话交换台在100分钟内记录每分钟接到的呼叫次数，得到如下数据：

每分钟呼叫次数	0	1	2	3	4	5	$⩾ 6$
频数	8	22	30	20	12	5	3

在 $α = 0.05$ 下检验每分钟呼叫次数是否服从泊松分布。

解： $H_{0}$ : 每分钟呼叫次数 $\sim P (λ)$ 。

估计参数：

\hat{λ} = \overset{x}{ˉ} = \frac{0 \times 8 + 1 \times 22 + 2 \times 30 + 3 \times 20 + 4 \times 12 + 5 \times 5 + 6 \times 3}{100} = \frac{218}{100} = 2.18

计算理论概率和期望频数：

$k$	$p_{k} = e^{- 2.18} \cdot 2.1 8^{k} / k!$	$E_{k} = 100 p_{k}$
0	0.1130	11.30
1	0.2464	24.64
2	0.2686	26.86
3	0.1951	19.51
4	0.1063	10.63
5	0.0463	4.63
$⩾ 6$	0.0243	2.43

将 $k ⩾ 5$ 合并： $O_{⩾ 5} = 8$ ， $E_{⩾ 5} = 7.06$ 。

χ^{2} = \frac{( 8 - 11.30 ) ^{2}}{11.30} + \frac{( 22 - 24.64 ) ^{2}}{24.64} + \frac{( 30 - 26.86 ) ^{2}}{26.86} + \frac{( 20 - 19.51 ) ^{2}}{19.51} + \frac{( 12 - 10.63 ) ^{2}}{10.63} + \frac{( 8 - 7.06 ) ^{2}}{7.06} = 0.963 + 0.283 + 0.367 + 0.012 + 0.177 + 0.125 = 1.927

自由度 $= 6 - 1 - 1 = 4$ ， $χ_{0.95}^{2} (4) = 9.488$ 。

因为 $χ^{2} = 1.927 < 9.488$ ，所以不拒绝 $H_{0}$ ，即每分钟呼叫次数服从泊松分布。

真题8（列联表独立性检验）：研究血型与疾病类型的关系，得到如下 $3 \times 3$ 列联表：

	A型	B型	O型	合计
甲病	30	20	50	100
乙病	40	30	30	100
丙病	30	50	20	100
合计	100	100	100	300

在 $α = 0.01$ 下检验血型与疾病类型是否独立。

解： $H_{0}$ : 血型与疾病类型独立。

由于各行合计和各列合计均为100，期望频数 $E_{ij} = 100 \times 100/300 = 33.33$ （对所有 $i, j$ ）。

χ^{2} = i = 1 \sum 3 j = 1 \sum 3 \frac{( O _{ij} - 33.33 ) ^{2}}{33.33} = \frac{( 30 - 33.33 ) ^{2} + ( 20 - 33.33 ) ^{2} + ( 50 - 33.33 ) ^{2} + ( 40 - 33.33 ) ^{2} + ( 30 - 33.33 ) ^{2} + ( 30 - 33.33 ) ^{2} + ( 30 - 33.33 ) ^{2} + ( 50 - 33.33 ) ^{2} + ( 20 - 33.33 ) ^{2}}{33.33} = \frac{11.09 + 177.69 + 277.89 + 44.49 + 11.09 + 11.09 + 11.09 + 277.89 + 177.69}{33.33} = \frac{1000.01}{33.33} = 30.00

自由度 $= (3 - 1) (3 - 1) = 4$ ， $χ_{0.99}^{2} (4) = 13.277$ 。

因为 $χ^{2} = 30.00 > 13.277$ ，所以拒绝 $H_{0}$ ，即血型与疾病类型有关。

真题9（泊松分布拟合检验）：某十字路口在50个时间段（每个时间段10分钟）内记录交通事故数，得到如下数据：

事故数	0	1	2	3	4	$⩾ 5$
频数	18	15	10	5	2	0

在 $α = 0.10$ 下检验事故数是否服从泊松分布。

解： $H_{0}$ : 事故数 $\sim P (λ)$ 。

\hat{λ} = \overset{x}{ˉ} = \frac{0 \times 18 + 1 \times 15 + 2 \times 10 + 3 \times 5 + 4 \times 2}{50} = \frac{43}{50} = 0.86

计算理论概率：

$k$	$p_{k}$	$E_{k}$
0	$e^{- 0.86} = 0.423$	21.15
1	$0.86 \cdot e^{- 0.86} = 0.364$	18.20
2	$0.8 6^{2} /2! \cdot e^{- 0.86} = 0.156$	7.82
3	$0.8 6^{3} /3! \cdot e^{- 0.86} = 0.045$	2.25
$⩾ 4$	$1 - 0.423 - 0.364 - 0.156 - 0.045 = 0.012$	0.58

将 $k ⩾ 3$ 合并： $O_{⩾ 3} = 7$ ， $E_{⩾ 3} = 2.83$ 。但 $E_{⩾ 3} < 5$ ，需要进一步将 $k ⩾ 2$ 合并： $O_{⩾ 2} = 17$ ， $E_{⩾ 2} = 10.65$ 。

χ^{2} = \frac{( 18 - 21.15 ) ^{2}}{21.15} + \frac{( 15 - 18.20 ) ^{2}}{18.20} + \frac{( 17 - 10.65 ) ^{2}}{10.65} = 0.469 + 0.563 + 3.785 = 4.817

自由度 $= 3 - 1 - 1 = 1$ ， $χ_{0.90}^{2} (1) = 2.706$ 。

因为 $χ^{2} = 4.817 > 2.706$ ，所以拒绝 $H_{0}$ ，即事故数不服从泊松分布。

真题10（正态分布拟合检验）：从某年级学生中随机抽取200人，测量身高（单位：cm），得到如下频数分布：

区间	$(- \infty, 160)$	$[160, 165)$	$[165, 170)$	$[170, 175)$	$[175, + \infty)$
频数	15	35	70	55	25

已知样本均值 $\overset{x}{ˉ} = 168.5$ ，样本标准差 $s = 5.2$ 。在 $α = 0.05$ 下检验身高是否服从正态分布。

解： $H_{0}$ : 身高 $\sim N (μ, σ^{2})$ 。

用样本估计： $\overset{μ}{^} = 168.5$ ， $\overset{σ}{^} = 5.2$ 。

标准化 $Z = (X - 168.5) /5.2$ ，计算各区间的理论概率：

区间	$Z$ 区间	$p_{i}$	$E_{i}$
$(- \infty, 160)$	$(- \infty, - 1.635)$	0.0510	10.20
$[160, 165)$	$[- 1.635, - 0.673)$	0.1976	39.52
$[165, 170)$	$[- 0.673, 0.288)$	0.3649	72.98
$[170, 175)$	$[0.288, 1.250)$	0.2931	58.62
$[175, + \infty)$	$[1.250, + \infty)$	0.1056	21.12

所有 $E_{i} ⩾ 5$ ，无需合并。

χ^{2} = \frac{( 15 - 10.20 ) ^{2}}{10.20} + \frac{( 35 - 39.52 ) ^{2}}{39.52} + \frac{( 70 - 72.98 ) ^{2}}{72.98} + \frac{( 55 - 58.62 ) ^{2}}{58.62} + \frac{( 25 - 21.12 ) ^{2}}{21.12} = 2.259 + 0.517 + 0.122 + 0.224 + 0.713 = 3.835

自由度 $= 5 - 1 - 2 = 2$ ， $χ_{0.95}^{2} (2) = 5.991$ 。

因为 $χ^{2} = 3.835 < 5.991$ ，所以不拒绝 $H_{0}$ ，即身高服从正态分布。

十一、教材原文

教材原文

本节对应教材：茆诗松《概率论与数理统计》（第三版）第七章第四节”似然比检验与分布拟合检验”。

PDF原文请参考：概率论与统计/7.4_教材扫描_正文.pdf 和 概率论与统计/7.4_卡方核心笔记_似然比检验.pdf

第七章假设检验/似然比检验

数学笔记 Wiki

探索

7.4 似然比检验与分布拟合检验

7.4 似然比检验与分布拟合检验

一、似然比检验的基本思想

似然比统计量

直观理解

二、Neyman-Pearson引理

最优势检验

Neyman-Pearson引理

似然比检验的等价形式

三、广义似然比检验

广义似然比统计量

Wilks定理（渐近分布）

广义似然比检验与前面各节检验的关系

四、卡方拟合优度检验

卡方拟合优度检验

Pearson定理

分组方法与注意事项

五、独立性检验

列联表与独立性检验

独立性检验的渐近分布

六、卡方检验汇总

三种卡方检验的对比

卡方检验的适用条件

卡方检验与似然比检验的关系

七、知识结构总览

八、核心思想与解题技巧

似然比检验解题步骤

卡方检验解题步骤

常见题型总结

九、补充理解与易混淆点

误区一：“似然比检验总是最优的”

误区二：“卡方检验的分组越多越好”

误区三：“列联表卡方检验要求样本量很大”

误区四：“拟合优度检验的p值很小就说明分布完全不对”

误区五：“似然比检验和卡方检验是两种不同的方法”

十、习题精选

教材习题

考研真题

十一、教材原文

关系图谱

目录

反向链接