6.6 区间估计

本节概览

本节系统介绍区间估计的理论与方法。核心逻辑链条：点估计 $\hat{θ}$ 给出参数的单一数值，而区间估计给出一个随机区间 $[\hat{θ}^{L}, \hat{θ}^{U}]$ ，使其以置信水平 $1 - α$ 覆盖未知参数 $θ$ 。构造置信区间的核心方法是枢轴量法：寻找一个分布已知的枢轴量 $G (X_{1}, \dots, X_{n}, θ)$ ，利用其分布的分位数反解出 $θ$ 的置信区间。

逻辑链条：基本概念 → 枢轴量法 → 单总体均值 → 单总体方差 → 两总体均值差 → 两总体方差比 → 汇总表 → 大样本近似 → 样本量

前置依赖：§6.1（点估计概念）、§5.4（ $χ^{2}$ 分布、 $t$ 分布、 $F$ 分布及分位数）、§4.4（大样本近似）

核心主线：区间估计弥补了点估计的不足——不仅给出参数的近似值，还给出估计的精度（区间宽度）和可靠度（置信水平）。枢轴量法是构造置信区间的通用方法：构造分布已知的枢轴量→确定分位数→不等式反解。

一、区间估计的基本概念

点估计 vs 区间估计

§6.1 中介绍的点估计用单一数值 $\hat{θ}$ 去估计未知参数 $θ$ ，虽然直观，但无法反映估计的精度和可靠性。区间估计弥补了这一不足：它给出一个区间 $[\hat{θ}^{L}, \hat{θ}^{U}]$ ，并附带一个概率指标说明该区间包含真值的可靠程度。

类比：点估计像说”这座山高 8848 米”，区间估计像说”这座山高约在 8844 到 8852 米之间，我有 95% 的把握”。

置信区间的定义

定义 6.6.1 — 置信区间

设总体 $X$ 的分布函数 $F (x; θ)$ 含有未知参数 $θ \in Θ$ ， $X_{1}, X_{2}, \dots, X_{n}$ 是来自总体 $X$ 的样本。对给定的 $α \in (0, 1)$ ，若存在两个统计量 $\hat{θ}^{L} = \hat{θ}^{L} (X_{1}, \dots, X_{n})$ 和 $\hat{θ}^{U} = \hat{θ}^{U} (X_{1}, \dots, X_{n})$ ，使得对一切 $θ \in Θ$ ，有
$P_{θ} (\hat{θ}^{L} ⩽ θ ⩽ \hat{θ}^{U}) ⩾ 1 - α,$
则称随机区间 $[\hat{θ}^{L}, \hat{θ}^{U}]$ 为 $θ$ 的置信水平为 $1 - α$ 的置信区间（confidence interval）， $\hat{θ}^{L}$ 和 $\hat{θ}^{U}$ 分别称为置信下限和置信上限。

要点解读：

$\hat{θ}^{L}$ 和 $\hat{θ}^{U}$ 是统计量（样本的函数），因此 $[\hat{θ}^{L}, \hat{θ}^{U}]$ 是一个随机区间——每次抽样得到不同的区间。
$θ$ 是未知的固定常数，不是随机变量。
概率 $P_{θ} (\cdot)$ 中的随机性来自样本，而非参数。

置信水平

定义 6.6.2 — 置信水平

满足
$θ \in Θ in f P_{θ} (\hat{θ}^{L} ⩽ θ ⩽ \hat{θ}^{U}) ⩾ 1 - α$
的最大常数 $1 - α$ 称为置信区间的置信水平（confidence level）。当上式对所有 $θ$ 取等号时， $1 - α$ 就是精确置信水平。

置信水平的频率解释

定理 6.6.1 — 置信水平的频率解释

若 $[\hat{θ}^{L}, \hat{θ}^{U}]$ 是参数 $θ$ 的置信水平为 $1 - α$ 的置信区间，则在大量重复抽样中，约有 $(1 - α) \times 100%$ 的区间包含参数真值 $θ$ 。

直观理解：设想我们反复从同一总体中抽取 $n$ 个样本，每次都构造一个 $1 - α$ 置信区间。在这大量（如 100 次）重复中，大约有 $(1 - α) \times 100$ 个区间会”套住”真值 $θ$ ，而约有 $α \times 100$ 个区间会”落空”。注意：一旦区间被算出，它要么包含 $θ$ ，要么不包含，概率非 0 即 1。

例 6.6.1 — 正态总体均值置信区间的直观构造

设 $X \sim N (μ, σ^{2})$ ，其中 $σ^{2}$ 已知。取容量为 $n$ 的样本 $X_{1}, \dots, X_{n}$ ，则由 §5.4 的正态总体抽样定理，
$\frac{X ˉ - μ}{σ / n} \sim N (0, 1) .$
对给定的 $α$ ，取标准正态分布的 $1 - α /2$ 分位数 $u_{1 - α /2}$ ，则
$P (- u_{1 - α /2} ⩽ \frac{X ˉ - μ}{σ / n} ⩽ u_{1 - α /2}) = 1 - α .$
对不等式做等价变形（乘以 $σ / n$ ，再移项），得到
$P (\overset{ˉ}{X} - u_{1 - α /2} \cdot \frac{σ}{n} ⩽ μ ⩽ \overset{ˉ}{X} + u_{1 - α /2} \cdot \frac{σ}{n}) = 1 - α .$
因此 $μ$ 的 $1 - α$ 置信区间为
$[\overset{ˉ}{X} - u_{1 - α /2} \cdot \frac{σ}{n}, \overset{ˉ}{X} + u_{1 - α /2} \cdot \frac{σ}{n}] .$

二、枢轴量法

枢轴量的定义与构造

定义 6.6.3 — 枢轴量

设 $X_{1}, X_{2}, \dots, X_{n}$ 是来自总体 $F (x; θ)$ 的样本， $θ$ 为未知参数。若存在样本和 $θ$ 的函数
$G = G (X_{1}, X_{2}, \dots, X_{n}, θ),$
其分布不依赖于任何未知参数（即 $G$ 的分布完全已知），则称 $G$ 为 $θ$ 的一个枢轴量（pivotal quantity）。

枢轴量的关键特征：

$G$ 同时含有样本和未知参数 $θ$ ；
$G$ 的分布完全已知，不依赖于任何未知参数；
通过对 $G$ 取概率事件 $c ⩽ G ⩽ d$ ，再反解不等式得到 $\hat{θ}^{L} ⩽ θ ⩽ \hat{θ}^{U}$ 。

枢轴量法的一般步骤

定理 6.6.2 — 枢轴量法三步法

第一步：构造枢轴量。根据总体分布和待估参数，构造一个分布已知的枢轴量 $G (X_{1}, \dots, X_{n}, θ)$ 。

第二步：确定分位数。对给定的置信水平 $1 - α$ ，选取常数 $c$ 和 $d$ （通常取等尾分位数，即 $P (G < c) = P (G > d) = α /2$ ），使得
$P (c ⩽ G ⩽ d) = 1 - α .$
第三步：不等式反解。由 $c ⩽ G ⩽ d$ 反解出 $\hat{θ}^{L} ⩽ θ ⩽ \hat{θ}^{U}$ ，即得 $θ$ 的 $1 - α$ 置信区间 $[\hat{θ}^{L}, \hat{θ}^{U}]$ 。

等尾置信区间的最优性说明

对于对称分布（如正态分布、 $t$ 分布），取等尾分位数（即 $c$ 和 $d$ 关于分布中心对称）能使置信区间长度 $E_{θ} (\hat{θ}^{U} - \hat{θ}^{L})$ 最小，从而估计精度最高。对于不对称分布（如 $χ^{2}$ 分布、 $F$ 分布），等尾区间不一定是最短的，但习惯上仍取等尾分位数以简化计算。

例 6.6.2 — 均匀分布 $U (0, θ)$ 参数的置信区间

设 $X_{1}, X_{2}, \dots, X_{n} \sim i.i.d. U (0, θ)$ ，求 $θ$ 的 $1 - α$ 置信区间。

第一步：取 $X_{(n)} = max {X_{1}, \dots, X_{n}}$ 为充分统计量。由顺序统计量理论， $X_{(n)} / θ \sim Beta (n, 1)$ ，其分布不依赖于 $θ$ ，故 $G = X_{(n)} / θ$ 是枢轴量。

第二步：对 $Beta (n, 1)$ 分布， $G$ 的密度函数为 $f (g) = n g^{n - 1}$ ， $0 < g < 1$ 。取等尾分位数：
$P (G < c) = c^{n} = α /2 ⟹ c = (α /2)^{1/ n},$ $P (G > d) = 1 - d^{n} = α /2 ⟹ d = (1 - α /2)^{1/ n} .$
第三步：由 $c ⩽ X_{(n)} / θ ⩽ d$ 反解得
$\frac{X _{(n)}}{( 1 - α /2 ) ^{1/ n}} ⩽ θ ⩽ \frac{X _{(n)}}{( α /2 ) ^{1/ n}} .$

三、单个正态总体均值的置信区间

设 $X_{1}, X_{2}, \dots, X_{n} \sim i.i.d. N (μ, σ^{2})$ ，样本均值 $\overset{ˉ}{X} = \frac{1}{n} \sum_{i = 1}^{n} X_{i}$ ，样本方差 $S^{2} = \frac{1}{n - 1} \sum_{i = 1}^{n} (X_{i} - \overset{ˉ}{X})^{2}$ 。

情形一： $σ^{2}$ 已知

定理 6.6.3 — $σ^{2}$ 已知时 $μ$ 的置信区间

当 $σ^{2}$ 已知时， $μ$ 的 $1 - α$ 置信区间为
$[\overset{ˉ}{X} - u_{1 - α /2} \cdot \frac{σ}{n}, \overset{ˉ}{X} + u_{1 - α /2} \cdot \frac{σ}{n}],$
其中 $u_{1 - α /2}$ 为标准正态分布的 $1 - α /2$ 分位数。

证明

证明：

第一步：构造枢轴量。由正态总体抽样定理，
$\frac{X ˉ - μ}{σ / n} \sim N (0, 1) .$
该枢轴量分布不依赖于任何未知参数。

第二步：确定分位数。取 $P (- u_{1 - α /2} ⩽ G ⩽ u_{1 - α /2}) = 1 - α$ 。

第三步：不等式反解。由 $- u_{1 - α /2} ⩽ \frac{X ˉ - μ}{σ / n} ⩽ u_{1 - α /2}$ ，乘以 $σ / n$ 并移项即得。

$□$

情形二： $σ^{2}$ 未知

定理 6.6.4 — $σ^{2}$ 未知时 $μ$ 的置信区间

当 $σ^{2}$ 未知时， $μ$ 的 $1 - α$ 置信区间为
$[\overset{ˉ}{X} - t_{1 - α /2} (n - 1) \cdot \frac{S}{n}, \overset{ˉ}{X} + t_{1 - α /2} (n - 1) \cdot \frac{S}{n}],$
其中 $t_{1 - α /2} (n - 1)$ 为自由度 $n - 1$ 的 $t$ 分布的 $1 - α /2$ 分位数。

证明

证明：

第一步：构造枢轴量。由 Fisher 引理， $\overset{ˉ}{X}$ 与 $S^{2}$ 独立，且
$\frac{X ˉ - μ}{S / n} = \frac{( X ˉ - μ ) / ( σ / n )}{S ^{2} / σ ^{2}} \sim t (n - 1) .$
第二步：确定分位数。取 $P (- t_{1 - α /2} (n - 1) ⩽ t ⩽ t_{1 - α /2} (n - 1)) = 1 - α$ 。

第三步：不等式反解。同上，乘以 $S / n$ 并移项。

$□$

例 6.6.3 — 正态总体均值的置信区间计算

设某工厂生产的零件长度服从正态分布 $N (μ, σ^{2})$ 。从中随机抽取 $n = 16$ 个零件，测得 $\overset{x}{ˉ} = 10.5$ mm， $s = 0.8$ mm。求 $μ$ 的 95% 置信区间。

解： $σ^{2}$ 未知，使用 $t$ 枢轴量。 $n = 16$ ，自由度 $ν = 15$ ， $α = 0.05$ 。
$t_{0.975} (15) \approx 2.131.$
置信区间为
$[10.5 - 2.131 \times \frac{0.8}{16}, 10.5 + 2.131 \times \frac{0.8}{16}] = [10.5 - 0.426, 10.5 + 0.426] = [10.074, 10.926] .$
即有 95% 的置信度认为零件平均长度在 $[10.074, 10.926]$ mm 之间。

四、单个正态总体方差的置信区间

定理 6.6.5 — $σ^{2}$ 的置信区间

设 $X_{1}, \dots, X_{n} \sim i.i.d. N (μ, σ^{2})$ ，则 $σ^{2}$ 的 $1 - α$ 置信区间为
$[\frac{( n - 1 ) S ^{2}}{χ _{1 - α /2}^{2} ( n - 1 )}, \frac{( n - 1 ) S ^{2}}{χ _{α /2}^{2} ( n - 1 )}],$
其中 $χ_{α /2}^{2} (n - 1)$ 和 $χ_{1 - α /2}^{2} (n - 1)$ 分别为 $χ^{2} (n - 1)$ 分布的 $α /2$ 和 $1 - α /2$ 分位数。

证明

证明：

第一步：构造枢轴量。由 Fisher 引理，
$χ^{2} = \frac{( n - 1 ) S ^{2}}{σ ^{2}} \sim χ^{2} (n - 1) .$
第二步：确定分位数。取等尾分位数使得
$P (χ_{α /2}^{2} (n - 1) ⩽ \frac{( n - 1 ) S ^{2}}{σ ^{2}} ⩽ χ_{1 - α /2}^{2} (n - 1)) = 1 - α .$
第三步：不等式反解。对不等式取倒数（注意不等号方向反转），再乘以 $(n - 1) S^{2}$ ：
$\frac{( n - 1 ) S ^{2}}{χ _{1 - α /2}^{2} ( n - 1 )} ⩽ σ^{2} ⩽ \frac{( n - 1 ) S ^{2}}{χ _{α /2}^{2} ( n - 1 )} .$
$□$

例 6.6.4 — 正态总体方差的置信区间计算

沿用例 6.6.3 的数据： $n = 16$ ， $s^{2} = 0.64$ ，求 $σ^{2}$ 的 95% 置信区间。

解：自由度 $ν = 15$ ，查 $χ^{2}$ 分布表：
$χ_{0.025}^{2} (15) = 6.262, χ_{0.975}^{2} (15) = 27.488.$
置信区间为
$[\frac{15 \times 0.64}{27.488}, \frac{15 \times 0.64}{6.262}] = [\frac{9.6}{27.488}, \frac{9.6}{6.262}] = [0.349, 1.533] .$

五、两个正态总体均值差的置信区间

设 $X_{1}, \dots, X_{m} \sim i.i.d. N (μ_{1}, σ_{1}^{2})$ ， $Y_{1}, \dots, Y_{n} \sim i.i.d. N (μ_{2}, σ_{2}^{2})$ ，两组样本独立。

情形一： $σ_{1}^{2}, σ_{2}^{2}$ 均已知

定理 6.6.6 — 方差已知时 $μ_{1} - μ_{2}$ 的置信区间

当 $σ_{1}^{2}, σ_{2}^{2}$ 已知时， $μ_{1} - μ_{2}$ 的 $1 - α$ 置信区间为
$[\overset{ˉ}{X} - \overset{ˉ}{Y} - u_{1 - α /2} \frac{σ _{1}^{2}}{m} + \frac{σ _{2}^{2}}{n}, \overset{ˉ}{X} - \overset{ˉ}{Y} + u_{1 - α /2} \frac{σ _{1}^{2}}{m} + \frac{σ _{2}^{2}}{n}] .$

证明

证明：

第一步：构造枢轴量。由 $\overset{ˉ}{X} \sim N (μ_{1}, σ_{1}^{2} / m)$ ， $\overset{ˉ}{Y} \sim N (μ_{2}, σ_{2}^{2} / n)$ ，且独立，
$\frac{( X ˉ - Y ˉ ) - ( μ _{1} - μ _{2} )}{σ _{1}^{2} / m + σ _{2}^{2} / n} \sim N (0, 1) .$
第二步与第三步：取正态分位数并反解即得。

$□$

情形二： $σ_{1}^{2} = σ_{2}^{2} = σ^{2}$ 未知（合并 $t$ 区间）

定理 6.6.7 — 等方差未知时 $μ_{1} - μ_{2}$ 的置信区间（合并 $t$ ）

当 $σ_{1}^{2} = σ_{2}^{2} = σ^{2}$ 但 $σ^{2}$ 未知时， $μ_{1} - μ_{2}$ 的 $1 - α$ 置信区间为
$[\overset{ˉ}{X} - \overset{ˉ}{Y} - t_{1 - α /2} (m + n - 2) \cdot S_{x y} \frac{1}{m} + \frac{1}{n}, \overset{ˉ}{X} - \overset{ˉ}{Y} + t_{1 - α /2} (m + n - 2) \cdot S_{x y} \frac{1}{m} + \frac{1}{n}],$
其中合并样本方差为
$S_{x y}^{2} = \frac{( m - 1 ) S _{x}^{2} + ( n - 1 ) S _{y}^{2}}{m + n - 2} .$

证明

证明：

第一步：构造枢轴量。由 Fisher 引理推广， $\overset{ˉ}{X} - \overset{ˉ}{Y}$ 与 $S_{x y}^{2}$ 独立，且
$\frac{( X ˉ - Y ˉ ) - ( μ _{1} - μ _{2} )}{S _{x y} 1/ m + 1/ n} \sim t (m + n - 2) .$
第二步与第三步：取 $t$ 分位数并反解即得。

$□$

情形三： $σ_{1}^{2} \neq = σ_{2}^{2}$ 未知（近似方法）

当两总体方差不相等且均未知时，精确置信区间不存在（Behrens-Fisher 问题）。常用两种近似方法：

定理 6.6.8 — 方差不等未知时 $μ_{1} - μ_{2}$ 的近似置信区间

方法一（大样本近似）：当 $m, n$ 都较大时，由 Slutsky 定理，
$\frac{( X ˉ - Y ˉ ) - ( μ _{1} - μ _{2} )}{S _{x}^{2} / m + S _{y}^{2} / n} L N (0, 1) .$
$μ_{1} - μ_{2}$ 的近似 $1 - α$ 置信区间为
$\overset{ˉ}{X} - \overset{ˉ}{Y} \pm u_{1 - α /2} \frac{S _{x}^{2}}{m} + \frac{S _{y}^{2}}{n} .$
方法二（Welch-Satterthwaite 近似）：令 $S_{0}^{2} = S_{x}^{2} / m + S_{y}^{2} / n$ ，近似自由度为
$l = \frac{( S _{x}^{2} / m + S _{y}^{2} / n ) ^{2}}{\frac{( S _{x}^{2} / m ) ^{2}}{m - 1} + \frac{( S _{y}^{2} / n ) ^{2}}{n - 1}},$
则近似
$\frac{( X ˉ - Y ˉ ) - ( μ _{1} - μ _{2} )}{S _{0}} \tilde{˙} t (l) .$
$μ_{1} - μ_{2}$ 的近似 $1 - α$ 置信区间为
$\overset{ˉ}{X} - \overset{ˉ}{Y} \pm S_{0} \cdot t_{1 - α /2} (l) .$

例 6.6.5 — 两总体均值差的置信区间

设甲、乙两台机器生产的零件直径分别服从 $N (μ_{1}, σ_{1}^{2})$ 和 $N (μ_{2}, σ_{2}^{2})$ 。从甲机器取 $m = 10$ 个零件，得 $\overset{x}{ˉ} = 5.2$ ， $s_{x}^{2} = 0.25$ ；从乙机器取 $n = 12$ 个零件，得 $\overset{y}{ˉ} = 4.8$ ， $s_{y}^{2} = 0.36$ 。假设 $σ_{1}^{2} = σ_{2}^{2}$ ，求 $μ_{1} - μ_{2}$ 的 95% 置信区间。

解：合并方差
$S_{x y}^{2} = \frac{9 \times 0.25 + 11 \times 0.36}{20} = \frac{2.25 + 3.96}{20} = 0.3105.$
$t_{0.975} (20) \approx 2.086$ 。置信区间为
$(5.2 - 4.8) \pm 2.086 \times 0.3105 \times \frac{1}{10} + \frac{1}{12} = 0.4 \pm 2.086 \times 0.5572 \times 0.4282 = 0.4 \pm 0.498.$
即 $[- 0.098, 0.898]$ 。

六、两个正态总体方差比的置信区间

定理 6.6.9 — $σ_{1}^{2} / σ_{2}^{2}$ 的置信区间

设 $X_{1}, \dots, X_{m} \sim i.i.d. N (μ_{1}, σ_{1}^{2})$ ， $Y_{1}, \dots, Y_{n} \sim i.i.d. N (μ_{2}, σ_{2}^{2})$ ，两组样本独立，则 $σ_{1}^{2} / σ_{2}^{2}$ 的 $1 - α$ 置信区间为
$[\frac{S _{x}^{2}}{S _{y}^{2}} \cdot \frac{1}{F _{1 - α /2} ( m - 1 , n - 1 )}, \frac{S _{x}^{2}}{S _{y}^{2}} \cdot \frac{1}{F _{α /2} ( m - 1 , n - 1 )}] .$

证明

证明：

第一步：构造枢轴量。由 §5.4 的 $F$ 分布定义，
$\frac{( m - 1 ) S _{x}^{2} / σ _{1}^{2}}{( m - 1 )} / \frac{( n - 1 ) S _{y}^{2} / σ _{2}^{2}}{( n - 1 )} = \frac{S _{x}^{2} / σ _{1}^{2}}{S _{y}^{2} / σ _{2}^{2}} = \frac{S _{x}^{2}}{S _{y}^{2}} \cdot \frac{σ _{2}^{2}}{σ _{1}^{2}} \sim F (m - 1, n - 1) .$
第二步：确定分位数。
$P (F_{α /2} (m - 1, n - 1) ⩽ \frac{S _{x}^{2}}{S _{y}^{2}} \cdot \frac{σ _{2}^{2}}{σ _{1}^{2}} ⩽ F_{1 - α /2} (m - 1, n - 1)) = 1 - α .$
第三步：不等式反解。对不等式取倒数并整理：
$\frac{S _{x}^{2}}{S _{y}^{2}} \cdot \frac{1}{F _{1 - α /2} ( m - 1 , n - 1 )} ⩽ \frac{σ _{1}^{2}}{σ _{2}^{2}} ⩽ \frac{S _{x}^{2}}{S _{y}^{2}} \cdot \frac{1}{F _{α /2} ( m - 1 , n - 1 )} .$
$□$

例 6.6.6 — 两总体方差比的置信区间

沿用例 6.6.5 的数据： $m = 10$ ， $n = 12$ ， $s_{x}^{2} = 0.25$ ， $s_{y}^{2} = 0.36$ 。求 $σ_{1}^{2} / σ_{2}^{2}$ 的 95% 置信区间。

解： $s_{x}^{2} / s_{y}^{2} = 0.25/0.36 = 0.694$ 。查 $F$ 分布表：
$F_{0.025} (9, 11) \approx 0.255, F_{0.975} (9, 11) \approx 3.59.$
置信区间为
$[0.694 \times \frac{1}{3.59}, 0.694 \times \frac{1}{0.255}] = [0.193, 2.722] .$
由于区间包含 1，不能拒绝 $σ_{1}^{2} = σ_{2}^{2}$ 的假设，与例 6.6.5 中等方差假设一致。

七、正态总体置信区间汇总表

待估参数	条件	枢轴量	置信水平 $1 - α$ 的置信区间
$μ$	$σ^{2}$ 已知	$\frac{X ˉ - μ}{σ / n} \sim N (0, 1)$	$\overset{ˉ}{X} \pm u_{1 - α /2} \frac{σ}{n}$
$μ$	$σ^{2}$ 未知	$\frac{X ˉ - μ}{S / n} \sim t (n - 1)$	$\overset{ˉ}{X} \pm t_{1 - α /2} (n - 1) \frac{S}{n}$
$σ^{2}$	$μ$ 未知	$\frac{( n - 1 ) S ^{2}}{σ ^{2}} \sim χ^{2} (n - 1)$	$[\frac{( n - 1 ) S ^{2}}{χ _{1 - α /2}^{2} ( n - 1 )}, \frac{( n - 1 ) S ^{2}}{χ _{α /2}^{2} ( n - 1 )}]$
$μ_{1} - μ_{2}$	$σ_{1}^{2}, σ_{2}^{2}$ 已知	$\frac{( X ˉ - Y ˉ ) - ( μ _{1} - μ _{2} )}{σ _{1}^{2} / m + σ _{2}^{2} / n} \sim N (0, 1)$	$\overset{ˉ}{X} - \overset{ˉ}{Y} \pm u_{1 - α /2} \frac{σ _{1}^{2}}{m} + \frac{σ _{2}^{2}}{n}$
$μ_{1} - μ_{2}$	$σ_{1}^{2} = σ_{2}^{2}$ 未知	$\frac{( X ˉ - Y ˉ ) - ( μ _{1} - μ _{2} )}{S _{x y} 1/ m + 1/ n} \sim t (m + n - 2)$	$\overset{ˉ}{X} - \overset{ˉ}{Y} \pm t_{1 - α /2} (m + n - 2) \cdot S_{x y} \frac{1}{m} + \frac{1}{n}$
$μ_{1} - μ_{2}$	$σ_{1}^{2} \neq = σ_{2}^{2}$ 未知	近似正态或 Welch $t$	$\overset{ˉ}{X} - \overset{ˉ}{Y} \pm u_{1 - α /2} \frac{S _{x}^{2}}{m} + \frac{S _{y}^{2}}{n}$ （大样本）
$σ_{1}^{2} / σ_{2}^{2}$	$μ_{1}, μ_{2}$ 未知	$\frac{S _{x}^{2} / S _{y}^{2}}{σ _{1}^{2} / σ _{2}^{2}} \sim F (m - 1, n - 1)$	$[\frac{S _{x}^{2}}{S _{y}^{2}} \cdot \frac{1}{F _{1 - α /2}}, \frac{S _{x}^{2}}{S _{y}^{2}} \cdot \frac{1}{F _{α /2}}]$

八、大样本置信区间

非正态总体的大样本近似

当总体分布未知或不为正态时，只要样本量足够大，可利用中心极限定理构造近似置信区间。

定理 6.6.10 — 大样本近似置信区间

设 $X_{1}, \dots, X_{n}$ 来自均值为 $μ$ 、方差为 $σ^{2}$ 的总体（分布任意），则当 $n$ 充分大时，
$\frac{X ˉ - μ}{S / n} L N (0, 1) .$
$μ$ 的近似 $1 - α$ 置信区间为
$[\overset{ˉ}{X} - u_{1 - α /2} \cdot \frac{S}{n}, \overset{ˉ}{X} + u_{1 - α /2} \cdot \frac{S}{n}] .$

比例 $p$ 的置信区间

设 $X_{1}, \dots, X_{n} \sim i.i.d. b (1, p)$ ， $\overset{ˉ}{X}$ 为样本比例。由中心极限定理，

\frac{X ˉ - p}{p ( 1 - p ) / n} L N (0, 1) .

定理 6.6.11 — 比例 $p$ 的近似置信区间

方法一（标准近似）：当 $n$ 较大且 $\overset{ˉ}{X} (1 - \overset{ˉ}{X}) ⩽ 0.25$ 时， $p$ 的近似 $1 - α$ 置信区间为
$[\overset{ˉ}{X} - u_{1 - α /2} \frac{X ˉ ( 1 - X ˉ )}{n}, \overset{ˉ}{X} + u_{1 - α /2} \frac{X ˉ ( 1 - X ˉ )}{n}] .$
方法二（Wilson 区间）：更精确的 Wilson 置信区间为
$[\frac{1}{1 + λ / n} (\overset{ˉ}{X} + \frac{λ}{2 n} - \frac{u _{1 - α /2}}{2 n} 4 n \overset{ˉ}{X} (1 - \overset{ˉ}{X}) + λ), \frac{1}{1 + λ / n} (\overset{ˉ}{X} + \frac{λ}{2 n} + \frac{u _{1 - α /2}}{2 n} 4 n \overset{ˉ}{X} (1 - \overset{ˉ}{X}) + λ)],$
其中 $λ = u_{1 - α /2}^{2}$ 。

例 6.6.7 — 比例的置信区间

在一次民意调查中，随机抽取 $n = 1000$ 人，其中 $\overset{x}{ˉ} = 0.52$ 支持某政策。求支持率 $p$ 的 95% 置信区间。

解： $u_{0.975} = 1.96$ ， $\overset{x}{ˉ} (1 - \overset{x}{ˉ}) = 0.52 \times 0.48 = 0.2496 ⩽ 0.25$ ，可用标准近似。
$[0.52 - 1.96 \frac{0.2496}{1000}, 0.52 + 1.96 \frac{0.2496}{1000}] = [0.52 - 0.031, 0.52 + 0.031] = [0.489, 0.551] .$

九、样本量的确定

在实际应用中，常需要在给定精度和置信水平下确定所需的最小样本量。

定理 6.6.12 — 样本量的确定

估计均值时：给定允许误差 $d_{0}$ 和置信水平 $1 - α$ ，要求
$u_{1 - α /2} \cdot \frac{σ}{n} ⩽ d_{0} ⟹ n ⩾ (\frac{u _{1 - α /2} \cdot σ}{d _{0}})^{2} .$
估计比例时：给定允许误差 $d_{0}$ 和置信水平 $1 - α$ ，当 $p$ 未知时取 $p = 0.5$ （最保守估计），要求
$n ⩾ (\frac{u _{1 - α /2}}{2 d _{0}})^{2} .$

例 6.6.8 — 样本量的确定

要调查某城市居民对某政策的支持率 $p$ ，要求在 95% 置信水平下误差不超过 $d_{0} = 0.02$ 。求最少需要的样本量。

解： $u_{0.975} = 1.96$ ， $p$ 未知取 $p = 0.5$ ：
$n ⩾ (\frac{1.96}{2 \times 0.02})^{2} = (\frac{1.96}{0.04})^{2} = 4 9^{2} = 2401.$
至少需要 2401 个样本。注意这是最保守的估计；若已知 $p$ 大约在 0.5 附近，则 2401 个样本确实必要。

十、知识结构总览

graph TD
    区间估计[区间估计] --> 基本概念[基本概念]
    区间估计 --> 枢轴量法[枢轴量法]
    区间估计 --> 单正态总体[单正态总体]
    区间估计 --> 两正态总体[两正态总体]
    区间估计 --> 大样本近似[大样本近似]
    区间估计 --> 样本量确定[样本量确定]

    基本概念 --> 置信区间[置信区间]
    基本概念 --> 置信水平[置信水平]
    基本概念 --> 频率解释[频率解释]

    枢轴量法 --> 构造枢轴量[构造枢轴量]
    枢轴量法 --> 确定分位数[确定分位数]
    枢轴量法 --> 不等式反解[不等式反解]

    单正态总体 --> 均值置信区间[均值置信区间]
    单正态总体 --> 方差置信区间[方差置信区间]
    均值置信区间 --> 方差已知正态枢轴量[方差已知正态枢轴量]
    均值置信区间 --> 方差未知枢轴量[方差未知枢轴量]
    方差置信区间 --> 卡方枢轴量[卡方枢轴量]

    两正态总体 --> 均值差置信区间[均值差置信区间]
    两正态总体 --> 方差比置信区间[方差比置信区间]
    均值差置信区间 --> 方差已知[方差已知]
    均值差置信区间 --> 等方差未知[等方差未知]
    均值差置信区间 --> 方差不等近似[方差不等近似]
    方差比置信区间 --> 枢轴量[枢轴量]

    大样本近似 --> 非正态大样本[非正态大样本]
    大样本近似 --> 比例置信区间[比例置信区间]
    比例置信区间 --> 标准近似[标准近似]
    比例置信区间 --> 威尔逊区间[威尔逊区间]

    样本量确定 --> 均值估计样本量[均值估计样本量]
    样本量确定 --> 比例估计样本量[比例估计样本量]

十一、补充理解与易混淆点

误区一：混淆置信水平与后验概率

来源：CSDN文库 + Accendo Reliability + Radford University + Save My Exams + Merrick Math

误区1："95% 置信区间意味着参数有 95% 的概率落在该区间内"

❌ 错误解释：将置信水平理解为”参数 $θ$ 落入已算出区间的概率”。这种说法暗示 $θ$ 是随机变量，区间的端点是固定的。 ✅ 正确解释：在频率学派框架下， $θ$ 是固定的未知常数，区间端点是随机的。正确的说法是：“如果我们反复抽样并构造 95% 置信区间，那么大约 95% 的这些区间会包含真值 $θ$ 。“一旦区间被算出， $θ$ 要么在里面，要么不在，概率非 0 即 1。只有贝叶斯学派才能对 $θ$ 做概率陈述。

误区二：置信水平越高越好

来源：原创力文档 + CSDN + Pearson + Penn State STAT 415 + 维基教科书

误区2："置信水平越高，置信区间越好"

❌ 错误解释：认为应该尽可能选择 99.99% 甚至更高的置信水平，因为”越有把握越好”。 ✅ 正确解释：提高置信水平（如从 95% 到 99%）会使置信区间更宽，估计精度降低。置信水平与精度之间存在此消彼长的关系。在实际应用中，应根据研究问题的需求权衡两者。高风险领域（如药物试验）可能需要 99% 置信水平，而探索性研究用 90% 可能更合适。

误区三：小样本时误用正态分位数

来源：Basic Free Tools + CSDN + LibreTexts + 维基教科书 + Radford University

误区3："样本量较小时也可以用正态分布的分位数构造均值置信区间"

❌ 错误解释：在 $σ^{2}$ 未知、 $n < 30$ 时仍用 $u_{1 - α /2}$ 代替 $t_{1 - α /2} (n - 1)$ 构造置信区间。 ✅ 正确解释：当 $σ^{2}$ 未知时，必须使用 $t$ 分布的分位数。 $t$ 分布比正态分布”厚尾”，在小样本下给出的区间更宽，能正确反映用 $S$ 代替 $σ$ 带来的额外不确定性。随着 $n \to \infty$ ， $t (n - 1) \to N (0, 1)$ ，两者趋于一致。一般当 $n ⩾ 30$ 时近似效果较好，但严格来说仍应使用 $t$ 分位数。

误区四：置信区间重叠与显著性检验的关系

来源：ResearchGate (Zientek et al., 2010) + Accendo Reliability + CSDN + 维基教科书 + Penn State STAT 415

误区4："两个参数的置信区间不重叠意味着它们有显著差异，重叠意味着没有显著差异"

❌ 错误解释：将置信区间是否重叠直接等同于假设检验是否拒绝。 ✅ 正确解释：如果两个置信区间不重叠，则对应的假设检验通常会拒绝原假设（两参数相等）。但如果两个置信区间有重叠，假设检验不一定不拒绝——这取决于重叠的程度。对于两个独立样本均值之差的检验，置信区间可以有少量重叠但检验仍然显著。正确做法是直接构造均值差的置信区间，而非比较两个单独的置信区间。

误区五：忽视枢轴量法的适用条件

来源：维基教科书 + Stat 5102 (University of Minnesota) + CSDN + 原创力文档 + Save My Exams

误区5："任何参数都可以直接套用正态总体的置信区间公式"

❌ 错误解释：不验证总体分布是否为正态，直接套用 $t$ 区间或 $χ^{2}$ 区间公式。 ✅ 正确解释：本节给出的精确置信区间公式（ $t$ 区间、 $χ^{2}$ 区间、 $F$ 区间）都要求总体服从正态分布。如果总体明显偏离正态，应使用大样本近似（中心极限定理）或非参数方法（如 Bootstrap）。在使用任何公式前，应先检验正态性假设是否合理。

十二、习题精选

习题概览

本节共精选 10 道习题：6 道教材习题 + 4 道补充题（教材 6.6 节补充题）。覆盖知识点：置信区间构造（正态总体均值/方差/均值差/方差比）、枢轴量法应用、大样本近似、样本量确定。

编号类型知识点难度
习题1 教材6.6 $σ^{2}$ 已知时 $μ$ 的置信区间 ★★☆
习题2 教材6.6 $σ^{2}$ 未知时 $μ$ 的置信区间 ★★☆
习题3 教材6.6 $σ^{2}$ 的置信区间 ★★★
习题4 教材6.6 两总体均值差的置信区间 ★★★
习题5 教材6.6 两总体方差比的置信区间 ★★★
习题6 教材6.6 比例 $p$ 的置信区间 ★★☆
习题7 补充（教材6.6-1）枢轴量法构造均匀分布参数置信区间 ★★★
习题8 补充（教材6.6-2）样本量的确定 ★★☆
习题9 补充（教材6.6-3）大样本置信区间 + 精度比较 ★★★
习题10 补充（教材6.6-4）置信水平与区间宽度的关系 ★★☆

编号	类型	知识点	难度
习题1	教材6.6	$σ^{2}$ 已知时 $μ$ 的置信区间	★★☆
习题2	教材6.6	$σ^{2}$ 未知时 $μ$ 的置信区间	★★☆
习题3	教材6.6	$σ^{2}$ 的置信区间	★★★
习题4	教材6.6	两总体均值差的置信区间	★★★
习题5	教材6.6	两总体方差比的置信区间	★★★
习题6	教材6.6	比例 $p$ 的置信区间	★★☆
习题7	补充（教材6.6-1）	枢轴量法构造均匀分布参数置信区间	★★★
习题8	补充（教材6.6-2）	样本量的确定	★★☆
习题9	补充（教材6.6-3）	大样本置信区间 + 精度比较	★★★
习题10	补充（教材6.6-4）	置信水平与区间宽度的关系	★★☆

习题1（教材6.6）

习题1

设 $X_{1}, \dots, X_{9} \sim i.i.d. N (μ, 0.09)$ （即 $σ^{2} = 0.09$ ），测得 $\overset{x}{ˉ} = 5.2$ 。求 $μ$ 的 95% 和 99% 置信区间。

查看解答

$σ = 0.3$ ， $n = 9$ 。

95% 置信区间（ $α = 0.05$ ， $u_{0.975} = 1.96$ ）：
$[5.2 - 1.96 \times \frac{0.3}{3}, 5.2 + 1.96 \times \frac{0.3}{3}] = [5.2 - 0.196, 5.2 + 0.196] = [5.004, 5.396] .$
99% 置信区间（ $α = 0.01$ ， $u_{0.995} = 2.576$ ）：
$[5.2 - 2.576 \times \frac{0.3}{3}, 5.2 + 2.576 \times \frac{0.3}{3}] = [5.2 - 0.258, 5.2 + 0.258] = [4.942, 5.458] .$
可以看到，99% 置信区间比 95% 的更宽，体现了置信水平与精度的权衡。

习题2（教材6.6）

习题2

设 $X_{1}, \dots, X_{16} \sim i.i.d. N (μ, σ^{2})$ ，测得 $\overset{x}{ˉ} = 12.5$ ， $s = 2.4$ 。求 $μ$ 的 95% 置信区间。

查看解答

$σ^{2}$ 未知，使用 $t$ 枢轴量。 $ν = 15$ ， $t_{0.975} (15) = 2.131$ 。
$[12.5 - 2.131 \times \frac{2.4}{4}, 12.5 + 2.131 \times \frac{2.4}{4}] = [12.5 - 1.279, 12.5 + 1.279] = [11.221, 13.779] .$

习题3（教材6.6）

习题3

设 $X_{1}, \dots, X_{25} \sim i.i.d. N (μ, σ^{2})$ ，测得 $s^{2} = 4.0$ 。求 $σ^{2}$ 的 95% 置信区间。

查看解答

$ν = 24$ ， $χ_{0.025}^{2} (24) = 12.401$ ， $χ_{0.975}^{2} (24) = 39.364$ 。
$[\frac{24 \times 4.0}{39.364}, \frac{24 \times 4.0}{12.401}] = [\frac{96}{39.364}, \frac{96}{12.401}] = [2.439, 7.741] .$

习题4（教材6.6）

习题4

设 $X_{1}, \dots, X_{12} \sim i.i.d. N (μ_{1}, σ^{2})$ ， $Y_{1}, \dots, Y_{15} \sim i.i.d. N (μ_{2}, σ^{2})$ ，两组独立。测得 $\overset{x}{ˉ} = 28.5$ ， $\overset{y}{ˉ} = 26.3$ ， $s_{x}^{2} = 3.2$ ， $s_{y}^{2} = 4.1$ 。求 $μ_{1} - μ_{2}$ 的 95% 置信区间。

查看解答

等方差 $σ^{2}$ 未知，使用合并 $t$ 区间。 $ν = 12 + 15 - 2 = 25$ 。
$S_{x y}^{2} = \frac{11 \times 3.2 + 14 \times 4.1}{25} = \frac{35.2 + 57.4}{25} = 3.704.$
$t_{0.975} (25) = 2.060$ 。
$(28.5 - 26.3) \pm 2.060 \times 3.704 \times \frac{1}{12} + \frac{1}{15} = 2.2 \pm 2.060 \times 1.925 \times 0.3953 = 2.2 \pm 1.567.$
置信区间为 $[0.633, 3.767]$ 。

习题5（教材6.6）

习题5

沿用习题4的数据，求 $σ_{1}^{2} / σ_{2}^{2}$ 的 95% 置信区间。

查看解答

$s_{x}^{2} / s_{y}^{2} = 3.2/4.1 = 0.780$ 。 $ν_{1} = 11$ ， $ν_{2} = 14$ 。
$F_{0.025} (11, 14) \approx 0.293, F_{0.975} (11, 14) \approx 3.37.$ $[0.780 \times \frac{1}{3.37}, 0.780 \times \frac{1}{0.293}] = [0.231, 2.662] .$
区间包含 1，与等方差假设一致。

习题6（教材6.6）

习题6

在一批产品中随机抽取 $n = 200$ 件，发现 18 件不合格。求不合格率 $p$ 的 95% 置信区间。

查看解答

$\overset{x}{ˉ} = 18/200 = 0.09$ 。 $u_{0.975} = 1.96$ 。 $\overset{x}{ˉ} (1 - \overset{x}{ˉ}) = 0.09 \times 0.91 = 0.0819 ⩽ 0.25$ 。
$[0.09 - 1.96 \frac{0.0819}{200}, 0.09 + 1.96 \frac{0.0819}{200}] = [0.09 - 0.040, 0.09 + 0.040] = [0.050, 0.130] .$

习题7（补充，教材6.6-1）

习题7（补充，教材6.6-1）

设 $X_{1}, \dots, X_{n} \sim i.i.d. Exp (λ)$ （指数分布，密度 $f (x) = λ e^{- λ x}$ ， $x > 0$ ），利用枢轴量法求 $λ$ 的 $1 - α$ 置信区间。

查看解答

第一步：由指数分布的性质， $\sum_{i = 1}^{n} X_{i} \sim Gamma (n, λ)$ ，即 $2 λ \sum_{i = 1}^{n} X_{i} \sim χ^{2} (2 n)$ 。因此
$G = 2 λ i = 1 \sum n X_{i} \sim χ^{2} (2 n)$
是枢轴量。

第二步：取等尾分位数 $χ_{α /2}^{2} (2 n)$ 和 $χ_{1 - α /2}^{2} (2 n)$ 。

第三步：由 $χ_{α /2}^{2} (2 n) ⩽ 2 λ \sum X_{i} ⩽ χ_{1 - α /2}^{2} (2 n)$ 反解得
$\frac{χ _{α /2}^{2} ( 2 n )}{2 \sum X _{i}} ⩽ λ ⩽ \frac{χ _{1 - α /2}^{2} ( 2 n )}{2 \sum X _{i}} .$

习题8（补充，教材6.6-2）

习题8（补充，教材6.6-2）

某研究者希望估计某地区人均月收入的 95% 置信区间，要求区间半宽度不超过 200 元。已知该地区人均月收入的标准差约为 $σ = 1500$ 元。最少需要多少样本？

查看解答

$d_{0} = 200$ ， $σ = 1500$ ， $u_{0.975} = 1.96$ 。
$n ⩾ (\frac{1.96 \times 1500}{200})^{2} = (\frac{2940}{200})^{2} = 14. 7^{2} = 216.09.$
取 $n ⩾ 217$ 。至少需要 217 个样本。

习题9（补充，教材6.6-3）

习题9（补充，教材6.6-3）

设 $X_{1}, \dots, X_{50} \sim i.i.d. Poisson (λ)$ ，测得 $\sum_{i = 1}^{50} X_{i} = 200$ 。利用大样本近似求 $λ$ 的 95% 置信区间。

查看解答

$\overset{ˉ}{X} = 200/50 = 4$ 。Poisson 分布的方差 $= λ$ ，用 $\overset{ˉ}{X} = 4$ 估计。由中心极限定理，
$\frac{X ˉ - λ}{X ˉ / n} \approx N (0, 1) .$ $[4 - 1.96 \frac{4}{50}, 4 + 1.96 \frac{4}{50}] = [4 - 0.554, 4 + 0.554] = [3.446, 4.554] .$

习题10（补充，教材6.6-4）

习题10（补充，教材6.6-4）

设 $X_{1}, \dots, X_{n} \sim i.i.d. N (μ, σ^{2})$ ， $σ^{2}$ 已知。证明：当样本量从 $n$ 增大到 $4 n$ 时，相同置信水平下置信区间的宽度缩小为原来的一半。

查看解答

证明：

第一步：写出区间宽度。 $σ^{2}$ 已知时 $μ$ 的 $1 - α$ 置信区间宽度为
$w_{n} = 2 u_{1 - α /2} \cdot \frac{σ}{n} .$
第二步：计算新宽度。样本量变为 $4 n$ 时，
$w_{4 n} = 2 u_{1 - α /2} \cdot \frac{σ}{4 n} = 2 u_{1 - α /2} \cdot \frac{σ}{2 n} = \frac{1}{2} w_{n} .$
第三步：结论。 $w_{4 n} = w_{n} /2$ ，即宽度缩小为原来的一半。这说明要将估计精度提高一倍（区间宽度减半），需要将样本量增大到 4 倍。

$□$

十三、教材原文

第六章参数估计/区间估计

数学笔记 Wiki

探索

6.6 区间估计

6.6 区间估计

一、区间估计的基本概念

点估计 vs 区间估计

置信区间的定义

置信水平

置信水平的频率解释

二、枢轴量法

枢轴量的定义与构造

枢轴量法的一般步骤

三、单个正态总体均值的置信区间

情形一：σ2 已知

情形二：σ2 未知

四、单个正态总体方差的置信区间

五、两个正态总体均值差的置信区间

情形一：σ12​,σ22​ 均已知

情形二：σ12​=σ22​=σ2 未知（合并 t 区间）

情形三：σ12​=σ22​ 未知（近似方法）

六、两个正态总体方差比的置信区间

七、正态总体置信区间汇总表

八、大样本置信区间

非正态总体的大样本近似

比例 p 的置信区间

九、样本量的确定

十、知识结构总览

十一、补充理解与易混淆点

误区一：混淆置信水平与后验概率

误区二：置信水平越高越好

误区三：小样本时误用正态分位数

误区四：置信区间重叠与显著性检验的关系

误区五：忽视枢轴量法的适用条件

十二、习题精选

习题1（教材6.6）

习题2（教材6.6）

习题3（教材6.6）

习题4（教材6.6）

习题5（教材6.6）

习题6（教材6.6）

习题7（补充，教材6.6-1）

习题8（补充，教材6.6-2）

习题9（补充，教材6.6-3）

习题10（补充，教材6.6-4）

十三、教材原文

关系图谱

目录

反向链接

情形一： $σ^{2}$ 已知

情形二： $σ^{2}$ 未知

情形一： $σ_{1}^{2}, σ_{2}^{2}$ 均已知

情形二： $σ_{1}^{2} = σ_{2}^{2} = σ^{2}$ 未知（合并 $t$ 区间）

情形三： $σ_{1}^{2} \neq = σ_{2}^{2}$ 未知（近似方法）

比例 $p$ 的置信区间