6.6 区间估计
相关笔记:6.1 点估计的概念与无偏性 | 6.2 矩估计及相合性 | 6.3 最大似然估计与EM算法 | 6.4 最小方差无偏估计 | 6.5 贝叶斯估计 | 5.4 三大抽样分布 | 4.4 中心极限定理 | 2.5 常用连续分布
本节概览
本节系统介绍区间估计的理论与方法。核心逻辑链条:点估计 给出参数的单一数值,而区间估计给出一个随机区间 ,使其以置信水平 覆盖未知参数 。构造置信区间的核心方法是枢轴量法:寻找一个分布已知的枢轴量 ,利用其分布的分位数反解出 的置信区间。
逻辑链条:基本概念 → 枢轴量法 → 单总体均值 → 单总体方差 → 两总体均值差 → 两总体方差比 → 汇总表 → 大样本近似 → 样本量
前置依赖:§6.1(点估计概念)、§5.4( 分布、 分布、 分布及分位数)、§4.4(大样本近似)
核心主线:区间估计弥补了点估计的不足——不仅给出参数的近似值,还给出估计的精度(区间宽度)和可靠度(置信水平)。枢轴量法是构造置信区间的通用方法:构造分布已知的枢轴量→确定分位数→不等式反解。
一、区间估计的基本概念
点估计 vs 区间估计
§6.1 中介绍的点估计用单一数值 去估计未知参数 ,虽然直观,但无法反映估计的精度和可靠性。区间估计弥补了这一不足:它给出一个区间 ,并附带一个概率指标说明该区间包含真值的可靠程度。
类比:点估计像说”这座山高 8848 米”,区间估计像说”这座山高约在 8844 到 8852 米之间,我有 95% 的把握”。
置信区间的定义
定义 6.6.1 — 置信区间
设总体 的分布函数 含有未知参数 , 是来自总体 的样本。对给定的 ,若存在两个统计量 和 ,使得对一切 ,有
则称随机区间 为 的置信水平为 的置信区间(confidence interval), 和 分别称为置信下限和置信上限。
要点解读:
- 和 是统计量(样本的函数),因此 是一个随机区间——每次抽样得到不同的区间。
- 是未知的固定常数,不是随机变量。
- 概率 中的随机性来自样本,而非参数。
置信水平
定义 6.6.2 — 置信水平
满足
的最大常数 称为置信区间的置信水平(confidence level)。当上式对所有 取等号时, 就是精确置信水平。
置信水平的频率解释
定理 6.6.1 — 置信水平的频率解释
若 是参数 的置信水平为 的置信区间,则在大量重复抽样中,约有 的区间包含参数真值 。
直观理解:设想我们反复从同一总体中抽取 个样本,每次都构造一个 置信区间。在这大量(如 100 次)重复中,大约有 个区间会”套住”真值 ,而约有 个区间会”落空”。注意:一旦区间被算出,它要么包含 ,要么不包含,概率非 0 即 1。
例 6.6.1 — 正态总体均值置信区间的直观构造
二、枢轴量法
枢轴量的定义与构造
定义 6.6.3 — 枢轴量
设 是来自总体 的样本, 为未知参数。若存在样本和 的函数
其分布不依赖于任何未知参数(即 的分布完全已知),则称 为 的一个枢轴量(pivotal quantity)。
枢轴量的关键特征:
- 同时含有样本和未知参数 ;
- 的分布完全已知,不依赖于任何未知参数;
- 通过对 取概率事件 ,再反解不等式得到 。
枢轴量法的一般步骤
定理 6.6.2 — 枢轴量法三步法
第一步:构造枢轴量。根据总体分布和待估参数,构造一个分布已知的枢轴量 。
第二步:确定分位数。对给定的置信水平 ,选取常数 和 (通常取等尾分位数,即 ),使得
第三步:不等式反解。由 反解出 ,即得 的 置信区间 。
等尾置信区间的最优性说明
对于对称分布(如正态分布、 分布),取等尾分位数(即 和 关于分布中心对称)能使置信区间长度 最小,从而估计精度最高。对于不对称分布(如 分布、 分布),等尾区间不一定是最短的,但习惯上仍取等尾分位数以简化计算。
例 6.6.2 — 均匀分布 参数的置信区间
设 ,求 的 置信区间。
第一步:取 为充分统计量。由顺序统计量理论,,其分布不依赖于 ,故 是枢轴量。
第二步:对 分布, 的密度函数为 ,。取等尾分位数:
第三步:由 反解得
三、单个正态总体均值的置信区间
设 ,样本均值 ,样本方差 。
情形一: 已知
定理 6.6.3 — 已知时 的置信区间
当 已知时, 的 置信区间为
其中 为标准正态分布的 分位数。
证明
证明:
第一步:构造枢轴量。由正态总体抽样定理,
该枢轴量分布不依赖于任何未知参数。
第二步:确定分位数。取 。
第三步:不等式反解。由 ,乘以 并移项即得。
情形二: 未知
定理 6.6.4 — 未知时 的置信区间
当 未知时, 的 置信区间为
其中 为自由度 的 分布的 分位数。
证明
例 6.6.3 — 正态总体均值的置信区间计算
设某工厂生产的零件长度服从正态分布 。从中随机抽取 个零件,测得 mm, mm。求 的 95% 置信区间。
解: 未知,使用 枢轴量。,自由度 ,。
置信区间为
即有 95% 的置信度认为零件平均长度在 mm 之间。
四、单个正态总体方差的置信区间
定理 6.6.5 — 的置信区间
设 ,则 的 置信区间为
其中 和 分别为 分布的 和 分位数。
证明
证明:
第一步:构造枢轴量。由 Fisher 引理,
第二步:确定分位数。取等尾分位数使得
第三步:不等式反解。对不等式取倒数(注意不等号方向反转),再乘以 :
例 6.6.4 — 正态总体方差的置信区间计算
沿用例 6.6.3 的数据:,,求 的 95% 置信区间。
解:自由度 ,查 分布表:
置信区间为
五、两个正态总体均值差的置信区间
设 ,,两组样本独立。
情形一: 均已知
定理 6.6.6 — 方差已知时 的置信区间
当 已知时, 的 置信区间为
证明
证明:
第一步:构造枢轴量。由 ,,且独立,
第二步与第三步:取正态分位数并反解即得。
情形二: 未知(合并 区间)
定理 6.6.7 — 等方差未知时 的置信区间(合并 )
当 但 未知时, 的 置信区间为
其中合并样本方差为
证明
证明:
第一步:构造枢轴量。由 Fisher 引理推广, 与 独立,且
第二步与第三步:取 分位数并反解即得。
情形三: 未知(近似方法)
当两总体方差不相等且均未知时,精确置信区间不存在(Behrens-Fisher 问题)。常用两种近似方法:
定理 6.6.8 — 方差不等未知时 的近似置信区间
方法一(大样本近似):当 都较大时,由 Slutsky 定理,
的近似 置信区间为
方法二(Welch-Satterthwaite 近似):令 ,近似自由度为
则近似
的近似 置信区间为
例 6.6.5 — 两总体均值差的置信区间
设甲、乙两台机器生产的零件直径分别服从 和 。从甲机器取 个零件,得 ,;从乙机器取 个零件,得 ,。假设 ,求 的 95% 置信区间。
解:合并方差
。置信区间为
即 。
六、两个正态总体方差比的置信区间
定理 6.6.9 — 的置信区间
设 ,,两组样本独立,则 的 置信区间为
证明
例 6.6.6 — 两总体方差比的置信区间
沿用例 6.6.5 的数据:,,,。求 的 95% 置信区间。
解:。查 分布表:
置信区间为
由于区间包含 1,不能拒绝 的假设,与例 6.6.5 中等方差假设一致。
七、正态总体置信区间汇总表
| 待估参数 | 条件 | 枢轴量 | 置信水平 的置信区间 |
|---|---|---|---|
| 已知 | |||
| 未知 | |||
| 未知 | |||
| 已知 | |||
| 未知 | |||
| 未知 | 近似正态或 Welch | (大样本) | |
| 未知 |
八、大样本置信区间
非正态总体的大样本近似
当总体分布未知或不为正态时,只要样本量足够大,可利用 中心极限定理 构造近似置信区间。
定理 6.6.10 — 大样本近似置信区间
设 来自均值为 、方差为 的总体(分布任意),则当 充分大时,
的近似 置信区间为
比例 的置信区间
设 , 为样本比例。由中心极限定理,
定理 6.6.11 — 比例 的近似置信区间
方法一(标准近似):当 较大且 时, 的近似 置信区间为
方法二(Wilson 区间):更精确的 Wilson 置信区间为
其中 。
例 6.6.7 — 比例的置信区间
在一次民意调查中,随机抽取 人,其中 支持某政策。求支持率 的 95% 置信区间。
解:,,可用标准近似。
九、样本量的确定
在实际应用中,常需要在给定精度和置信水平下确定所需的最小样本量。
定理 6.6.12 — 样本量的确定
估计均值时:给定允许误差 和置信水平 ,要求
估计比例时:给定允许误差 和置信水平 ,当 未知时取 (最保守估计),要求
例 6.6.8 — 样本量的确定
要调查某城市居民对某政策的支持率 ,要求在 95% 置信水平下误差不超过 。求最少需要的样本量。
解:, 未知取 :
至少需要 2401 个样本。注意这是最保守的估计;若已知 大约在 0.5 附近,则 2401 个样本确实必要。
十、知识结构总览
graph TD 区间估计[区间估计] --> 基本概念[基本概念] 区间估计 --> 枢轴量法[枢轴量法] 区间估计 --> 单正态总体[单正态总体] 区间估计 --> 两正态总体[两正态总体] 区间估计 --> 大样本近似[大样本近似] 区间估计 --> 样本量确定[样本量确定] 基本概念 --> 置信区间[置信区间] 基本概念 --> 置信水平[置信水平] 基本概念 --> 频率解释[频率解释] 枢轴量法 --> 构造枢轴量[构造枢轴量] 枢轴量法 --> 确定分位数[确定分位数] 枢轴量法 --> 不等式反解[不等式反解] 单正态总体 --> 均值置信区间[均值置信区间] 单正态总体 --> 方差置信区间[方差置信区间] 均值置信区间 --> 方差已知正态枢轴量[方差已知正态枢轴量] 均值置信区间 --> 方差未知枢轴量[方差未知枢轴量] 方差置信区间 --> 卡方枢轴量[卡方枢轴量] 两正态总体 --> 均值差置信区间[均值差置信区间] 两正态总体 --> 方差比置信区间[方差比置信区间] 均值差置信区间 --> 方差已知[方差已知] 均值差置信区间 --> 等方差未知[等方差未知] 均值差置信区间 --> 方差不等近似[方差不等近似] 方差比置信区间 --> 枢轴量[枢轴量] 大样本近似 --> 非正态大样本[非正态大样本] 大样本近似 --> 比例置信区间[比例置信区间] 比例置信区间 --> 标准近似[标准近似] 比例置信区间 --> 威尔逊区间[威尔逊区间] 样本量确定 --> 均值估计样本量[均值估计样本量] 样本量确定 --> 比例估计样本量[比例估计样本量]
十一、补充理解与易混淆点
误区一:混淆置信水平与后验概率
来源:CSDN文库 + Accendo Reliability + Radford University + Save My Exams + Merrick Math
误区1:"95% 置信区间意味着参数有 95% 的概率落在该区间内"
❌ 错误解释:将置信水平理解为”参数 落入已算出区间的概率”。这种说法暗示 是随机变量,区间的端点是固定的。 ✅ 正确解释:在频率学派框架下, 是固定的未知常数,区间端点是随机的。正确的说法是:“如果我们反复抽样并构造 95% 置信区间,那么大约 95% 的这些区间会包含真值 。“一旦区间被算出, 要么在里面,要么不在,概率非 0 即 1。只有贝叶斯学派才能对 做概率陈述。
误区二:置信水平越高越好
来源:原创力文档 + CSDN + Pearson + Penn State STAT 415 + 维基教科书
误区2:"置信水平越高,置信区间越好"
❌ 错误解释:认为应该尽可能选择 99.99% 甚至更高的置信水平,因为”越有把握越好”。 ✅ 正确解释:提高置信水平(如从 95% 到 99%)会使置信区间更宽,估计精度降低。置信水平与精度之间存在此消彼长的关系。在实际应用中,应根据研究问题的需求权衡两者。高风险领域(如药物试验)可能需要 99% 置信水平,而探索性研究用 90% 可能更合适。
误区三:小样本时误用正态分位数
来源:Basic Free Tools + CSDN + LibreTexts + 维基教科书 + Radford University
误区3:"样本量较小时也可以用正态分布的分位数构造均值置信区间"
❌ 错误解释:在 未知、 时仍用 代替 构造置信区间。 ✅ 正确解释:当 未知时,必须使用 分布的分位数。 分布比正态分布”厚尾”,在小样本下给出的区间更宽,能正确反映用 代替 带来的额外不确定性。随着 ,,两者趋于一致。一般当 时近似效果较好,但严格来说仍应使用 分位数。
误区四:置信区间重叠与显著性检验的关系
来源:ResearchGate (Zientek et al., 2010) + Accendo Reliability + CSDN + 维基教科书 + Penn State STAT 415
误区4:"两个参数的置信区间不重叠意味着它们有显著差异,重叠意味着没有显著差异"
❌ 错误解释:将置信区间是否重叠直接等同于假设检验是否拒绝。 ✅ 正确解释:如果两个置信区间不重叠,则对应的假设检验通常会拒绝原假设(两参数相等)。但如果两个置信区间有重叠,假设检验不一定不拒绝——这取决于重叠的程度。对于两个独立样本均值之差的检验,置信区间可以有少量重叠但检验仍然显著。正确做法是直接构造均值差的置信区间,而非比较两个单独的置信区间。
误区五:忽视枢轴量法的适用条件
来源:维基教科书 + Stat 5102 (University of Minnesota) + CSDN + 原创力文档 + Save My Exams
误区5:"任何参数都可以直接套用正态总体的置信区间公式"
❌ 错误解释:不验证总体分布是否为正态,直接套用 区间或 区间公式。 ✅ 正确解释:本节给出的精确置信区间公式( 区间、 区间、 区间)都要求总体服从正态分布。如果总体明显偏离正态,应使用大样本近似(中心极限定理)或非参数方法(如 Bootstrap)。在使用任何公式前,应先检验正态性假设是否合理。
十二、习题精选
习题概览
本节共精选 10 道习题:6 道教材习题 + 4 道补充题(教材 6.6 节补充题)。覆盖知识点:置信区间构造(正态总体均值/方差/均值差/方差比)、枢轴量法应用、大样本近似、样本量确定。
编号 类型 知识点 难度 习题1 教材6.6 已知时 的置信区间 ★★☆ 习题2 教材6.6 未知时 的置信区间 ★★☆ 习题3 教材6.6 的置信区间 ★★★ 习题4 教材6.6 两总体均值差的置信区间 ★★★ 习题5 教材6.6 两总体方差比的置信区间 ★★★ 习题6 教材6.6 比例 的置信区间 ★★☆ 习题7 补充(教材6.6-1) 枢轴量法构造均匀分布参数置信区间 ★★★ 习题8 补充(教材6.6-2) 样本量的确定 ★★☆ 习题9 补充(教材6.6-3) 大样本置信区间 + 精度比较 ★★★ 习题10 补充(教材6.6-4) 置信水平与区间宽度的关系 ★★☆
习题1(教材6.6)
习题1
设 (即 ),测得 。求 的 95% 和 99% 置信区间。
查看解答
,。
95% 置信区间(,):
99% 置信区间(,):
可以看到,99% 置信区间比 95% 的更宽,体现了置信水平与精度的权衡。
习题2(教材6.6)
习题2
设 ,测得 ,。求 的 95% 置信区间。
查看解答
未知,使用 枢轴量。,。
习题3(教材6.6)
习题3
设 ,测得 。求 的 95% 置信区间。
查看解答
,,。
习题4(教材6.6)
习题4
设 ,,两组独立。测得 ,,,。求 的 95% 置信区间。
查看解答
等方差 未知,使用合并 区间。。
。
置信区间为 。
习题5(教材6.6)
习题5
沿用习题4的数据,求 的 95% 置信区间。
查看解答
。,。
区间包含 1,与等方差假设一致。
习题6(教材6.6)
习题6
在一批产品中随机抽取 件,发现 18 件不合格。求不合格率 的 95% 置信区间。
查看解答
。。。
习题7(补充,教材6.6-1)
习题7(补充,教材6.6-1)
设 (指数分布,密度 ,),利用枢轴量法求 的 置信区间。
查看解答
第一步:由指数分布的性质,,即 。因此
是枢轴量。
第二步:取等尾分位数 和 。
第三步:由 反解得
习题8(补充,教材6.6-2)
习题8(补充,教材6.6-2)
某研究者希望估计某地区人均月收入的 95% 置信区间,要求区间半宽度不超过 200 元。已知该地区人均月收入的标准差约为 元。最少需要多少样本?
查看解答
,,。
取 。至少需要 217 个样本。
习题9(补充,教材6.6-3)
习题9(补充,教材6.6-3)
设 ,测得 。利用大样本近似求 的 95% 置信区间。
查看解答
。Poisson 分布的方差 ,用 估计。 由中心极限定理,
习题10(补充,教材6.6-4)
习题10(补充,教材6.6-4)
设 , 已知。证明:当样本量从 增大到 时,相同置信水平下置信区间的宽度缩小为原来的一半。
查看解答
证明:
第一步:写出区间宽度。 已知时 的 置信区间宽度为
第二步:计算新宽度。样本量变为 时,
第三步:结论。,即宽度缩小为原来的一半。这说明要将估计精度提高一倍(区间宽度减半),需要将样本量增大到 4 倍。
十三、教材原文
第六章 参数估计/区间估计