6.6 区间估计

相关笔记6.1 点估计的概念与无偏性 | 6.2 矩估计及相合性 | 6.3 最大似然估计与EM算法 | 6.4 最小方差无偏估计 | 6.5 贝叶斯估计 | 5.4 三大抽样分布 | 4.4 中心极限定理 | 2.5 常用连续分布

本节概览

本节系统介绍区间估计的理论与方法。核心逻辑链条:点估计 给出参数的单一数值,而区间估计给出一个随机区间 ,使其以置信水平 覆盖未知参数 。构造置信区间的核心方法是枢轴量法:寻找一个分布已知的枢轴量 ,利用其分布的分位数反解出 的置信区间。

逻辑链条基本概念枢轴量法单总体均值单总体方差两总体均值差两总体方差比汇总表大样本近似样本量

前置依赖§6.1(点估计概念)、§5.4 分布、 分布、 分布及分位数)、§4.4(大样本近似)

核心主线:区间估计弥补了点估计的不足——不仅给出参数的近似值,还给出估计的精度(区间宽度)和可靠度(置信水平)。枢轴量法是构造置信区间的通用方法:构造分布已知的枢轴量→确定分位数→不等式反解。


一、区间估计的基本概念

点估计 vs 区间估计

§6.1 中介绍的点估计用单一数值 去估计未知参数 ,虽然直观,但无法反映估计的精度和可靠性。区间估计弥补了这一不足:它给出一个区间 ,并附带一个概率指标说明该区间包含真值的可靠程度。

类比:点估计像说”这座山高 8848 米”,区间估计像说”这座山高约在 8844 到 8852 米之间,我有 95% 的把握”。

置信区间的定义

定义 6.6.1 — 置信区间

设总体 的分布函数 含有未知参数 是来自总体 的样本。对给定的 ,若存在两个统计量 ,使得对一切 ,有

则称随机区间 置信水平置信区间(confidence interval), 分别称为置信下限置信上限

要点解读

  • 统计量(样本的函数),因此 是一个随机区间——每次抽样得到不同的区间。
  • 未知的固定常数,不是随机变量。
  • 概率 中的随机性来自样本,而非参数。

置信水平

定义 6.6.2 — 置信水平

满足

的最大常数 称为置信区间的置信水平(confidence level)。当上式对所有 取等号时, 就是精确置信水平

置信水平的频率解释

定理 6.6.1 — 置信水平的频率解释

是参数 的置信水平为 的置信区间,则在大量重复抽样中,约有 的区间包含参数真值

直观理解:设想我们反复从同一总体中抽取 个样本,每次都构造一个 置信区间。在这大量(如 100 次)重复中,大约有 个区间会”套住”真值 ,而约有 个区间会”落空”。注意:一旦区间被算出,它要么包含 ,要么不包含,概率非 0 即 1

例 6.6.1 — 正态总体均值置信区间的直观构造

,其中 已知。取容量为 的样本 ,则由 §5.4 的正态总体抽样定理,

对给定的 ,取标准正态分布的 分位数 ,则

对不等式做等价变形(乘以 ,再移项),得到

因此 置信区间为


二、枢轴量法

枢轴量的定义与构造

定义 6.6.3 — 枢轴量

是来自总体 的样本, 为未知参数。若存在样本和 的函数

其分布不依赖于任何未知参数(即 的分布完全已知),则称 的一个枢轴量(pivotal quantity)。

枢轴量的关键特征

  1. 同时含有样本未知参数
  2. 的分布完全已知,不依赖于任何未知参数;
  3. 通过对 取概率事件 ,再反解不等式得到

枢轴量法的一般步骤

定理 6.6.2 — 枢轴量法三步法

第一步:构造枢轴量。根据总体分布和待估参数,构造一个分布已知的枢轴量

第二步:确定分位数。对给定的置信水平 ,选取常数 (通常取等尾分位数,即 ),使得

第三步:不等式反解。由 反解出 ,即得 置信区间

等尾置信区间的最优性说明

对于对称分布(如正态分布、 分布),取等尾分位数(即 关于分布中心对称)能使置信区间长度 最小,从而估计精度最高。对于不对称分布(如 分布、 分布),等尾区间不一定是最短的,但习惯上仍取等尾分位数以简化计算。

例 6.6.2 — 均匀分布 参数的置信区间

,求 置信区间。

第一步:取 为充分统计量。由顺序统计量理论,,其分布不依赖于 ,故 是枢轴量。

第二步:对 分布, 的密度函数为 。取等尾分位数:

第三步:由 反解得


三、单个正态总体均值的置信区间

,样本均值 ,样本方差

情形一: 已知

定理 6.6.3 — 已知时 的置信区间

已知时, 置信区间为

其中 为标准正态分布的 分位数。

证明

证明

第一步:构造枢轴量。由正态总体抽样定理,

该枢轴量分布不依赖于任何未知参数。

第二步:确定分位数。取

第三步:不等式反解。由 ,乘以 并移项即得。

情形二: 未知

定理 6.6.4 — 未知时 的置信区间

未知时, 置信区间为

其中 为自由度 分布的 分位数。

证明

证明

第一步:构造枢轴量。由 Fisher 引理 独立,且

第二步:确定分位数。取

第三步:不等式反解。同上,乘以 并移项。

例 6.6.3 — 正态总体均值的置信区间计算

设某工厂生产的零件长度服从正态分布 。从中随机抽取 个零件,测得 mm, mm。求 的 95% 置信区间。

未知,使用 枢轴量。,自由度

置信区间为

即有 95% 的置信度认为零件平均长度在 mm 之间。


四、单个正态总体方差的置信区间

定理 6.6.5 — 的置信区间

,则 置信区间为

其中 分别为 分布的 分位数。

证明

证明

第一步:构造枢轴量。由 Fisher 引理,

第二步:确定分位数。取等尾分位数使得

第三步:不等式反解。对不等式取倒数(注意不等号方向反转),再乘以

例 6.6.4 — 正态总体方差的置信区间计算

沿用例 6.6.3 的数据:,求 的 95% 置信区间。

:自由度 ,查 分布表:

置信区间为


五、两个正态总体均值差的置信区间

,两组样本独立。

情形一: 均已知

定理 6.6.6 — 方差已知时 的置信区间

已知时, 置信区间为

证明

证明

第一步:构造枢轴量。由 ,且独立,

第二步与第三步:取正态分位数并反解即得。

情形二: 未知(合并 区间)

定理 6.6.7 — 等方差未知时 的置信区间(合并

未知时, 置信区间为

其中合并样本方差

证明

证明

第一步:构造枢轴量。由 Fisher 引理推广, 独立,且

第二步与第三步:取 分位数并反解即得。

情形三: 未知(近似方法)

当两总体方差不相等且均未知时,精确置信区间不存在(Behrens-Fisher 问题)。常用两种近似方法:

定理 6.6.8 — 方差不等未知时 的近似置信区间

方法一(大样本近似):当 都较大时,由 Slutsky 定理,

的近似 置信区间为

方法二(Welch-Satterthwaite 近似):令 ,近似自由度为

则近似

的近似 置信区间为

例 6.6.5 — 两总体均值差的置信区间

设甲、乙两台机器生产的零件直径分别服从 。从甲机器取 个零件,得 ;从乙机器取 个零件,得 。假设 ,求 的 95% 置信区间。

:合并方差

。置信区间为


六、两个正态总体方差比的置信区间

定理 6.6.9 — 的置信区间

,两组样本独立,则 置信区间为

证明

证明

第一步:构造枢轴量。由 §5.4 分布定义,

第二步:确定分位数

第三步:不等式反解。对不等式取倒数并整理:

例 6.6.6 — 两总体方差比的置信区间

沿用例 6.6.5 的数据:。求 的 95% 置信区间。

。查 分布表:

置信区间为

由于区间包含 1,不能拒绝 的假设,与例 6.6.5 中等方差假设一致。


七、正态总体置信区间汇总表

待估参数条件枢轴量置信水平 的置信区间
已知
未知
未知
已知
未知
未知近似正态或 Welch (大样本)
未知

八、大样本置信区间

非正态总体的大样本近似

当总体分布未知或不为正态时,只要样本量足够大,可利用 中心极限定理 构造近似置信区间。

定理 6.6.10 — 大样本近似置信区间

来自均值为 、方差为 的总体(分布任意),则当 充分大时,

的近似 置信区间为

比例 的置信区间

为样本比例。由中心极限定理,

定理 6.6.11 — 比例 的近似置信区间

方法一(标准近似):当 较大且 时, 的近似 置信区间为

方法二(Wilson 区间):更精确的 Wilson 置信区间为

其中

例 6.6.7 — 比例的置信区间

在一次民意调查中,随机抽取 人,其中 支持某政策。求支持率 的 95% 置信区间。

,可用标准近似。


九、样本量的确定

在实际应用中,常需要在给定精度和置信水平下确定所需的最小样本量

定理 6.6.12 — 样本量的确定

估计均值时:给定允许误差 和置信水平 ,要求

估计比例时:给定允许误差 和置信水平 ,当 未知时取 (最保守估计),要求

例 6.6.8 — 样本量的确定

要调查某城市居民对某政策的支持率 ,要求在 95% 置信水平下误差不超过 。求最少需要的样本量。

未知取

至少需要 2401 个样本。注意这是最保守的估计;若已知 大约在 0.5 附近,则 2401 个样本确实必要。


十、知识结构总览

graph TD
    区间估计[区间估计] --> 基本概念[基本概念]
    区间估计 --> 枢轴量法[枢轴量法]
    区间估计 --> 单正态总体[单正态总体]
    区间估计 --> 两正态总体[两正态总体]
    区间估计 --> 大样本近似[大样本近似]
    区间估计 --> 样本量确定[样本量确定]

    基本概念 --> 置信区间[置信区间]
    基本概念 --> 置信水平[置信水平]
    基本概念 --> 频率解释[频率解释]

    枢轴量法 --> 构造枢轴量[构造枢轴量]
    枢轴量法 --> 确定分位数[确定分位数]
    枢轴量法 --> 不等式反解[不等式反解]

    单正态总体 --> 均值置信区间[均值置信区间]
    单正态总体 --> 方差置信区间[方差置信区间]
    均值置信区间 --> 方差已知正态枢轴量[方差已知正态枢轴量]
    均值置信区间 --> 方差未知枢轴量[方差未知枢轴量]
    方差置信区间 --> 卡方枢轴量[卡方枢轴量]

    两正态总体 --> 均值差置信区间[均值差置信区间]
    两正态总体 --> 方差比置信区间[方差比置信区间]
    均值差置信区间 --> 方差已知[方差已知]
    均值差置信区间 --> 等方差未知[等方差未知]
    均值差置信区间 --> 方差不等近似[方差不等近似]
    方差比置信区间 --> 枢轴量[枢轴量]

    大样本近似 --> 非正态大样本[非正态大样本]
    大样本近似 --> 比例置信区间[比例置信区间]
    比例置信区间 --> 标准近似[标准近似]
    比例置信区间 --> 威尔逊区间[威尔逊区间]

    样本量确定 --> 均值估计样本量[均值估计样本量]
    样本量确定 --> 比例估计样本量[比例估计样本量]

十一、补充理解与易混淆点

误区一:混淆置信水平与后验概率

来源:CSDN文库 + Accendo Reliability + Radford University + Save My Exams + Merrick Math

误区1:"95% 置信区间意味着参数有 95% 的概率落在该区间内"

❌ 错误解释:将置信水平理解为”参数 落入已算出区间的概率”。这种说法暗示 是随机变量,区间的端点是固定的。 ✅ 正确解释:在频率学派框架下,固定的未知常数,区间端点是随机的。正确的说法是:“如果我们反复抽样并构造 95% 置信区间,那么大约 95% 的这些区间会包含真值 。“一旦区间被算出, 要么在里面,要么不在,概率非 0 即 1。只有贝叶斯学派才能对 做概率陈述。

误区二:置信水平越高越好

来源:原创力文档 + CSDN + Pearson + Penn State STAT 415 + 维基教科书

误区2:"置信水平越高,置信区间越好"

❌ 错误解释:认为应该尽可能选择 99.99% 甚至更高的置信水平,因为”越有把握越好”。 ✅ 正确解释:提高置信水平(如从 95% 到 99%)会使置信区间更宽,估计精度降低。置信水平与精度之间存在此消彼长的关系。在实际应用中,应根据研究问题的需求权衡两者。高风险领域(如药物试验)可能需要 99% 置信水平,而探索性研究用 90% 可能更合适。

误区三:小样本时误用正态分位数

来源:Basic Free Tools + CSDN + LibreTexts + 维基教科书 + Radford University

误区3:"样本量较小时也可以用正态分布的分位数构造均值置信区间"

❌ 错误解释:在 未知、 时仍用 代替 构造置信区间。 ✅ 正确解释:当 未知时,必须使用 分布的分位数。 分布比正态分布”厚尾”,在小样本下给出的区间更宽,能正确反映用 代替 带来的额外不确定性。随着 ,两者趋于一致。一般当 时近似效果较好,但严格来说仍应使用 分位数。

误区四:置信区间重叠与显著性检验的关系

来源:ResearchGate (Zientek et al., 2010) + Accendo Reliability + CSDN + 维基教科书 + Penn State STAT 415

误区4:"两个参数的置信区间不重叠意味着它们有显著差异,重叠意味着没有显著差异"

❌ 错误解释:将置信区间是否重叠直接等同于假设检验是否拒绝。 ✅ 正确解释:如果两个置信区间不重叠,则对应的假设检验通常会拒绝原假设(两参数相等)。但如果两个置信区间有重叠,假设检验不一定不拒绝——这取决于重叠的程度。对于两个独立样本均值之差的检验,置信区间可以有少量重叠但检验仍然显著。正确做法是直接构造均值差的置信区间,而非比较两个单独的置信区间。

误区五:忽视枢轴量法的适用条件

来源:维基教科书 + Stat 5102 (University of Minnesota) + CSDN + 原创力文档 + Save My Exams

误区5:"任何参数都可以直接套用正态总体的置信区间公式"

❌ 错误解释:不验证总体分布是否为正态,直接套用 区间或 区间公式。 ✅ 正确解释:本节给出的精确置信区间公式( 区间、 区间、 区间)都要求总体服从正态分布。如果总体明显偏离正态,应使用大样本近似(中心极限定理)或非参数方法(如 Bootstrap)。在使用任何公式前,应先检验正态性假设是否合理。


十二、习题精选

习题概览

本节共精选 10 道习题:6 道教材习题 + 4 道补充题(教材 6.6 节补充题)。覆盖知识点:置信区间构造(正态总体均值/方差/均值差/方差比)、枢轴量法应用、大样本近似、样本量确定。

编号类型知识点难度
习题1教材6.6 已知时 的置信区间★★☆
习题2教材6.6 未知时 的置信区间★★☆
习题3教材6.6 的置信区间★★★
习题4教材6.6两总体均值差的置信区间★★★
习题5教材6.6两总体方差比的置信区间★★★
习题6教材6.6比例 的置信区间★★☆
习题7补充(教材6.6-1)枢轴量法构造均匀分布参数置信区间★★★
习题8补充(教材6.6-2)样本量的确定★★☆
习题9补充(教材6.6-3)大样本置信区间 + 精度比较★★★
习题10补充(教材6.6-4)置信水平与区间宽度的关系★★☆

习题1(教材6.6)

习题1

(即 ),测得 。求 的 95% 和 99% 置信区间。


习题2(教材6.6)

习题2

,测得 。求 的 95% 置信区间。


习题3(教材6.6)

习题3

,测得 。求 的 95% 置信区间。


习题4(教材6.6)

习题4

,两组独立。测得 。求 的 95% 置信区间。


习题5(教材6.6)

习题5

沿用习题4的数据,求 的 95% 置信区间。


习题6(教材6.6)

习题6

在一批产品中随机抽取 件,发现 18 件不合格。求不合格率 的 95% 置信区间。


习题7(补充,教材6.6-1)

习题7(补充,教材6.6-1)

(指数分布,密度 ),利用枢轴量法求 置信区间。


习题8(补充,教材6.6-2)

习题8(补充,教材6.6-2)

某研究者希望估计某地区人均月收入的 95% 置信区间,要求区间半宽度不超过 200 元。已知该地区人均月收入的标准差约为 元。最少需要多少样本?


习题9(补充,教材6.6-3)

习题9(补充,教材6.6-3)

,测得 。利用大样本近似求 的 95% 置信区间。


习题10(补充,教材6.6-4)

习题10(补充,教材6.6-4)

已知。证明:当样本量从 增大到 时,相同置信水平下置信区间的宽度缩小为原来的一半。


十三、教材原文


第六章 参数估计/区间估计