第六章 参数估计 — 章节汇总

全章概览

本章是数理统计的核心章节,系统介绍参数估计的理论与方法。全章围绕”如何用样本数据估计未知参数”这一核心问题,沿两条主线展开:频率学派从点估计(§6.1-§6.4)到区间估计(§6.6),贝叶斯学派(§6.5)将参数视为随机变量,利用先验信息进行估计。

全章逻辑主线:点估计基本概念(§6.1)→ 矩估计与相合性(§6.2)→ 最大似然估计与EM算法(§6.3)→ 最小方差无偏估计(§6.4)→ 贝叶斯估计(§6.5)→ 区间估计(§6.6


一、全章知识框架

graph TB
    A[第六章 参数估计] --> B[§6.1 点估计概念与无偏性]
    A --> C[§6.2 矩估计及相合性]
    A --> D[§6.3 最大似然估计与EM]
    A --> E[§6.4 最小方差无偏估计]
    A --> F[§6.5 贝叶斯估计]
    A --> G[§6.6 区间估计]

    B --> B1[估计量与估计值]
    B --> B2[无偏性与有效性]
    B --> B3[Fisher信息量]
    B --> B4[均方误差分解]

    C --> C1[替换原理]
    C --> C2[矩估计方程组]
    C --> C3[相合性判定]
    C --> C4[渐近正态性]

    D --> D1[似然函数与对数似然]
    D --> D2[MLE求解与不变性]
    D --> D3[EM算法E步M步]
    D --> D4[渐近有效性]

    E --> E1[UMVUE定义]
    E --> E2[Rao-Blackwell定理]
    E --> E3[Lehmann-Scheffé定理]
    E --> E4[完备统计量]

    F --> F1[先验与后验分布]
    F --> F2[共轭先验分布]
    F --> F3[贝叶斯风险]
    F --> F4[后验期望估计]

    G --> G1[置信区间与置信水平]
    G --> G2[枢轴量法三步骤]
    G --> G3[正态总体七种区间]
    G --> G4[样本量确定]

    B --> C
    C --> D
    D --> E
    B --> F
    E --> G
    D --> G

二、核心知识点与公式汇总

§6.1 点估计的概念与无偏性

参数估计是数理统计的核心任务之一。点估计用统计量的一个取值作为参数的近似值。估计量的评价标准包括无偏性有效性(C-R下界)和相合性均方误差将偏差和方差统一在一个度量中。Fisher信息量刻画了样本包含关于参数的信息量,是C-R下界的基础。这五个核心概念构成了点估计理论的评价体系,从不同角度衡量估计量的优劣。

无偏性要求估计量在大量重复使用中”平均而言”恰好等于真值,是最基本的评价标准。有效性在无偏估计类中进一步比较方差大小,方差越小越精确。C-R不等式给出了无偏估计方差的统一下界,达到该下界的估计称为有效估计。均方误差则不要求无偏性,将偏差的平方与方差之和作为综合评价,在实际应用中更为灵活。

Fisher信息量 是连接样本信息与估计精度的桥梁,它反映了单个样本包含关于参数 的信息量。C-R不等式表明,任何无偏估计的方差都不会小于 ,这一结果深刻揭示了参数可估计性的理论极限。

编号类型名称内容
6.1.1定义估计量与估计值估计量 是统计量;代入样本观测值后为估计值
6.1.2定义无偏估计 对一切 成立
6.1.3定义有效估计无偏估计的方差达到 C-R 下界:
6.1.4定义Fisher信息量
6.1.5定义相合估计,即 ,$\lim_{n\to\infty}P(
6.1.6定义均方误差
6.1.7定义矩估计法用样本 阶矩 代替总体 阶矩 ,解方程组得参数估计
6.1.8定义似然函数与MLE
编号类型名称内容
6.1.T1定理C-R不等式在正则条件下,
6.1.T2定理有效估计判定 达到C-R下界 存在函数使
6.1.T3定理相合性判定 的相合估计
6.1.T4定理偏差-方差分解
6.1.T5定理MLE不变性 的MLE,则 的MLE

核心公式


§6.2 矩估计及相合性

矩估计法是最古老的参数估计方法,基于替换原理——用样本矩代替总体矩。矩估计的优良性质(相合性、渐近正态性)由大数定律和中心极限定理保证。相合性是估计量的基本要求,可通过MSE趋于零或无偏+方差趋于零来判断。

替换原理的直观思想是:样本来自总体,因此样本的经验分布应当”模仿”总体的真实分布。用样本矩代替总体矩,本质上就是用经验分布的矩代替真实分布的矩。这一思想虽然简单,却具有深刻的统计意义——大数定律保证了样本矩几乎必然收敛到总体矩,从而矩估计天然具有相合性。

矩估计的渐近正态性来自中心极限定理:当样本量足够大时,矩估计量的分布近似正态。这使得我们可以在大样本下构造近似置信区间和进行近似假设检验。此外,矩估计还具有函数不变性:若 的矩估计,则 的矩估计。

编号类型名称内容
6.2.1定义替换原理用样本 阶原点矩 代替总体 阶原点矩
6.2.2定义矩估计方程组,解出
6.2.3定义相合估计严格定义,$\lim_{n\to\infty}P_{\theta}(
编号类型名称内容
6.2.T1定理替换原理依据辛钦大数定律: 阶矩存在时)
6.2.T2定理矩估计相合性 连续且 ,则矩估计
6.2.T3定理渐近正态性 由Delta方法确定
6.2.T4定理函数不变性 的矩估计,则 的矩估计
6.2.T5定理MSE判定法
6.2.T6定理无偏+方差→相合 无偏且 ,则 相合
6.2.T7定理常见相合估计 相合估计 相合估计 ;样本 频相合估计总体比例
6.2.T8定理连续映射定理 处连续,则
6.2.T9定理MLE相合性在正则条件下,MLE是相合估计

核心公式


§6.3 最大似然估计与EM算法

最大似然估计(MLE)是频率学派最重要的估计方法,具有不变性、相合性和渐近有效性等优良性质。EM算法是处理含缺失数据/隐变量模型的通用迭代方法,E步计算条件期望,M步最大化Q函数。

最大似然原理的核心思想是:已观测到的数据是”最可能”出现的,因此选择使观测数据出现概率最大的参数值作为估计。这一思想虽然直观,但在数学上却具有深刻的理论基础——在正则条件下,MLE是渐近有效的,即其渐近方差达到C-R下界,没有任何其他估计量能在渐近意义上做得更好。

EM算法将复杂的优化问题分解为两步交替进行:E步(Expectation)在给定当前参数估计下,计算完全数据对数似然的期望;M步(Maximization)最大化这个期望。EM算法保证每一步迭代都不降低似然函数值,因此收敛到似然函数的局部最大值或鞍点。在混合模型、缺失数据等问题中,EM算法是最常用的参数估计工具。

编号类型名称内容
6.3.1定义似然函数深入
6.3.2定义最大似然原理
6.3.3定义完全数据与观测数据完全数据 ,观测数据 为缺失/隐变量
6.3.4定义EM算法E步:$Q(\theta
编号类型名称内容
6.3.T1定理MLE不变性 的MLE,则 的MLE
6.3.T2定理MLE相合性在正则条件下,
6.3.T3定理MLE渐近正态性
6.3.T4定理MLE渐近有效性MLE的渐近方差达到C-R下界,是渐近最优的
6.3.T5定理EM收敛性每次迭代 ,收敛到似然函数驻点

核心公式


§6.4 最小方差无偏估计

一致最小方差无偏估计(UMVUE)是无偏估计中的”最优”估计。Rao-Blackwell定理通过对无偏估计取充分统计量的条件期望来改善估计。Lehmann-Scheffé定理结合充分性和完备性给出了UMVUE的存在性判据。

寻找UMVUE的思路是:先在所有无偏估计中筛选,再在其中找方差最小的。Rao-Blackwell定理告诉我们,利用充分统计量对无偏估计进行”平滑”(取条件期望),不会引入偏差,但可以降低方差。Lehmann-Scheffé定理进一步指出,如果充分统计量还是完备的,那么这种”平滑”得到的估计就是唯一的UMVUE。

指数族分布在UMVUE理论中扮演重要角色。满秩指数族的充分统计量自然具备完备性,因此UMVUE的存在性自动得到保证。这一结果将UMVUE的寻找简化为:找到充分完备统计量,然后构造其函数使之成为无偏估计。

编号类型名称内容
6.4.1定义UMVUE 无偏,且对一切无偏估计
6.4.2定义完备统计量
6.4.3定义充分完备统计量 既是充分统计量又是完备统计量
编号类型名称内容
6.4.T1定理UMVUE唯一性若UMVUE存在,则在概率1意义下唯一
6.4.T2定理零估计量判定 完备 a.s.
6.4.T3定理Rao-Blackwell 充分, 无偏,则 $\hat\theta = E(\tilde\theta
6.4.T4定理Lehmann-Scheffé 充分完备, 无偏,则 是UMVUE
6.4.T5定理指数族完备性满秩指数族的自然充分统计量是完备的

核心公式


§6.5 贝叶斯估计

贝叶斯估计将参数视为随机变量,利用先验分布和样本信息得到后验分布,基于后验分布进行推断。共轭先验分布使后验分布与先验分布属于同一分布族,大大简化计算。贝叶斯风险在平方损失下由后验期望最小化。

贝叶斯学派与频率学派的核心分歧在于对参数的认识:频率学派认为参数是固定的未知常数,贝叶斯学派则将参数视为具有某个先验分布的随机变量。样本的作用是更新我们对参数的认知——从先验分布到后验分布。贝叶斯公式密度形式是这一更新过程的数学表达。

共轭先验分布是贝叶斯推断中最重要的计算技巧之一。当似然函数属于指数族时,选择与似然函数共轭的先验分布,可以保证后验分布与先验分布属于同一分布族,从而后验参数的更新公式具有闭式表达。这使得贝叶斯推断的计算大大简化,也便于序贯更新。

编号类型名称内容
6.5.1定义先验分布参数 的分布 ,反映抽样前对 的认知
6.5.2定义后验分布$\pi(\theta
6.5.3定义贝叶斯估计量在平方损失下,$\hat\theta_B = E(\theta
6.5.4定义共轭先验分布先验 与后验 $\pi(\theta
6.5.5定义贝叶斯风险,综合先验与损失
编号类型名称内容
6.5.T1定理贝叶斯公式密度形式$\pi(\theta
6.5.T2定理贝叶斯估计最优性在平方损失下,后验期望 $E(\theta

核心公式

常见共轭先验对表

似然分布参数共轭先验后验分布后验参数
(成功概率)
(均值)
(均值)
(方差)
(率参数)
(成功概率)
(上界)
正态-逆Gamma正态-逆Gamma参数更新公式见教材

§6.6 区间估计

区间估计给出参数的一个随机区间,使其以置信水平 覆盖真值。枢轴量法是构造置信区间的核心方法:构造分布已知的枢轴量→确定分位数→不等式反解。正态总体下有7种标准置信区间公式。

区间估计是对点估计的重要补充。点估计只给出一个数值,无法反映估计的精度和可靠性;区间估计则同时给出了估计的范围和置信水平,信息量更为丰富。置信水平 的含义是:在大量重复抽样中,约有 的区间会覆盖真值。注意,对于某一个具体的区间,它要么覆盖真值,要么不覆盖,置信水平是方法本身的覆盖率,不是某个具体区间的概率。

枢轴量法是构造置信区间最系统的方法。其核心是找到一个仅依赖于样本和参数、且分布完全已知的统计量(枢轴量)。常见的枢轴量包括: 等。确定枢轴量后,利用其分布的分位数建立概率等式,再通过不等式反解得到置信区间。

编号类型名称内容
6.6.1定义置信区间 为置信水平 的置信区间
6.6.2定义置信水平:随机区间覆盖真值的概率, 常取 0.05 或 0.01
6.6.3定义枢轴量仅含样本和参数、分布完全已知的统计量
编号类型名称内容
6.6.T1定理频率解释置信水平 是覆盖率的长期频率,非单次概率
6.6.T2定理枢轴量法三步(1)构造枢轴量 ;(2)确定分位数 ;(3)反解得
6.6.T3定理已知区间
6.6.T4定理未知区间
6.6.T5定理区间
6.6.T6定理方差已知均值差区间
6.6.T7定理等方差未知均值差区间
6.6.T8定理方差不等近似(大样本近似)
6.6.T9定理方差比区间
6.6.T10定理大样本近似,SE由渐近方差估计
6.6.T11定理比例区间(大样本)
6.6.T12定理样本量确定(估计均值,误差不超过

核心公式

正态总体置信区间汇总表

场景参数条件枢轴量 置信区间
单总体均值 已知
单总体均值 未知
单总体方差 未知
双总体均值差 已知
双总体均值差 未知
双总体均值差大样本
双总体方差比 未知

三、章节学习脉络

§6.1 点估计的概念与无偏性

本节是全章的起点,建立了点估计的基本语言和评价体系。核心问题是:给定一个统计量作为参数的估计,如何评判其好坏?无偏性是最基本的要求——估计量不能系统性地偏大或偏小。但仅有无偏性是不够的,两个无偏估计中,方差更小的更精确,由此引出有效性和C-R不等式。

C-R不等式是本节的理论高潮。它利用Fisher信息量给出了无偏估计方差的统一下界,揭示了参数估计精度的理论极限。理解C-R不等式的关键在于理解Fisher信息量的含义:它度量了单个观测值中包含的关于参数的信息量。样本量越大,信息量按比例增长,C-R下界则相应降低。

均方误差(MSE)提供了一个更灵活的评价框架。它将偏差的平方与方差之和作为综合度量,不要求无偏性。在实际应用中,一个有偏但方差很小的估计,其MSE可能小于无偏估计,因此在MSE意义下更优。偏差-方差分解是理解这一现象的关键工具。

§6.2 矩估计及相合性

本节介绍最古老的参数估计方法——矩估计法,并系统讨论估计量的相合性。矩估计的核心思想”替换原理”极其直观:用样本矩代替总体矩来建立方程,解出参数估计。这种方法不需要知道总体分布的具体形式,只需知道矩与参数的关系即可。

相合性是本节的另一个重点。相合性要求当样本量趋于无穷时,估计量几乎必然收敛到真值。这是估计量的”最低门槛”——一个不相合的估计量在理论上几乎没有价值。本节给出了多种判断相合性的方法:MSE趋于零、无偏加方差趋于零、利用大数定律和连续映射定理等。

矩估计的渐近正态性是连接点估计与区间估计的桥梁。在大样本下,矩估计量近似服从正态分布,其渐近方差可以通过Delta方法计算。这一结果不仅为矩估计提供了精度评估,也为大样本置信区间的构造奠定了基础。

§6.3 最大似然估计与EM算法

本节介绍频率学派最重要的估计方法——最大似然估计(MLE),以及处理复杂模型的EM算法。MLE的核心优势在于充分利用了分布的具体信息(通过似然函数),因此在正则条件下具有渐近有效性——没有其他估计量能在渐近意义上做得更好。

EM算法是MLE在含缺失数据/隐变量场景下的推广。许多实际问题(如混合模型、隐马尔可夫模型、缺失数据等)的似然函数难以直接最大化,EM算法通过交替执行E步和M步来迭代求解。E步计算完全数据对数似然在观测数据条件下的期望,M步最大化这个期望。EM算法的理论保证(单调递增性)使其成为实际应用中最常用的迭代算法之一。

MLE与矩估计的对比是本节的重要思考点。矩估计计算简单但一般不是最优的;MLE计算可能复杂但具有渐近最优性。在实际应用中,当两者结果不一致时,通常优先选择MLE。

§6.4 最小方差无偏估计

本节追求无偏估计中的”最优”——一致最小方差无偏估计(UMVUE)。如果说§6.1建立了评价标准,§6.2和§6.3给出了构造方法,那么本节则回答了”最优估计是否存在、如何寻找”这一根本问题。

Rao-Blackwell定理和Lehmann-Scheffé定理是本节的理论核心。Rao-Blackwell定理告诉我们,利用充分统计量对无偏估计取条件期望,可以降低方差而不引入偏差。Lehmann-Scheffé定理进一步指出,如果充分统计量还是完备的,那么通过这种方法得到的估计就是唯一的UMVUE。这两个定理合在一起,给出了寻找UMVUE的系统方法。

指数族分布在UMVUE理论中具有特殊地位。满秩指数族的自然充分统计量自动具备完备性,因此UMVUE的存在性得到保证。这一结果大大简化了UMVUE的寻找过程,也解释了为什么指数族分布在数理统计中如此重要。

§6.5 贝叶斯估计

本节介绍与频率学派截然不同的参数估计范式——贝叶斯估计。贝叶斯学派将参数视为随机变量,赋予其先验分布,然后利用样本信息通过贝叶斯公式更新为后验分布,最后基于后验分布进行推断。

贝叶斯估计与频率学派估计的根本区别在于对”概率”的理解:频率学派将概率视为长期频率,参数是固定常数;贝叶斯学派将概率视为主观信念的程度,参数是随机变量。这种哲学差异导致了两种不同的推断框架,但在数学上,贝叶斯方法提供了更加统一和灵活的推断体系。

共轭先验分布是贝叶斯计算的重要工具。选择与似然函数共轭的先验分布,可以保证后验分布与先验分布属于同一分布族,从而得到闭式的后验参数更新公式。这不仅简化了计算,还使得序贯更新(逐步纳入新数据)变得自然和高效。

§6.6 区间估计

本节是全章的终点,从点估计过渡到区间估计。点估计给出参数的一个数值近似,但无法反映估计的精度和可靠性;区间估计则给出一个随机区间,并以置信水平量化其覆盖真值的概率,信息量更为丰富。

枢轴量法是构造置信区间最系统的方法。其三步流程(构造枢轴量→确定分位数→反解不等式)适用于各种场景。理解枢轴量法的关键在于理解”枢轴”的含义:枢轴量的分布不依赖于未知参数,这使得我们可以利用已知的分布分位数来建立概率等式。

正态总体下的7种标准置信区间是本节的计算重点。这些公式覆盖了单总体和双总体、均值和方差的各种组合,是实际应用中最常用的区间估计工具。掌握这些公式的关键在于理解每种场景下枢轴量的构造和分布,而非死记硬背公式本身。


四、补充理解与跨章展望

全章核心思想

第一层:频率学派 vs 贝叶斯学派的不同范式

频率学派(§6.1-§6.4, §6.6)将参数视为固定未知常数,所有推断基于样本分布;贝叶斯学派(§6.5)将参数视为随机变量,利用先验信息进行推断。两种范式各有优劣:频率学派方法不需要主观先验,结果更具客观性;贝叶斯方法能自然融入先验知识,在小样本下优势明显。在实际应用中,两种方法常常互为补充。

第二层:点估计→区间估计的递进关系

点估计(§6.1-§6.5)给出参数的一个”最佳猜测”,区间估计(§6.6)则给出参数的一个”合理范围”。点估计是区间估计的基础——大多数置信区间的构造都以某个点估计为中心。区间估计弥补了点估计无法反映精度的缺陷,提供了更完整的统计信息。从点估计到区间估计,是统计推断从”单一数值”到”范围+可靠性”的自然递进。

第三层:评价标准体系

全章建立了一个层次分明的评价标准体系:

  • 无偏性(§6.1):最基本要求,估计量不能系统性偏离真值
  • 有效性(§6.1):在无偏估计中比较方差,方差越小越好
  • 相合性(§6.2):大样本下估计量收敛到真值,是”最低门槛”
  • 充分性(§6.4):充分利用样本信息,不丢失有用信息
  • 最小方差(§6.4):在所有无偏估计中找方差最小的,即UMVUE

跨章关联表

关联方向关联内容说明
第五章→第六章抽样分布→估计量分布5.4 三大抽样分布 中的 分布是置信区间枢轴量的分布基础
第四章→第六章大数定律→相合性4.3 大数定律 保证样本矩收敛到总体矩,是矩估计相合性的理论依据
第四章→第六章中心极限定理→渐近正态性4.4 中心极限定理 保证估计量的大样本正态性,是区间估计的理论基础
第三章→第六章条件期望→Rao-Blackwell3.5 条件分布与条件期望 中的条件期望性质是Rao-Blackwell定理的数学工具
第六章→第七章参数估计→假设检验点估计和区间估计为第七章假设检验提供检验统计量和拒绝域

全章学习建议

  1. 先掌握评价标准,再学习构造方法。建议先彻底理解无偏性、有效性、相合性、MSE等评价标准(§6.1),再学习具体的估计方法(§6.2-§6.3)。评价标准是”尺子”,构造方法是”制造”,先用尺子知道什么是好的,再去制造好的估计量。

  2. 重视正态总体的特殊结构。正态总体是全章最重要的应用场景,其充分统计量()的分布完全已知(5.4 三大抽样分布),这使得正态总体下的UMVUE和置信区间都有简洁的闭式表达。建议熟练掌握正态总体下的所有标准结果。

  3. 对比频率学派与贝叶斯学派。在学习完§6.5后,建议回顾§6.1-§6.4的内容,对比两种范式在参数认识、推断方法、结果解释等方面的异同。这种对比不仅能加深对两种方法的理解,还能培养统计思维的多角度视野。


五、全章复习题

复习题1(§6.1 无偏性与MSE)

i.i.d.,。 (1) 证明 的无偏估计。 (2) 求

查看解答

(1) 证明 的无偏估计

首先展开平方和:

取期望:

由于 ,且 ,故 。代入得:

因此:

的无偏估计。证毕。

(2) 求

由于 是无偏估计,,由偏差-方差分解:

利用 的性质,,故:

因此

复习题2(§6.2 矩估计求解)

设总体密度 为 i.i.d. 样本。 (1) 求 的矩估计 。 (2) 判断 是否为 的相合估计。

查看解答

(1) 求矩估计

先计算总体一阶矩:

由替换原理,令

解得:

(2) 判断相合性

由大数定律,。由于函数 处连续,由连续映射定理:

因此 的相合估计。

复习题3(§6.3 MLE求解)

i.i.d. ,求 的最大似然估计。

查看解答

似然函数为:

对数似然函数为:

求导并令其为零

求导并令其为零

代入:

验证二阶条件:可以验证 ,故确为最大值点。

因此

注意: 不是 的无偏估计(分母为 而非 ),但它是相合估计。

复习题4(§6.3 EM算法)

两硬币模型:硬币A正面概率为 ,硬币B正面概率为 。每次随机选一枚硬币抛10次,共做 次实验,观测数据为(正面次数序列):。假设选硬币的概率为 。写出EM算法的E步和M步。

查看解答

为第 次实验所选硬币的指示变量: 表示选硬币A, 表示选硬币B。

E步:在当前参数 下,计算第 次实验选硬币A的后验概率:

其中

为例,若

类似地计算

M步:最大化Q函数,更新参数:

直觉理解: 是第 次实验”属于硬币A”的权重,M步中 的更新就是加权平均——用权重 将各次实验的正面比例加权平均。

复习题5(§6.4 UMVUE)

i.i.d. ,用 Lehmann-Scheffé 定理求 的 UMVUE。

查看解答

第一步:找充分完备统计量

二项分布 属于指数族:

自然充分统计量为 。满秩指数族的充分统计量是完备的,因此 是充分完备统计量。

第二步:构造 使

需要找到函数 使得:

考虑 的期望:

因此:

,则

第三步:应用 Lehmann-Scheffé 定理

由于 是充分完备统计量, 的无偏估计,由 Lehmann-Scheffé 定理, 的唯一UMVUE。

因此 的UMVUE为:

复习题6(§6.5 贝叶斯估计)

i.i.d. 。在平方损失下求 的贝叶斯估计。

查看解答

第一步:写出似然函数

第二步:写出先验分布

第三步:求后验分布

这正是 的核,其中:

因此后验分布为

第四步:求贝叶斯估计

在平方损失下,贝叶斯估计为后验期望:

直观理解:贝叶斯估计可以看作先验信息 和样本信息 的”加权综合”。当 时,,即样本量足够大时,贝叶斯估计收敛到频率学派的MLE,先验信息的影响逐渐消失。

复习题7(§6.6 置信区间)

i.i.d. 。求 的 95% 置信区间。

查看解答

由于 未知,使用 分布枢轴量:

确定分位数:查 分布表,

计算置信区间

因此 的 95% 置信区间为:

含义解释:如果重复抽样很多次,每次计算这样的区间,大约有 95% 的区间会覆盖真实的 值。

复习题8(跨节综合:点估计与区间估计的关系)

解释为什么点估计和区间估计是互补的,以及置信区间如何弥补点估计的不足。结合具体例子说明。

查看解答

点估计与区间估计的互补关系

点估计给出参数的一个”最佳猜测值”,区间估计给出参数的一个”合理范围”。两者回答的是不同层面的问题:

  • 点估计回答:“参数最可能是什么值?”
  • 区间估计回答:“参数大概在什么范围内?我对这个范围有多大把握?”

置信区间弥补点估计不足的三个方面

(1) 精度信息:点估计无法反映估计的精度。例如,,但不知道这个估计有多精确。如果95%置信区间是 ,说明估计相当精确;如果是 ,说明精度很差。同样的点估计值,对应的置信区间宽度可能截然不同。

(2) 可靠性量化:点估计无法量化估计的可靠性。置信水平 直接给出了区间覆盖真值的概率,使决策者能够根据需要选择合适的置信水平(如95%或99%)。

(3) 决策支持:在实际应用中,区间估计提供的信息更适合决策。例如,若某零件长度的规格要求是 mm, 的点估计无法判断是否合格,但若95%置信区间为 ,则可以较有信心地认为合格。

具体例子

i.i.d.

  • 点估计:(仅一个数值)
  • 95%置信区间:

点估计只告诉我们”均值大约是5”,而置信区间告诉我们”我们有95%的信心认为均值在4.608到5.392之间”。后者包含了精度信息(区间宽度约0.784)和可靠性信息(95%),为决策提供了更充分的依据。


六、各节笔记索引

节号节标题核心主题定义数定理数误区数习题数
§6.16.1 点估计的概念与无偏性无偏性、有效性、Fisher信息量、MSE85410
§6.26.2 矩估计及相合性替换原理、矩估计、相合性判定39410
§6.36.3 最大似然估计与EM算法MLE、EM算法、渐近有效性45510
§6.46.4 最小方差无偏估计UMVUE、Rao-Blackwell、Lehmann-Scheffé35510
§6.56.5 贝叶斯估计先验与后验、共轭先验、贝叶斯风险52610
§6.66.6 区间估计置信区间、枢轴量法、正态总体区间312510
合计26382960

第六章 参数估计/章节汇总