假设检验

概述

假设检验(Hypothesis Testing)是统计推断的两大支柱之一(另一是参数估计)。其核心思想是:先提出一个关于总体的假设(零假设),然后根据样本数据判断是否有足够证据拒绝该假设。


一、假设检验的基本概念

原假设与备择假设

原假设(H₀)

亦称零假设,是需要通过样本数据来检验的假设。通常表示”没有效应”或”没有差异”。

备择假设(H₁)

与原假设对立的假设。当拒绝 H₀ 时接受 H₁。

建立原则

  • H₀ 应是关于总体参数的明确陈述
  • H₀ 应与实际问题等价
  • H₁ 是我们希望证明的结论

二、检验统计量与拒绝域

检验统计量

用于检验原假设的样本函数,记为

拒绝域

当检验统计量的值落在某区域 时,拒绝原假设 H₀。区域 称为拒绝域


三、两类错误

决策
接受 H₀拒绝 H₀
H₀ 为真✅ 正确❌ 第一类错误(α)
H₀ 为假❌ 第二类错误(β)✅ 正确(功效)

第一类错误(Type I Error)

H₀ 为真,但被拒绝的错误。概率记为 ,即显著性水平。

第二类错误(Type II Error)

H₀ 为假,但被接受的错误。概率记为

功效函数(Power Function)

功效函数描述了在不同参数值下正确拒绝 H₀ 的概率。


四、p 值

p 值

在原假设为真的条件下,检验统计量至少与观测值一样极端的概率。p 值越小,拒绝 H₀ 的证据越强。

判断标准(常见约定):

  • :极强证据拒绝 H₀
  • :强证据拒绝 H₀
  • :弱证据拒绝 H₀
  • :没有足够证据拒绝 H₀

五、显著性检验

显著性检验

控制第一类错误概率不超过 (通常取 )的检验方法。

步骤

  1. 建立 H₀ 和 H₁
  2. 选择显著性水平
  3. 构建检验统计量及其在 H₀ 下的分布
  4. 确定拒绝域
  5. 计算观测值并做出决策

六、置信区间与假设检验的对偶关系

参数 的置信水平为 的置信区间与显著性水平为 的双侧假设检验问题具有对偶关系。


七、相关章节