假设检验
概述
假设检验(Hypothesis Testing)是统计推断的两大支柱之一(另一是参数估计)。其核心思想是:先提出一个关于总体的假设(零假设),然后根据样本数据判断是否有足够证据拒绝该假设。
一、假设检验的基本概念
原假设与备择假设
原假设(H₀)
亦称零假设,是需要通过样本数据来检验的假设。通常表示”没有效应”或”没有差异”。
备择假设(H₁)
与原假设对立的假设。当拒绝 H₀ 时接受 H₁。
建立原则:
- H₀ 应是关于总体参数的明确陈述
- H₀ 应与实际问题等价
- H₁ 是我们希望证明的结论
二、检验统计量与拒绝域
检验统计量
用于检验原假设的样本函数,记为 。
拒绝域
当检验统计量的值落在某区域 时,拒绝原假设 H₀。区域 称为拒绝域。
三、两类错误
| 决策 | ||
|---|---|---|
| 接受 H₀ | 拒绝 H₀ | |
| H₀ 为真 | ✅ 正确 | ❌ 第一类错误(α) |
| H₀ 为假 | ❌ 第二类错误(β) | ✅ 正确(功效) |
第一类错误(Type I Error)
H₀ 为真,但被拒绝的错误。概率记为 ,即显著性水平。
第二类错误(Type II Error)
H₀ 为假,但被接受的错误。概率记为 。
功效函数(Power Function)
功效函数描述了在不同参数值下正确拒绝 H₀ 的概率。
四、p 值
p 值
在原假设为真的条件下,检验统计量至少与观测值一样极端的概率。p 值越小,拒绝 H₀ 的证据越强。
判断标准(常见约定):
- :极强证据拒绝 H₀
- :强证据拒绝 H₀
- :弱证据拒绝 H₀
- :没有足够证据拒绝 H₀
五、显著性检验
显著性检验
控制第一类错误概率不超过 (通常取 )的检验方法。
步骤:
- 建立 H₀ 和 H₁
- 选择显著性水平
- 构建检验统计量及其在 H₀ 下的分布
- 确定拒绝域
- 计算观测值并做出决策
六、置信区间与假设检验的对偶关系
参数 的置信水平为 的置信区间与显著性水平为 的双侧假设检验问题具有对偶关系。
七、相关章节
- 第七章 假设检验 — 章节汇总
- 参数估计 — 置信区间与假设检验的对偶性
- 正态分布 — 正态总体参数检验
- 三大抽样分布 — t 分布、F 分布在检验中的应用