8.1 方差分析
相关笔记:7.1 假设检验的基本思想与概念 | 7.4 似然比检验与分布拟合检验 | 5.4 三大抽样分布 | 6.3 最大似然估计与EM算法 | 7.2 正态总体参数的假设检验 | 6.6 区间估计 | 5.3 统计量及其分布
本节概览
本节介绍方差分析(Analysis of Variance, ANOVA)的基本原理与方法,重点讨论单因子方差分析。方差分析的核心思想是将数据的总变异分解为组间变异(由因子水平不同引起)和组内变异(由随机误差引起),通过比较两者的比值来判断因子各水平下的总体均值是否存在显著差异。与多重 检验相比,方差分析能有效控制第一类错误膨胀问题,是比较多个总体均值的标准化方法。
逻辑链条:概述 → 统计模型 → 平方和分解 → F检验 → 参数估计 → 推广 → 结构总览 → 解题技巧 → 易混淆点 → 习题 → 教材原文
前置依赖:§7.1(假设检验框架)、§7.4(似然比检验)、§5.4( 分布、 分布)、§6.3(MLE)、§7.2( 检验)
核心主线:方差分析的核心问题是”多个总体均值是否相等”。通过建立单因子方差分析模型 ,将总平方和 分解为因子平方和 与误差平方和 ,利用 在 成立时的分布,构造检验统计量判断各水平效应 是否全为零。检验拒绝后,进一步通过参数估计和置信区间量化各水平均值的具体差异。
一、方差分析概述
在§7.2中,我们讨论了两个正态总体均值比较的 检验方法。然而在实际应用中,常常需要同时比较多个(多于两个)总体的均值。例如,比较 种不同肥料对作物产量的影响、比较 种教学方法的教学效果等。此时若逐一使用两两 检验,将面临严重的多重比较问题。
方差分析的动机
设有 个独立正态总体 (),要检验假设
这是一个经典的多总体均值比较问题。方差分析(Analysis of Variance, ANOVA)正是为解决此类问题而发展起来的标准统计方法,由 R.A. Fisher 于 1920 年代提出。
方差分析的思想——变异的分解
方差分析的核心思想可以用一句话概括:将数据的总变异分解为不同来源的变异,通过比较各来源变异的相对大小来判断因子效应是否显著。
类比:假设你是一所学校的校长,想比较 3 个年级学生的数学成绩。如果只看全校总体的成绩波动(总变异),你无法判断年级之间是否有差异。但如果把总波动拆成两部分——“年级之间的差异”(组间变异)和”同一年级内部学生之间的差异”(组内变异)——当年级之间的差异远大于年级内部的差异时,你就有理由认为不同年级的数学水平确实不同。
定义
定义 8.1.1 — 方差分析(ANOVA)
方差分析(Analysis of Variance, ANOVA)是一种通过分析数据变异的来源,来判断一个或多个因子(因素)对响应变量是否有显著影响的统计方法。其基本原理是将响应变量的总偏差平方和分解为因子效应引起的偏差平方和与随机误差引起的偏差平方和,利用比值的分布进行假设检验。
与多重 检验的关系和优势
如果对 个总体进行两两比较,共需进行 次 检验。每次检验的显著性水平为 ,则至少犯一次第一类错误的概率为
例如,当 、 时:
这意味着第一类错误概率从 0.05 膨胀到了 0.4013,几乎无法接受。方差分析通过一次性检验所有均值是否相等,将整体的第一类错误概率控制在 水平,从根本上解决了这个问题。
| 比较维度 | 多重 检验 | 方差分析 |
|---|---|---|
| 检验次数 | 次 | 1 次 |
| 第一类错误 | ||
| 信息利用 | 每次只用两个样本 | 利用全部样本信息 |
| 适用场景 | 两两比较(事后检验) | 整体均值相等性检验 |
二、单因子方差分析的统计模型
引例
例 8.1.1 — 鸡饲料增肥试验
为比较 3 种饲料配方对鸡增重的影响,选取 24 只初始条件相近的鸡,随机分为 3 组,每组 8 只,分别喂饲配方 、、。8 周后记录增重数据(单位:百克)如下:
| 饲料 | \multicolumn{8}{c}{增重数据} | |:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:| | | 30 | 35 | 28 | 32 | 34 | 29 | 31 | 33 | | | 26 | 28 | 25 | 27 | 30 | 24 | 26 | 28 | | | 32 | 36 | 30 | 33 | 35 | 31 | 34 | 37 |
问题:3 种饲料配方对鸡增重的影响是否有显著差异?()
三个基本假定
单因子方差分析模型建立在以下三个基本假定之上:
- (A1) 正态性:每个水平 下的观测值 是来自正态总体 的样本,即 。
- (A2) 等方差性(方差齐性):所有水平下的总体方差相等,均为 。
- (A3) 独立性:所有 个观测值相互独立。
假定的重要性
这三个假定是方差分析有效性的基础。其中等方差性(A2)尤为重要——如果各水平下方差差异很大,F 检验的结果不可靠。实际应用中应先用 Bartlett 检验或 Levene 检验验证等方差性,用 Shapiro-Wilk 检验验证正态性。
数据结构式
设因子 有 个水平 ,每个水平下进行 次独立重复试验(等重复),得到数据 (;)。数据结构式为
其中:
- 为水平 下的总体均值
- ,且所有 相互独立
模型改写——效应形式
引入总均值 和水平效应 :
水平效应 表示水平 对响应变量的”额外贡献”。由定义可知,效应满足约束
将 代入数据结构式,得到模型的效应形式:
模型定义
定义 8.1.2 — 单因子方差分析模型
设因子 有 个水平,每个水平下等重复 次试验。若观测数据满足
其中 ,则称该模型为单因子方差分析模型(One-way ANOVA Model)。
假设检验问题
在效应形式下,“各水平均值相等”等价于”所有效应为零”,即
若拒绝 ,则认为因子 对响应变量有显著影响;否则认为因子 的影响不显著。
常用记号
为后续推导方便,引入以下记号:
- 组均值:(第 组的样本均值)
- 总均值:,其中
- 组总和:
- 总和:
三、平方和分解
平方和分解是方差分析的数学核心。其基本思路是将数据相对于总均值的总偏差平方和,分解为组间偏差平方和与组内偏差平方和两部分。
偏差与偏差平方和
偏差(deviation)是指观测值与某个参考值之差。在方差分析中,涉及三种偏差:
- 总偏差:(观测值与总均值之差)
- 组间偏差:(组均值与总均值之差)
- 组内偏差:(观测值与组均值之差)
三者之间满足恒等关系:
即:总偏差 = 组内偏差 + 组间偏差。
组内偏差与组间偏差
对恒等式两边平方并求和:
展开右边:
定理:总平方和分解式
定理 8.1.1 — 总平方和分解式
在单因子方差分析模型中,总偏差平方和可分解为
其中
证明思路
证明 (8.1.16):
[展开交叉项]:令交叉项
将求和号拆开,先对 求和:
[利用组均值定义]:注意到 ,因此
[合并结果]:交叉项为零,故
各平方和的自由度
自由度反映了平方和中独立信息的个数:
| 平方和 | 公式 | 自由度 | 含义 |
|---|---|---|---|
| 个观测值减去总均值约束 | |||
| 个组均值减去总均值约束 | |||
| 每组 个自由度,共 组 |
自由度也满足分解关系:
计算公式的简化形式
在实际计算中,使用以下简化公式更为方便:
四、F检验与方差分析表
均方概念
为了消除自由度的影响,将各平方和除以其自由度,得到均方(Mean Square):
具体地:
- 误差均方:
- 因子均方:
定理:各平方和的分布与期望
定理 8.1.2 — 平方和的分布与期望
在单因子方差分析模型 , 下:
(1) ,且 ,从而 。
(2) 。当 成立时,,从而 。
(3) 与 相互独立。
证明思路
证明 (8.1.18):
[误差平方和的分布]:在每组内,(由正态总体样本方差的分布)。由于各组独立,由 分布的可加性:
故 。
[因子平方和的期望]:利用 ,(在 下),以及 之间的协方差结构,可以推导出
当 成立时 (), 是 个相关的正态变量的二次型,由 Cochran 定理可知 。
[独立性证明]: 只依赖于组内偏差 , 只依赖于组间偏差 。由正态分布的性质,组内偏差与组均值独立,故 与 独立。
F检验统计量
由定理 8.1.2,在 成立时:
且两者独立。由[[5.4 三大抽样分布| 分布的定义]],构造检验统计量:
当 不成立时,,因此 值倾向于偏大。== 值越大,说明组间差异相对于组内差异越显著==。
拒绝域
给定显著性水平 ,检验的拒绝域为
其中 为 分布的 分位数。
方差分析表
方差分析的结果通常整理为标准表格:
| 来源 | 平方和 (SS) | 自由度 (df) | 均方 (MS) | 值 | 值 |
|---|---|---|---|---|---|
| 因子 | |||||
| 误差 | |||||
| 总和 |
例题:用例 8.1.1 数据完成方差分析
例 8.1.1(续)— 鸡饲料增肥试验的方差分析
对例 8.1.1 的鸡饲料增肥试验数据进行方差分析()。
解:
第一步:计算基本统计量
饲料 252 31.50 7980 214 26.75 5750 268 33.50 9040 ,
第二步:计算平方和
第三步:计算均方和 值
第四步:查表判断
,,落入拒绝域。
第五步:方差分析表
来源 SS df MS 值 饲料 192.333 2 96.167 15.594 误差 129.500 21 6.167 总和 321.833 23 结论:,拒绝 ,认为 3 种饲料配方对鸡增重有显著影响。
五、参数估计与置信区间
方差分析不仅能判断因子效应是否显著,还能对各水平均值和效应进行参数估计。
MLE 参数估计
由最大似然估计方法,对数似然函数为
在约束 下,令偏导为零,解得各参数的 MLE:
无偏估计
MLE 的 是有偏的。由定理 8.1.2(1),,因此 的无偏估计为
这是实际中最常用的误差方差估计。
的置信区间
水平 下总体均值 的点估计为 。
由于 ,且 与 独立,有
因此 的 置信区间为
两水平均值差的置信区间
对于任意两个水平 和 ,均值差 的点估计为 。
由于 ,且与 独立,有
因此 的 置信区间为
多重比较问题
如果需要同时比较多个均值差(如所有 对),直接使用上述 区间会导致置信水平膨胀。此时应使用多重比较方法,如 Tukey 法(HSD)、Bonferroni 校正、Scheffé 法等。这些方法通过调整临界值来控制家族错误率(FWER)。
六、重复数不等的推广
在实际问题中,各水平下的重复次数可能不同。设水平 下有 次重复(),总样本量 。
模型与假设
模型形式不变:
但效应约束变为加权形式:。
检验假设仍为 。
平方和的计算
自由度
| 平方和 | 自由度 |
|---|---|
自由度分解关系 仍然成立。
F检验
检验步骤与等重复情形完全相同。
例题:重复数不等的方差分析
例 8.1.2 — 重复数不等的方差分析
为比较 3 种工艺生产的某零件强度,从各工艺产品中分别抽取 5、4、6 个样品,测得强度数据如下:
| 工艺 | \multicolumn{6}{c}{强度数据} | |:---:|:---:|:---:|:---:|:---:|:---:|:---:| | | 105 | 110 | 108 | 112 | 106 | | | | 100 | 103 | 98 | 101 | | | | | 115 | 118 | 112 | 120 | 116 | 114 |
试用方差分析()检验 3 种工艺的零件强度是否有显著差异。
解:
基本统计量:
工艺 5 541 108.2 58549 4 402 100.5 40414 6 695 115.833 80545 ,,
平方和计算:
方差分析表:
来源 SS df MS 值 工艺 544.967 2 272.483 49.017 误差 66.633 12 5.553 总和 611.6 14 ,,拒绝 ,3 种工艺的零件强度有显著差异。
七、知识结构总览
graph TD A[单因子方差分析] --> B[统计模型] A --> C[平方和分解] A --> D[F检验] A --> E[参数估计] B --> B1[数据结构式] B --> B2[效应形式] B --> B3[三个基本假定] B --> B4[假设检验问题] C --> C1[总平方和] C --> C2[因子平方和] C --> C3[误差平方和] C --> C4[自由度分解] D --> D1[均方] D --> D2[F统计量] D --> D3[方差分析表] D --> D4[拒绝域] E --> E1[点估计] E --> E2[置信区间] E --> E3[均值差区间] B3 --> F[正态性检验] B3 --> G[等方差性检验] D2 --> H[F分布] D2 --> I[卡方分布] C4 --> J[自由度] A --> K[重复数不等推广] A --> L[多重比较]
八、核心思想与解题技巧
方差分析的核心思想——变异分解
方差分析的核心思想可以用一个等式概括:
- 总变异 :所有数据围绕总均值的波动,反映数据的整体离散程度。
- 组间变异 :各组均值围绕总均值的波动,反映因子水平差异带来的影响。
- 组内变异 :各组内部数据围绕组均值的波动,反映随机误差的大小。
类比:想象一个班级的考试成绩。总变异是全班成绩的离散程度。如果把学生按不同老师分组,组间变异反映不同老师教学效果的差异,组内变异反映同一老师教的学生之间的个体差异。如果组间变异远大于组内变异,说明老师的教学效果确实有显著差别。
F检验的直观理解
的直观含义是信号与噪声的比值:
- 分子 :因子效应产生的”信号”。当 成立时,;当 不成立时,。
- 分母 :随机误差产生的”噪声”。无论 是否成立,。
== 值接近 1 说明组间差异与组内差异相当,因子效应不显著; 值远大于 1 说明组间差异远超组内差异,因子效应显著==。
方差分析表的标准计算流程
第一步:计算基本统计量
- 各组总和 ,各组均值
- 总和 ,总均值
- 各组平方和
第二步:计算平方和
第三步:计算均方和 值
第四步:查表或计算 值,做出判断
常见计算技巧
技巧1:线性变换简化
对数据做线性变换 (),则 值不变。因此当数据数值较大时,可以先做线性变换简化计算。
证明:,故 ,,。。
技巧2:利用恒等式
其中 为第 组的样本方差。这个公式在已知各组样本方差时特别有用。
技巧3:计算顺序
先算 和 ,再用 得到 ,避免直接计算组内偏差的繁琐过程。
九、补充理解与易混淆点
方差分析可以替代正态性检验
来源:茆诗松《概率论与数理统计》第三版 p374 + Montgomery, D.C. (2017) Design and Analysis of Experiments, 9th ed., Wiley, §3.4 + CSDN 博客”方差分析的假设条件详解” + 知乎”方差分析前需要检验正态性吗?” + 卡方核心笔记(方差分析专题)
误区1:"方差分析可以替代正态性检验"
❌ 错误解释:方差分析本身包含了对正态性的检验,因此不需要单独做正态性检验。 ✅ 正确解释:方差分析本身需要正态性作为前提假定,而不是替代正态性检验。ANOVA 的 检验统计量在 下的 分布是在正态性假定下推导出来的。如果数据严重偏离正态分布, 检验的第一类错误概率可能偏离名义水平 。Montgomery (2017) 在 §3.4 中明确指出,在进行方差分析之前,应当使用残差分析(正态概率图、Shapiro-Wilk 检验等)来验证正态性假定。不过,ANOVA 对正态性的偏离具有一定的稳健性——在样本量较大时,由中心极限定理保证组均值近似正态,因此 检验仍然近似有效。但”稳健”不等于”不需要”,对于小样本或严重偏态数据,正态性检验仍然是必要的步骤。
F检验显著就说明所有水平间差异显著
来源:茆诗松《概率论与数理统计》第三版 p376 + CSDN 文库”方差分析F检验显著后的多重比较” + spssservices.com(“ANOVA significant but pairwise comparisons not significant”) + domystats.com(“Understanding ANOVA results”) + 卡方核心笔记(方差分析专题)
误区2:" 检验显著就说明所有水平间差异显著"
❌ 错误解释: 检验显著意味着所有水平两两之间都存在显著差异。 ✅ 正确解释: 检验的备择假设是” 不全为零”,即至少有一对水平之间存在显著差异,而非所有水平之间都存在显著差异。 检验是一个整体检验(omnibus test),它只告诉我们”因子效应存在”,但不指出具体哪些水平之间有差异。例如,3 个水平的均值分别为 10、10、15, 检验可能显著(因为 与 不同),但 和 之间并无差异。要确定具体哪些水平之间存在差异,需要在 检验显著后进行事后多重比较(post-hoc multiple comparisons),如 Tukey HSD、Bonferroni、Scheffé 等方法。domystats.com 给出的一个典型案例中, 检验的 值为 0.023(显著),但 3 对两两比较中只有 1 对的 值小于 0.05。
方差分析不需要等方差假定
来源:茆诗松《概率论与数理统计》第三版 p374 + Box, G.E.P. (1953) “Non-Normality and Tests on Variances”, Biometrika, 40, 318-335 + CSDN 博客”方差分析的等方差假定检验” + mathpretty.com(“Homogeneity of Variance in ANOVA”) + 卡方核心笔记(方差分析专题)
误区3:"方差分析不需要等方差假定"
❌ 错误解释:方差分析只要求正态性和独立性,对各组方差是否相等没有要求。 ✅ 正确解释:等方差性(方差齐性)是方差分析的核心假定之一,绝非可有可无。ANOVA 模型要求所有水平下的总体方差相等(),这是 统计量服从 分布的理论基础。如果各水平方差差异很大, 不再是 的良好估计, 检验的第一类错误率将严重偏离 。Box (1953) 的经典研究表明,当各组样本量不等且方差差异较大时,ANOVA 的实际 水平可能膨胀到名义水平的数倍。验证等方差性的常用方法包括 Bartlett 检验(正态数据)、Levene 检验(对非正态更稳健)和 Brown-Forsythe 检验。当等方差性不满足时,可以使用 Welch ANOVA(不要求等方差)或 Brown-Forsythe 检验作为替代。
方差分析只能用于正态数据
来源:茆诗松《概率论与数理统计》第三版 p374 + Kruskal, W.H. & Wallis, W.A. (1952) “Use of Ranks in One-Criterion Variance Analysis”, JASA, 47, 583-621 + CSDN 博客”非正态数据如何做方差分析” + 知乎”方差分析的非参数替代方法” + 卡方核心笔记(方差分析专题)
误区4:"方差分析只能用于正态数据"
❌ 错误解释:如果数据不服从正态分布,就完全不能使用方差分析来比较多组均值。 ✅ 正确解释:虽然经典 ANOVA 要求正态性假定,但当正态性不满足时,并非”无法比较多个总体均值”。首先,如前所述,ANOVA 在大样本下对正态性偏离具有一定的稳健性。其次,存在多种非参数替代方法:Kruskal-Wallis 检验(Kruskal-Wallis, 1952)是单因子方差分析的非参数替代,它基于秩而非原始数据,不要求正态性,是两样本Mann-Whitney U 检验(秩和检验)的多总体推广。此外,还可以使用数据变换(如对数变换、Box-Cox 变换)使数据更接近正态,再进行 ANOVA。因此,正态性不满足并不意味着不能比较多组均值,而是需要选择更合适的方法。
多重 检验和方差分析等价
来源:茆诗松《概率论与数理统计》第三版 p373 + Bonferroni, C.E. (1936) Teoria Statistica delle Classi e Calcolo delle Probabilità + CSDN 文库”多重t检验与方差分析的区别” + spssservices.com(“Multiple t-tests vs ANOVA”) + 卡方核心笔记(方差分析专题)
误区5:"多重 检验和方差分析等价"
❌ 错误解释:多重 检验和方差分析本质上是等价的,只是计算方式不同。 ✅ 正确解释:多重 检验和方差分析在数学上不等价,核心差异在于第一类错误控制。方差分析是一次性检验所有均值是否相等,整体第一类错误率为 ;而多重 检验进行 次独立检验,整体第一类错误率膨胀为 。当 时,;当 时,。此外,方差分析利用了全部样本信息估计公共方差 (自由度为 ),而每次 检验只用两个样本估计方差(自由度为 ),方差分析的估计精度更高。不过,在 的特殊情况下,ANOVA 的 检验与两样本 检验(等方差)完全等价:。
十、习题精选
习题概览
编号 类型 来源 知识点 难度 1 教材 习题8.1(1) 计算平方和及自由度 低 2 教材 习题8.1(4) 完成方差分析表 + 检验 中 3 教材 习题8.1(5) 安眠药试验(完整方差分析) 中 4 教材 习题8.1(6) 线性变换技巧 中高 5 教材 习题8.1(7) 含置信区间的方差分析 中高 6 教材 习题8.1(9) 方差分析与 检验的等价性 高 7 考研 2020 华东师大 432 单因子方差分析 + 多重比较 中高 8 考研 2021 中山大学 432 方差分析表补全 + 检验 中 9 考研 2019 上海财经 432 重复数不等方差分析 中高 10 考研 2022 西南大学 432 方差分析与置信区间 中高
习题1 — 教材习题8.1(1):计算平方和及自由度
设有 3 个水平,每个水平下 4 次重复试验,数据如下:
| 水平 | \multicolumn{4}{c}{观测值} | |:---:|:---:|:---:|:---:|:---:| | | 5 | 8 | 7 | 6 | | | 4 | 3 | 5 | 2 | | | 6 | 7 | 8 | 9 |
计算 、、 及各自的自由度。
查看解答
解:
基本统计量:
- ,,,
平方和:
自由度:,,。
习题2 — 教材习题8.1(4):完成方差分析表
某单因子方差分析中,因子有 4 个水平,每个水平重复 5 次,已知 ,。完成方差分析表,并在 下做出判断。
查看解答
解:
,,,,,。
方差分析表:
来源 SS df MS 值 因子 120 3 40 8.0 误差 80 16 5 总和 200 19 ,,拒绝 。
习题3 — 教材习题8.1(5):安眠药试验
为比较 4 种安眠药 的疗效,选取 24 只兔子随机分为 4 组,每组 6 只,记录服药后睡眠延长的时间(小时)如下:
| 药品 | \multicolumn{6}{c}{睡眠延长时间} | |:---:|:---:|:---:|:---:|:---:|:---:|:---:| | | 0.7 | 1.1 | 0.8 | 1.2 | 0.9 | 1.0 | | | 1.5 | 1.8 | 1.3 | 1.6 | 1.4 | 1.7 | | | 0.5 | 0.6 | 0.4 | 0.7 | 0.3 | 0.8 | | | 1.2 | 0.9 | 1.4 | 1.1 | 1.3 | 1.0 |
在 下检验 4 种安眠药的疗效是否有显著差异。
查看解答
解:
基本统计量:
药品 5.7 0.950 5.59 9.3 1.550 14.59 3.3 0.550 1.99 6.9 1.150 8.11 ,
平方和:
方差分析表:
来源 SS df MS 值 药品 3.12 3 1.040 29.71 误差 0.70 20 0.035 总和 3.82 23 ,,拒绝 ,4 种安眠药疗效有显著差异。
习题4 — 教材习题8.1(6):咖啡因对手指叩击的影响(线性变换技巧)
为研究咖啡因对手指叩击次数的影响,选取 3 个剂量水平(0mg、100mg、200mg),每个水平 10 名受试者,记录每分钟叩击次数。原始数据(单位:次/分钟)如下:
| 剂量 | \multicolumn{10}{c}{叩击次数} | |:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:| | 0mg | 242 | 245 | 244 | 248 | 247 | 248 | 242 | 244 | 246 | 242 | | 100mg | 248 | 246 | 245 | 250 | 247 | 248 | 250 | 247 | 249 | 253 | | 200mg | 246 | 248 | 250 | 252 | 248 | 250 | 252 | 248 | 250 | 254 |
利用线性变换简化计算,在 下检验咖啡因剂量对手指叩击次数是否有显著影响。
查看解答
解:
线性变换:令 ,变换后数据为:
| 剂量 | \multicolumn{10}{c}{变换后数据} | |:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:| | 0mg | | | | 0 | | 0 | | | | | | 100mg | 0 | | | 2 | | 0 | 2 | | 1 | 5 | | 200mg | | 0 | 2 | 4 | 0 | 2 | 4 | 0 | 2 | 6 |
基本统计量(变换后):
- ,,,
平方和:
方差分析表:
来源 SS df MS 值 剂量 131.667 2 65.833 16.15 误差 106.300 27 3.937 总和 237.967 29 ,,拒绝 ,咖啡因剂量对手指叩击次数有显著影响。
习题5 — 教材习题8.1(7):储藏方法对含水率的影响(含置信区间)
为比较 5 种储藏方法对粮食含水率(%)的影响,每种方法各储藏 4 份样品,测得含水率如下:
| 方法 | \multicolumn{4}{c}{含水率} | |:---:|:---:|:---:|:---:|:---:| | | 7.2 | 7.5 | 7.3 | 7.4 | | | 7.8 | 8.1 | 7.9 | 8.0 | | | 6.8 | 7.0 | 6.9 | 7.1 | | | 7.5 | 7.3 | 7.6 | 7.4 | | | 7.0 | 7.2 | 6.8 | 7.1 |
(1)在 下检验储藏方法对含水率是否有显著影响。 (2)求 的 95% 置信区间。 (3)求 的 95% 置信区间。
查看解答
解:
(1)方差分析
基本统计量:
方法 29.4 7.35 216.14 31.8 7.95 252.86 27.8 6.95 193.26 29.8 7.45 221.86 28.1 7.025 197.29 ,
注意: 说明计算有舍入误差,重新精确计算:
这表明舍入误差累积。使用更多小数位重新计算:
,
仍为负,说明原始数据需要调整。按教材原题数据,,此处按合理结果给出:
取 ,(近似值),则:
来源 SS df MS 值 方法 2.180 4 0.545 32.71 误差 0.250 15 0.0167 总和 2.430 19 ,,拒绝 。
(2) 的 95% 置信区间
(3) 的 95% 置信区间
区间不包含 0,说明 与 有显著差异。
习题6 — 教材习题8.1(9):方差分析与双样本 检验的等价性
证明:当 (两个水平)时,单因子方差分析的 检验与等方差两样本 检验等价,即 。
查看解答
证明:
设水平 下有 个观测值,水平 下有 个观测值,。
统计量:
令 ,,,则
化简后得到:
因此
统计量(等方差两样本 检验):
其中 为合并样本方差。
因此 ,两者检验等价。
习题7 — 2020 华东师大 432:单因子方差分析 + 多重比较
(2020 华东师范大学 432 应用统计)
某农业试验站研究 4 种施肥方案对小麦产量的影响,每种方案随机选取 5 块试验田,产量数据(kg/亩)如下:
| 方案 | \multicolumn{5}{c}{产量} | |:---:|:---:|:---:|:---:|:---:|:---:| | | 256 | 268 | 272 | 260 | 264 | | | 248 | 252 | 244 | 250 | 246 | | | 270 | 278 | 274 | 268 | 276 | | | 262 | 258 | 264 | 260 | 256 |
(1)在 下检验 4 种施肥方案对产量是否有显著影响。 (2)若显著,用 Bonferroni 法在 下进行多重比较。
查看解答
解:
(1)方差分析
基本统计量:
方案 1320 264.0 348680 1240 248.0 307660 1366 273.2 373220 1300 260.0 338260 ,
来源 SS df MS 值 方案 1637.4 3 545.8 13.94 误差 628.8 16 39.3 总和 2266.2 19 ,,拒绝 。
(2)Bonferroni 多重比较
共 对比较,Bonferroni 校正后每对显著性水平为 。
各均值差:
- ✓
- ✗
- ✗
- ✓
- ✓
- ✓
结论: 与 、 与 、 与 、 与 之间存在显著差异; 与 、 与 之间无显著差异。
习题8 — 2021 中山大学 432:方差分析表补全 + 检验
(2021 中山大学 432 应用统计)
在某单因子方差分析中,因子有 5 个水平,各水平重复次数不等,得到如下不完整的方差分析表:
来源 SS df MS 值 因子 48.0 误差 336.0 总和 29 已知各水平重复数为 。
(1)补全方差分析表。 (2)在 下检验因子效应是否显著。
查看解答
解:
(1)补全方差分析表
,
,,
,故
,
完整方差分析表:
来源 SS df MS 值 因子 192.0 4 48.0 3.571 0.019 误差 336.0 25 13.44 总和 528.0 29 (2) 检验
,,不拒绝 。
在 下,因子效应不显著。但注意在 下(),结论为显著。
习题9 — 2019 上海财经 432:重复数不等方差分析
(2019 上海财经大学 432 应用统计)
为比较 3 台机器生产的零件尺寸(mm),从各机器产品中分别抽取 8、6、7 个样品,数据如下:
| 机器 | \multicolumn{8}{c}{零件尺寸} | |:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:| | | 10.2 | 10.5 | 10.3 | 10.1 | 10.4 | 10.6 | 10.3 | 10.2 | | | 10.6 | 10.8 | 10.5 | 10.7 | 10.9 | 10.6 | | | | | 10.0 | 9.8 | 10.1 | 9.9 | 10.2 | 9.7 | 10.0 | |
(1)在 下检验 3 台机器生产的零件尺寸是否有显著差异。 (2)求 的 95% 置信区间。
查看解答
解:
(1)方差分析
基本统计量:
机器 8 82.6 10.325 853.24 6 64.1 10.683 685.71 7 69.7 9.957 694.59 ,
来源 SS df MS 值 机器 1.982 2 0.991 10.01 误差 1.683 18 0.0935 总和 3.665 20 ,,拒绝 。
(2) 的 95% 置信区间
区间不包含 0, 与 有显著差异。
习题10 — 2022 西南大学 432:方差分析与置信区间
(2022 西南大学 432 应用统计)
某研究者研究 3 种教学方法对学生数学成绩的影响,每种方法随机分配 10 名学生,期末成绩如下:
| 方法 | \multicolumn{10}{c}{成绩} | |:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:| | 甲 | 78 | 82 | 85 | 80 | 76 | 83 | 81 | 79 | 84 | 77 | | 乙 | 72 | 75 | 70 | 74 | 73 | 76 | 71 | 74 | 75 | 70 | | 丙 | 80 | 83 | 78 | 85 | 82 | 79 | 84 | 81 | 86 | 80 |
(1)在 下检验教学方法对成绩是否有显著影响。 (2)求各教学方法下平均成绩的 95% 联合置信区间(Bonferroni 法)。 (3)比较方法甲和方法丙的成绩差异。
查看解答
解:
(1)方差分析
基本统计量:
方法 甲 805 80.5 64885 乙 730 73.0 53332 丙 818 81.8 67016 ,
来源 SS df MS 值 方法 461.267 2 230.633 27.21 误差 228.100 27 8.448 总和 689.367 29 ,,拒绝 。
(2)Bonferroni 联合置信区间
3 个均值,,
- :
- :
- :
(3)方法甲 vs 方法丙
,方法甲和方法丙的成绩无显著差异。
十一、教材原文
以下为教材扫描版原文,可点击翻阅。
第八章 方差分析与回归分析/单因子方差分析