5.4 三大抽样分布

本节概览

本节系统介绍数理统计中最重要的三大抽样分布：卡方分布、t 分布和 F 分布。它们都由标准正态分布衍生而来，是正态总体下统计推断的理论基石。

逻辑链条：卡方分布 → Fisher引理 → F分布 → t分布 → 推论

前置依赖：§5.3（统计量、样本均值方差）、§2.5（Gamma分布、Beta分布）、§3.3（变量变换法）

核心主线：三大分布均由正态分布”组装”而成——卡方分布是标准正态变量的平方和，F 分布是两个独立卡方变量之比，t 分布是标准正态变量与卡方变量之商。Fisher 引理是连接正态总体与三大分布的核心桥梁，它保证了样本均值与样本方差的独立性，并将样本方差的分布归结为卡方分布。

一、卡方分布

卡方分布（ $χ^{2}$ 分布）是三大抽样分布中最基本的，它是标准正态变量平方和的分布。

定义

定义 5.4.1 — 卡方分布

设 $X_{1}, X_{2}, \dots, X_{n}$ 为 $n$ 个相互独立的标准正态随机变量，即 $X_{i} \sim N (0, 1)$ ， $i = 1, 2, \dots, n$ ，则称
$χ^{2} = i = 1 \sum n X_{i}^{2}$
服从自由度为 $n$ 的卡方分布（chi-squared distribution），记为 $χ^{2} \sim χ^{2} (n)$ 。

自由度的含义：自由度 $n$ 表示独立标准正态变量的个数，即平方和中包含的独立信息量。这个概念在后续 Fisher 引理中会反复出现。

密度函数

卡方分布的密度函数

若 $χ^{2} \sim χ^{2} (n)$ ，则其密度函数为
$p (y) = \frac{( \frac{1}{2} ) ^{n /2}}{Γ ( \frac{n}{2} )} \cdot y^{n /2 - 1} \cdot e^{- y /2}, y > 0$

与 Gamma 分布的关系

卡方分布本质上是 Gamma 分布的特例：

χ^{2} (n) = G a (\frac{n}{2}, \frac{1}{2})

即自由度为 $n$ 的卡方分布等价于形状参数为 $n /2$ 、尺度参数为 $1/2$ 的 Gamma 分布。

密度函数的推导

推导： $χ^{2} (n)$ 的密度函数

第一步：单个标准正态变量平方的分布

设 $X \sim N (0, 1)$ ，求 $Y = X^{2}$ 的密度函数。

当 $y > 0$ 时，由变量变换法：
$p_{Y} (y) = p_{X} (y) \cdot \frac{d}{d y} y + p_{X} (- y) \cdot \frac{d}{d y} (- y)$ $= \frac{1}{2 π} e^{- y /2} \cdot \frac{1}{2 y} + \frac{1}{2 π} e^{- y /2} \cdot \frac{1}{2 y}$ $= \frac{1}{2 π} \cdot y^{- 1/2} \cdot e^{- y /2}$
这正是 $G a (\frac{1}{2}, \frac{1}{2})$ 的密度函数。因此 $X^{2} \sim G a (\frac{1}{2}, \frac{1}{2})$ 。

第二步：Gamma 分布的可加性

由 §2.5 中 Gamma 分布的可加性：若 $U \sim G a (α_{1}, λ)$ ， $V \sim G a (α_{2}, λ)$ ，且 $U$ 与 $V$ 独立，则
$U + V \sim G a (α_{1} + α_{2}, λ)$
注意可加性要求尺度参数相同。

第三步：推广到 $n$ 个变量

由于 $X_{1}^{2}, X_{2}^{2}, \dots, X_{n}^{2}$ 相互独立，且每个 $X_{i}^{2} \sim G a (\frac{1}{2}, \frac{1}{2})$ ，反复应用可加性得
$χ^{2} = i = 1 \sum n X_{i}^{2} \sim G a (\frac{n}{2}, \frac{1}{2})$
写出 $G a (\frac{n}{2}, \frac{1}{2})$ 的密度函数即为卡方分布的密度函数。 $□$

数字特征

卡方分布的数字特征

若 $χ^{2} \sim χ^{2} (n)$ ，则
$E (χ^{2}) = n, Var (χ^{2}) = 2 n$

推导：由 $χ^{2} (n) = G a (n /2, 1/2)$ ，利用 Gamma 分布 $G a (α, λ)$ 的期望 $E = α / λ$ 和方差 $Var = α / λ^{2}$ ：

E (χ^{2}) = \frac{n /2}{1/2} = n Var (χ^{2}) = \frac{n /2}{( 1/2 ) ^{2}} = 2 n

可加性

卡方分布的可加性

设 $X \sim χ^{2} (m)$ ， $Y \sim χ^{2} (n)$ ，且 $X$ 与 $Y$ 相互独立，则
$X + Y \sim χ^{2} (m + n)$

证明：由 $X \sim G a (m /2, 1/2)$ ， $Y \sim G a (n /2, 1/2)$ ，尺度参数相同，直接应用 Gamma 分布可加性即得。 $□$

更一般地，若 $X_{1}, \dots, X_{k}$ 相互独立， $X_{i} \sim χ^{2} (n_{i})$ ，则 $\sum_{i = 1}^{k} X_{i} \sim χ^{2} (\sum_{i = 1}^{k} n_{i})$ 。

例题

例 5.4.1 — 正态总体中偏差平方和的分布

设 $X_{1}, X_{2}, \dots, X_{n} \sim i.i.d. N (μ, σ^{2})$ ，求 $T = \sum_{i = 1}^{n} (X_{i} - μ)^{2}$ 的分布。

解：令 $Z_{i} = \frac{X _{i} - μ}{σ}$ ，则 $Z_{i} \sim N (0, 1)$ 且相互独立。

因此
$\frac{T}{σ ^{2}} = i = 1 \sum n (\frac{X _{i} - μ}{σ})^{2} = i = 1 \sum n Z_{i}^{2} \sim χ^{2} (n)$
即 $T / σ^{2} \sim χ^{2} (n)$ ，等价于 $T \sim G a (\frac{n}{2}, \frac{1}{2 σ ^{2}})$ 。

注意：这里用的是 $X_{i} - μ$ （总体均值），而非 $X_{i} - \overset{ˉ}{X}$ （样本均值）。后者涉及一个约束 $\sum (X_{i} - \overset{ˉ}{X}) = 0$ ，自由度会减少 1，这正是 Fisher 引理的核心内容。

二、Fisher引理（正态总体抽样定理）

Fisher 引理是正态总体统计推断的基石，它揭示了样本均值与样本方差的独立性，并给出了样本方差服从卡方分布的结论。

预备知识：多维正态变换

多维正态分布的线性变换性质

若 $X = (X_{1}, \dots, X_{n})^{⊤} \sim N (μ, Σ)$ ， $A$ 为 $m \times n$ 常数矩阵（ $rank (A) = m$ ），则
$Y = A X \sim N (A μ, A Σ A^{⊤})$
特别地，当 $A$ 为 $n \times n$ 正交矩阵（ $A A^{⊤} = I_{n}$ ）时，变换后的各分量仍相互独立。

Fisher 引理

定理 5.4.1 — Fisher 引理（正态总体抽样定理）

设 $X_{1}, X_{2}, \dots, X_{n} \sim i.i.d. N (μ, σ^{2})$ ， $\overset{ˉ}{X} = \frac{1}{n} \sum_{i = 1}^{n} X_{i}$ 为样本均值， $S^{2} = \frac{1}{n - 1} \sum_{i = 1}^{n} (X_{i} - \overset{ˉ}{X})^{2}$ 为样本方差，则：

$\overset{ˉ}{X}$ 与 $S^{2}$ 相互独立；

$\overset{ˉ}{X} \sim N (μ, \frac{σ ^{2}}{n})$ ；

$\frac{( n - 1 ) S ^{2}}{σ ^{2}} \sim χ^{2} (n - 1)$ 。

完整证明（正交变换法）

证明：Fisher 引理

第一步：构造正交矩阵

构造 $n \times n$ 正交矩阵 $A$ ，使其第一行为
$a_{1} = (\frac{1}{n}, \frac{1}{n}, \dots, \frac{1}{n})$
其余 $n - 1$ 行 $a_{2}, \dots, a_{n}$ 可通过 Schmidt 正交化得到，满足
$a_{i} \cdot a_{j} = δ_{ij}, j = 1 \sum n a_{ij} = 0 (i = 2, 3, \dots, n)$
即 $A A^{⊤} = I_{n}$ 。

第二步：作正交变换

令 $Y = A X$ ，其中 $X = (X_{1}, \dots, X_{n})^{⊤}$ 。则
$Y_{1} = j = 1 \sum n a_{1 j} X_{j} = \frac{1}{n} j = 1 \sum n X_{j} = n \overset{ˉ}{X}$
由于 $X \sim N (μ 1_{n}, σ^{2} I_{n})$ ，由正态变换性质：
$Y = A X \sim N (A (μ 1_{n}), A (σ^{2} I_{n}) A^{⊤}) = N (μ A 1_{n}, σ^{2} I_{n})$
因此 $Y_{1}, Y_{2}, \dots, Y_{n}$ 相互独立，且 $Y_{i} \sim N (E (Y_{i}), σ^{2})$ 。

第三步：利用正交变换保范数

正交变换保持向量的 Euclidean 范数不变：
$i = 1 \sum n X_{i}^{2} = X^{⊤} X = X^{⊤} A^{⊤} A X = Y^{⊤} Y = i = 1 \sum n Y_{i}^{2}$
第四步：分析各分量的分布

$Y_{1} = n \overset{ˉ}{X} \sim N (n μ, σ^{2})$

对 $i \geq 2$ ： $E (Y_{i}) = \sum_{j = 1}^{n} a_{ij} \cdot μ = μ \sum_{j = 1}^{n} a_{ij} = 0$ （因为第 $2$ 到 $n$ 行元素之和为零）

因此 $Y_{2}, \dots, Y_{n} \sim i.i.d. N (0, σ^{2})$

第五步：推导样本方差的分布

由保范数：
$i = 1 \sum n X_{i}^{2} = Y_{1}^{2} + i = 2 \sum n Y_{i}^{2} = n \overset{ˉ}{X}^{2} + i = 2 \sum n Y_{i}^{2}$
另一方面：
$i = 1 \sum n (X_{i} - \overset{ˉ}{X})^{2} = i = 1 \sum n X_{i}^{2} - n \overset{ˉ}{X}^{2}$
因此：
$(n - 1) S^{2} = i = 1 \sum n (X_{i} - \overset{ˉ}{X})^{2} = i = 2 \sum n Y_{i}^{2}$
由于 $Y_{1} = n \overset{ˉ}{X}$ 只依赖于 $\overset{ˉ}{X}$ ，而 $(n - 1) S^{2} = \sum_{i = 2}^{n} Y_{i}^{2}$ 只依赖于 $Y_{2}, \dots, Y_{n}$ ，且 $Y_{1}$ 与 $Y_{2}, \dots, Y_{n}$ 相互独立，故 $\overset{ˉ}{X}$ 与 $S^{2}$ 相互独立。

又因为 $Y_{i} / σ \sim N (0, 1)$ （ $i = 2, \dots, n$ ），所以
$\frac{( n - 1 ) S ^{2}}{σ ^{2}} = i = 2 \sum n (\frac{Y _{i}}{σ})^{2} \sim χ^{2} (n - 1)$
自由度为 $n - 1$ 而非 $n$ ，因为只有 $n - 1$ 个独立的标准正态变量参与求和。 $□$

直观理解：为什么自由度是 $n - 1$ ？

$n$ 个偏差 $(X_{1} - \overset{ˉ}{X}), \dots, (X_{n} - \overset{ˉ}{X})$ 并非完全独立——它们满足约束
$i = 1 \sum n (X_{i} - \overset{ˉ}{X}) = 0$
知道其中 $n - 1$ 个偏差后，第 $n$ 个就被唯一确定了。因此”真正的”独立信息只有 $n - 1$ 份，自由度为 $n - 1$ 。

类比：想象一根绳子上拴了 $n$ 个珠子，要求珠子的平均位置固定（绳子的重心不动）。你可以自由移动 $n - 1$ 个珠子，但第 $n$ 个珠子的位置自动被确定了。

三、F分布

F 分布由两个独立的卡方变量之比构造而成，广泛用于方差分析（ANOVA）和方差齐性检验。

定义

定义 5.4.2 — F 分布

设 $X_{1} \sim χ^{2} (m)$ ， $X_{2} \sim χ^{2} (n)$ ，且 $X_{1}$ 与 $X_{2}$ 相互独立，则称
$F = \frac{X _{1} / m}{X _{2} / n}$
服从第一自由度为 $m$ 、第二自由度为 $n$ 的 F 分布（F-distribution），记为 $F \sim F (m, n)$ 。

自由度的含义： $m$ 是分子自由度（来自分子上的卡方变量）， $n$ 是分母自由度（来自分母上的卡方变量）。两个自由度的顺序不可互换。

密度函数的推导

推导：F 分布的密度函数

第一步：求 $Z = X_{1} / X_{2}$ 的密度（商的分布公式）

设 $X_{1} \sim G a (m /2, 1/2)$ ， $X_{2} \sim G a (n /2, 1/2)$ ，二者独立。由商的分布公式：
$p_{Z} (z) = \int_{0}^{+ \infty} x_{2} \cdot p_{X_{1}} (z x_{2}) \cdot p_{X_{2}} (x_{2}) d x_{2}$
代入 Gamma 密度：
$p_{Z} (z) = \int_{0}^{+ \infty} x_{2} \cdot \frac{( 1/2 ) ^{m /2}}{Γ ( m /2 )} (z x_{2})^{m /2 - 1} e^{- z x_{2} /2} \cdot \frac{( 1/2 ) ^{n /2}}{Γ ( n /2 )} x_{2}^{n /2 - 1} e^{- x_{2} /2} d x_{2}$ $= \frac{( 1/2 ) ^{(m + n) /2} z ^{m /2 - 1}}{Γ ( m /2 ) Γ ( n /2 )} \int_{0}^{+ \infty} x_{2}^{(m + n) /2 - 1} e^{- (z + 1) x_{2} /2} d x_{2}$
令 $t = (z + 1) x_{2} /2$ ，积分变为
$\int_{0}^{+ \infty} (\frac{2 t}{z + 1})^{(m + n) /2 - 1} e^{- t} \cdot \frac{2}{z + 1} d t = (\frac{2}{z + 1})^{(m + n) /2} Γ (\frac{m + n}{2})$
因此
$p_{Z} (z) = \frac{Γ ( \frac{m + n}{2} )}{Γ ( \frac{m}{2} ) Γ ( \frac{n}{2} )} \cdot \frac{z ^{m /2 - 1}}{( 1 + z ) ^{(m + n) /2}}, z > 0$
第二步：由 $F = (n / m) Z$ 作变量变换

令 $F = \frac{n}{m} Z$ ，即 $Z = \frac{m}{n} F$ ，则 $\frac{d z}{df} = \frac{m}{n}$ 。
$f_{F} (y) = p_{Z} (\frac{m}{n} y) \cdot \frac{m}{n}$
第三步：化简得标准 F 密度函数

将 $z = m y / n$ 代入 $p_{Z} (z)$ 并乘以 $m / n$ ：
$f_{F} (y) = \frac{Γ ( \frac{m + n}{2} )}{Γ ( \frac{m}{2} ) Γ ( \frac{n}{2} )} \cdot (\frac{m}{n})^{m /2} \cdot \frac{y ^{m /2 - 1}}{( 1 + \frac{m}{n} y ) ^{(m + n) /2}}, y > 0$
这就是 $F (m, n)$ 的标准密度函数。 $□$

数字特征

F 分布的数字特征

若 $F \sim F (m, n)$ ，则

当 $n > 2$ 时， $E (F) = \frac{n}{n - 2}$

当 $n > 4$ 时， $Var (F) = \frac{2 n ^{2} ( m + n - 2 )}{m ( n - 2 ) ^{2} ( n - 4 )}$

注意： $E (F)$ 只依赖于分母自由度 $n$ ，与分子自由度 $m$ 无关（在 $n > 2$ 时）。当 $n \leq 2$ 时，期望不存在；当 $n \leq 4$ 时，方差不存在。

分位数性质

F 分布分位数的倒数关系

$F_{1 - α} (m, n) = \frac{1}{F _{α} ( n , m )}$

证明：设 $F \sim F (m, n)$ ，则 $1/ F \sim F (n, m)$ 。

P (F \leq F_{1 - α} (m, n)) = 1 - α P (\frac{1}{F} \geq \frac{1}{F _{1 - α} ( m , n )}) = 1 - α P (\frac{1}{F} \leq \frac{1}{F _{1 - α} ( m , n )}) = α

而 $1/ F \sim F (n, m)$ ，所以

\frac{1}{F _{1 - α} ( m , n )} = F_{α} (n, m)

即 $F_{1 - α} (m, n) = 1/ F_{α} (n, m)$ 。 $□$

查表技巧

F 分布表通常只给出 $α = 0.05, 0.01$ 等小概率的上侧分位数 $F_{α} (m, n)$ 。若需要 $F_{0.95} (m, n)$ ，可利用倒数关系：
$F_{0.95} (m, n) = \frac{1}{F _{0.05} ( n , m )}$

例题

例 5.4.2 — F 分布分位数计算

求 $F_{0.05} (10, 5)$ 。

解：利用倒数关系：
$F_{0.05} (10, 5) = \frac{1}{F _{0.95} ( 5 , 10 )}$
查 F 分布表得 $F_{0.95} (5, 10) = 3.33$ ，因此
$F_{0.05} (10, 5) = \frac{1}{3.33} \approx 0.3$

四、t分布

t 分布（Student’s t 分布）由标准正态变量与卡方变量的商构造而成，是小样本推断的核心工具。

定义

定义 5.4.3 — t 分布

设 $X_{1} \sim N (0, 1)$ ， $X_{2} \sim χ^{2} (n)$ ，且 $X_{1}$ 与 $X_{2}$ 相互独立，则称
$t = \frac{X _{1}}{X _{2} / n}$
服从自由度为 $n$ 的 t 分布（t-distribution），记为 $t \sim t (n)$ 。

密度函数的推导（从 F 分布出发）

推导：t 分布的密度函数

第一步：建立 $t^{2}$ 与 F 分布的关系

注意到
$t^{2} = \frac{X _{1}^{2}}{X _{2} / n}$
其中 $X_{1}^{2} \sim χ^{2} (1)$ （因为 $X_{1} \sim N (0, 1)$ ）， $X_{2} \sim χ^{2} (n)$ ，且二者独立。由 F 分布的定义：
$t^{2} = \frac{X _{1}^{2} /1}{X _{2} / n} \sim F (1, n)$
第二步：利用分布函数建立关系

设 $f_{F} (y)$ 为 $F (1, n)$ 的密度函数。由于 $t$ 分布关于原点对称：
$P (0 < t < y) = \frac{1}{2} P (t^{2} < y^{2}) = \frac{1}{2} P (F < y^{2})$
第三步：对 $y$ 求导得密度函数

对上式两端关于 $y$ 求导：
$f_{t} (y) = \frac{1}{2} \cdot f_{F} (y^{2}) \cdot 2 y = y \cdot f_{F} (y^{2}), y > 0$
由对称性， $f_{t} (- y) = f_{t} (y)$ 。将 $F (1, n)$ 的密度函数代入并化简：
$f_{t} (y) = \frac{Γ ( \frac{n + 1}{2} )}{nπ Γ ( \frac{n}{2} )} \cdot (1 + \frac{y ^{2}}{n})^{- (n + 1) /2}, - \infty < y < + \infty$
$□$

数字特征

t 分布的数字特征

若 $t \sim t (n)$ ，则

当 $n > 1$ 时， $E (t) = 0$

当 $n > 2$ 时， $Var (t) = \frac{n}{n - 2}$

当 $n = 1$ 时，期望不存在（ $t (1)$ 即 Cauchy 分布）

与标准正态分布的对比

t 分布的密度曲线关于 $y = 0$ 对称，形状类似于标准正态分布，但尾部更厚（heavy-tailed）。自由度 $n$ 越大，t 分布越接近 $N (0, 1)$ 。

| 自由度 $n$ | $P (∣ t ∣ > 1)$ | $P (∣ t ∣ > 2)$ | $P (∣ t ∣ > 3)$ | |:----------:|:------------:|:------------:|:------------:| | $N (0, 1)$ | 0.3173 | 0.0455 | 0.0027 | | $t (1)$ | 0.5000 | 0.1476 | 0.0955 | | $t (4)$ | 0.3583 | 0.1161 | 0.0199 | | $t (10)$ | 0.3404 | 0.0757 | 0.0067 | | $t (30)$ | 0.3253 | 0.0555 | 0.0037 |

关键观察

自由度越小，尾部概率越大，极端值出现的可能性越高

当 $n = 4$ 时， $P (∣ t ∣ > 2) = 0.1161$ ，是 $N (0, 1)$ 下 $0.0455$ 的约 2.5 倍

当 $n \geq 30$ 时，t 分布与 $N (0, 1)$ 的差异已经很小

t 分布的渐近性质

t 分布的收敛性

当自由度 $n \to + \infty$ 时， $t (n)$ 的分布收敛于标准正态分布 $N (0, 1)$ 。
$t (n) d N (0, 1), n \to + \infty$

直观理解：当 $n \to \infty$ 时， $X_{2} / n \to E (X_{2} / n) = n / n = 1$ （由大数定律），因此

t = \frac{X _{1}}{X _{2} / n} \approx \frac{X _{1}}{1} = X_{1} \sim N (0, 1)

t(1) = Cauchy 分布

当 $n = 1$ 时，t 分布退化为 Cauchy 分布：

f_{t} (y) = \frac{1}{π ( 1 + y ^{2} )}, - \infty < y < + \infty

Cauchy 分布的期望和方差都不存在（因为积分 $\int_{- \infty}^{+ \infty} ∣ y ∣ f (y) d y$ 发散），这是 t 分布的一个极端情形。

历史背景：Gosset 与 Student

Gosset 与"Student"的故事

t 分布由英国统计学家 William Sealy Gosset（1876—1937）在 1908 年提出。Gosset 在 Guinness 啤酒厂担任化学师，在工作中遇到了小样本（ $n < 30$ ）下的质量控制问题。

当时统计学界普遍使用大样本理论（基于中心极限定理），但啤酒厂的样本量往往很小。Gosset 发现用 $N (0, 1)$ 近似小样本下的检验统计量会导致严重的误差，于是他推导出了 t 分布的精确形式。

由于 Guinness 公司禁止员工公开发表研究成果，Gosset 以 “Student” 为笔名在 Biometrika 上发表了这篇论文。直到 Gosset 去世后，R. A. Fisher 才正式确认了”Student”的真实身份。

因此 t 分布又称 Student’s t 分布。

五、正态总体抽样定理推论

基于 Fisher 引理和三大分布的定义，可以推导出正态总体下各种常用统计量的精确分布。

推论 5.4.1：两正态总体的 F 统计量

推论 5.4.1 — 两正态总体的 F 统计量

设 $X_{1}, \dots, X_{m} \sim i.i.d. N (μ_{1}, σ_{1}^{2})$ ， $Y_{1}, \dots, Y_{n} \sim i.i.d. N (μ_{2}, σ_{2}^{2})$ ，两组样本相互独立。记 $S_{X}^{2}$ 、 $S_{Y}^{2}$ 分别为两组样本的样本方差，则
$F = \frac{S _{X}^{2} / σ _{1}^{2}}{S _{Y}^{2} / σ _{2}^{2}} \sim F (m - 1, n - 1)$
特别地，当 $σ_{1}^{2} = σ_{2}^{2}$ 时，
$F = \frac{S _{X}^{2}}{S _{Y}^{2}} \sim F (m - 1, n - 1)$

证明：推论 5.4.1

第一步：应用 Fisher 引理

由 Fisher 引理：
$\frac{( m - 1 ) S _{X}^{2}}{σ _{1}^{2}} \sim χ^{2} (m - 1), \frac{( n - 1 ) S _{Y}^{2}}{σ _{2}^{2}} \sim χ^{2} (n - 1)$
且由于两组样本独立，这两个卡方变量也相互独立。

第二步：由 F 分布的定义
$F = \frac{S _{X}^{2} / σ _{1}^{2}}{S _{Y}^{2} / σ _{2}^{2}} = \frac{( m - 1 ) S _{X}^{2} / σ _{1}^{2} / ( m - 1 )}{( n - 1 ) S _{Y}^{2} / σ _{2}^{2} / ( n - 1 )} = \frac{χ ^{2} ( m - 1 ) / ( m - 1 )}{χ ^{2} ( n - 1 ) / ( n - 1 )} \sim F (m - 1, n - 1)$
$□$

推论 5.4.2：单正态总体的 t 统计量

推论 5.4.2 — 单正态总体的 t 统计量

设 $X_{1}, \dots, X_{n} \sim i.i.d. N (μ, σ^{2})$ ，则
$t = \frac{n ( X ˉ - μ )}{S} \sim t (n - 1)$

证明：推论 5.4.2

第一步：分子标准化

由 Fisher 引理， $\overset{ˉ}{X} \sim N (μ, σ^{2} / n)$ ，因此
$\frac{X ˉ - μ}{σ / n} = \frac{n ( X ˉ - μ )}{σ} \sim N (0, 1)$
第二步：分母的卡方分布

由 Fisher 引理， $\frac{( n - 1 ) S ^{2}}{σ ^{2}} \sim χ^{2} (n - 1)$ ，因此
$\frac{S}{σ} = \frac{( n - 1 ) S ^{2} / σ ^{2}}{n - 1} = \frac{χ ^{2} ( n - 1 )}{n - 1}$
第三步：由 t 分布的定义

由 Fisher 引理， $\overset{ˉ}{X}$ 与 $S^{2}$ 相互独立，因此分子与分母独立。
$t = \frac{n ( X ˉ - μ ) / σ}{S / σ} = \frac{N ( 0 , 1 )}{χ ^{2} ( n - 1 ) / ( n - 1 )} \sim t (n - 1)$
$□$

推论 5.4.2 的意义

当 $σ^{2}$ 未知时，用 $S$ 代替 $σ$ 后，统计量的分布从 $N (0, 1)$ 变为 $t (n - 1)$ 。这就是为什么在 $σ$ 未知时，要用 t 检验而非 Z 检验。

推论 5.4.3：两正态总体的 t 统计量（等方差）

推论 5.4.3 — 两正态总体的 t 统计量（等方差）

设 $X_{1}, \dots, X_{m} \sim i.i.d. N (μ_{1}, σ^{2})$ ， $Y_{1}, \dots, Y_{n} \sim i.i.d. N (μ_{2}, σ^{2})$ ，两组样本相互独立。定义合并样本方差：
$S_{w}^{2} = \frac{( m - 1 ) S _{X}^{2} + ( n - 1 ) S _{Y}^{2}}{m + n - 2}$
则
$t = \frac{( X ˉ - Y ˉ ) - ( μ _{1} - μ _{2} )}{S _{w} \frac{1}{m} + \frac{1}{n}} \sim t (m + n - 2)$

证明：推论 5.4.3

第一步：分子的分布

$\overset{ˉ}{X} \sim N (μ_{1}, σ^{2} / m)$ ， $\overset{ˉ}{Y} \sim N (μ_{2}, σ^{2} / n)$ ，二者独立，因此
$\overset{ˉ}{X} - \overset{ˉ}{Y} \sim N (μ_{1} - μ_{2}, σ^{2} (\frac{1}{m} + \frac{1}{n}))$
标准化得
$U = \frac{( X ˉ - Y ˉ ) - ( μ _{1} - μ _{2} )}{σ 1/ m + 1/ n} \sim N (0, 1)$
第二步：分母的卡方分布

由 Fisher 引理：
$\frac{( m - 1 ) S _{X}^{2}}{σ ^{2}} \sim χ^{2} (m - 1), \frac{( n - 1 ) S _{Y}^{2}}{σ ^{2}} \sim χ^{2} (n - 1)$
二者独立，由卡方分布的可加性：
$V = \frac{( m + n - 2 ) S _{w}^{2}}{σ ^{2}} = \frac{( m - 1 ) S _{X}^{2} + ( n - 1 ) S _{Y}^{2}}{σ ^{2}} \sim χ^{2} (m + n - 2)$
第三步：独立性

$S_{X}^{2}$ 与 $\overset{ˉ}{X}$ 独立（Fisher 引理）， $S_{Y}^{2}$ 与 $\overset{ˉ}{Y}$ 独立（Fisher 引理），且两组样本独立，因此 $U$ 与 $V$ 相互独立。

第四步：由 t 分布的定义
$t = \frac{U}{V / ( m + n - 2 )} = \frac{( X ˉ - Y ˉ ) - ( μ _{1} - μ _{2} )}{S _{w} 1/ m + 1/ n} \sim t (m + n - 2)$
$□$

六、三大分布关系总览

关系表

关系	说明
$χ^{2} (n) = G a (n /2, 1/2)$	卡方分布是 Gamma 分布的特例
$F (m, n) = \frac{χ ^{2} ( m ) / m}{χ ^{2} ( n ) / n}$	F 分布由两个独立卡方变量之比构造
$t (n) = \frac{N ( 0 , 1 )}{χ ^{2} ( n ) / n}$	t 分布由标准正态与卡方变量之商构造
$t^{2} (n) \sim F (1, n)$	t 分布的平方服从 F 分布
$t (n) d N (0, 1)$	t 分布随自由度增大收敛于标准正态

核心公式汇总表

分布	定义	密度函数	期望	方差	分位数性质
$χ^{2} (n)$	$\sum_{i = 1}^{n} Z_{i}^{2}$ ， $Z_{i} \sim iid N (0, 1)$	$\frac{( 1/2 ) ^{n /2}}{Γ ( n /2 )} y^{n /2 - 1} e^{- y /2}$	$n$	$2 n$	可加性
$F (m, n)$	$\frac{χ ^{2} ( m ) / m}{χ ^{2} ( n ) / n}$	$\frac{Γ ( \frac{m + n}{2} )}{Γ ( m /2 ) Γ ( n /2 )} (\frac{m}{n})^{m /2} \frac{y ^{m /2 - 1}}{( 1 + m y / n ) ^{(m + n) /2}}$	$\frac{n}{n - 2}$ $(n > 2)$	$\frac{2 n ^{2} ( m + n - 2 )}{m ( n - 2 ) ^{2} ( n - 4 )}$ $(n > 4)$	$F_{1 - α} (m, n) = 1/ F_{α} (n, m)$
$t (n)$	$\frac{N ( 0 , 1 )}{χ ^{2} ( n ) / n}$	$\frac{Γ (( n + 1 ) /2 )}{nπ Γ ( n /2 )} (1 + \frac{y ^{2}}{n})^{- (n + 1) /2}$	$0$ $(n > 1)$	$\frac{n}{n - 2}$ $(n > 2)$	对称性： $t_{α} (n) = - t_{1 - α} (n)$

七、知识结构总览

graph TD
    A[标准正态分布 N(0,1)] --> B[卡方分布 χ²(n)]
    A --> D[t 分布 t(n)]
    B --> C[F 分布 F(m,n)]
    B --> D

    B --> B1[定义: n个独立N(0,1)的平方和]
    B --> B2[性质: E=n, Var=2n]
    B --> B3[性质: 可加性]
    B --> B4[特例: Ga(n/2, 1/2)]

    C --> C1[定义: 两个独立χ²之比]
    C --> C2[性质: 倒数关系]
    C --> C3[应用: 方差齐性检验]

    D --> D1[定义: N(0,1)与χ²(n)之商]
    D --> D2[性质: 对称, 厚尾]
    D --> D3[收敛: n→∞时趋近N(0,1)]
    D --> D4[应用: 小样本均值检验]

    B --> E[Fisher引理]
    E --> E1[X̄与S²独立]
    E --> E2[(n-1)S²/σ² ~ χ²(n-1)]

    E --> F1[推论: 单总体t统计量]
    E --> F2[推论: 两总体F统计量]
    E --> F3[推论: 两总体t统计量]

    D1 --> G[t² ~ F(1,n)]

八、核心思想与技巧

分位数查表技巧

F 分布的倒数关系：

F_{1 - α} (m, n) = \frac{1}{F _{α} ( n , m )}

当需要查 $F_{0.95} (m, n)$ 时，只需查 $F_{0.05} (n, m)$ 再取倒数。

t 分布的对称性：

t_{α} (n) = - t_{1 - α} (n)

t 分布表通常只给出上侧分位数 $t_{α} (n)$ （ $α > 0.5$ 时为正值）。下侧分位数可通过对称性得到。

卡方分布的单侧性：

卡方分布的密度函数在 $y > 0$ 上定义，分位数只有上侧分位数 $χ_{α}^{2} (n)$ ，满足 $P (χ^{2} > χ_{α}^{2} (n)) = α$ 。

正态总体抽样定理应用框架

单正态总体 $N (μ, σ^{2})$ ：

条件	统计量	分布
$σ^{2}$ 已知	$\frac{X ˉ - μ}{σ / n}$	$N (0, 1)$
$σ^{2}$ 未知	$\frac{X ˉ - μ}{S / n}$	$t (n - 1)$
—	$\frac{( n - 1 ) S ^{2}}{σ ^{2}}$	$χ^{2} (n - 1)$

两正态总体（等方差 $σ^{2}$ ）：

条件	统计量	分布
均值比较	$\frac{( X ˉ - Y ˉ ) - ( μ _{1} - μ _{2} )}{S _{w} 1/ m + 1/ n}$	$t (m + n - 2)$
方差比较	$\frac{S _{X}^{2}}{S _{Y}^{2}}$	$F (m - 1, n - 1)$

九、补充理解与易混淆点

卡方分布自由度混淆

来源：茆诗松§5.4 p248 + 卡方核心笔记 + CSDN《数理统计基础笔记四》 + CSDN《三大抽样分布简单理解》 + UCLA《Distributions related to normal》

误区1："卡方分布的自由度就是样本量n"

错误解释：认为 $χ^{2} (n)$ 中的 $n$ 总是等于样本量。

正确解释： $χ^{2} (n)$ 的 $n$ 是独立标准正态变量的个数。在 Fisher 引理中， $(n - 1) S^{2} / σ^{2} \sim χ^{2} (n - 1)$ ，自由度是 $n - 1$ 而非 $n$ ，因为 $n$ 个偏差 $(X_{i} - \overset{ˉ}{X})$ 中只有 $n - 1$ 个是独立的（偏差之和为零约束）。

t 分布与标准正态分布混淆

来源：茆诗松§5.4 p255-256 + CSDN《概率分布t分布详解》 + CSDN《机器学习中的数学》 + UCLA《Distributions》 + 卡方核心笔记

误区2："小样本也可以用N(0,1)近似t分布"

错误解释：认为 $t (n)$ 和 $N (0, 1)$ 差不多，小样本时可以直接用 $N (0, 1)$ 查表。

正确解释： $t (n)$ 的尾部概率显著大于 $N (0, 1)$ 。例如 $P (∣ X ∣ > 2)$ 在 $N (0, 1)$ 下为 $0.0455$ ，在 $t (4)$ 下为 $0.1161$ ，相差 2.5 倍以上。n < 30 时必须用 t 分布，只有 $n \geq 30$ 时才能用 $N (0, 1)$ 近似。

F 分布自由度顺序

来源：茆诗松§5.4 p253 + 卡方核心笔记 + CSDN《三大抽样分布简单理解》 + LibreTexts《F-distribution》 + CSDN《数理统计基础笔记四》

误区3："F(m,n)和F(n,m)是一样的"

错误解释：认为 F 分布的两个自由度可以互换。

正确解释： $F (m, n)$ 中m 是分子自由度，n 是分母自由度，不可互换。 $F (m, n) \neq = F (n, m)$ ，但它们有倒数关系： $F_{1 - α} (m, n) = 1/ F_{α} (n, m)$ 。查表时务必注意自由度的顺序。

X̄与S²独立性误用

来源：茆诗松§5.4 p250-251（Fisher引理）+ 卡方核心笔记 + CSDN《数理统计基础笔记四》 + bookdown《统计考研复习参考》Ch5 + UCLA《Distributions》

误区4："任何总体下样本均值和样本方差都独立"

错误解释：认为 $\overset{ˉ}{X}$ 与 $S^{2}$ 的独立性是普遍成立的。

正确解释： $\overset{ˉ}{X}$ 与 $S^{2}$ 的相互独立仅在正态总体下成立，这是 Fisher 引理的核心结论。对于非正态总体， $\overset{ˉ}{X}$ 与 $S^{2}$ 一般不独立。正态分布的这个特殊性质在统计推断中至关重要。

χ²分布可加性条件

来源：茆诗松§5.4 p248 + 卡方核心笔记 + CSDN《三大抽样分布简单理解》 + CSDN《数理统计基础笔记四》 + bookdown《统计考研复习参考》Ch5

误区5："任意χ²变量都可以直接相加"

错误解释：认为任何两个 $χ^{2}$ 分布变量之和仍然是 $χ^{2}$ 分布。

正确解释： $χ^{2}$ 分布的可加性要求各变量相互独立。若 $X \sim χ^{2} (m)$ ， $Y \sim χ^{2} (n)$ 且 $X$ 与 $Y$ 独立，则 $X + Y \sim χ^{2} (m + n)$ 。若 $X$ 与 $Y$ 不独立，则 $X + Y$ 的分布不再是 $χ^{2}$ 分布（自由度也不等于 $m + n$ ）。

十、习题精选

习题概览

本节精选 10 道习题，其中 6 道来自教材，4 道来自考研真题。

编号来源核心知识点难度
1 教材 5.4-1 样本均值的概率计算 ★★☆
2 教材 5.4-5 t 统计量概率计算 ★★★
3 教材 5.4-7 F 分布对称性证明 ★★☆
4 教材 5.4-9 正态变量函数的分布 ★★★
5 教材 5.4-13 F 统计量概率计算 ★★★
6 教材 5.4-19 均匀分布与卡方分布 ★★★★
7 2014 兰州大学 432 Fisher 引理证明 ★★★★
8 2015 大连理工大学 432 两总体 t 分布证明 ★★★★
9 2018 东北师范大学 432 F 分布概率计算 ★★★
10 2024 武汉大学 432 Fisher 引理推广 ★★★★★

编号	来源	核心知识点	难度
1	教材 5.4-1	样本均值的概率计算	★★☆
2	教材 5.4-5	t 统计量概率计算	★★★
3	教材 5.4-7	F 分布对称性证明	★★☆
4	教材 5.4-9	正态变量函数的分布	★★★
5	教材 5.4-13	F 统计量概率计算	★★★
6	教材 5.4-19	均匀分布与卡方分布	★★★★
7	2014 兰州大学 432	Fisher 引理证明	★★★★
8	2015 大连理工大学 432	两总体 t 分布证明	★★★★
9	2018 东北师范大学 432	F 分布概率计算	★★★
10	2024 武汉大学 432	Fisher 引理推广	★★★★★

习题 1（教材 5.4-1）

习题 1

设总体 $X \sim N (7.6, 4)$ ，从中抽取样本 $X_{1}, \dots, X_{n}$ 。要使样本均值 $\overset{ˉ}{X}$ 落在 $(5.6, 9.6)$ 内的概率不小于 $0.95$ ，样本量 $n$ 至少应取多少？

查看解答

解： $\overset{ˉ}{X} \sim N (7.6, 4/ n)$ ，标准化得
$\frac{X ˉ - 7.6}{2/ n} \sim N (0, 1)$
要求
$P (5.6 < \overset{ˉ}{X} < 9.6) = P (\frac{5.6 - 7.6}{2/ n} < Z < \frac{9.6 - 7.6}{2/ n}) = P (- n < Z < n) = 2Φ (n) - 1 \geq 0.95$
因此 $Φ (n) \geq 0.975$ ，查标准正态表得 $n \geq 1.96$ ，即 $n \geq 3.84$ 。

取 $n \geq 4$ 。

习题 2（教材 5.4-5）

习题 2

设 $X_{1}, \dots, X_{16} \sim i.i.d. N (μ, σ^{2})$ ，已知 $\overset{ˉ}{X} = 9$ ， $S^{2} = 5.32$ 。求 $P (∣ \overset{ˉ}{X} - μ ∣ < 0.6)$ 。

查看解答

解：由推论 5.4.2，
$t = \frac{16 ( X ˉ - μ )}{S} = \frac{4 ( X ˉ - μ )}{S} \sim t (15)$
$S = 5.32 \approx 2.3065$ ，因此
$P (∣ \overset{ˉ}{X} - μ ∣ < 0.6) = P (\frac{4 ( X ˉ - μ )}{S} < \frac{4 \times 0.6}{2.3065}) = P (∣ t_{15} ∣ < 1.0405)$
查 t 分布表， $t_{0.15} (15) \approx 1.0405$ （线性插值），因此
$P = 1 - 2 \times 0.1573 = 0.6854$

习题 3（教材 5.4-7）

习题 3

设 $X \sim F (n, n)$ ，证明 $P (X < 1) = 0.5$ 。

查看解答

证明：设 $X \sim F (n, n)$ ，令 $Y = 1/ X$ 。

由 F 分布的定义， $Y = 1/ X \sim F (n, n)$ （因为 $X = \frac{χ ^{2} ( n ) / n}{χ ^{2} ( n ) / n}$ ，取倒数后 $Y = \frac{χ ^{2} ( n ) / n}{χ ^{2} ( n ) / n} \sim F (n, n)$ ）。

因此
$P (X < 1) = P (Y > 1) = P (X > 1)$
又因为 $P (X < 1) + P (X > 1) = 1$ （连续分布中 $P (X = 1) = 0$ ），所以
$P (X < 1) = 0.5$
$□$

习题 4（教材 5.4-9）

习题 4

设 $X_{1}, X_{2} \sim i.i.d. N (0, σ^{2})$ ，求 $Y = (\frac{X _{1} + X _{2}}{X _{1} - X _{2}})^{2}$ 的分布。

查看解答

解：令 $U = X_{1} + X_{2}$ ， $V = X_{1} - X_{2}$ 。

由于 $(X_{1}, X_{2})$ 服从二元正态分布， $U$ 和 $V$ 的线性组合仍为联合正态。

计算协方差：
$Cov (U, V) = Cov (X_{1} + X_{2}, X_{1} - X_{2}) = Var (X_{1}) - Var (X_{2}) = σ^{2} - σ^{2} = 0$
协方差为零 + 联合正态 $\Rightarrow$ $U$ 与 $V$ 相互独立。

又 $U \sim N (0, 2 σ^{2})$ ， $V \sim N (0, 2 σ^{2})$ ，因此
$\frac{U}{2 σ} \sim N (0, 1), \frac{V}{2 σ} \sim N (0, 1)$
于是
$Y = (\frac{U}{V})^{2} = \frac{U ^{2} / ( 2 σ ^{2} )}{V ^{2} / ( 2 σ ^{2} )} \sim F (1, 1)$
（因为 $U^{2} / (2 σ^{2}) \sim χ^{2} (1)$ ， $V^{2} / (2 σ^{2}) \sim χ^{2} (1)$ ，二者独立。）

习题 5（教材 5.4-13）

习题 5

设两个等方差正态总体 $N (μ_{1}, σ^{2})$ 和 $N (μ_{2}, σ^{2})$ ，分别抽取 $n_{1} = 15$ 和 $n_{2} = 20$ 的样本。求 $P (S_{1}^{2} / S_{2}^{2} > 2)$ 。

查看解答

解：由推论 5.4.1，等方差时
$F = \frac{S _{1}^{2}}{S _{2}^{2}} \sim F (14, 19)$
因此
$P (\frac{S _{1}^{2}}{S _{2}^{2}} > 2) = P (F (14, 19) > 2) = 1 - F_{F} (2)$
查 F 分布表， $F_{0.05} (14, 19) \approx 2.26$ （或通过插值），因此
$P \approx 1 - 0.9202 = 0.0798$

习题 6（教材 5.4-19）

习题 6

设 $X_{1}, \dots, X_{n} \sim i.i.d. N (μ, σ^{2})$ ， $F (x)$ 为 $N (μ, σ^{2})$ 的分布函数。证明
$T = - 2 i = 1 \sum n ln F (X_{i}) \sim χ^{2} (2 n)$

查看解答

证明：

第一步： $F (X)$ 的分布

设 $X$ 的分布函数为 $F (x)$ ，则 $Y = F (X) \sim U (0, 1)$ （概率积分变换）。

第二步： $- 2 ln Y$ 的分布

设 $Y \sim U (0, 1)$ ， $W = - 2 ln Y$ 。当 $w > 0$ 时：
$P (W \leq w) = P (- 2 ln Y \leq w) = P (Y \geq e^{- w /2}) = 1 - e^{- w /2}$
这是参数为 $1/2$ 的指数分布的分布函数，即 $W \sim E x p (1/2) = G a (1, 1/2) = χ^{2} (2)$ 。

第三步：利用独立性

由于 $X_{1}, \dots, X_{n}$ 独立， $F (X_{1}), \dots, F (X_{n})$ 也独立，从而 $W_{i} = - 2 ln F (X_{i})$ 独立同分布于 $χ^{2} (2)$ 。

由卡方分布的可加性：
$T = i = 1 \sum n W_{i} \sim χ^{2} (2 n)$
$□$

习题 7（2014 兰州大学 432）

习题 7

设 $X_{1}, \dots, X_{n} \sim i.i.d. N (μ, σ^{2})$ ，证明 $\overset{ˉ}{X}$ 与 $S^{2}$ 相互独立，且 $(n - 1) S^{2} / σ^{2} \sim χ^{2} (n - 1)$ 。

查看解答

证明：此即 Fisher 引理（定理 5.4.1），完整证明见完整证明（正交变换法）。

核心思路：构造正交矩阵 $A$ （第一行全为 $1/ n$ ），作变换 $Y = A X$ ，利用正交变换保范数和正态变量的独立性，将 $(n - 1) S^{2}$ 表示为 $n - 1$ 个独立 $N (0, σ^{2})$ 变量的平方和。

习题 8（2015 大连理工大学 432）

习题 8

设 $X_{1}, \dots, X_{m} \sim i.i.d. N (μ_{1}, σ^{2})$ ， $Y_{1}, \dots, Y_{n} \sim i.i.d. N (μ_{2}, σ^{2})$ ，两组样本独立。证明推论 5.4.3。

查看解答

证明：完整证明见推论 5.4.3：两正态总体的 t 统计量（等方差）。

核心步骤：

分子： $(\overset{ˉ}{X} - \overset{ˉ}{Y}) - (μ_{1} - μ_{2}) \sim N (0, σ^{2} (1/ m + 1/ n))$

分母： $(m + n - 2) S_{w}^{2} / σ^{2} \sim χ^{2} (m + n - 2)$ （卡方可加性）

独立性：分子与分母独立（Fisher 引理 + 两组样本独立）

由 t 分布定义得 $t \sim t (m + n - 2)$

习题 9（2018 东北师范大学 432）

习题 9

设 $X_{1}, \dots, X_{16} \sim i.i.d. N (0, 4)$ ， $Y_{1}, \dots, Y_{16} \sim i.i.d. N (0, 4)$ ，两组样本独立。求 $P (S_{x}^{2} / S_{y}^{2} > 2.5)$ 。

查看解答

解： $X_{i} \sim N (0, 4)$ ，即 $σ^{2} = 4$ 。

由 Fisher 引理：
$\frac{15 S _{x}^{2}}{4} \sim χ^{2} (15), \frac{15 S _{y}^{2}}{4} \sim χ^{2} (15)$
由推论 5.4.1（等方差）：
$F = \frac{S _{x}^{2}}{S _{y}^{2}} \sim F (15, 15)$
因此
$P (\frac{S _{x}^{2}}{S _{y}^{2}} > 2.5) = P (F (15, 15) > 2.5) = 1 - F_{F} (2.5)$
查 F 分布表， $F_{0.05} (15, 15) \approx 2.40$ ， $F_{0.025} (15, 15) \approx 2.86$ ，线性插值得 $P \approx 0.04$ 。

习题 10（2024 武汉大学 432）

习题 10

设 $X_{1}, \dots, X_{n} \sim i.i.d. N (μ_{1}, σ_{1}^{2})$ ， $Y_{1}, \dots, Y_{n} \sim i.i.d. N (μ_{2}, σ_{2}^{2})$ ，两组样本独立， $σ_{1}^{2} \neq = σ_{2}^{2}$ 。讨论相关统计量的分布。

查看解答

解：这是 Fisher 引理在异方差情形下的推广。

由 Fisher 引理分别应用于两组样本：
$\overset{ˉ}{X} \sim N (μ_{1}, \frac{σ _{1}^{2}}{n}), \overset{ˉ}{Y} \sim N (μ_{2}, \frac{σ _{2}^{2}}{n})$ $\frac{( n - 1 ) S _{x}^{2}}{σ _{1}^{2}} \sim χ^{2} (n - 1), \frac{( n - 1 ) S _{y}^{2}}{σ _{2}^{2}} \sim χ^{2} (n - 1)$
由于 $σ_{1}^{2} \neq = σ_{2}^{2}$ ，不能直接用合并方差 $S_{w}^{2}$ 。但可以构造：
$F = \frac{S _{x}^{2} / σ _{1}^{2}}{S _{y}^{2} / σ _{2}^{2}} \sim F (n - 1, n - 1)$
对于均值差的检验，由于异方差，不能使用推论 5.4.3 的 t 统计量。此时可用 Behrens-Fisher 问题的近似解法（如 Welch t 检验）：
$t^{*} = \frac{( X ˉ - Y ˉ ) - ( μ _{1} - μ _{2} )}{S _{x}^{2} / n + S _{y}^{2} / n}$
其近似服从自由度为
$ν = \frac{( S _{x}^{2} / n + S _{y}^{2} / n ) ^{2}}{( S _{x}^{2} / n ) ^{2} / ( n - 1 ) + ( S _{y}^{2} / n ) ^{2} / ( n - 1 )}$
的 t 分布（Welch-Satterthwaite 近似）。

十一、教材原文

教材参考

以下为茆诗松《概率论与数理统计》第五章 5.4 节的教材原文，供对照参考。

第五章统计量及其分布/三大抽样分布

数学笔记 Wiki

探索

5.4 三大抽样分布

5.4 三大抽样分布

一、卡方分布

定义

密度函数

与 Gamma 分布的关系

密度函数的推导

数字特征

可加性

例题

二、Fisher引理（正态总体抽样定理）

预备知识：多维正态变换

Fisher 引理

完整证明（正交变换法）

三、F分布

定义

密度函数的推导

数字特征

分位数性质

例题

四、t分布

定义

密度函数的推导（从 F 分布出发）

数字特征

与标准正态分布的对比

t 分布的渐近性质

t(1) = Cauchy 分布

历史背景：Gosset 与 Student

五、正态总体抽样定理推论

推论 5.4.1：两正态总体的 F 统计量

推论 5.4.2：单正态总体的 t 统计量

推论 5.4.3：两正态总体的 t 统计量（等方差）

六、三大分布关系总览

关系表

核心公式汇总表

七、知识结构总览

八、核心思想与技巧

分位数查表技巧

正态总体抽样定理应用框架

九、补充理解与易混淆点

卡方分布自由度混淆

t 分布与标准正态分布混淆

F 分布自由度顺序

X̄与S²独立性误用

χ²分布可加性条件

十、习题精选

习题 1（教材 5.4-1）

习题 2（教材 5.4-5）

习题 3（教材 5.4-7）

习题 4（教材 5.4-9）

习题 5（教材 5.4-13）

习题 6（教材 5.4-19）

习题 7（2014 兰州大学 432）

习题 8（2015 大连理工大学 432）

习题 9（2018 东北师范大学 432）

习题 10（2024 武汉大学 432）

十一、教材原文

关系图谱

目录

反向链接