2.5 常用连续分布

本节概览

本节介绍概率论中最重要的五大连续分布：正态分布、均匀分布、指数分布、伽马分布和贝塔分布。这些分布描述了不同场景下连续随机变量的统计规律性，是后续统计推断的理论基础。

逻辑链条：均匀分布（最基本连续分布）→ 指数分布（等待时间）→ 伽马分布（指数分布推广）→ 贝塔分布（区间上的分布）→ 正态分布（中心极限定理的终极形态）→ 分布间的关系与汇总

前置依赖：§2.1（密度函数、分布函数）、§2.2（期望、线性性）、§2.3（方差）、§1.4（条件概率）

核心主线：五大连续分布各有适用场景。正态分布 $N (μ, σ^{2})$ 是自然界最常见的分布，由中心极限定理保证；指数分布 $E x p (λ)$ 描述事件间隔时间，具有独特的无记忆性；伽马分布 $G a (α, λ)$ 是指数分布的自然推广；贝塔分布 $B e (a, b)$ 描述 $(0, 1)$ 区间上的随机比例。

一、正态分布

正态分布是概率论中最重要的连续分布，也是整个统计学的基石。它由高斯（Gauss）在研究天文观测误差时系统提出，因此又称高斯分布。

物理背景

正态分布的物理背景源于高斯误差理论。高斯在研究天文观测数据时发现：

观测误差是由大量微小独立的随机因素叠加而成的；
这些因素中，正误差和负误差出现的可能性相等；
小误差出现的概率大于大误差出现的概率；
极大误差出现的概率趋近于零。

这就是著名的误差公理。数学上，当大量独立同分布的随机变量相加时，由中心极限定理保证，其和的分布趋近于正态分布。

生活中的正态分布：身高、体重、考试成绩、测量误差、分子运动速度等，都近似服从正态分布。

正态分布的定义

定义 2.5.1 — 正态分布

若连续随机变量 $X$ 的密度函数为
$p (x) = \frac{1}{2 π σ} exp {- \frac{( x - μ ) ^{2}}{2 σ ^{2}}}, - \infty < x < + \infty$
其中 $μ \in R$ ， $σ > 0$ 为参数，则称 $X$ 服从参数为 $(μ, σ^{2})$ 的正态分布，记为 $X \sim N (μ, σ^{2})$ 。

参数的含义：

$μ$ ：位置参数（均值），决定密度曲线的中心位置。 $μ$ 越大，曲线越靠右。
$σ^{2}$ ：尺度参数（方差），决定密度曲线的形状。 $σ^{2}$ 越小，曲线越集中（高而窄）； $σ^{2}$ 越大，曲线越分散（矮而宽）。

密度函数的验证：

需要验证 $p (x) \geq 0$ 且 $\int_{- \infty}^{+ \infty} p (x) d x = 1$ 。

非负性显然成立（指数函数和分母均为正）。归一性的验证需要计算积分：

I = \int_{- \infty}^{+ \infty} exp {- \frac{( x - μ ) ^{2}}{2 σ ^{2}}} d x

令 $t = \frac{x - μ}{σ}$ ，则 $d x = σ d t$ ：

I = σ \int_{- \infty}^{+ \infty} e^{- t^{2} /2} d t

利用著名的概率积分 $\int_{- \infty}^{+ \infty} e^{- t^{2} /2} d t = 2 π$ ，得 $I = σ 2 π$ 。

因此 $\int_{- \infty}^{+ \infty} p (x) d x = \frac{1}{2 π σ} \cdot σ 2 π = 1$ 。 $□$

密度函数的图像特征

正态分布的密度曲线具有以下重要特征：

对称性：关于 $x = μ$ 对称，即 $p (μ + x) = p (μ - x)$ 。
单峰性：在 $x = μ$ 处取得最大值 $p (μ) = \frac{1}{2 π σ}$ 。
渐近性：当 $x \to \pm \infty$ 时， $p (x) \to 0$ ，曲线以 $x$ 轴为渐近线。
拐点：在 $x = μ \pm σ$ 处有拐点。

标准正态分布

标准正态分布

当 $μ = 0$ ， $σ = 1$ 时的正态分布称为标准正态分布，记为 $N (0, 1)$ 。其密度函数和分布函数分别记为
$φ (u) = \frac{1}{2 π} e^{- u^{2} /2}, - \infty < u < + \infty$ $Φ (u) = \int_{- \infty}^{u} φ (t) d t = \int_{- \infty}^{u} \frac{1}{2 π} e^{- t^{2} /2} d t$

标准正态分布的重要性质：

对称性： $φ (- u) = φ (u)$ ，即密度函数是偶函数。
分布函数的对称关系： $Φ (- u) = 1 - Φ (u)$ 。
- 推导：由密度函数的对称性，
$Φ (- u) = \int_{- \infty}^{- u} φ (t) d t = \int_{u}^{+ \infty} φ (t) d t = 1 - \int_{- \infty}^{u} φ (t) d t = 1 - Φ (u)$
$Φ (0) = 0.5$ ：由对称性直接得出。

标准化定理

定理 2.5.1 — 标准化定理

若 $X \sim N (μ, σ^{2})$ ，则 $U = \frac{X - μ}{σ} \sim N (0, 1)$ 。

证明

证明：需要证明 $U$ 的密度函数为 $φ (u)$ 。

[变量代换法]：设 $X$ 的分布函数为 $F_{X} (x)$ ，则 $U$ 的分布函数为
$F_{U} (u) = P (U \leq u) = P (\frac{X - μ}{σ} \leq u) = P (X \leq μ + σ u) = F_{X} (μ + σ u)$
对 $u$ 求导，得 $U$ 的密度函数：
$p_{U} (u) = \frac{d}{d u} F_{U} (u) = \frac{d}{d u} F_{X} (μ + σ u) = p_{X} (μ + σ u) \cdot σ$
将 $X$ 的密度函数代入：
$p_{U} (u) = σ \cdot \frac{1}{2 π σ} exp {- \frac{( μ + σ u - μ ) ^{2}}{2 σ ^{2}}} = \frac{1}{2 π} exp {- \frac{u ^{2}}{2}} = φ (u)$
因此 $U \sim N (0, 1)$ 。 $□$

标准化定理的意义在于：任何正态分布的概率计算都可以转化为标准正态分布的计算，只需查标准正态分布表即可。

概率计算公式

利用标准化定理，可以推导出正态分布的概率计算公式：

（1）单侧概率：

P (X \leq c) = P (\frac{X - μ}{σ} \leq \frac{c - μ}{σ}) = Φ (\frac{c - μ}{σ}) P (X > c) = 1 - Φ (\frac{c - μ}{σ})

（2）区间概率：

P (a < X \leq b) = Φ (\frac{b - μ}{σ}) - Φ (\frac{a - μ}{σ})

（3）对称区间概率：

P (μ - kσ < X < μ + kσ) = Φ (k) - Φ (- k) = 2Φ (k) - 1

3σ原则

3σ原则

若 $X \sim N (μ, σ^{2})$ ，则
$P (μ - kσ < X < μ + kσ) = 2Φ (k) - 1$
特别地：

$k = 1$ ： $P (μ - σ < X < μ + σ) = 2Φ (1) - 1 \approx 68.27%$

$k = 2$ ： $P (μ - 2 σ < X < μ + 2 σ) = 2Φ (2) - 1 \approx 95.45%$

$k = 3$ ： $P (μ - 3 σ < X < μ + 3 σ) = 2Φ (3) - 1 \approx 99.73%$

证明

证明：由标准化定理，
$P (μ - kσ < X < μ + kσ) = P (- k < \frac{X - μ}{σ} < k) = Φ (k) - Φ (- k)$
[对称性]：由 $Φ (- k) = 1 - Φ (k)$ ，
$Φ (k) - Φ (- k) = Φ (k) - (1 - Φ (k)) = 2Φ (k) - 1$
查标准正态分布表： $Φ (1) \approx 0.8413$ ， $Φ (2) \approx 0.9772$ ， $Φ (3) \approx 0.9987$ 。

代入即得三个概率值。 $□$

3σ原则的实际意义：正态随机变量几乎肯定落在 $(μ - 3 σ, μ + 3 σ)$ 内，落在该区间外的概率不到 $0.3%$ 。这是质量控制中”3σ准则”的理论基础。

正态分布的期望和方差

定理 2.5.2 — 正态分布的期望和方差

若 $X \sim N (μ, σ^{2})$ ，则
$E (X) = μ, Var (X) = σ^{2}$

证明

证明：利用标准化定理，设 $U = \frac{X - μ}{σ} \sim N (0, 1)$ ，则 $X = μ + σ U$ 。

[标准化+线性性]：

第一步：计算 $E (U)$ 。
$E (U) = \int_{- \infty}^{+ \infty} u \cdot φ (u) d u = \frac{1}{2 π} \int_{- \infty}^{+ \infty} u e^{- u^{2} /2} d u$
注意到被积函数 $u e^{- u^{2} /2}$ 是奇函数，积分区间关于原点对称，因此
$E (U) = 0$
第二步：计算 $E (X)$ 。
$E (X) = E (μ + σ U) = μ + σ E (U) = μ + σ \cdot 0 = μ$
第三步：计算 $E (U^{2})$ 。
$E (U^{2}) = \int_{- \infty}^{+ \infty} u^{2} \cdot φ (u) d u = \frac{1}{2 π} \int_{- \infty}^{+ \infty} u^{2} e^{- u^{2} /2} d u$
利用分部积分，令 $v = u$ ， $d w = u e^{- u^{2} /2} d u$ ，则 $d v = d u$ ， $w = - e^{- u^{2} /2}$ ：
$E (U^{2}) = \frac{1}{2 π} [- u e^{- u^{2} /2}_{- \infty}^{+ \infty} + \int_{- \infty}^{+ \infty} e^{- u^{2} /2} d u]$
第一项在 $u \to \pm \infty$ 时趋于 $0$ （指数衰减比多项式增长快）。第二项：
$\int_{- \infty}^{+ \infty} e^{- u^{2} /2} d u = 2 π$
因此 $E (U^{2}) = \frac{1}{2 π} \cdot 2 π = 1$ 。

第四步：计算 $Var (X)$ 。
$Var (U) = E (U^{2}) - [E (U)]^{2} = 1 - 0 = 1$
$Var (X) = Var (μ + σ U) = σ^{2} Var (U) = σ^{2} \cdot 1 = σ^{2}$ $□$

这验证了参数 $μ$ 和 $σ^{2}$ 确实是正态分布的期望和方差。

例题

例 2.5.1 — 正态分布概率计算

设 $X \sim N (108, 9)$ （即 $μ = 108$ ， $σ^{2} = 9$ ， $σ = 3$ ），求 $P (102 < X < 117)$ 。

解：利用标准化公式：

P (102 < X < 117) = Φ (\frac{117 - 108}{3}) - Φ (\frac{102 - 108}{3}) = Φ (3) - Φ (- 2)

由对称性 $Φ (- 2) = 1 - Φ (2)$ ：

= Φ (3) - (1 - Φ (2)) = Φ (3) + Φ (2) - 1

查标准正态分布表： $Φ (2) \approx 0.9772$ ， $Φ (3) \approx 0.9987$ 。

P (102 < X < 117) \approx 0.9987 + 0.9772 - 1 = 0.9759

即 $P (102 < X < 117) \approx 0.9759$ 。

例 2.5.2 — 正态分布分位数

设 $X \sim N (0, 1)$ ，求 $a$ 使得 $P (X < a) = 0.95$ 。

解：由标准正态分布函数的定义，

P (X < a) = Φ (a) = 0.95

查标准正态分布表， $Φ (1.645) \approx 0.95$ ，因此 $a \approx 1.645$ 。

这里 $a = 1.645$ 称为标准正态分布的==上 $0.05$ 分位数==，记为 $u_{0.05} = 1.645$ 。

常用分位数：

$u_{0.05} = 1.645$ （单侧 $95%$ ）
$u_{0.025} = 1.96$ （双侧 $95%$ ）
$u_{0.005} = 2.576$ （双侧 $99%$ ）

二、均匀分布

均匀分布是最简单的连续分布，描述的是随机变量在某区间上”均匀”取值的情形。

均匀分布的定义

定义 2.5.2 — 均匀分布

若连续随机变量 $X$ 的密度函数为
$p (x) = ⎩ ⎨ ⎧ \frac{1}{b - a}, 0, a < x < b 其他$
其中 $a < b$ 为参数，则称 $X$ 在区间 $(a, b)$ 上服从均匀分布，记为 $X \sim U (a, b)$ 。

直观理解： $X$ 落在 $(a, b)$ 内任何等长子区间上的概率相同。就像向线段 $(a, b)$ 上随机投点，每个点被投中的概率密度相同。

验证归一性：

\int_{- \infty}^{+ \infty} p (x) d x = \int_{a}^{b} \frac{1}{b - a} d x = \frac{1}{b - a} \cdot (b - a) = 1 ✓

均匀分布的分布函数

由 §2.1 中分布函数的定义 $F (x) = \int_{- \infty}^{x} p (t) d t$ ：

F (x) = ⎩ ⎨ ⎧ 0, \frac{x - a}{b - a}, 1, x \leq a a < x < b x \geq b

分布函数在 $(a, b)$ 上是线性增长的，从 $0$ 单调递增到 $1$ 。

均匀分布的期望和方差

定理 2.5.3 — 均匀分布的期望和方差

若 $X \sim U (a, b)$ ，则
$E (X) = \frac{a + b}{2}, Var (X) = \frac{( b - a ) ^{2}}{12}$

证明

证明：

[直接积分法]：

期望：
$E (X) = \int_{a}^{b} x \cdot \frac{1}{b - a} d x = \frac{1}{b - a} \cdot \frac{x ^{2}}{2}_{a}^{b} = \frac{1}{b - a} \cdot \frac{b ^{2} - a ^{2}}{2} = \frac{b ^{2} - a ^{2}}{2 ( b - a )} = \frac{( b - a ) ( b + a )}{2 ( b - a )} = \frac{a + b}{2}$
方差：先计算 $E (X^{2})$ ：
$E (X^{2}) = \int_{a}^{b} x^{2} \cdot \frac{1}{b - a} d x = \frac{1}{b - a} \cdot \frac{x ^{3}}{3}_{a}^{b} = \frac{b ^{3} - a ^{3}}{3 ( b - a )} = \frac{( b - a ) ( b ^{2} + ab + a ^{2} )}{3 ( b - a )} = \frac{b ^{2} + ab + a ^{2}}{3}$
因此：
$Var (X) = E (X^{2}) - [E (X)]^{2} = \frac{b ^{2} + ab + a ^{2}}{3} - \frac{( a + b ) ^{2}}{4}$
通分（公分母为 $12$ ）： $= \frac{4 ( b ^{2} + ab + a ^{2} ) - 3 ( a ^{2} + 2 ab + b ^{2} )}{12} = \frac{4 b ^{2} + 4 ab + 4 a ^{2} - 3 a ^{2} - 6 ab - 3 b ^{2}}{12} = \frac{a ^{2} - 2 ab + b ^{2}}{12} = \frac{( b - a ) ^{2}}{12}$ $□$

直观理解：

期望 $\frac{a + b}{2}$ ：区间的中点，符合”均匀”的直觉。
方差 $\frac{( b - a ) ^{2}}{12}$ ：区间越长，分散程度越大。

例题

例 2.5.3 — 均匀分布应用

某公共汽车站每隔 15 分钟一班，乘客到达车站的时刻是随机的。求乘客等候时间不超过 5 分钟的概率。

解：设乘客到达时刻为 $X$ （分钟），则 $X \sim U (0, 15)$ 。

等候时间不超过 5 分钟，意味着乘客在班车到达前 5 分钟内到达。由于班车在 $t = 0, 15, 30, \dots$ 到达，乘客等候时间 $T = 15 - X$ （若 $X$ 落在某一个 15 分钟区间内）。

等候时间不超过 5 分钟： $T \leq 5$ ，即 $15 - X \leq 5$ ，即 $X \geq 10$ 。

P (X \geq 10) = \int_{10}^{15} \frac{1}{15} d x = \frac{15 - 10}{15} = \frac{5}{15} = \frac{1}{3}

因此乘客等候时间不超过 5 分钟的概率为 $\frac{1}{3}$ 。

三、指数分布

指数分布是描述等待时间和寿命的最重要的连续分布，在排队论、可靠性理论中有着广泛应用。

指数分布的定义

定义 2.5.3 — 指数分布

若连续随机变量 $X$ 的密度函数为
$p (x) = {λ e^{- λ x}, 0, x \geq 0 x < 0$
其中 $λ > 0$ 为参数，则称 $X$ 服从参数为 $λ$ 的指数分布，记为 $X \sim E x p (λ)$ 。

参数的含义： $λ$ 是速率参数，表示单位时间内事件发生的平均次数。 $λ$ 越大，事件发生越频繁，等待时间越短。

验证归一性：

\int_{- \infty}^{+ \infty} p (x) d x = \int_{0}^{+ \infty} λ e^{- λ x} d x = - e^{- λ x}_{0}^{+ \infty} = 0 - (- 1) = 1 ✓

指数分布的分布函数

F (x) = \int_{- \infty}^{x} p (t) d t = {0, 1 - e^{- λ x}, x < 0 x \geq 0

推导：当 $x \geq 0$ 时，

F (x) = \int_{0}^{x} λ e^{- λ t} d t = - e^{- λ t}_{0}^{x} = - e^{- λ x} + 1 = 1 - e^{- λ x}

指数分布的期望和方差

定理 2.5.4 — 指数分布的期望和方差

若 $X \sim E x p (λ)$ ，则
$E (X) = \frac{1}{λ}, Var (X) = \frac{1}{λ ^{2}}$

证明

证明：

[分部积分法]：

期望：
$E (X) = \int_{0}^{+ \infty} x \cdot λ e^{- λ x} d x$
令 $u = x$ ， $d v = λ e^{- λ x} d x$ ，则 $d u = d x$ ， $v = - e^{- λ x}$ ：
$E (X) = - x e^{- λ x}_{0}^{+ \infty} + \int_{0}^{+ \infty} e^{- λ x} d x$
第一项： $lim_{x \to + \infty} x e^{- λ x} = 0$ （指数衰减比多项式增长快），在 $x = 0$ 处为 $0$ 。

第二项： $\int_{0}^{+ \infty} e^{- λ x} d x = \frac{1}{λ}$ 。

因此 $E (X) = 0 + \frac{1}{λ} = \frac{1}{λ}$ 。

方差：先计算 $E (X^{2})$ ：
$E (X^{2}) = \int_{0}^{+ \infty} x^{2} \cdot λ e^{- λ x} d x$
两次分部积分（或利用伽马函数，见下节）：
$E (X^{2}) = \frac{2}{λ ^{2}}$
因此： $Var (X) = E (X^{2}) - [E (X)]^{2} = \frac{2}{λ ^{2}} - \frac{1}{λ ^{2}} = \frac{1}{λ ^{2}}$ $□$

直观理解：

期望 $E (X) = \frac{1}{λ}$ ：如果事件平均每小时发生 $λ$ 次，则平均等待时间为 $\frac{1}{λ}$ 小时。
标准差 $Var (X) = \frac{1}{λ} = E (X)$ ：标准差等于均值，说明指数分布的离散程度相对较大。

无记忆性

定理 2.5.5 — 指数分布的无记忆性

若 $X \sim E x p (λ)$ ，则对任意 $s > 0$ ， $t > 0$ ，有
$P (X > s + t ∣ X > s) = P (X > t)$

证明

证明：

[条件概率+分布函数]：

由条件概率公式：
$P (X > s + t ∣ X > s) = \frac{P ( X > s + t )}{P ( X > s )}$
利用指数分布的尾部概率 $P (X > x) = 1 - F (x) = e^{- λ x}$ ： $= \frac{e ^{- λ (s + t)}}{e ^{- λ s}} = \frac{e ^{- λ s} \cdot e ^{- λ t}}{e ^{- λ s}} = e^{- λ t} = P (X > t)$ $□$

无记忆性的含义：如果一件产品已经工作了 $s$ 小时仍未损坏，那么它再工作 $t$ 小时的概率，与一件新产品工作 $t$ 小时的概率相同。换句话说，过去的"历史"不会影响未来的"寿命"。

生活类比：就像掷骰子——无论你已经掷了多少次没有出现 6 点，下一次掷出 6 点的概率始终是 $\frac{1}{6}$ 。指数分布的”等待”也具有这种”不记仇”的特性。

与泊松过程的关系

在参数为 $λ$ 的泊松过程中，两次相邻事件之间的时间间隔服从 $E x p (λ)$ 分布。这是指数分布最重要的物理背景之一。

例如：某服务台顾客到达服从参数为 $λ$ 的泊松过程，则相邻两位顾客到达的时间间隔 $T \sim E x p (λ)$ 。

例题

例 2.5.4 — 指数分布无记忆性应用

某电子元件的寿命 $X \sim E x p (0.01)$ （单位：小时）。已知该元件已正常工作了 200 小时，求它再正常工作 100 小时的概率。

解：由无记忆性，

P (X > 200 + 100 ∣ X > 200) = P (X > 100) = e^{- 0.01 \times 100} = e^{- 1} \approx 0.3679

注意：这个概率与元件已经工作了 200 小时这一事实无关！这正是无记忆性的体现。

四、伽马分布

伽马分布是指数分布的自然推广，也是卡方分布的理论基础。

伽马函数

伽马函数

称函数
$Γ (α) = \int_{0}^{+ \infty} x^{α - 1} e^{- x} d x, α > 0$
为伽马函数。

伽马函数的基本性质：

性质 1： $Γ (1) = 1$

Γ (1) = \int_{0}^{+ \infty} e^{- x} d x = - e^{- x}_{0}^{+ \infty} = 1

性质 2：递推公式 $Γ (α + 1) = α Γ (α)$

Γ (α + 1) = \int_{0}^{+ \infty} x^{α} e^{- x} d x

分部积分：令 $u = x^{α}$ ， $d v = e^{- x} d x$ ，则 $d u = α x^{α - 1} d x$ ， $v = - e^{- x}$ ：

= - x^{α} e^{- x}_{0}^{+ \infty} + α \int_{0}^{+ \infty} x^{α - 1} e^{- x} d x = 0 + α Γ (α) = α Γ (α)

推论：当 $α = n$ （正整数）时， $Γ (n + 1) = n!$ 。因此伽马函数是阶乘的推广。

性质 3： $Γ (\frac{1}{2}) = π$

Γ (\frac{1}{2}) = \int_{0}^{+ \infty} x^{- 1/2} e^{- x} d x

令 $x = \frac{t ^{2}}{2}$ ，则 $d x = t d t$ ， $x^{- 1/2} = \frac{2}{t}$ ：

= \int_{0}^{+ \infty} \frac{2}{t} e^{- t^{2} /2} t d t = 2 \int_{0}^{+ \infty} e^{- t^{2} /2} d t = 2 \cdot \frac{2 π}{2} = π

其中利用了概率积分 $\int_{0}^{+ \infty} e^{- t^{2} /2} d t = \frac{2 π}{2}$ 。

伽马分布的定义

定义 2.5.4 — 伽马分布

若连续随机变量 $X$ 的密度函数为
$p (x) = ⎩ ⎨ ⎧ \frac{λ ^{α}}{Γ ( α )} x^{α - 1} e^{- λ x}, 0, x > 0 x \leq 0$
其中 $α > 0$ ， $λ > 0$ 为参数，则称 $X$ 服从参数为 $(α, λ)$ 的伽马分布，记为 $X \sim G a (α, λ)$ 。

参数的含义：

$α$ ：形状参数，决定密度曲线的形状。 $α \leq 1$ 时单调递减， $α > 1$ 时呈单峰状。
$λ$ ：速率参数（尺度参数的倒数），与指数分布中的 $λ$ 含义相同。

验证归一性：

\int_{0}^{+ \infty} \frac{λ ^{α}}{Γ ( α )} x^{α - 1} e^{- λ x} d x

令 $t = λ x$ ，则 $d x = d t / λ$ ：

= \frac{λ ^{α}}{Γ ( α )} \int_{0}^{+ \infty} (\frac{t}{λ})^{α - 1} e^{- t} \frac{d t}{λ} = \frac{λ ^{α}}{Γ ( α )} \cdot \frac{1}{λ ^{α}} \int_{0}^{+ \infty} t^{α - 1} e^{- t} d t = \frac{Γ ( α )}{Γ ( α )} = 1 ✓

伽马分布的期望和方差

定理 2.5.6 — 伽马分布的期望和方差

若 $X \sim G a (α, λ)$ ，则
$E (X) = \frac{α}{λ}, Var (X) = \frac{α}{λ ^{2}}$

证明

证明：

[伽马函数递推]：

期望：
$E (X) = \int_{0}^{+ \infty} x \cdot \frac{λ ^{α}}{Γ ( α )} x^{α - 1} e^{- λ x} d x = \frac{λ ^{α}}{Γ ( α )} \int_{0}^{+ \infty} x^{α} e^{- λ x} d x$
令 $t = λ x$ ：
$= \frac{λ ^{α}}{Γ ( α )} \int_{0}^{+ \infty} (\frac{t}{λ})^{α} e^{- t} \frac{d t}{λ} = \frac{λ ^{α}}{Γ ( α )} \cdot \frac{1}{λ ^{α + 1}} \int_{0}^{+ \infty} t^{α} e^{- t} d t = \frac{1}{λ Γ ( α )} \cdot Γ (α + 1)$
由递推公式 $Γ (α + 1) = α Γ (α)$ ：
$= \frac{α Γ ( α )}{λ Γ ( α )} = \frac{α}{λ}$
方差：类似地计算 $E (X^{2})$ ：
$E (X^{2}) = \frac{λ ^{α}}{Γ ( α )} \int_{0}^{+ \infty} x^{α + 1} e^{- λ x} d x = \frac{Γ ( α + 2 )}{λ ^{2} Γ ( α )} = \frac{( α + 1 ) α Γ ( α )}{λ ^{2} Γ ( α )} = \frac{α ( α + 1 )}{λ ^{2}}$
因此： $Var (X) = E (X^{2}) - [E (X)]^{2} = \frac{α ( α + 1 )}{λ ^{2}} - \frac{α ^{2}}{λ ^{2}} = \frac{α}{λ ^{2}}$ $□$

伽马分布的特例

特例 1：当 $α = 1$ 时， $G a (1, λ) = E x p (λ)$ 。

验证： $Γ (1) = 1$ ，密度函数变为

p (x) = \frac{λ ^{1}}{Γ ( 1 )} x^{0} e^{- λ x} = λ e^{- λ x}, x > 0

这正是指数分布 $E x p (λ)$ 的密度函数。

特例 2：卡方分布。当 $α = \frac{n}{2}$ ， $λ = \frac{1}{2}$ 时， $G a (\frac{n}{2}, \frac{1}{2})$ 就是自由度为 $n$ 的卡方分布，记为 $χ^{2} (n)$ 。

卡方分布的密度函数为：

p (x) = \frac{1}{2 ^{n /2} Γ ( n /2 )} x^{n /2 - 1} e^{- x /2}, x > 0

卡方分布在统计推断中极为重要，是假设检验和区间估计的核心工具。

与泊松过程的关系

在参数为 $λ$ 的泊松过程中，==第 $n$ 次事件发生的等待时间== $T_{n} \sim G a (n, λ)$ 。

当 $n = 1$ 时， $T_{1} \sim G a (1, λ) = E x p (λ)$ ，即第一次事件发生的等待时间服从指数分布。

这说明伽马分布是指数分布在”等待第 $n$ 次事件”场景下的自然推广。

五、贝塔分布

贝塔分布描述的是 $(0, 1)$ 区间上的随机变量，常用于建模比例、概率等有界量。

贝塔函数

贝塔函数

称函数
$B (a, b) = \int_{0}^{1} x^{a - 1} (1 - x)^{b - 1} d x, a > 0, b > 0$
为贝塔函数。

贝塔函数与伽马函数的关系：

B (a, b) = \frac{Γ ( a ) Γ ( b )}{Γ ( a + b )}

这个关系非常重要，它将贝塔函数的计算转化为伽马函数的计算。

贝塔分布的定义

定义 2.5.5 — 贝塔分布

若连续随机变量 $X$ 的密度函数为
$p (x) = ⎩ ⎨ ⎧ \frac{Γ ( a + b )}{Γ ( a ) Γ ( b )} x^{a - 1} (1 - x)^{b - 1}, 0, 0 < x < 1 其他$
其中 $a > 0$ ， $b > 0$ 为参数，则称 $X$ 服从参数为 $(a, b)$ 的贝塔分布，记为 $X \sim B e (a, b)$ 。

参数的含义：

$a$ ：控制密度函数在 $x$ 接近 $1$ 时的行为。 $a$ 越大，密度越集中在 $1$ 附近。
$b$ ：控制密度函数在 $x$ 接近 $0$ 时的行为。 $b$ 越大，密度越集中在 $0$ 附近。
当 $a = b$ 时，密度函数关于 $x = 0.5$ 对称。

验证归一性：

\int_{0}^{1} \frac{Γ ( a + b )}{Γ ( a ) Γ ( b )} x^{a - 1} (1 - x)^{b - 1} d x = \frac{Γ ( a + b )}{Γ ( a ) Γ ( b )} \cdot B (a, b) = \frac{Γ ( a + b )}{Γ ( a ) Γ ( b )} \cdot \frac{Γ ( a ) Γ ( b )}{Γ ( a + b )} = 1 ✓

贝塔分布的期望和方差

定理 2.5.7 — 贝塔分布的期望和方差

若 $X \sim B e (a, b)$ ，则
$E (X) = \frac{a}{a + b}, Var (X) = \frac{ab}{( a + b ) ^{2} ( a + b + 1 )}$

证明

证明：

[贝塔函数性质]：

期望：
$E (X) = \int_{0}^{1} x \cdot \frac{Γ ( a + b )}{Γ ( a ) Γ ( b )} x^{a - 1} (1 - x)^{b - 1} d x = \frac{Γ ( a + b )}{Γ ( a ) Γ ( b )} \int_{0}^{1} x^{a} (1 - x)^{b - 1} d x$
积分部分正是 $B (a + 1, b)$ ：
$= \frac{Γ ( a + b )}{Γ ( a ) Γ ( b )} \cdot B (a + 1, b) = \frac{Γ ( a + b )}{Γ ( a ) Γ ( b )} \cdot \frac{Γ ( a + 1 ) Γ ( b )}{Γ ( a + b + 1 )}$
利用 $Γ (a + 1) = a Γ (a)$ 和 $Γ (a + b + 1) = (a + b) Γ (a + b)$ ：
$= \frac{Γ ( a + b )}{Γ ( a ) Γ ( b )} \cdot \frac{a Γ ( a ) Γ ( b )}{( a + b ) Γ ( a + b )} = \frac{a}{a + b}$
方差：类似地计算 $E (X^{2})$ ：
$E (X^{2}) = \frac{Γ ( a + b )}{Γ ( a ) Γ ( b )} \cdot B (a + 2, b) = \frac{Γ ( a + b )}{Γ ( a ) Γ ( b )} \cdot \frac{Γ ( a + 2 ) Γ ( b )}{Γ ( a + b + 2 )}$
利用 $Γ (a + 2) = (a + 1) a Γ (a)$ 和 $Γ (a + b + 2) = (a + b + 1) (a + b) Γ (a + b)$ ：
$= \frac{( a + 1 ) a}{( a + b + 1 ) ( a + b )}$
因此：
$Var (X) = E (X^{2}) - [E (X)]^{2} = \frac{a ( a + 1 )}{( a + b ) ( a + b + 1 )} - \frac{a ^{2}}{( a + b ) ^{2}}$
通分： $= \frac{a ( a + 1 ) ( a + b ) - a ^{2} ( a + b + 1 )}{( a + b ) ^{2} ( a + b + 1 )} = \frac{a ( a ^{2} + ab + a + b ) - a ^{3} - a ^{2} b - a ^{2}}{( a + b ) ^{2} ( a + b + 1 )} = \frac{ab}{( a + b ) ^{2} ( a + b + 1 )}$ $□$

贝塔分布的特例

特例：当 $a = 1$ ， $b = 1$ 时， $B e (1, 1) = U (0, 1)$ 。

验证： $Γ (1) = 1$ ， $Γ (2) = 1$ ，密度函数变为

p (x) = \frac{Γ ( 2 )}{Γ ( 1 ) Γ ( 1 )} x^{0} (1 - x)^{0} = \frac{1}{1 \cdot 1} \cdot 1 \cdot 1 = 1, 0 < x < 1

这正是 $(0, 1)$ 上的均匀分布。因此均匀分布是贝塔分布的特例。

六、各分布间的关系与汇总

分布关系图

graph TB
    A[均匀分布] -->|特例 Be1,1| B[贝塔分布]
    C[指数分布] -->|特例 Ga1,λ| D[伽马分布]
    D -->|特例 χ²n| E[卡方分布]
    C -->|无记忆性| F[泊松过程间隔]
    D -->|第n次等待时间| F
    G[正态分布] -->|中心极限定理| H[大量独立因素叠加]
    E -->|统计推断| I[假设检验与区间估计]
    B -->|贝叶斯推断| J[先验分布]
    C -->|寿命建模| K[可靠性理论]
    D -->|求和| L[独立指数分布之和]
    G -->|标准化| M[标准正态分布]

全分布汇总表

离散分布汇总

分布名称记号分布列/密度期望方差
二点分布 $b (1, p)$ $P (X = k) = p^{k} (1 - p)^{1 - k}$ ， $k = 0, 1$ $p$ $p (1 - p)$
二项分布 $b (n, p)$ $P (X = k) = (k n) p^{k} (1 - p)^{n - k}$ $n p$ $n p (1 - p)$
泊松分布 $P (λ)$ $P (X = k) = \frac{λ ^{k}}{k !} e^{- λ}$ $λ$ $λ$
几何分布 $G e (p)$ $P (X = k) = (1 - p)^{k - 1} p$ ， $k = 1, 2, \dots$ $\frac{1}{p}$ $\frac{1 - p}{p ^{2}}$
超几何分布 $H (n, M, N)$ $P (X = k) = \frac{( k M ) ( n - k N - M )}{( n N )}$ $\frac{n M}{N}$ $\frac{n M ( N - M ) ( N - n )}{N ^{2} ( N - 1 )}$
负二项分布 $N b (r, p)$ $P (X = k) = (r - 1 k - 1) p^{r} (1 - p)^{k - r}$ $\frac{r}{p}$ $\frac{r ( 1 - p )}{p ^{2}}$

分布名称	记号	分布列/密度	期望	方差
二点分布	$b (1, p)$	$P (X = k) = p^{k} (1 - p)^{1 - k}$ ， $k = 0, 1$	$p$	$p (1 - p)$
二项分布	$b (n, p)$	$P (X = k) = (k n) p^{k} (1 - p)^{n - k}$	$n p$	$n p (1 - p)$
泊松分布	$P (λ)$	$P (X = k) = \frac{λ ^{k}}{k !} e^{- λ}$	$λ$	$λ$
几何分布	$G e (p)$	$P (X = k) = (1 - p)^{k - 1} p$ ， $k = 1, 2, \dots$	$\frac{1}{p}$	$\frac{1 - p}{p ^{2}}$
超几何分布	$H (n, M, N)$	$P (X = k) = \frac{( k M ) ( n - k N - M )}{( n N )}$	$\frac{n M}{N}$	$\frac{n M ( N - M ) ( N - n )}{N ^{2} ( N - 1 )}$
负二项分布	$N b (r, p)$	$P (X = k) = (r - 1 k - 1) p^{r} (1 - p)^{k - r}$	$\frac{r}{p}$	$\frac{r ( 1 - p )}{p ^{2}}$

连续分布汇总

分布名称记号密度函数期望方差
均匀分布 $U (a, b)$ $p (x) = \frac{1}{b - a}$ ， $a < x < b$ $\frac{a + b}{2}$ $\frac{( b - a ) ^{2}}{12}$
指数分布 $E x p (λ)$ $p (x) = λ e^{- λ x}$ ， $x \geq 0$ $\frac{1}{λ}$ $\frac{1}{λ ^{2}}$
伽马分布 $G a (α, λ)$ $p (x) = \frac{λ ^{α}}{Γ ( α )} x^{α - 1} e^{- λ x}$ ， $x > 0$ $\frac{α}{λ}$ $\frac{α}{λ ^{2}}$
卡方分布 $χ^{2} (n)$ $p (x) = \frac{1}{2 ^{n /2} Γ ( n /2 )} x^{n /2 - 1} e^{- x /2}$ ， $x > 0$ $n$ $2 n$
贝塔分布 $B e (a, b)$ $p (x) = \frac{Γ ( a + b )}{Γ ( a ) Γ ( b )} x^{a - 1} (1 - x)^{b - 1}$ ， $0 < x < 1$ $\frac{a}{a + b}$ $\frac{ab}{( a + b ) ^{2} ( a + b + 1 )}$
正态分布 $N (μ, σ^{2})$ $p (x) = \frac{1}{2 π σ} e^{- \frac{( x - μ ) ^{2}}{2 σ ^{2}}}$ $μ$ $σ^{2}$
标准正态 $N (0, 1)$ $φ (u) = \frac{1}{2 π} e^{- u^{2} /2}$ $0$ $1$

分布名称	记号	密度函数	期望	方差
均匀分布	$U (a, b)$	$p (x) = \frac{1}{b - a}$ ， $a < x < b$	$\frac{a + b}{2}$	$\frac{( b - a ) ^{2}}{12}$
指数分布	$E x p (λ)$	$p (x) = λ e^{- λ x}$ ， $x \geq 0$	$\frac{1}{λ}$	$\frac{1}{λ ^{2}}$
伽马分布	$G a (α, λ)$	$p (x) = \frac{λ ^{α}}{Γ ( α )} x^{α - 1} e^{- λ x}$ ， $x > 0$	$\frac{α}{λ}$	$\frac{α}{λ ^{2}}$
卡方分布	$χ^{2} (n)$	$p (x) = \frac{1}{2 ^{n /2} Γ ( n /2 )} x^{n /2 - 1} e^{- x /2}$ ， $x > 0$	$n$	$2 n$
贝塔分布	$B e (a, b)$	$p (x) = \frac{Γ ( a + b )}{Γ ( a ) Γ ( b )} x^{a - 1} (1 - x)^{b - 1}$ ， $0 < x < 1$	$\frac{a}{a + b}$	$\frac{ab}{( a + b ) ^{2} ( a + b + 1 )}$
正态分布	$N (μ, σ^{2})$	$p (x) = \frac{1}{2 π σ} e^{- \frac{( x - μ ) ^{2}}{2 σ ^{2}}}$	$μ$	$σ^{2}$
标准正态	$N (0, 1)$	$φ (u) = \frac{1}{2 π} e^{- u^{2} /2}$	$0$	$1$

七、知识结构总览

graph LR
    A[2.5 常用连续分布] --> B[正态分布]
    A --> C[均匀分布]
    A --> D[指数分布]
    A --> E[伽马分布]
    A --> F[贝塔分布]

    B --> B1[标准化定理]
    B --> B2[三σ原则]
    B --> B3[期望与方差]

    C --> C1[分布函数]
    C --> C2[期望与方差]

    D --> D1[无记忆性]
    D --> D2[泊松过程]

    E --> E1[伽马函数]
    E --> E2[卡方分布特例]

    F --> F1[贝塔函数]
    F --> F2[均匀分布特例]

    D -->|Ga1,λ| E
    E -->|χ²n| G[卡方分布]
    C -->|Be1,1| F

八、核心思想与证明技巧

核心思想

标准化思想

正态分布的标准化定理是本节最重要的技巧。其核心思想是：通过线性变换将一般正态分布转化为标准正态分布，从而利用标准正态分布表进行概率计算。

X \sim N (μ, σ^{2}) U = \frac{X - μ}{σ} U \sim N (0, 1)

这种思想在统计推断中反复出现：t分布、F分布的构造都依赖于标准化。

无记忆性思想

指数分布的无记忆性是其最独特的性质。在离散分布中，几何分布是唯一具有无记忆性的分布；在连续分布中，指数分布是唯一具有无记忆性的分布。

无记忆性的本质是条件分布与原始分布相同：

P (X > s + t ∣ X > s) = P (X > t)

这意味着”已经等待了 $s$ 时间”这个信息对未来的等待时间没有任何影响。

分布族谱思想

五大连续分布并非孤立存在，而是构成一个有机的”家族”：

指数分布是伽马分布的特例（ $α = 1$ ）
卡方分布是伽马分布的特例（ $α = n /2$ ， $λ = 1/2$ ）
均匀分布是贝塔分布的特例（ $a = b = 1$ ）
正态分布是中心极限定理下的极限分布

理解这些关系，有助于构建完整的概率论知识网络。

证明技巧

分部积分法

在计算指数分布和伽马分布的期望方差时，分部积分法是最基本的工具。关键在于合理选择 $u$ 和 $d v$ ：

计算 $E (X)$ 时：令 $u = x$ ， $d v = p (x) d x$
计算 $E (X^{2})$ 时：令 $u = x^{2}$ ， $d v = p (x) d x$

边界项 $[- x^{n} e^{- λ x}]_{0}^{+ \infty}$ 通常为零，因为指数衰减比多项式增长快。

变量代换法

在验证归一性、计算期望方差时，变量代换 $t = λ x$ 是常用技巧，它可以将含参数 $λ$ 的积分转化为伽马函数的标准形式。

利用对称性

标准正态分布密度函数是偶函数，这一性质在概率计算中极为有用：

Φ (- u) = 1 - Φ (u) \int_{- \infty}^{+ \infty} u φ (u) d u = 0

和分解法

虽然本节未直接使用和分解法，但它是计算正态分布期望方差的关键：将 $X = μ + σ U$ 分解，利用期望的线性性简化计算。这一方法在§2.4中计算二项分布期望方差时已经使用过。

九、补充理解与易混淆点

正态分布就是钟形曲线分布

来源：教材 §2.5 课后讨论题 + 陈希孺《概率论》第三章 + Stack Exchange + MIT OCW 18.05 + Wikipedia 正态分布词条

误区分析

❌ 认为”只要密度曲线是钟形的，就一定是正态分布”。

✅ 钟形只是正态分布的必要条件，而非充分条件。许多其他分布（如 t 分布、Logistic 分布、Laplace 分布）的密度曲线也呈钟形，但它们不是正态分布。

正态分布的密度函数具有特定的解析形式 $p (x) = \frac{1}{2 π σ} e^{- \frac{( x - μ ) ^{2}}{2 σ ^{2}}}$ ，其判定需要验证密度函数的具体形式，而非仅凭形状判断。

标准差越小正态分布越矮

来源：教材 §2.5 密度函数图像分析 + Ross《概率论》第五章 + Casella & Berger 第四章 + 3Blue1Brown 视频 + 跨考考研复习指南

误区分析

❌ 认为”标准差 $σ$ 越小，正态分布的密度曲线越矮”。

✅ 事实恰恰相反： $σ$ 越小，密度曲线越高越窄。这是因为密度曲线下的总面积必须等于 $1$ （归一性）， $σ$ 越小意味着数据越集中，密度函数的峰值就越高。

具体地，密度函数的最大值为 $p (μ) = \frac{1}{2 π σ}$ ，显然 $σ$ 越小， $p (μ)$ 越大。

指数分布的无记忆性意味着过去不影响未来

来源：教材 §2.5 无记忆性定理 + Ross《概率模型》+ MIT OCW 6.041 + Stack Exchange + 《应用随机过程》教材

误区分析

❌ 笼统地认为”指数分布的无记忆性意味着过去完全不影响未来”，将其推广到所有场景。

✅ 无记忆性的成立需要严格的数学条件：

随机变量必须服从指数分布（连续情形）或几何分布（离散情形），这是唯一具有无记忆性的分布；

无记忆性描述的是条件概率 $P (X > s + t ∣ X > s) = P (X > t)$ ，而非一般性的”过去不影响未来”；

在实际应用中，无记忆性要求事件发生的过程具有独立增量性（如泊松过程），现实中很多寿命问题并不严格满足这一条件（如机器磨损会随时间累积）。

伽马分布就是卡方分布

来源：教材 §2.5 伽马与卡方关系 + Casella & Berger 伽马分布族 + Wackerly 卡方分布推导 + 跨考考研复习指南 + Wikipedia

误区分析

❌ 将伽马分布与卡方分布等同起来。

✅ 卡方分布 $χ^{2} (n)$ 是伽马分布 $G a (α, λ)$ 当 $α = n /2$ ， $λ = 1/2$ 时的特例。伽马分布是一个更广泛的分布族：

$G a (1, λ) = E x p (λ)$ （指数分布）

$G a (n /2, 1/2) = χ^{2} (n)$ （卡方分布）

一般的 $G a (α, λ)$ 包含上述所有特例

混淆两者的关系，类似于将”矩形”等同于”正方形”——正方形是矩形的特例，但矩形不都是正方形。

均匀分布是最简单的连续分布

来源：教材 §2.5 均匀与贝塔关系 + Gelman《贝叶斯数据分析》+ Robert《贝叶斯选择》+ Stack Exchange + 陈希孺《概率论》

误区分析

❌ 认为均匀分布是”最基本”的连续分布，与其他分布没有深层联系。

✅ 均匀分布 $U (0, 1)$ 实际上是贝塔分布 $B e (1, 1)$ 的特例。更重要的是，均匀分布在概率论中扮演着基础性角色：

概率积分变换：任何连续分布都可以通过均匀分布生成（逆变换法）；

贝叶斯统计中，均匀分布常被用作”无信息先验”；

随机数生成：计算机生成各种分布的随机数，第一步都是生成 $U (0, 1)$ 均匀随机数。

因此，均匀分布的”简单”只是表面上的，它在理论中的地位极为重要。

正态分布的期望和方差可以直接看出来

来源：教材 §2.5 定理2.5.2证明 + Feller《概率论》正态矩计算 + MIT OCW 18.05 + 跨考考研复习指南 + 3Blue1Brown 视频

误区分析

❌ 认为”正态分布 $N (μ, σ^{2})$ 的期望就是 $μ$ 、方差就是 $σ^{2}$ ，这是显然的，不需要证明”。

✅ 虽然 $μ$ 和 $σ^{2}$ 确实是正态分布的期望和方差，但这一结论需要严格的数学证明。证明的关键步骤包括：

利用标准化变换 $U = \frac{X - μ}{σ}$ 将问题归结为标准正态分布；

利用奇函数的对称性证明 $E (U) = 0$ ；

利用分部积分证明 $E (U^{2}) = 1$ ；

利用期望的线性性和方差的性质还原到一般正态分布。

这些证明技巧在概率论中反复出现，掌握它们对后续学习至关重要。

十、习题精选

习题概览

编号题目来源知识点难度
1 教材 2.5-1 正态分布标准化计算基础
2 教材 2.5-3 正态分布概率区间基础
3 教材 2.5-7 均匀分布概率计算基础
4 教材 2.5-10 指数分布无记忆性验证中等
5 教材 2.5-15 伽马函数性质证明中等
6 教材 2.5-18 贝塔分布期望方差推导中等
7 2015 南开大学 432 正态分布与方程判别式进阶
8 2014 东北师范大学 432 均匀分布与方程判别式进阶
9 2022 上海财经大学 432 概率积分变换进阶
10 2015 北京师范大学 432 指数分布无记忆性与 Gamma 分布进阶

编号	题目来源	知识点	难度
1	教材 2.5-1	正态分布标准化计算	基础
2	教材 2.5-3	正态分布概率区间	基础
3	教材 2.5-7	均匀分布概率计算	基础
4	教材 2.5-10	指数分布无记忆性验证	中等
5	教材 2.5-15	伽马函数性质证明	中等
6	教材 2.5-18	贝塔分布期望方差推导	中等
7	2015 南开大学 432	正态分布与方程判别式	进阶
8	2014 东北师范大学 432	均匀分布与方程判别式	进阶
9	2022 上海财经大学 432	概率积分变换	进阶
10	2015 北京师范大学 432	指数分布无记忆性与 Gamma 分布	进阶

教材习题

1. 教材 2.5-1：正态分布标准化计算

设 $X \sim N (3, 4)$ ，求下列概率：（1） $P (2 < X \leq 5)$ （2） $P (X > 0)$ （3） $P (∣ X ∣ > 1)$

查看解答

$X \sim N (3, 4)$ ，即 $μ = 3$ ， $σ = 2$ 。

（1）
$P (2 < X \leq 5) = Φ (\frac{5 - 3}{2}) - Φ (\frac{2 - 3}{2}) = Φ (1) - Φ (- 0.5) = Φ (1) - (1 - Φ (0.5))$ $= 0.8413 - (1 - 0.6915) = 0.8413 - 0.3085 = 0.5328$
（2）
$P (X > 0) = 1 - Φ (\frac{0 - 3}{2}) = 1 - Φ (- 1.5) = 1 - (1 - Φ (1.5)) = Φ (1.5) \approx 0.9332$
（3）
$P (∣ X ∣ > 1) = P (X > 1) + P (X < - 1)$ $P (X > 1) = 1 - Φ (\frac{1 - 3}{2}) = 1 - Φ (- 1) = Φ (1) \approx 0.8413$ $P (X < - 1) = Φ (\frac{- 1 - 3}{2}) = Φ (- 2) = 1 - Φ (2) \approx 0.0228$ $P (∣ X ∣ > 1) \approx 0.8413 + 0.0228 = 0.8641$

2. 教材 2.5-3：正态分布概率区间

设 $X \sim N (μ, σ^{2})$ ，已知 $P (X \leq - 1.6) = 0.036$ ， $P (X \leq 5.9) = 0.758$ 。求 $μ$ 和 $σ$ 。

查看解答

由标准化公式：
$P (X \leq - 1.6) = Φ (\frac{- 1.6 - μ}{σ}) = 0.036$ $P (X \leq 5.9) = Φ (\frac{5.9 - μ}{σ}) = 0.758$
查标准正态分布表：

$Φ (z) = 0.036$ 对应 $z \approx - 1.80$

$Φ (z) = 0.758$ 对应 $z \approx 0.70$

因此：
$\frac{- 1.6 - μ}{σ} = - 1.80 \dots (1)$ $\frac{5.9 - μ}{σ} = 0.70 \dots (2)$
由 (1)： $- 1.6 - μ = - 1.80 σ$ ，即 $μ = 1.80 σ - 1.6$

代入 (2)： $\frac{5.9 - ( 1.80 σ - 1.6 )}{0.70} = σ$
$5.9 - 1.80 σ + 1.6 = 0.70 σ$ $7.5 = 2.50 σ$ $σ = 3$ $μ = 1.80 \times 3 - 1.6 = 5.4 - 1.6 = 3.8$
因此 $μ = 3.8$ ， $σ = 3$ 。

3. 教材 2.5-7：均匀分布概率计算

设 $X \sim U (0, 5)$ ，求方程 $4 t^{2} + 4 Xt + X + 2 = 0$ 有实根的概率。

查看解答

二次方程 $4 t^{2} + 4 Xt + X + 2 = 0$ 有实根的条件是判别式非负：
$Δ = (4 X)^{2} - 4 \times 4 \times (X + 2) \geq 0$ $16 X^{2} - 16 (X + 2) \geq 0$ $X^{2} - X - 2 \geq 0$ $(X - 2) (X + 1) \geq 0$
由于 $X \sim U (0, 5)$ ， $X > 0$ ，因此只需 $X - 2 \geq 0$ ，即 $X \geq 2$ 。
$P (X \geq 2) = \int_{2}^{5} \frac{1}{5} d x = \frac{5 - 2}{5} = \frac{3}{5} = 0.6$

4. 教材 2.5-10：指数分布无记忆性验证

设 $X \sim E x p (λ)$ ，证明：对任意 $s, t > 0$ ， $P (X > s + t ∣ X > s) = P (X > t)$ ，并利用此结果计算：已知某元件已工作了 500 小时，求它再工作 300 小时的概率（设 $λ = 0.002$ ）。

查看解答

证明（见定理 2.5.5）：
$P (X > s + t ∣ X > s) = \frac{P ( X > s + t )}{P ( X > s )} = \frac{e ^{- λ (s + t)}}{e ^{- λ s}} = e^{- λ t} = P (X > t)$
计算：
$P (X > 500 + 300 ∣ X > 500) = P (X > 300) = e^{- 0.002 \times 300} = e^{- 0.6} \approx 0.5488$

5. 教材 2.5-15：伽马函数性质证明

证明： $Γ (n + \frac{1}{2}) = \frac{( 2 n )!}{4 ^{n} \cdot n !} π$ ，其中 $n$ 为非负整数。

查看解答

证明：对 $n$ 用数学归纳法。

基础步（ $n = 0$ ）：
$Γ (\frac{1}{2}) = π$
右边： $\frac{0 !}{4 ^{0} \cdot 0 !} π = π$ 。成立。

归纳步：假设 $Γ (n + \frac{1}{2}) = \frac{( 2 n )!}{4 ^{n} \cdot n !} π$ 成立。

由递推公式：
$Γ ((n + 1) + \frac{1}{2}) = (n + \frac{1}{2}) Γ (n + \frac{1}{2})$ $= \frac{2 n + 1}{2} \cdot \frac{( 2 n )!}{4 ^{n} \cdot n !} π = \frac{( 2 n + 1 ) ( 2 n )!}{2 \cdot 4 ^{n} \cdot n !} π$
注意到 $(2 n + 1) (2 n)! = (2 n + 1)!$ ，且 $2 \cdot 4^{n} = 2 \cdot 4^{n}$ ， $(n + 1)! = (n + 1) \cdot n!$ ：
$= \frac{( 2 n + 1 )!}{2 \cdot 4 ^{n} \cdot n !} π = \frac{( 2 n + 1 )! \cdot ( n + 1 )}{2 \cdot 4 ^{n} \cdot n ! \cdot ( n + 1 )} π$
另一种方式：直接验证
$\frac{( 2 ( n + 1 ))!}{4 ^{n + 1} \cdot ( n + 1 )!} = \frac{( 2 n + 2 )!}{4 ^{n + 1} \cdot ( n + 1 )!} = \frac{( 2 n + 2 ) ( 2 n + 1 )!}{4 \cdot 4 ^{n} \cdot ( n + 1 ) \cdot n !} = \frac{2 ( n + 1 ) ( 2 n + 1 )!}{4 \cdot 4 ^{n} \cdot ( n + 1 ) \cdot n !} = \frac{( 2 n + 1 )!}{2 \cdot 4 ^{n} \cdot n !}$
因此归纳步成立。 $□$

6. 教材 2.5-18：贝塔分布期望方差推导

设 $X \sim B e (a, b)$ ，利用贝塔函数与伽马函数的关系，推导 $E (X)$ 和 $Var (X)$ 。

查看解答

推导（见定理 2.5.7）：

期望：
$E (X) = \frac{Γ ( a + b )}{Γ ( a ) Γ ( b )} \int_{0}^{1} x^{a} (1 - x)^{b - 1} d x = \frac{Γ ( a + b )}{Γ ( a ) Γ ( b )} \cdot B (a + 1, b)$ $= \frac{Γ ( a + b )}{Γ ( a ) Γ ( b )} \cdot \frac{Γ ( a + 1 ) Γ ( b )}{Γ ( a + b + 1 )} = \frac{Γ ( a + b ) \cdot a Γ ( a ) \cdot Γ ( b )}{Γ ( a ) Γ ( b ) \cdot ( a + b ) Γ ( a + b )} = \frac{a}{a + b}$
方差：
$E (X^{2}) = \frac{Γ ( a + b )}{Γ ( a ) Γ ( b )} \cdot B (a + 2, b) = \frac{Γ ( a + b )}{Γ ( a ) Γ ( b )} \cdot \frac{Γ ( a + 2 ) Γ ( b )}{Γ ( a + b + 2 )}$ $= \frac{( a + 1 ) a}{( a + b + 1 ) ( a + b )}$ $Var (X) = \frac{( a + 1 ) a}{( a + b + 1 ) ( a + b )} - \frac{a ^{2}}{( a + b ) ^{2}} = \frac{ab}{( a + b ) ^{2} ( a + b + 1 )}$

考研真题

7. 2015 南开大学 432：正态分布与方程判别式

设 $X \sim N (μ, σ^{2})$ ，方程 $y^{2} + 4 y + X = 0$ 无实根的概率为 $\frac{1}{2}$ ，求 $μ$ 。

查看解答

方程 $y^{2} + 4 y + X = 0$ 的判别式为
$Δ = 16 - 4 X$
无实根的条件是 $Δ < 0$ ，即 $16 - 4 X < 0$ ，即 $X > 4$ 。

由题意 $P (X > 4) = \frac{1}{2}$ 。

由于 $X \sim N (μ, σ^{2})$ ，正态分布关于 $μ$ 对称，因此
$P (X > μ) = \frac{1}{2}$
由 $P (X > 4) = P (X > μ) = \frac{1}{2}$ ，得 $μ = 4$ 。

注意：此题不需要知道 $σ$ 的值，因为正态分布的中位数等于均值。

8. 2014 东北师范大学 432：均匀分布与方程判别式

设 $X \sim U (1, 6)$ ，求方程 $y^{2} + X y + 1 = 0$ 有实根的概率。

查看解答

方程 $y^{2} + X y + 1 = 0$ 的判别式为
$Δ = X^{2} - 4$
有实根的条件是 $Δ \geq 0$ ，即 $X^{2} \geq 4$ ，即 $X \geq 2$ 或 $X \leq - 2$ 。

由于 $X \sim U (1, 6)$ ， $X > 0$ ，因此只需 $X \geq 2$ 。
$P (X \geq 2) = \frac{6 - 2}{6 - 1} = \frac{4}{5}$

9. 2022 上海财经大学 432：概率积分变换

设 $U \sim U (0, 1)$ ，求函数 $g (u)$ 使得 $Y = g (U) \sim E x p (\frac{1}{2})$ 。

查看解答

方法：逆变换法（概率积分变换）。

设 $Y \sim E x p (\frac{1}{2})$ ，则 $Y$ 的分布函数为
$F_{Y} (y) = 1 - e^{- y /2}, y \geq 0$
逆变换法的原理：若 $U \sim U (0, 1)$ ，令 $Y = F_{Y}^{- 1} (U)$ ，则 $Y \sim E x p (\frac{1}{2})$ 。

令 $F_{Y} (y) = u$ ：
$1 - e^{- y /2} = u$ $e^{- y /2} = 1 - u$ $- \frac{y}{2} = ln (1 - u)$ $y = - 2 ln (1 - u)$
因此 $g (u) = - 2 ln (1 - u)$ 。

验证：由于 $U \sim U (0, 1)$ ，则 $1 - U \sim U (0, 1)$ ，因此也可以写成 $g (u) = - 2 ln u$ 。

10. 2015 北京师范大学 432：指数分布无记忆性与 Gamma 分布

某银行有两个窗口，王芳和李先生分别到达。设两个窗口的服务时间相互独立，均服从 $E x p (1)$ （单位：小时）。（1）求王芳比李先生先离开的概率；（2）求王芳最后离开的概率；（3）求李先生最后离开的概率。

查看解答

设王芳所在窗口的服务时间为 $X \sim E x p (1)$ ，李先生所在窗口的服务时间为 $Y \sim E x p (1)$ ， $X$ 与 $Y$ 独立。

（1）王芳比李先生先离开的概率
$P (X < Y) = \int_{0}^{+ \infty} \int_{0}^{y} f_{X} (x) f_{Y} (y) d x d y = \int_{0}^{+ \infty} e^{- y} (\int_{0}^{y} e^{- x} d x) d y$ $= \int_{0}^{+ \infty} e^{- y} (1 - e^{- y}) d y = \int_{0}^{+ \infty} e^{- y} d y - \int_{0}^{+ \infty} e^{- 2 y} d y = 1 - \frac{1}{2} = \frac{1}{2}$
直观理解：由对称性， $P (X < Y) = P (Y < X)$ ，而 $P (X = Y) = 0$ （连续分布），因此 $P (X < Y) = \frac{1}{2}$ 。

（2）王芳最后离开的概率

“王芳最后离开”等价于 $X > Y$ ，即王芳的服务时间比李先生长。
$P (X > Y) = P (Y < X) = \frac{1}{2}$
（3）李先生最后离开的概率

“李先生最后离开”等价于 $Y > X$ 。
$P (Y > X) = \frac{1}{2}$
注：如果题目改为三个窗口（王芳、李先生、张三），则每人最后离开的概率均为 $\frac{1}{3}$ （由对称性）。更一般地， $n$ 个独立同分布的指数分布随机变量，每个成为最大值的概率均为 $\frac{1}{n}$ 。

十一、教材原文

第二章随机变量及其分布/常用连续分布

数学笔记 Wiki

探索

2.5 常用连续分布

2.5 常用连续分布

一、正态分布

物理背景

正态分布的定义

密度函数的图像特征

标准正态分布

标准化定理

概率计算公式

3σ原则

正态分布的期望和方差

例题

二、均匀分布

均匀分布的定义

均匀分布的分布函数

均匀分布的期望和方差

例题

三、指数分布

指数分布的定义

指数分布的分布函数

指数分布的期望和方差

无记忆性

例题

四、伽马分布

伽马函数

伽马分布的定义

伽马分布的期望和方差

伽马分布的特例

五、贝塔分布

贝塔函数

贝塔分布的定义

贝塔分布的期望和方差

贝塔分布的特例

六、各分布间的关系与汇总

分布关系图

全分布汇总表

七、知识结构总览

八、核心思想与证明技巧

核心思想

标准化思想

无记忆性思想

分布族谱思想

证明技巧

分部积分法

变量代换法

利用对称性

和分解法

九、补充理解与易混淆点

正态分布就是钟形曲线分布

标准差越小正态分布越矮

指数分布的无记忆性意味着过去不影响未来

伽马分布就是卡方分布

均匀分布是最简单的连续分布

正态分布的期望和方差可以直接看出来

十、习题精选

教材习题

考研真题

十一、教材原文

关系图谱

目录

反向链接