2.5 常用连续分布

本节概览

本节介绍概率论中最重要的五大连续分布:正态分布均匀分布指数分布伽马分布贝塔分布。这些分布描述了不同场景下连续随机变量的统计规律性,是后续统计推断的理论基础。

逻辑链条:均匀分布(最基本连续分布)→ 指数分布(等待时间)→ 伽马分布(指数分布推广)→ 贝塔分布(区间上的分布)→ 正态分布(中心极限定理的终极形态)→ 分布间的关系与汇总

前置依赖§2.1(密度函数、分布函数)、§2.2(期望、线性性)、§2.3(方差)、§1.4(条件概率)

核心主线:五大连续分布各有适用场景。正态分布 是自然界最常见的分布,由中心极限定理保证;指数分布 描述事件间隔时间,具有独特的无记忆性;伽马分布 是指数分布的自然推广;贝塔分布 描述 区间上的随机比例。


一、正态分布

正态分布是概率论中最重要的连续分布,也是整个统计学的基石。它由高斯(Gauss)在研究天文观测误差时系统提出,因此又称高斯分布

物理背景

正态分布的物理背景源于高斯误差理论。高斯在研究天文观测数据时发现:

  1. 观测误差是由大量微小独立的随机因素叠加而成的;
  2. 这些因素中,正误差和负误差出现的可能性相等;
  3. 小误差出现的概率大于大误差出现的概率;
  4. 极大误差出现的概率趋近于零。

这就是著名的误差公理。数学上,当大量独立同分布的随机变量相加时,由中心极限定理保证,其和的分布趋近于正态分布。

生活中的正态分布:身高、体重、考试成绩、测量误差、分子运动速度等,都近似服从正态分布。

正态分布的定义

定义 2.5.1 — 正态分布

若连续随机变量 的密度函数为

其中 为参数,则称 服从参数为 正态分布,记为

参数的含义

  • 位置参数(均值),决定密度曲线的中心位置。 越大,曲线越靠右。
  • 尺度参数(方差),决定密度曲线的形状。 越小,曲线越集中(高而窄); 越大,曲线越分散(矮而宽)。

密度函数的验证

需要验证

非负性显然成立(指数函数和分母均为正)。归一性的验证需要计算积分:

,则

利用著名的概率积分 ,得

因此

密度函数的图像特征

正态分布的密度曲线具有以下重要特征:

  1. 对称性:关于 对称,即
  2. 单峰性:在 处取得最大值
  3. 渐近性:当 时,,曲线以 轴为渐近线。
  4. 拐点:在 处有拐点。

标准正态分布

标准正态分布

时的正态分布称为标准正态分布,记为 。其密度函数和分布函数分别记为

标准正态分布的重要性质

  1. 对称性,即密度函数是偶函数。
  2. 分布函数的对称关系
    • 推导:由密度函数的对称性,
  3. :由对称性直接得出。

标准化定理

定理 2.5.1 — 标准化定理

,则

证明

证明:需要证明 的密度函数为

[变量代换法]:设 的分布函数为 ,则 的分布函数为

求导,得 的密度函数:

的密度函数代入:

因此

标准化定理的意义在于:任何正态分布的概率计算都可以转化为标准正态分布的计算,只需查标准正态分布表即可。

概率计算公式

利用标准化定理,可以推导出正态分布的概率计算公式:

(1)单侧概率

(2)区间概率

(3)对称区间概率

3σ原则

3σ原则

,则

特别地:

证明

证明:由标准化定理,

[对称性]:由

查标准正态分布表:

代入即得三个概率值。

3σ原则的实际意义:正态随机变量几乎肯定落在 内,落在该区间外的概率不到 。这是质量控制中”3σ准则”的理论基础。

正态分布的期望和方差

定理 2.5.2 — 正态分布的期望和方差

,则

证明

证明:利用标准化定理,设 ,则

[标准化+线性性]

第一步:计算

注意到被积函数 是奇函数,积分区间关于原点对称,因此

第二步:计算

第三步:计算

利用分部积分,令 ,则

第一项在 时趋于 (指数衰减比多项式增长快)。第二项:

因此

第四步:计算

这验证了参数 确实是正态分布的期望和方差。

例题

例 2.5.1 — 正态分布概率计算

(即 ),求

:利用标准化公式:

由对称性

查标准正态分布表:

例 2.5.2 — 正态分布分位数

,求 使得

:由标准正态分布函数的定义,

查标准正态分布表,,因此

这里 称为标准正态分布的==上 分位数==,记为

常用分位数

  • (单侧
  • (双侧
  • (双侧

二、均匀分布

均匀分布是最简单的连续分布,描述的是随机变量在某区间上”均匀”取值的情形。

均匀分布的定义

定义 2.5.2 — 均匀分布

若连续随机变量 的密度函数为

其中 为参数,则称 在区间 上服从均匀分布,记为

直观理解 落在 内任何等长子区间上的概率相同。就像向线段 上随机投点,每个点被投中的概率密度相同。

验证归一性

均匀分布的分布函数

§2.1 中分布函数的定义

分布函数在 上是线性增长的,从 单调递增到

均匀分布的期望和方差

定理 2.5.3 — 均匀分布的期望和方差

,则

证明

证明

[直接积分法]

期望

方差:先计算

因此:

通分(公分母为 ):

直观理解

  • 期望 :区间的中点,符合”均匀”的直觉。
  • 方差 :区间越长,分散程度越大。

例题

例 2.5.3 — 均匀分布应用

某公共汽车站每隔 15 分钟一班,乘客到达车站的时刻是随机的。求乘客等候时间不超过 5 分钟的概率。

:设乘客到达时刻为 (分钟),则

等候时间不超过 5 分钟,意味着乘客在班车到达前 5 分钟内到达。由于班车在 到达,乘客等候时间 (若 落在某一个 15 分钟区间内)。

等候时间不超过 5 分钟:,即 ,即

因此乘客等候时间不超过 5 分钟的概率为


三、指数分布

指数分布是描述等待时间寿命的最重要的连续分布,在排队论、可靠性理论中有着广泛应用。

指数分布的定义

定义 2.5.3 — 指数分布

若连续随机变量 的密度函数为

其中 为参数,则称 服从参数为 指数分布,记为

参数的含义速率参数,表示单位时间内事件发生的平均次数。 越大,事件发生越频繁,等待时间越短。

验证归一性

指数分布的分布函数

推导:当 时,

指数分布的期望和方差

定理 2.5.4 — 指数分布的期望和方差

,则

证明

证明

[分部积分法]

期望

,则

第一项:(指数衰减比多项式增长快),在 处为

第二项:

因此

方差:先计算

两次分部积分(或利用伽马函数,见下节):

因此:

直观理解

  • 期望 :如果事件平均每小时发生 次,则平均等待时间为 小时。
  • 标准差 :标准差等于均值,说明指数分布的离散程度相对较大。

无记忆性

定理 2.5.5 — 指数分布的无记忆性

,则对任意 ,有

证明

证明

[条件概率+分布函数]

由条件概率公式:

利用指数分布的尾部概率

无记忆性的含义:如果一件产品已经工作了 小时仍未损坏,那么它再工作 小时的概率,与一件新产品工作 小时的概率相同。换句话说,过去的"历史"不会影响未来的"寿命"

生活类比:就像掷骰子——无论你已经掷了多少次没有出现 6 点,下一次掷出 6 点的概率始终是 。指数分布的”等待”也具有这种”不记仇”的特性。

与泊松过程的关系

在参数为 泊松过程中,两次相邻事件之间的时间间隔服从 分布。这是指数分布最重要的物理背景之一。

例如:某服务台顾客到达服从参数为 的泊松过程,则相邻两位顾客到达的时间间隔

例题

例 2.5.4 — 指数分布无记忆性应用

某电子元件的寿命 (单位:小时)。已知该元件已正常工作了 200 小时,求它再正常工作 100 小时的概率。

:由无记忆性,

注意:这个概率与元件已经工作了 200 小时这一事实无关!这正是无记忆性的体现。


四、伽马分布

伽马分布是指数分布的自然推广,也是卡方分布的理论基础。

伽马函数

伽马函数

称函数

伽马函数

伽马函数的基本性质

性质 1

性质 2:递推公式

分部积分:令 ,则

推论:当 (正整数)时,。因此伽马函数是阶乘的推广。

性质 3

,则

其中利用了概率积分

伽马分布的定义

定义 2.5.4 — 伽马分布

若连续随机变量 的密度函数为

其中 为参数,则称 服从参数为 伽马分布,记为

参数的含义

  • 形状参数,决定密度曲线的形状。 时单调递减, 时呈单峰状。
  • 速率参数(尺度参数的倒数),与指数分布中的 含义相同。

验证归一性

,则

伽马分布的期望和方差

定理 2.5.6 — 伽马分布的期望和方差

,则

证明

证明

[伽马函数递推]

期望

由递推公式

方差:类似地计算

因此:

伽马分布的特例

特例 1:当 时,

验证:,密度函数变为

这正是指数分布 的密度函数。

特例 2卡方分布。当 时, 就是自由度为 卡方分布,记为

卡方分布的密度函数为:

卡方分布在统计推断中极为重要,是假设检验和区间估计的核心工具。

与泊松过程的关系

在参数为 的泊松过程中,==第 次事件发生的等待时间==

时,,即第一次事件发生的等待时间服从指数分布。

这说明伽马分布是指数分布在”等待第 次事件”场景下的自然推广。


五、贝塔分布

贝塔分布描述的是 区间上的随机变量,常用于建模比例、概率等有界量。

贝塔函数

贝塔函数

称函数

贝塔函数

贝塔函数与伽马函数的关系

这个关系非常重要,它将贝塔函数的计算转化为伽马函数的计算。

贝塔分布的定义

定义 2.5.5 — 贝塔分布

若连续随机变量 的密度函数为

其中 为参数,则称 服从参数为 贝塔分布,记为

参数的含义

  • :控制密度函数在 接近 时的行为。 越大,密度越集中在 附近。
  • :控制密度函数在 接近 时的行为。 越大,密度越集中在 附近。
  • 时,密度函数关于 对称。

验证归一性

贝塔分布的期望和方差

定理 2.5.7 — 贝塔分布的期望和方差

,则

证明

证明

[贝塔函数性质]

期望

积分部分正是

利用

方差:类似地计算

利用

因此:

通分:

贝塔分布的特例

特例:当 时,

验证:,密度函数变为

这正是 上的均匀分布。因此均匀分布是贝塔分布的特例。


六、各分布间的关系与汇总

分布关系图

graph TB
    A[均匀分布] -->|特例 Be1,1| B[贝塔分布]
    C[指数分布] -->|特例 Ga1,λ| D[伽马分布]
    D -->|特例 χ²n| E[卡方分布]
    C -->|无记忆性| F[泊松过程间隔]
    D -->|第n次等待时间| F
    G[正态分布] -->|中心极限定理| H[大量独立因素叠加]
    E -->|统计推断| I[假设检验与区间估计]
    B -->|贝叶斯推断| J[先验分布]
    C -->|寿命建模| K[可靠性理论]
    D -->|求和| L[独立指数分布之和]
    G -->|标准化| M[标准正态分布]

全分布汇总表

离散分布汇总

分布名称记号分布列/密度期望方差
二点分布
二项分布
泊松分布
几何分布
超几何分布
负二项分布

连续分布汇总

分布名称记号密度函数期望方差
均匀分布
指数分布
伽马分布
卡方分布
贝塔分布
正态分布
标准正态

七、知识结构总览

graph LR
    A[2.5 常用连续分布] --> B[正态分布]
    A --> C[均匀分布]
    A --> D[指数分布]
    A --> E[伽马分布]
    A --> F[贝塔分布]

    B --> B1[标准化定理]
    B --> B2[三σ原则]
    B --> B3[期望与方差]

    C --> C1[分布函数]
    C --> C2[期望与方差]

    D --> D1[无记忆性]
    D --> D2[泊松过程]

    E --> E1[伽马函数]
    E --> E2[卡方分布特例]

    F --> F1[贝塔函数]
    F --> F2[均匀分布特例]

    D -->|Ga1,λ| E
    E -->|χ²n| G[卡方分布]
    C -->|Be1,1| F

八、核心思想与证明技巧

核心思想

标准化思想

正态分布的标准化定理是本节最重要的技巧。其核心思想是:通过线性变换将一般正态分布转化为标准正态分布,从而利用标准正态分布表进行概率计算。

这种思想在统计推断中反复出现:t分布、F分布的构造都依赖于标准化。

无记忆性思想

指数分布的无记忆性是其最独特的性质。在离散分布中,几何分布是唯一具有无记忆性的分布;在连续分布中,指数分布是唯一具有无记忆性的分布。

无记忆性的本质是条件分布与原始分布相同

这意味着”已经等待了 时间”这个信息对未来的等待时间没有任何影响。

分布族谱思想

五大连续分布并非孤立存在,而是构成一个有机的”家族”:

  • 指数分布伽马分布的特例(
  • 卡方分布伽马分布的特例(
  • 均匀分布贝塔分布的特例(
  • 正态分布中心极限定理下的极限分布

理解这些关系,有助于构建完整的概率论知识网络。

证明技巧

分部积分法

在计算指数分布和伽马分布的期望方差时,分部积分法是最基本的工具。关键在于合理选择

  • 计算 时:令
  • 计算 时:令

边界项 通常为零,因为指数衰减比多项式增长快。

变量代换法

在验证归一性、计算期望方差时,变量代换 是常用技巧,它可以将含参数 的积分转化为伽马函数的标准形式。

利用对称性

标准正态分布密度函数是偶函数,这一性质在概率计算中极为有用:

和分解法

虽然本节未直接使用和分解法,但它是计算正态分布期望方差的关键:将 分解,利用期望的线性性简化计算。这一方法在§2.4中计算二项分布期望方差时已经使用过。


九、补充理解与易混淆点

正态分布就是钟形曲线分布

来源:教材 §2.5 课后讨论题 + 陈希孺《概率论》第三章 + Stack Exchange + MIT OCW 18.05 + Wikipedia 正态分布词条

误区分析

❌ 认为”只要密度曲线是钟形的,就一定是正态分布”。

✅ 钟形只是正态分布的必要条件,而非充分条件。许多其他分布(如 t 分布、Logistic 分布、Laplace 分布)的密度曲线也呈钟形,但它们不是正态分布。

正态分布的密度函数具有特定的解析形式 ,其判定需要验证密度函数的具体形式,而非仅凭形状判断。

标准差越小正态分布越矮

来源:教材 §2.5 密度函数图像分析 + Ross《概率论》第五章 + Casella & Berger 第四章 + 3Blue1Brown 视频 + 跨考考研复习指南

误区分析

❌ 认为”标准差 越小,正态分布的密度曲线越矮”。

✅ 事实恰恰相反: 越小,密度曲线越高越窄。这是因为密度曲线下的总面积必须等于 (归一性), 越小意味着数据越集中,密度函数的峰值就越高。

具体地,密度函数的最大值为 ,显然 越小, 越大。

指数分布的无记忆性意味着过去不影响未来

来源:教材 §2.5 无记忆性定理 + Ross《概率模型》+ MIT OCW 6.041 + Stack Exchange + 《应用随机过程》教材

误区分析

❌ 笼统地认为”指数分布的无记忆性意味着过去完全不影响未来”,将其推广到所有场景。

✅ 无记忆性的成立需要严格的数学条件

  1. 随机变量必须服从指数分布(连续情形)或几何分布(离散情形),这是唯一具有无记忆性的分布;
  2. 无记忆性描述的是条件概率 ,而非一般性的”过去不影响未来”;
  3. 在实际应用中,无记忆性要求事件发生的过程具有独立增量性(如泊松过程),现实中很多寿命问题并不严格满足这一条件(如机器磨损会随时间累积)。

伽马分布就是卡方分布

来源:教材 §2.5 伽马与卡方关系 + Casella & Berger 伽马分布族 + Wackerly 卡方分布推导 + 跨考考研复习指南 + Wikipedia

误区分析

❌ 将伽马分布与卡方分布等同起来。

✅ 卡方分布 是伽马分布 时的特例。伽马分布是一个更广泛的分布族:

  • (指数分布)
  • (卡方分布)
  • 一般的 包含上述所有特例

混淆两者的关系,类似于将”矩形”等同于”正方形”——正方形是矩形的特例,但矩形不都是正方形。

均匀分布是最简单的连续分布

来源:教材 §2.5 均匀与贝塔关系 + Gelman《贝叶斯数据分析》+ Robert《贝叶斯选择》+ Stack Exchange + 陈希孺《概率论》

误区分析

❌ 认为均匀分布是”最基本”的连续分布,与其他分布没有深层联系。

✅ 均匀分布 实际上是贝塔分布 的特例。更重要的是,均匀分布在概率论中扮演着基础性角色

  1. 概率积分变换:任何连续分布都可以通过均匀分布生成(逆变换法);
  2. 贝叶斯统计中,均匀分布常被用作”无信息先验”;
  3. 随机数生成:计算机生成各种分布的随机数,第一步都是生成 均匀随机数。

因此,均匀分布的”简单”只是表面上的,它在理论中的地位极为重要。

正态分布的期望和方差可以直接看出来

来源:教材 §2.5 定理2.5.2证明 + Feller《概率论》正态矩计算 + MIT OCW 18.05 + 跨考考研复习指南 + 3Blue1Brown 视频

误区分析

❌ 认为”正态分布 的期望就是 、方差就是 ,这是显然的,不需要证明”。

✅ 虽然 确实是正态分布的期望和方差,但这一结论需要严格的数学证明。证明的关键步骤包括:

  1. 利用标准化变换 将问题归结为标准正态分布;
  2. 利用奇函数的对称性证明
  3. 利用分部积分证明
  4. 利用期望的线性性和方差的性质还原到一般正态分布。

这些证明技巧在概率论中反复出现,掌握它们对后续学习至关重要。


十、习题精选

习题概览

编号题目来源知识点难度
1教材 2.5-1正态分布标准化计算基础
2教材 2.5-3正态分布概率区间基础
3教材 2.5-7均匀分布概率计算基础
4教材 2.5-10指数分布无记忆性验证中等
5教材 2.5-15伽马函数性质证明中等
6教材 2.5-18贝塔分布期望方差推导中等
72015 南开大学 432正态分布与方程判别式进阶
82014 东北师范大学 432均匀分布与方程判别式进阶
92022 上海财经大学 432概率积分变换进阶
102015 北京师范大学 432指数分布无记忆性与 Gamma 分布进阶

教材习题

1. 教材 2.5-1:正态分布标准化计算

,求下列概率: (1) (2) (3)

2. 教材 2.5-3:正态分布概率区间

,已知 。求

3. 教材 2.5-7:均匀分布概率计算

,求方程 有实根的概率。

4. 教材 2.5-10:指数分布无记忆性验证

,证明:对任意 ,并利用此结果计算:已知某元件已工作了 500 小时,求它再工作 300 小时的概率(设 )。

5. 教材 2.5-15:伽马函数性质证明

证明:,其中 为非负整数。

6. 教材 2.5-18:贝塔分布期望方差推导

,利用贝塔函数与伽马函数的关系,推导


考研真题

7. 2015 南开大学 432:正态分布与方程判别式

,方程 无实根的概率为 ,求

8. 2014 东北师范大学 432:均匀分布与方程判别式

,求方程 有实根的概率。

9. 2022 上海财经大学 432:概率积分变换

,求函数 使得

10. 2015 北京师范大学 432:指数分布无记忆性与 Gamma 分布

某银行有两个窗口,王芳和李先生分别到达。设两个窗口的服务时间相互独立,均服从 (单位:小时)。 (1)求王芳比李先生先离开的概率; (2)求王芳最后离开的概率; (3)求李先生最后离开的概率。


十一、教材原文


第二章 随机变量及其分布/常用连续分布