2.5 常用连续分布
本节概览
本节介绍概率论中最重要的五大连续分布:正态分布、均匀分布、指数分布、伽马分布和贝塔分布。这些分布描述了不同场景下连续随机变量的统计规律性,是后续统计推断的理论基础。
逻辑链条:均匀分布(最基本连续分布)→ 指数分布(等待时间)→ 伽马分布(指数分布推广)→ 贝塔分布(区间上的分布)→ 正态分布(中心极限定理的终极形态)→ 分布间的关系与汇总
前置依赖:§2.1(密度函数、分布函数)、§2.2(期望、线性性)、§2.3(方差)、§1.4(条件概率)
核心主线:五大连续分布各有适用场景。正态分布 是自然界最常见的分布,由中心极限定理保证;指数分布 描述事件间隔时间,具有独特的无记忆性;伽马分布 是指数分布的自然推广;贝塔分布 描述 区间上的随机比例。
一、正态分布
正态分布是概率论中最重要的连续分布,也是整个统计学的基石。它由高斯(Gauss)在研究天文观测误差时系统提出,因此又称高斯分布。
物理背景
正态分布的物理背景源于高斯误差理论。高斯在研究天文观测数据时发现:
- 观测误差是由大量微小独立的随机因素叠加而成的;
- 这些因素中,正误差和负误差出现的可能性相等;
- 小误差出现的概率大于大误差出现的概率;
- 极大误差出现的概率趋近于零。
这就是著名的误差公理。数学上,当大量独立同分布的随机变量相加时,由中心极限定理保证,其和的分布趋近于正态分布。
生活中的正态分布:身高、体重、考试成绩、测量误差、分子运动速度等,都近似服从正态分布。
正态分布的定义
定义 2.5.1 — 正态分布
若连续随机变量 的密度函数为
其中 , 为参数,则称 服从参数为 的正态分布,记为 。
参数的含义:
- :位置参数(均值),决定密度曲线的中心位置。 越大,曲线越靠右。
- :尺度参数(方差),决定密度曲线的形状。 越小,曲线越集中(高而窄); 越大,曲线越分散(矮而宽)。
密度函数的验证:
需要验证 且 。
非负性显然成立(指数函数和分母均为正)。归一性的验证需要计算积分:
令 ,则 :
利用著名的概率积分 ,得 。
因此 。
密度函数的图像特征
正态分布的密度曲线具有以下重要特征:
- 对称性:关于 对称,即 。
- 单峰性:在 处取得最大值 。
- 渐近性:当 时,,曲线以 轴为渐近线。
- 拐点:在 处有拐点。
标准正态分布
标准正态分布
当 , 时的正态分布称为标准正态分布,记为 。其密度函数和分布函数分别记为
标准正态分布的重要性质:
- 对称性:,即密度函数是偶函数。
- 分布函数的对称关系:。
- 推导:由密度函数的对称性,
- :由对称性直接得出。
标准化定理
定理 2.5.1 — 标准化定理
若 ,则 。
证明
证明:需要证明 的密度函数为 。
[变量代换法]:设 的分布函数为 ,则 的分布函数为
对 求导,得 的密度函数:
将 的密度函数代入:
因此 。
标准化定理的意义在于:任何正态分布的概率计算都可以转化为标准正态分布的计算,只需查标准正态分布表即可。
概率计算公式
利用标准化定理,可以推导出正态分布的概率计算公式:
(1)单侧概率:
(2)区间概率:
(3)对称区间概率:
3σ原则
3σ原则
若 ,则
特别地:
- :
- :
- :
证明
证明:由标准化定理,
[对称性]:由 ,
查标准正态分布表:,,。
代入即得三个概率值。
3σ原则的实际意义:正态随机变量几乎肯定落在 内,落在该区间外的概率不到 。这是质量控制中”3σ准则”的理论基础。
正态分布的期望和方差
定理 2.5.2 — 正态分布的期望和方差
若 ,则
证明
证明:利用标准化定理,设 ,则 。
[标准化+线性性]:
第一步:计算 。
注意到被积函数 是奇函数,积分区间关于原点对称,因此
第二步:计算 。
第三步:计算 。
利用分部积分,令 ,,则 ,:
第一项在 时趋于 (指数衰减比多项式增长快)。第二项:
因此 。
第四步:计算 。
这验证了参数 和 确实是正态分布的期望和方差。
例题
例 2.5.1 — 正态分布概率计算
设 (即 ,,),求 。
解:利用标准化公式:
由对称性 :
查标准正态分布表:,。
即 。
例 2.5.2 — 正态分布分位数
设 ,求 使得 。
解:由标准正态分布函数的定义,
查标准正态分布表,,因此 。
这里 称为标准正态分布的==上 分位数==,记为 。
常用分位数:
- (单侧 )
- (双侧 )
- (双侧 )
二、均匀分布
均匀分布是最简单的连续分布,描述的是随机变量在某区间上”均匀”取值的情形。
均匀分布的定义
定义 2.5.2 — 均匀分布
若连续随机变量 的密度函数为
其中 为参数,则称 在区间 上服从均匀分布,记为 。
直观理解: 落在 内任何等长子区间上的概率相同。就像向线段 上随机投点,每个点被投中的概率密度相同。
验证归一性:
均匀分布的分布函数
由 §2.1 中分布函数的定义 :
分布函数在 上是线性增长的,从 单调递增到 。
均匀分布的期望和方差
定理 2.5.3 — 均匀分布的期望和方差
若 ,则
证明
证明:
[直接积分法]:
期望:
方差:先计算 :
因此:
通分(公分母为 ):
直观理解:
- 期望 :区间的中点,符合”均匀”的直觉。
- 方差 :区间越长,分散程度越大。
例题
例 2.5.3 — 均匀分布应用
某公共汽车站每隔 15 分钟一班,乘客到达车站的时刻是随机的。求乘客等候时间不超过 5 分钟的概率。
解:设乘客到达时刻为 (分钟),则 。
等候时间不超过 5 分钟,意味着乘客在班车到达前 5 分钟内到达。由于班车在 到达,乘客等候时间 (若 落在某一个 15 分钟区间内)。
等候时间不超过 5 分钟:,即 ,即 。
因此乘客等候时间不超过 5 分钟的概率为 。
三、指数分布
指数分布是描述等待时间和寿命的最重要的连续分布,在排队论、可靠性理论中有着广泛应用。
指数分布的定义
定义 2.5.3 — 指数分布
若连续随机变量 的密度函数为
其中 为参数,则称 服从参数为 的指数分布,记为 。
参数的含义: 是速率参数,表示单位时间内事件发生的平均次数。 越大,事件发生越频繁,等待时间越短。
验证归一性:
指数分布的分布函数
推导:当 时,
指数分布的期望和方差
定理 2.5.4 — 指数分布的期望和方差
若 ,则
证明
证明:
[分部积分法]:
期望:
令 ,,则 ,:
第一项:(指数衰减比多项式增长快),在 处为 。
第二项:。
因此 。
方差:先计算 :
两次分部积分(或利用伽马函数,见下节):
因此:
直观理解:
- 期望 :如果事件平均每小时发生 次,则平均等待时间为 小时。
- 标准差 :标准差等于均值,说明指数分布的离散程度相对较大。
无记忆性
定理 2.5.5 — 指数分布的无记忆性
若 ,则对任意 ,,有
证明
证明:
[条件概率+分布函数]:
由条件概率公式:
利用指数分布的尾部概率 :
无记忆性的含义:如果一件产品已经工作了 小时仍未损坏,那么它再工作 小时的概率,与一件新产品工作 小时的概率相同。换句话说,过去的"历史"不会影响未来的"寿命"。
生活类比:就像掷骰子——无论你已经掷了多少次没有出现 6 点,下一次掷出 6 点的概率始终是 。指数分布的”等待”也具有这种”不记仇”的特性。
与泊松过程的关系
在参数为 的泊松过程中,两次相邻事件之间的时间间隔服从 分布。这是指数分布最重要的物理背景之一。
例如:某服务台顾客到达服从参数为 的泊松过程,则相邻两位顾客到达的时间间隔 。
例题
例 2.5.4 — 指数分布无记忆性应用
某电子元件的寿命 (单位:小时)。已知该元件已正常工作了 200 小时,求它再正常工作 100 小时的概率。
解:由无记忆性,
注意:这个概率与元件已经工作了 200 小时这一事实无关!这正是无记忆性的体现。
四、伽马分布
伽马分布是指数分布的自然推广,也是卡方分布的理论基础。
伽马函数
伽马函数
称函数
为伽马函数。
伽马函数的基本性质:
性质 1:
性质 2:递推公式
分部积分:令 ,,则 ,:
推论:当 (正整数)时,。因此伽马函数是阶乘的推广。
性质 3:
令 ,则 ,:
其中利用了概率积分 。
伽马分布的定义
定义 2.5.4 — 伽马分布
若连续随机变量 的密度函数为
其中 , 为参数,则称 服从参数为 的伽马分布,记为 。
参数的含义:
- :形状参数,决定密度曲线的形状。 时单调递减, 时呈单峰状。
- :速率参数(尺度参数的倒数),与指数分布中的 含义相同。
验证归一性:
令 ,则 :
伽马分布的期望和方差
定理 2.5.6 — 伽马分布的期望和方差
若 ,则
证明
证明:
[伽马函数递推]:
期望:
令 :
由递推公式 :
方差:类似地计算 :
因此:
伽马分布的特例
特例 1:当 时,。
验证:,密度函数变为
这正是指数分布 的密度函数。
特例 2:卡方分布。当 , 时, 就是自由度为 的卡方分布,记为 。
卡方分布的密度函数为:
卡方分布在统计推断中极为重要,是假设检验和区间估计的核心工具。
与泊松过程的关系
在参数为 的泊松过程中,==第 次事件发生的等待时间== 。
当 时,,即第一次事件发生的等待时间服从指数分布。
这说明伽马分布是指数分布在”等待第 次事件”场景下的自然推广。
五、贝塔分布
贝塔分布描述的是 区间上的随机变量,常用于建模比例、概率等有界量。
贝塔函数
贝塔函数
称函数
为贝塔函数。
贝塔函数与伽马函数的关系:
这个关系非常重要,它将贝塔函数的计算转化为伽马函数的计算。
贝塔分布的定义
定义 2.5.5 — 贝塔分布
若连续随机变量 的密度函数为
其中 , 为参数,则称 服从参数为 的贝塔分布,记为 。
参数的含义:
- :控制密度函数在 接近 时的行为。 越大,密度越集中在 附近。
- :控制密度函数在 接近 时的行为。 越大,密度越集中在 附近。
- 当 时,密度函数关于 对称。
验证归一性:
贝塔分布的期望和方差
定理 2.5.7 — 贝塔分布的期望和方差
若 ,则
证明
证明:
[贝塔函数性质]:
期望:
积分部分正是 :
利用 和 :
方差:类似地计算 :
利用 和 :
因此:
通分:
贝塔分布的特例
特例:当 , 时,。
验证:,,密度函数变为
这正是 上的均匀分布。因此均匀分布是贝塔分布的特例。
六、各分布间的关系与汇总
分布关系图
graph TB A[均匀分布] -->|特例 Be1,1| B[贝塔分布] C[指数分布] -->|特例 Ga1,λ| D[伽马分布] D -->|特例 χ²n| E[卡方分布] C -->|无记忆性| F[泊松过程间隔] D -->|第n次等待时间| F G[正态分布] -->|中心极限定理| H[大量独立因素叠加] E -->|统计推断| I[假设检验与区间估计] B -->|贝叶斯推断| J[先验分布] C -->|寿命建模| K[可靠性理论] D -->|求和| L[独立指数分布之和] G -->|标准化| M[标准正态分布]
全分布汇总表
离散分布汇总
分布名称 记号 分布列/密度 期望 方差 二点分布 , 二项分布 泊松分布 几何分布 , 超几何分布 负二项分布
连续分布汇总
分布名称 记号 密度函数 期望 方差 均匀分布 , 指数分布 , 伽马分布 , 卡方分布 , 贝塔分布 , 正态分布 标准正态
七、知识结构总览
graph LR A[2.5 常用连续分布] --> B[正态分布] A --> C[均匀分布] A --> D[指数分布] A --> E[伽马分布] A --> F[贝塔分布] B --> B1[标准化定理] B --> B2[三σ原则] B --> B3[期望与方差] C --> C1[分布函数] C --> C2[期望与方差] D --> D1[无记忆性] D --> D2[泊松过程] E --> E1[伽马函数] E --> E2[卡方分布特例] F --> F1[贝塔函数] F --> F2[均匀分布特例] D -->|Ga1,λ| E E -->|χ²n| G[卡方分布] C -->|Be1,1| F
八、核心思想与证明技巧
核心思想
标准化思想
正态分布的标准化定理是本节最重要的技巧。其核心思想是:通过线性变换将一般正态分布转化为标准正态分布,从而利用标准正态分布表进行概率计算。
这种思想在统计推断中反复出现:t分布、F分布的构造都依赖于标准化。
无记忆性思想
指数分布的无记忆性是其最独特的性质。在离散分布中,几何分布是唯一具有无记忆性的分布;在连续分布中,指数分布是唯一具有无记忆性的分布。
无记忆性的本质是条件分布与原始分布相同:
这意味着”已经等待了 时间”这个信息对未来的等待时间没有任何影响。
分布族谱思想
五大连续分布并非孤立存在,而是构成一个有机的”家族”:
- 指数分布是伽马分布的特例()
- 卡方分布是伽马分布的特例(,)
- 均匀分布是贝塔分布的特例()
- 正态分布是中心极限定理下的极限分布
理解这些关系,有助于构建完整的概率论知识网络。
证明技巧
分部积分法
在计算指数分布和伽马分布的期望方差时,分部积分法是最基本的工具。关键在于合理选择 和 :
- 计算 时:令 ,
- 计算 时:令 ,
边界项 通常为零,因为指数衰减比多项式增长快。
变量代换法
在验证归一性、计算期望方差时,变量代换 是常用技巧,它可以将含参数 的积分转化为伽马函数的标准形式。
利用对称性
标准正态分布密度函数是偶函数,这一性质在概率计算中极为有用:
和分解法
虽然本节未直接使用和分解法,但它是计算正态分布期望方差的关键:将 分解,利用期望的线性性简化计算。这一方法在§2.4中计算二项分布期望方差时已经使用过。
九、补充理解与易混淆点
正态分布就是钟形曲线分布
来源:教材 §2.5 课后讨论题 + 陈希孺《概率论》第三章 + Stack Exchange + MIT OCW 18.05 + Wikipedia 正态分布词条
误区分析
❌ 认为”只要密度曲线是钟形的,就一定是正态分布”。
✅ 钟形只是正态分布的必要条件,而非充分条件。许多其他分布(如 t 分布、Logistic 分布、Laplace 分布)的密度曲线也呈钟形,但它们不是正态分布。
正态分布的密度函数具有特定的解析形式 ,其判定需要验证密度函数的具体形式,而非仅凭形状判断。
标准差越小正态分布越矮
来源:教材 §2.5 密度函数图像分析 + Ross《概率论》第五章 + Casella & Berger 第四章 + 3Blue1Brown 视频 + 跨考考研复习指南
误区分析
❌ 认为”标准差 越小,正态分布的密度曲线越矮”。
✅ 事实恰恰相反: 越小,密度曲线越高越窄。这是因为密度曲线下的总面积必须等于 (归一性), 越小意味着数据越集中,密度函数的峰值就越高。
具体地,密度函数的最大值为 ,显然 越小, 越大。
指数分布的无记忆性意味着过去不影响未来
来源:教材 §2.5 无记忆性定理 + Ross《概率模型》+ MIT OCW 6.041 + Stack Exchange + 《应用随机过程》教材
误区分析
❌ 笼统地认为”指数分布的无记忆性意味着过去完全不影响未来”,将其推广到所有场景。
✅ 无记忆性的成立需要严格的数学条件:
- 随机变量必须服从指数分布(连续情形)或几何分布(离散情形),这是唯一具有无记忆性的分布;
- 无记忆性描述的是条件概率 ,而非一般性的”过去不影响未来”;
- 在实际应用中,无记忆性要求事件发生的过程具有独立增量性(如泊松过程),现实中很多寿命问题并不严格满足这一条件(如机器磨损会随时间累积)。
伽马分布就是卡方分布
来源:教材 §2.5 伽马与卡方关系 + Casella & Berger 伽马分布族 + Wackerly 卡方分布推导 + 跨考考研复习指南 + Wikipedia
误区分析
❌ 将伽马分布与卡方分布等同起来。
✅ 卡方分布 是伽马分布 当 , 时的特例。伽马分布是一个更广泛的分布族:
- (指数分布)
- (卡方分布)
- 一般的 包含上述所有特例
混淆两者的关系,类似于将”矩形”等同于”正方形”——正方形是矩形的特例,但矩形不都是正方形。
均匀分布是最简单的连续分布
来源:教材 §2.5 均匀与贝塔关系 + Gelman《贝叶斯数据分析》+ Robert《贝叶斯选择》+ Stack Exchange + 陈希孺《概率论》
误区分析
❌ 认为均匀分布是”最基本”的连续分布,与其他分布没有深层联系。
✅ 均匀分布 实际上是贝塔分布 的特例。更重要的是,均匀分布在概率论中扮演着基础性角色:
- 概率积分变换:任何连续分布都可以通过均匀分布生成(逆变换法);
- 贝叶斯统计中,均匀分布常被用作”无信息先验”;
- 随机数生成:计算机生成各种分布的随机数,第一步都是生成 均匀随机数。
因此,均匀分布的”简单”只是表面上的,它在理论中的地位极为重要。
正态分布的期望和方差可以直接看出来
来源:教材 §2.5 定理2.5.2证明 + Feller《概率论》正态矩计算 + MIT OCW 18.05 + 跨考考研复习指南 + 3Blue1Brown 视频
误区分析
❌ 认为”正态分布 的期望就是 、方差就是 ,这是显然的,不需要证明”。
✅ 虽然 和 确实是正态分布的期望和方差,但这一结论需要严格的数学证明。证明的关键步骤包括:
- 利用标准化变换 将问题归结为标准正态分布;
- 利用奇函数的对称性证明 ;
- 利用分部积分证明 ;
- 利用期望的线性性和方差的性质还原到一般正态分布。
这些证明技巧在概率论中反复出现,掌握它们对后续学习至关重要。
十、习题精选
习题概览
编号 题目来源 知识点 难度 1 教材 2.5-1 正态分布标准化计算 基础 2 教材 2.5-3 正态分布概率区间 基础 3 教材 2.5-7 均匀分布概率计算 基础 4 教材 2.5-10 指数分布无记忆性验证 中等 5 教材 2.5-15 伽马函数性质证明 中等 6 教材 2.5-18 贝塔分布期望方差推导 中等 7 2015 南开大学 432 正态分布与方程判别式 进阶 8 2014 东北师范大学 432 均匀分布与方程判别式 进阶 9 2022 上海财经大学 432 概率积分变换 进阶 10 2015 北京师范大学 432 指数分布无记忆性与 Gamma 分布 进阶
教材习题
1. 教材 2.5-1:正态分布标准化计算
设 ,求下列概率: (1) (2) (3)
查看解答
,即 ,。
(1)
(2)
(3)
2. 教材 2.5-3:正态分布概率区间
设 ,已知 ,。求 和 。
查看解答
由标准化公式:
查标准正态分布表:
- 对应
- 对应
因此:
由 (1):,即
代入 (2):
因此 ,。
3. 教材 2.5-7:均匀分布概率计算
设 ,求方程 有实根的概率。
查看解答
二次方程 有实根的条件是判别式非负:
由于 ,,因此只需 ,即 。
4. 教材 2.5-10:指数分布无记忆性验证
设 ,证明:对任意 ,,并利用此结果计算:已知某元件已工作了 500 小时,求它再工作 300 小时的概率(设 )。
查看解答
证明(见定理 2.5.5):
计算:
5. 教材 2.5-15:伽马函数性质证明
证明:,其中 为非负整数。
查看解答
证明:对 用数学归纳法。
基础步():
右边:。成立。
归纳步:假设 成立。
由递推公式:
注意到 ,且 ,:
另一种方式:直接验证
因此归纳步成立。
6. 教材 2.5-18:贝塔分布期望方差推导
设 ,利用贝塔函数与伽马函数的关系,推导 和 。
查看解答
推导(见定理 2.5.7):
期望:
方差:
考研真题
7. 2015 南开大学 432:正态分布与方程判别式
设 ,方程 无实根的概率为 ,求 。
查看解答
方程 的判别式为
无实根的条件是 ,即 ,即 。
由题意 。
由于 ,正态分布关于 对称,因此
由 ,得 。
注意:此题不需要知道 的值,因为正态分布的中位数等于均值。
8. 2014 东北师范大学 432:均匀分布与方程判别式
设 ,求方程 有实根的概率。
查看解答
方程 的判别式为
有实根的条件是 ,即 ,即 或 。
由于 ,,因此只需 。
9. 2022 上海财经大学 432:概率积分变换
设 ,求函数 使得 。
查看解答
方法:逆变换法(概率积分变换)。
设 ,则 的分布函数为
逆变换法的原理:若 ,令 ,则 。
令 :
因此 。
验证:由于 ,则 ,因此也可以写成 。
10. 2015 北京师范大学 432:指数分布无记忆性与 Gamma 分布
某银行有两个窗口,王芳和李先生分别到达。设两个窗口的服务时间相互独立,均服从 (单位:小时)。 (1)求王芳比李先生先离开的概率; (2)求王芳最后离开的概率; (3)求李先生最后离开的概率。
查看解答
设王芳所在窗口的服务时间为 ,李先生所在窗口的服务时间为 , 与 独立。
(1)王芳比李先生先离开的概率
直观理解:由对称性,,而 (连续分布),因此 。
(2)王芳最后离开的概率
“王芳最后离开”等价于 ,即王芳的服务时间比李先生长。
(3)李先生最后离开的概率
“李先生最后离开”等价于 。
注:如果题目改为三个窗口(王芳、李先生、张三),则每人最后离开的概率均为 (由对称性)。更一般地, 个独立同分布的指数分布随机变量,每个成为最大值的概率均为 。
十一、教材原文
第二章 随机变量及其分布/常用连续分布