2.4 常用离散分布

本节概览

本节介绍概率论中最重要的五大离散分布:二项分布泊松分布超几何分布几何分布负二项分布。这些分布描述了不同场景下离散随机变量的统计规律性,是后续统计推断的理论基础。

逻辑链条:二点分布(伯努利试验)→ 二项分布(n重伯努利试验)→ 泊松分布(稀有事件近似)→ 超几何分布(不放回抽样)→ 几何分布(首次成功)→ 负二项分布(第r次成功)→ 分布间的关系与近似

前置依赖§2.1(分布列)、§2.2(期望、线性性)、§2.3(方差)、§1.5(事件的独立性)

核心主线:五大离散分布各有适用场景。二项分布 描述n次独立试验中成功的次数;泊松分布 描述稀有事件的计数;几何分布 描述首次成功所需的试验次数。泊松定理 (n大p小)是重要的近似工具。


一、二点分布与二项分布

伯努利试验与二点分布

定义 2.4.1 — 二点分布(伯努利分布)

设随机变量 只可能取 两个值,其分布列为

其中 ,则称 服从二点分布(或伯努利分布),记为

二点分布是最简单的离散分布,它描述的是一次伯努利试验的结果:

  • 伯努利试验:只有两种可能结果的随机试验,通常称为”成功”()和”失败”()。
  • 现实中的例子:抛一次硬币(正面/反面)、检验一件产品(合格/不合格)、一次投篮(命中/未中)。

二点分布的数字特征

利用 §2.2 的定义直接计算:

二项分布的定义

定义 2.4.2 — 二项分布

设随机变量 的分布列为

其中 ,则称 服从参数为 二项分布,记为

二项分布描述的是n重伯努利试验中成功的总次数。所谓n重伯努利试验,是指:

  1. 试验由 次独立的伯努利试验组成;
  2. 每次试验只有”成功”和”失败”两种结果;
  3. 每次试验中成功的概率 保持不变。

分布列的推导:在 次试验中恰好有 次成功,需要满足:

  • 次试验中选出 次: 种方式;
  • 选定的 次每次都成功:概率为
  • 剩余的 次每次都失败:概率为

§1.5 中事件的独立性,三者相乘即得分布列。

验证归一性:由二项式定理,

二项分布的期望和方差

定理 2.4.1 — 二项分布的数字特征

,则

证明思路

证明:采用和分解法——将 表示为 个独立同分布的二点分布之和。

为第 次试验的结果,即

,且由试验的独立性知 相互独立。

显然 (成功总次数 = 各次成功次数之和)。

[和分解法]:利用 §2.2 中期望的线性性和 §2.3 中方差的性质:

由于 相互独立,

和分解法的意义:这是概率论中极其重要的技巧——将复杂的随机变量分解为简单的、独立的随机变量之和,然后利用期望和方差的线性性来简化计算。这一方法在后续章节中会反复出现。

二项分布的例题

例 2.4.1 — 疾病治疗有效率

某种疾病的治疗有效率为 。现有 名患者接受治疗,求至少有 人被治愈的概率。

:设 名患者中被治愈的人数,则

所求概率为:

逐项计算:

因此:

即至少 人被治愈的概率约为

例 2.4.2 — 已知概率反求参数

,已知 ,求 ,其中

:先由 的条件求出

因此:

再计算

例 2.4.3 — 棋手比赛

甲、乙两名棋手比赛。每局甲胜的概率为 ,乙胜的概率为 (假设没有平局)。共比赛 局,求甲胜的局数多于乙胜的局数的概率。

:设 为甲在 局中获胜的局数,则

甲胜局数多于乙胜局数,即 (因为 等价于 )。

逐项计算:

甲胜局数多于乙的概率约为


二、泊松分布

泊松分布的定义

定义 2.4.3 — 泊松分布

设随机变量 的分布列为

其中 为常数,则称 服从参数为 泊松分布,记为

泊松分布由法国数学家 Simeon-Denis Poisson 于 1837 年提出,最初用于描述稀有事件在单位时间/空间内发生的次数。

泊松分布的典型应用场景

场景 的含义典型
电话交换台单位时间内接到的呼叫次数 次/分钟
放射性物质单位时间内发射的粒子数 次/秒
纺织品每平方米布料上的瑕疵数 个/平方米
交通事故某路口每月的事故数 次/月
服务器单位时间内收到的请求次数 次/秒

验证归一性

这里利用了 的泰勒展开式

泊松分布的期望和方差

定理 2.4.2 — 泊松分布的数字特征

,则

证明思路

证明:利用 §2.2 的定义和泊松分布的分布列。

期望

注意 的项为零,故从 开始。利用

,则

[换元求和]:关键技巧是将求和指标平移,重新利用 的展开式。

方差:先求

利用

第二个求和就是 。对于第一个求和:

因此 ,从而

泊松分布的期望等于方差,这是它最显著的特征之一,也是判断数据是否服从泊松分布的重要依据。

泊松分布的例题

例 2.4.4 — 铸件砂眼

某铸件上的砂眼数 服从参数 的泊松分布。规定砂眼数不超过 个的铸件为合格品。(1)求铸件为合格品的概率;(2)求铸件为不合格品的概率。

(1)合格品要求

(2)不合格品要求

例 2.4.5 — 库存决策

某商店某种商品的销售量 服从参数 的泊松分布。问月初应库存多少件该商品,才能以不小于 的概率满足当月需求?

:设月初库存 件,需要求最小的 使得

即:

逐项累加计算:

累加至

因此,月初应库存 件,才能以不小于 的概率满足需求。

泊松定理

定理 2.4.3 — 泊松定理

,其中 为常数),则对任意固定的非负整数

证明思路

证明:设 ,则 ,且

[取极限]:将二项分布的分布列展开并逐步取极限。

将其分解为三个因子:

因子一

因子二

因子三

其中利用了重要极限

三个因子相乘,即得

泊松定理的实用意义:当 很大、 很小、 适中时,二项分布 可以用泊松分布 来近似:

这一近似大大简化了计算,因为直接计算 很大时非常困难。


三、泊松近似的应用

核心思想

泊松定理的实际应用:当 较大(通常 )、 较小(通常 )时,用泊松分布 (其中 )近似二项分布 ,可以大幅简化计算。

例题精讲

例 2.4.6 — 发病率问题

某地区某种疾病的发病率为 。现检查 人,求至少有 人患病的概率。

:设 人中患病的人数,则

直接计算:

的计算非常困难。由于 很大、 很小,使用泊松近似。

,则

即至少有 人患病的概率约为

例 2.4.7 — 保险问题

某保险公司有 名同年龄段的人参保,每人每年死亡的概率为 。参保人每年交保费 元,若死亡则保险公司赔付 元。求:(1)保险公司亏本的概率;(2)保险公司获利不少于 元的概率。

:设 为一年中死亡的人数,则

由于 很大、 很小,取 ,用 近似。

保险公司总收入: 元。 赔付总额: 元。

(1)亏本,即

由于 是极端事件,概率几乎为零(),保险公司几乎不可能亏本。

(2)获利不少于 ,即 ,即

由于 距离均值约 个标准差,概率非常接近 )。

结论:在给定的条件下,保险公司亏本的概率几乎为零,获利不少于 元的概率几乎为 。这体现了大数定律在保险业中的基础作用。

例 2.4.8 — 维修工问题

某工厂有 台同类型设备,各台设备的工作是相互独立的,发生故障的概率均为 。一台设备的故障由一名维修工处理。考虑以下三种配置方案:

  • 方案一: 名维修工负责 台设备;
  • 方案二: 名维修工各负责 台设备;
  • 方案三: 名维修工各负责 台设备(共 台)。

比较三种方案下设备发生故障但不能及时修理的概率。

:设 为同时发生故障的设备数。

方案一,用 近似。

不能及时修理的条件:(只有 名维修工)。

方案二:每名维修工负责 台设备,,用 近似。

不能及时修理的条件:(每名维修工只能处理 台)。

方案三:每名维修工负责 台设备,,用 近似。

不能及时修理的条件:

比较

方案维修工人数每人负责台数不能及时修理概率
18019.12%
2406.16%
3273.05%

增加维修工人数可以显著降低设备不能及时修理的概率,但边际效益递减。

泊松近似的适用条件

泊松近似 的精度取决于 的具体取值:

  • 时,近似效果通常很好;
  • 时,近似效果极佳;
  • 较大(如 )时,泊松近似不再适用,应考虑正态近似。

经验法则 越大、 越小、 适中(),泊松近似效果越好。


四、超几何分布

超几何分布的定义

定义 2.4.4 — 超几何分布

设一批产品共 件,其中有 件次品。从中不放回地随机抽取 件,设 为抽到的次品数,则 的分布列为

服从参数为 超几何分布,记为

分布列的推导

  • 件产品中抽取 件,总共有 种等可能方式;
  • 要恰好抽到 件次品:从 件次品中选 件( 种方式),从 件正品中选 件( 种方式);
  • 由乘法原理,有利方式数为

的取值范围 必须同时满足 (次品数不超过总次品数)和 (正品数不超过总正品数),因此

超几何分布的期望

定理 2.4.4 — 超几何分布的期望

,则

证明思路

证明:同样采用和分解法

为第 次抽样的结果( 表示抽到次品, 表示抽到正品),则

注意:不放回抽样中 不独立,但期望的线性性不要求独立性。

[期望线性性]

对于任意 。由对称性,每次抽样抽到次品的概率相同:

这是因为无论第几次抽样,从整体来看,每件产品被抽到的概率是均等的。

因此

超几何分布的方差

定理 2.4.5 — 超几何分布的方差

,则

证明思路

证明:利用和分解 ,其中 为第 次抽样的指示变量。

[关键词]

由于

对于 。由于不放回抽样:

共有 ,因此:

与二项分布方差的对比

特征超几何分布二项分布
方差
有限总体校正因子无(无限总体)

时,,超几何分布的方差趋近于二项分布的方差 有限总体校正因子 说明不放回抽样的方差更小(信息量更大)。

超几何分布与二项分布的关系

定理 2.4.6 — 超几何分布的二项近似

很大、 相对 很小(即 )时,不放回抽样与有放回抽样差别很小,此时

直观理解:当 很大而 很小时,每次抽样后总体成分变化微乎其微,不放回抽样近似于有放回抽样。

经验法则:当 (即抽样比例不超过 )时,超几何分布可以用二项分布很好地近似。

两者的核心区别

特征超几何分布 二项分布
抽样方式不放回有放回
各次试验不独立独立
成功概率每次变化每次相同
适用条件总体有限总体无限或近似无限

五、几何分布与负二项分布

几何分布的定义

定义 2.4.5 — 几何分布

在一系列独立的伯努利试验中,每次试验成功的概率为 )。设 首次成功所需的试验次数,则 的分布列为

服从参数为 几何分布,记为

分布列的推导:首次成功出现在第 次试验,意味着前 次都失败、第 次成功。由独立性:

验证归一性(利用等比级数):

几何分布的期望和方差

定理 2.4.7 — 几何分布的数字特征

,则

证明思路

证明

期望

利用求和公式 ),取

[幂级数求和]:关键技巧是利用幂级数

方差:先求 。利用

第二项即 。第一项:

利用 ),取

因此:

直观理解 意味着如果每次成功概率为 ,平均需要 次试验才能首次成功。例如, 时平均需要 次。

几何分布的无记忆性

定理 2.4.8 — 几何分布的无记忆性

,则对任意正整数

证明思路

证明:首先计算尾部概率

,这表示前 次全部失败的概率。

[尾部概率]:关键步骤是求出 的简洁形式。

然后利用条件概率公式:

无记忆性的含义:如果已知前 次试验都失败了,那么从第 次开始,首次成功所需的额外试验次数仍然服从 。换句话说,“过去”的失败记录不会影响”未来”的成功概率——几何分布”忘记”了过去。

生活类比:就像反复掷一枚均匀的骰子,等待首次出现 点。无论之前掷了多少次都没有出现 点,下一次掷出 点的概率始终是 ,之前的历史不会改变未来的概率。

无记忆性是几何分布的本质特征,在离散分布中只有几何分布具有这一性质(在连续分布中只有指数分布具有无记忆性)。

负二项分布的定义

定义 2.4.6 — 负二项分布

在一系列独立的伯努利试验中,每次试验成功的概率为 )。设 为==第 次成功所需的试验次数==,则 的分布列为

服从参数为 负二项分布,记为

分布列的推导:第 次成功出现在第 次试验,意味着:

  • 次试验中恰好有 次成功: 种方式;
  • 次中 次成功、 次失败:概率为
  • 次试验成功:概率为

三者相乘即得分布列。

负二项分布与几何分布的关系

几何分布是负二项分布的特例:当 时,

这正是 的分布列。

负二项分布的分解:设 ,则 可以分解为 个独立的几何分布之和:

其中 相互独立,且

直观理解 是首次成功所需的试验次数, 是从第 次试验开始到第二次成功所需的额外试验次数,……, 是从第 次成功之后到第 次成功所需的额外试验次数。由无记忆性,每个 都服从 且相互独立。

负二项分布的数字特征

定理 2.4.9 — 负二项分布的数字特征

,则

证明思路

证明:利用分解 ,其中 且相互独立。

[和分解法]


六、各分布间的关系与汇总

期望方差公式汇总

分布记号分布列期望方差
二点分布,
二项分布,
泊松分布,
超几何分布
几何分布,
负二项分布,

分布间的关系图

graph TD
    A[常用离散分布] --> B[二点分布]
    A --> C[二项分布]
    A --> D[泊松分布]
    A --> E[超几何分布]
    A --> F[几何分布]
    A --> G[负二项分布]

    B --> B1[伯努利试验]
    B --> C1[n个独立二点分布之和]

    C --> C1
    C --> D1[泊松近似]

    D --> D1
    D --> D2[稀有事件计数]

    E --> E1[不放回抽样]
    E --> C2[二项近似]

    F --> F1[首次成功]
    F --> F2[无记忆性]
    F --> G1[r个几何分布之和]

    G --> G1

近似关系总结

  1. 超几何分布 → 二项分布:当 时(抽样比例很小),

    • 本质:不放回抽样近似为有放回抽样。
  2. 二项分布 → 泊松分布:当 大、 小、 适中时,

    • 本质:大量试验中稀有事件的发生次数。
  3. 近似链

记忆技巧

  • 二项分布的期望 :每次试验期望贡献 次就是
  • 泊松分布的期望 方差 :泊松分布独有特征;
  • 几何分布的期望 :概率越小,等待越久()。

七、知识结构总览

graph TD
    A[常用离散分布] --> B[二点分布]
    A --> C[二项分布]
    A --> D[泊松分布]
    A --> E[超几何分布]
    A --> F[几何分布]
    A --> G[负二项分布]

    B --> B1[伯努利试验]
    B --> C1[n个独立二点分布之和]

    C --> C1
    C --> D1[泊松近似]

    D --> D1
    D --> D2[稀有事件计数]

    E --> E1[不放回抽样]
    E --> C2[二项近似]

    F --> F1[首次成功]
    F --> F2[无记忆性]
    F --> G1[r个几何分布之和]

    G --> G1

八、核心思想与证明技巧

和分解法

和分解法是概率论中最重要的计算技巧之一。其核心思想是:

将一个复杂的随机变量 分解为若干个简单的、容易处理的随机变量 之和,然后利用期望和方差的线性性来计算

应用实例

  • 二项分布 ,且 相互独立;
  • 超几何分布 ,但 不独立;
  • 负二项分布 ,且 相互独立。

注意事项

  • 期望的线性性不需要独立性 恒成立;
  • 方差的线性性需要独立性 仅在 独立时成立。

泊松定理的证明思路

泊松定理的证明展示了概率论中取极限的典型方法:

  1. 将二项分布的分布列展开为三个因子的乘积;
  2. 分别对每个因子取 的极限;
  3. 利用基本极限

关键观察:当 很大时, 中的阶乘项很难直接计算,但通过极限过程可以将其转化为泊松分布的简洁形式。

几何分布无记忆性的证明

无记忆性的证明依赖于尾部概率的简洁形式:

一旦得到这个简洁形式,条件概率的计算就变得非常直接:

推广:无记忆性可以作为几何分布的等价定义——如果一个取正整数值的随机变量满足无记忆性,则它一定服从几何分布。

近似链

三大离散分布之间的近似关系构成了一个完整的链条:

这条近似链的实际意义在于:

  • 当总体很大时,超几何分布的计算(涉及组合数)可以用二项分布简化;
  • 当试验次数很大且成功概率很小时,二项分布的计算可以用泊松分布进一步简化。

期望方差公式的记忆技巧

记忆维度技巧
二项分布 期望 次试验,每次贡献 ;方差 :在期望基础上乘以”失败概率”
泊松分布 期望 方差 :泊松分布独有特征, 既是平均发生率也是波动程度
几何分布 期望 :概率越小等待越久;方差 :比期望的平方小
负二项分布 期望 :几何分布期望的 倍;方差 :几何分布方差的

九、补充理解与易混淆点

二项分布的独立性要求

来源:教材p84 + MIT 18.05 + Stanford Stat 116 + 华东师大讲义 + 中科大讲义

误区1:"二项分布要求每次试验概率相同"

❌ 错误解释:只要做n次试验,结果只有成功/失败两种,就服从二项分布。 ✅ 正确解释:二项分布要求n次试验独立每次成功概率p相同。如果不独立或p变化,则不服从二项分布。

深入理解:二项分布的两个核心假设缺一不可:

  • 独立性:各次试验的结果互不影响。例如,如果从少量产品中不放回抽样,各次抽样的结果就不独立。
  • 概率相同:每次试验成功的概率保持不变。例如,如果随着时间推移设备老化导致故障率变化,则不满足此条件。

泊松分布期望等于方差

来源:教材p86 + MIT 18.05 + UCLA Stats 100A + 华东师大讲义 + 五三多校真题

误区2:"泊松分布的期望和方差可以不同"

❌ 错误解释:泊松分布的期望和方差像其他分布一样,一般是不同的值。 ✅ 正确解释:泊松分布期望等于方差。这是泊松分布独有的特征,可以用来检验数据是否服从泊松分布。如果样本均值远不等于样本方差,则不太可能服从泊松分布。

实际应用:在数据分析中,如果观察到样本均值 和样本方差 近似相等,这是一个信号,提示数据可能服从泊松分布。这是判断分布类型的重要诊断工具。

无记忆性并非普遍性质

来源:教材p90 + MIT 18.05 + Stanford Stat 116 + 华东师大讲义 + 五三多校真题

误区3:"所有分布都有无记忆性"

❌ 错误解释:无记忆性是所有离散分布的普遍性质。 ✅ 正确解释:在离散分布中,只有几何分布具有无记忆性(连续分布中只有指数分布具有无记忆性)。无记忆性 是几何分布的本质特征,甚至可以作为几何分布的定义。

反例:考虑二项分布 。已知前 次失败了(即 ),那么 ,而 。因此二项分布不满足无记忆性。

超几何分布与二项分布的区别

来源:教材p88 + MIT 18.05 + Stanford Stat 116 + UCLA Stats 100A + 华东师大讲义

误区4:"超几何分布就是二项分布"

❌ 错误解释:不放回抽样和有放回抽样结果一样,超几何分布和二项分布可以互换使用。 ✅ 正确解释:超几何分布是不放回抽样,二项分布是有放回抽样。当抽样比例n/N很小时(通常n/N<0.05),两者近似相等。但抽样比例较大时,必须使用超几何分布。

数值对比:设

超几何分布:

二项近似():

两者差距明显(,远超 ),此时不能用二项近似。

负二项分布与几何分布的关系

来源:教材p91 + MIT 18.05 + Stanford Stat 116 + 华东师大讲义 + 五三多校真题

误区5:"负二项分布和几何分布是同一个东西"

❌ 错误解释:负二项分布就是几何分布的另一个名字。 ✅ 正确解释:几何分布是负二项分布在==r=1时的特例==。负二项分布 描述的是”第r次成功所需的试验次数”,而几何分布 描述的是”首次成功所需的试验次数”。

层次关系

几何分布是负二项分布当 时的特殊情况。负二项分布将”等待首次成功”推广为”等待第 次成功”,是几何分布的自然推广。


十、习题精选

习题概览

编号题目来源知识点难度
1教材 2.4-2二项分布概率计算★★☆
2教材 2.4-5二项分布反求参数★★☆
3教材 2.4-7泊松定理近似计算★★★
4教材 2.4-8泊松分布参数求解★★☆
5教材 2.4-11几何分布与全概率公式★★★
6教材 2.4-17泊松分布阶乘矩证明★★★
72017山东大学432泊松分布参数求解★★☆
82013武汉大学432二项分布最可能值★★★
92022兰州大学432几何分布与级数计算★★★
102022山东大学432泊松与二项分布关系★★★

教材习题

习题 2.4-2 — 一级品率问题

某产品的一级品率为 ,现检查 件产品。求至少有 件是一级品的概率。

习题 2.4-5 — 反求参数

已知 ,求

习题 2.4-7 — 泊松近似

某批产品的不合格品率为 ,现从中抽取 件进行检查。若发现不合格品数不少于 件,则拒收该批产品。求拒收概率。

习题 2.4-8 — 泊松分布参数求解

服从泊松分布,已知 ,求

习题 2.4-11 — 掷硬币付账

甲、乙、丙三人约定:掷一枚均匀硬币,第一个掷出正面的人付账。如果依次掷硬币,求甲、乙、丙付账的概率各是多少?

习题 2.4-17 — 泊松分布矩的递推公式

,证明:

卡方精选习题

习题7 — 2017山东大学432:泊松分布参数求解

服从参数为 的泊松分布,已知 ,求 的值。

A.   B.   C.   D.

习题8 — 2013武汉大学432:二项分布的最可能值

服从二项分布 ,若 不是整数,则 取何值时 最大?

A.   B.   C.   D.

习题9 — 2022兰州大学432:几何分布与级数计算

某人进行投篮游戏,每次投中的概率为 ),各次投篮相互独立。记 为首次投中时累计的投篮次数。 (1)写出 的分布律; (2)求 为偶数的概率。

习题10 — 2022山东大学432:泊松分布与二项分布的关系

设随机变量 为某医院一天出生的婴儿总数, 为其中的男婴数。已知联合分布为


十一、教材原文

以下为教材扫描版原文,可点击翻阅。

第二章 随机变量及其分布/常用离散分布