1.4 条件概率

本节概览

本节引入条件概率的核心概念,并由此推导出三大重要公式:乘法公式全概率公式贝叶斯公式。这三大公式是概率论中最常用的计算工具,贯穿整个学科。

逻辑链条:条件概率定义 → 条件概率是概率 → 乘法公式(求事件交的概率)→ 全概率公式(求复杂事件的概率)→ 贝叶斯公式(求条件概率/后验概率)

前置依赖1.1 随机事件及其运算(事件运算、De Morgan 公式)、§1.2(Kolmogorov 公理)、§1.3(可加性、加法公式、容斥原理)

核心主线:条件概率 是本节的出发点,它度量了”在 发生的前提下 发生的可能性”。乘法公式将交事件的概率分解为条件概率的乘积,全概率公式通过样本空间的分割将复杂事件化为简单事件,贝叶斯公式则实现了”由果溯因”的概率推理。


一、条件概率的定义

直观理解

条件概率的核心思想是样本空间的缩小:当已知事件 发生时,我们不再关心 之外的样本点,而只在 内部考虑事件 发生的可能性。

例 1.4.1 — 两孩家庭问题

考察有两个小孩的家庭,样本空间 男孩, 女孩, 表示大的是男孩小的是女孩),每个样本点等可能。

  • 事件 = “至少有一个女孩”:
  • 事件 = “至少有一个男孩”:
  • 发生条件下, 的条件概率:

解释 的发生排除了 ,样本空间缩小为 (3个样本点),其中 含2个样本点,故

关键观察,说明条件概率可以改变事件发生的可能性。

形式化定义

定义 1.4.1 — 条件概率

是样本空间 中的两事件,若 ,则称

为”在 发生下 的条件概率”。

例 1.4.2 — 维恩图说明

含25个等可能样本点, 含15个, 含7个, 含5个。

注意,条件概率具有方向性


二、条件概率的性质

性质 1.4.1 — 条件概率是概率

,则条件概率 满足概率的三条公理:

  1. 互不相容,则

证明思路

证明 (性质 1.4.1)

(1)(2) 由定义1.4.1直接可得。

[(3) 可列可加性]:因为 互不相容,所以 也互不相容。由§1.3的可列可加性:

重要推论

由于 满足概率的三条公理,§1.3中推导的所有概率性质对条件概率都成立,例如:

  • (Boole 不等式)

三、乘法公式

性质 1.4.2 — 乘法公式

(1) 若 ,则

(2) 若 ,则

证明思路

证明 (1.4.2):由条件概率定义 ,两边乘以 即得。

证明 (1.4.3):因为

所以(1.4.3)中所有条件概率均有意义,且右边等于:

所有中间项连锁约分,最终只剩

例 1.4.3 — 不合格品抽取

100个零件中10个不合格,一个一个取出(不放回),求第三次才取得不合格品的概率。

:设 = “第 次取出不合格品”。所求为

由乘法公式(1.4.3):

波利亚模型(罐子模型)

例 1.4.4 — 波利亚模型

罐中有 个黑球、 个红球。每次取出一球后,放回并加入 个同色球和 个异色球。连续取三个球,其中两红一黑的概率是否依赖于取出次序?

一般公式(以 为例):

四种特殊情况

模型参数三种排列的概率结论
不返回抽样均等于 与次序无关
返回抽样均等于 与次序无关
传染病模型均等于 与次序无关
安全模型三种排列概率不相等与次序有关

波利亚模型的核心结论

时(只加同色球或取出不放回),概率不依赖球的取出次序。这个结论在很多概率问题中有重要应用,例如摸彩问题中”先摸后摸概率相同”。


四、全概率公式

样本空间的分割

样本空间的分割

是样本空间 中的一组事件,若满足:

  1. 互不相容
  2. 完备性

则称 的一个分割(partition)。

全概率公式

性质 1.4.3 — 全概率公式

的一个分割,且 ),则对任一事件

最简形式(二分割):若 ,则

证明思路

证明 (1.4.4)

[事件分解]

互不相容(因为 互不相容)。

[应用可加性]

[代入乘法公式],代入即得(1.4.4)。

全概率公式的使用条件

分割条件可以放宽: 互不相容,且 ,全概率公式仍然成立。此外,分割可以是可列个事件。

例 1.4.5 — 摸彩模型

张彩票中1张可中奖,求第二人摸到中奖彩票的概率。

:设 = “第 人摸到中奖彩票”。

由全概率公式(1.4.5):

结论摸到中奖彩票的机会与先后次序无关

一般地,若 张彩票中有 张可中奖,则每人中奖概率均为

例 1.4.6 — 保险问题

投保人分两类:易出事故者(占20%,出事故概率0.4)和安全者(占80%,出事故概率0.1)。求新投保人一年内出事故的概率。

= “易出事故者”, = “出事故”。

例 1.4.7 — 敏感性问题调查(Warner 随机化应答技术)

调查学生看过黄色书刊的比例 。被调查者从罐中随机抽球:抽到白球回答”生日是否在7月1日前”(),抽到红球回答”是否看过黄色书刊”。

设红球比例为 张答卷中 张回答”是”,则由全概率公式:

解得:

实际算例,则 (约7.62%)。


五、贝叶斯公式

公式与证明

性质 1.4.4 — 贝叶斯公式

的一个分割,且 ),则

证明思路

证明 (1.4.6)

[分子]:由乘法公式

[分母]:由全概率公式

[合成]

先验概率与后验概率

  • 先验概率(prior probability),在观测到 之前对 的信念
  • 后验概率(posterior probability),在观测到 之后对 的修正信念
  • 贝叶斯公式实现了"由果溯因":已知结果 发生了,反推哪个原因 更可能

例题

例 1.4.8 — 肝癌普查问题

某地区肝癌发病率0.0004,甲胎蛋白法普查:患肝癌者99%呈阳性,未患肝癌者99.9%呈阴性。某人检查呈阳性,真患肝癌的概率?

= “患肝癌”, = “阳性”。

由贝叶斯公式:

直观理解:10000人中约4人患肝癌(真阳性约3.96人),9996人不患(假阳性约9.996人)。阳性者中真患肝癌仅占约28.4%。

复查效果:对阳性人群复查,先验概率更新为

复查大幅提高准确率:从28.4%跃升至99.7%。

例 1.4.9 — 孩子与狼(贝叶斯信任更新)

用贝叶斯公式分析村民对小孩信任度的下降过程。

初始先验(可信),(不可信)

条件概率(可信小孩说谎),(不可信小孩说谎)

第一次说谎后

第二次说谎后(以 为新先验):

信任度:每次说谎都会指数级降低信任度

三个公式的功能总结

公式功能典型应用
乘法公式求事件的概率 多步实验、不放回抽样
全概率公式复杂事件的概率 分层模型、多原因导致同一结果
贝叶斯公式条件概率 $P(B_iA)$(由果溯因)

六、知识结构总览

graph TD
    A[条件概率定义 P_A_B等于P_AB除以P_B] --> B[条件概率是概率]
    B --> C[乘法公式]
    C --> D[全概率公式]
    D --> E[贝叶斯公式]
    A --> F[样本空间缩小]
    C --> G[多步实验]
    D --> H[分层模型]
    E --> I[由果溯因]
    E --> J[先验与后验]

七、核心思想与证明技巧

核心思想

  1. 样本空间缩小:条件概率的本质是将样本空间从 缩小到 ,在缩小后的空间中重新度量事件
  2. 连锁约分:乘法公式的证明核心是中间项连锁约分,最终只剩
  3. 分而治之:全概率公式通过分割将复杂事件化为简单事件的加权平均
  4. 由果溯因:贝叶斯公式是”逆概率”推理,从观测结果反推原因
  5. 信任更新:贝叶斯公式的迭代使用可以实现信任度的动态更新(先验→后验→新先验→新后验)

证明技巧清单

  1. 连锁约分法:乘法公式(1.4.3)的证明
  2. 事件分解法:全概率公式中 的分解
  3. 分子分母分别处理:贝叶斯公式中分子用乘法公式、分母用全概率公式
  4. 对称性论证:波利亚模型中 时概率与次序无关的证明
  5. 迭代更新法:贝叶斯信任更新中用后验概率作为新的先验概率

八、补充理解与易混淆点

条件概率的方向性

来源:教材p37(例1.4.1)、MIT OCW 6.041 Lecture 4

误区1:"P(A|B) = P(B|A)"

❌ 错误解释:条件概率的两个事件可以随意交换位置

✅ 正确解释:,两者==仅在 时相等==。例1.4.1中 (碰巧相等),但例1.4.2中 。==混淆 是概率论中最常见的错误之一==,在医学检测中尤其危险(将”患病者阳性的概率”与”阳性者患病的概率”混为一谈)。

条件概率与无条件概率的关系

来源:教材p37、华东师范大学概率论讲义

误区2:"P(A|B) 一定大于等于 P(A)"

❌ 错误解释:已知 发生, 发生的可能性不会变小

✅ 正确解释: 可以大于、小于或等于 ,三种情况都有可能。 说明 的发生”促进”了 (正相关性), 说明 的发生”抑制”了 (负相关性), 说明 无关(独立性)。没有额外信息时,不能对 的大小关系做出任何判断。

全概率公式的分割条件

来源:教材p40(注意事项)、UCLA Stats 100A Lecture Notes

误区3:"全概率公式中分割必须穷尽整个样本空间"

❌ 错误解释: 必须满足

✅ 正确解释:全概率公式的分割条件可以放宽。实际上只需要:

  1. 互不相容
  2. 被分割完全覆盖)

不需要 。此外,分割也可以是可列个事件。这个放宽在实际应用中很有用——我们只需要关心与事件 相关的那些”原因”。

贝叶斯公式中先验概率的作用

来源:教材p43-44(例1.4.8)、Stanford Stat 116 Lecture Notes

误区4:"先验概率的选择不影响贝叶斯公式的结论"

❌ 错误解释:无论先验概率如何设定,贝叶斯公式都会给出正确的后验概率

✅ 正确解释:先验概率对后验概率有决定性影响。在例1.4.8中,如果肝癌发病率从0.0004变为0.01(提高25倍),则 会从28.4%大幅提升。先验概率反映了我们在观测数据之前对事件的主观信念,不同的先验会导致完全不同的后验结论。这也是贝叶斯统计学中”先验选择”问题备受关注的原因。

独立性与条件概率

来源:教材性质1.4.1、2015 中山大学 432 真题

误区5:"A 与 B 独立等价于 P(A|B) = P(A)"

❌ 错误解释:这个等价关系无条件成立

✅ 正确解释:” 独立 “这个等价关系==仅在 时成立==。当 时, 无定义,但 仍然可以独立(因为 )。严格来说,独立性的定义是 (不依赖条件概率),而 只是在 时的等价表述。

“至少一个”条件概率的样本空间陷阱

来源:教材p37(例1.4.1第(2)问)、2020 复旦大学 432 真题

误区6:"已知至少一个女孩,另一个也是女孩的概率是1/2"

❌ 错误解释:两个小孩中已知至少一个女孩,另一个孩子性别独立,所以概率是1/2

✅ 正确解释:在例1.4.1中,“至少一个女孩”对应样本空间 (3个样本点),“两个都是女孩”对应 (1个样本点),所以概率是 而非 直觉错误的原因是混淆了"指定某个孩子是女孩"和"至少一个孩子是女孩"这两个不同的条件。前者将样本空间缩小为2个样本点(概率1/2),后者缩小为3个样本点(概率1/3)。


九、习题精选

本节习题

编号标题核心考点难度来源
1考试不及格条件概率条件概率基本计算★☆☆教材习题1.4-1
2已知一件不合格求另一件条件概率+古典概型★★☆教材习题1.4-5
3乘法公式+加法公式P(A),P(BA),P(AB)求P(A∪B)
4钥匙掉落寻找全概率公式★★☆教材习题1.4-15
5两台车床不合格品全概率+贝叶斯★★★教材习题1.4-16
6传球问题全概率+差分方程★★★教材习题1.4-22
7条件概率基本计算P(AB)公式★☆☆
8击落飞机概率全概率+独立性★★☆2018 东北师范大学 432
9血液化验贝叶斯贝叶斯公式★★☆2021 东北师范大学 432
10Monty Hall三门问题条件概率+全概率★★★2017 北师大 432

习题1:考试不及格条件概率

习题1(教材习题1.4-1)

某班级数学不及格占8%,语文不及格占5%,两门都不及格占2%。 (1) 已知一学生数学不及格,他语文也不及格的概率? (2) 已知一学生语文不及格,他数学也不及格的概率?

习题2:已知一件不合格求另一件

习题2(教材习题1.4-5)

10件产品中有3件不合格品,从中任取两件,已知其中一件是不合格品,求另一件也是不合格品的概率。

习题3:乘法公式+加法公式

习题3(教材习题1.4-8)

已知 ,求

习题4:钥匙掉落寻找

习题4(教材习题1.4-15)

钥匙掉在宿舍里、教室里、路上的概率分别为50%、30%和20%,掉在上述三处被找到的概率分别为0.8、0.3和0.1。求找到钥匙的概率。

习题5:两台车床不合格品

习题5(教材习题1.4-16)

两台车床加工同样零件,第一台不合格品概率0.03,第二台0.06,第一台加工量是第二台的2倍。 (1) 任取一件是合格品的概率? (2) 取到不合格品,是第二台加工的概率?

习题6:传球问题

习题6(教材习题1.4-22)

个人相互传球,球从甲手中开始传出,每次等可能传给其余 人。求第 次传球时仍由甲传出的概率。

习题7:条件概率基本计算

习题7(2014 兰州大学 432)

已知 ,求

习题8:击落飞机概率

习题8(2018 东北师范大学 432)

对飞机进行三次独立射击,命中率分别为0.4、0.5、0.7。击中1次坠落概率0.2,击中2次坠落概率0.6,击中3次必坠落。求击落飞机的概率。

习题9:血液化验贝叶斯

习题9(2021 东北师范大学 432)

血液化验95%检出患病者(阳性),2%假阳性。患病率0.5%。阳性者真患病的概率?

习题10:Monty Hall 三门问题

习题10(2017 北师大 432)

三扇门后有两头羊和一辆车。你随机选A门(得车概率1/3)。主持人(知道车在哪)打开B或C中的一扇羊门。你要不要换门?


十、教材原文

第一章 随机事件与概率/条件概率