1.4 条件概率
本节概览
本节引入条件概率的核心概念,并由此推导出三大重要公式:乘法公式、全概率公式和贝叶斯公式。这三大公式是概率论中最常用的计算工具,贯穿整个学科。
逻辑链条:条件概率定义 → 条件概率是概率 → 乘法公式(求事件交的概率)→ 全概率公式(求复杂事件的概率)→ 贝叶斯公式(求条件概率/后验概率)
前置依赖:1.1 随机事件及其运算(事件运算、De Morgan 公式)、§1.2(Kolmogorov 公理)、§1.3(可加性、加法公式、容斥原理)
核心主线:条件概率 是本节的出发点,它度量了”在 发生的前提下 发生的可能性”。乘法公式将交事件的概率分解为条件概率的乘积,全概率公式通过样本空间的分割将复杂事件化为简单事件,贝叶斯公式则实现了”由果溯因”的概率推理。
一、条件概率的定义
直观理解
条件概率的核心思想是样本空间的缩小:当已知事件 发生时,我们不再关心 之外的样本点,而只在 内部考虑事件 发生的可能性。
例 1.4.1 — 两孩家庭问题
考察有两个小孩的家庭,样本空间 ( 男孩, 女孩, 表示大的是男孩小的是女孩),每个样本点等可能。
- 事件 = “至少有一个女孩”:
- 事件 = “至少有一个男孩”:
- 在 发生条件下, 的条件概率:
解释: 的发生排除了 ,样本空间缩小为 (3个样本点),其中 含2个样本点,故 。
关键观察:,说明条件概率可以改变事件发生的可能性。
形式化定义
定义 1.4.1 — 条件概率
设 与 是样本空间 中的两事件,若 ,则称
为”在 发生下 的条件概率”。
例 1.4.2 — 维恩图说明
设 含25个等可能样本点, 含15个, 含7个, 含5个。
注意:,条件概率具有方向性。
二、条件概率的性质
性质 1.4.1 — 条件概率是概率
若 ,则条件概率 满足概率的三条公理:
- ,
- 若 互不相容,则
证明思路
重要推论
由于 满足概率的三条公理,§1.3中推导的所有概率性质对条件概率都成立,例如:
- (Boole 不等式)
三、乘法公式
性质 1.4.2 — 乘法公式
(1) 若 ,则
(2) 若 ,则
证明思路
证明 (1.4.2):由条件概率定义 ,两边乘以 即得。
证明 (1.4.3):因为
所以(1.4.3)中所有条件概率均有意义,且右边等于:
所有中间项连锁约分,最终只剩 。
例 1.4.3 — 不合格品抽取
100个零件中10个不合格,一个一个取出(不放回),求第三次才取得不合格品的概率。
解:设 = “第 次取出不合格品”。所求为 。
由乘法公式(1.4.3):
波利亚模型(罐子模型)
例 1.4.4 — 波利亚模型
罐中有 个黑球、 个红球。每次取出一球后,放回并加入 个同色球和 个异色球。连续取三个球,其中两红一黑的概率是否依赖于取出次序?
一般公式(以 为例):
四种特殊情况:
| 模型 | 参数 | 三种排列的概率 | 结论 |
|---|---|---|---|
| 不返回抽样 | 均等于 | 与次序无关 | |
| 返回抽样 | 均等于 | 与次序无关 | |
| 传染病模型 | 均等于 | 与次序无关 | |
| 安全模型 | 三种排列概率不相等 | 与次序有关 |
波利亚模型的核心结论
当 时(只加同色球或取出不放回),概率不依赖球的取出次序。这个结论在很多概率问题中有重要应用,例如摸彩问题中”先摸后摸概率相同”。
四、全概率公式
样本空间的分割
样本空间的分割
设 是样本空间 中的一组事件,若满足:
- 互不相容:()
- 完备性:
则称 为 的一个分割(partition)。
全概率公式
性质 1.4.3 — 全概率公式
设 为 的一个分割,且 (),则对任一事件 :
最简形式(二分割):若 ,则
证明思路
证明 (1.4.4):
[事件分解]:
且 互不相容(因为 互不相容)。
[应用可加性]:
[代入乘法公式]:,代入即得(1.4.4)。
全概率公式的使用条件
分割条件可以放宽: 互不相容,且 ,全概率公式仍然成立。此外,分割可以是可列个事件。
例 1.4.5 — 摸彩模型
张彩票中1张可中奖,求第二人摸到中奖彩票的概率。
解:设 = “第 人摸到中奖彩票”。
由全概率公式(1.4.5):
结论:,摸到中奖彩票的机会与先后次序无关。
一般地,若 张彩票中有 张可中奖,则每人中奖概率均为 。
例 1.4.6 — 保险问题
投保人分两类:易出事故者(占20%,出事故概率0.4)和安全者(占80%,出事故概率0.1)。求新投保人一年内出事故的概率。
解: = “易出事故者”, = “出事故”。
例 1.4.7 — 敏感性问题调查(Warner 随机化应答技术)
调查学生看过黄色书刊的比例 。被调查者从罐中随机抽球:抽到白球回答”生日是否在7月1日前”(),抽到红球回答”是否看过黄色书刊”。
设红球比例为 , 张答卷中 张回答”是”,则由全概率公式:
解得:
实际算例:,,,则 (约7.62%)。
五、贝叶斯公式
公式与证明
性质 1.4.4 — 贝叶斯公式
设 是 的一个分割,且 ,(),则
证明思路
证明 (1.4.6):
[分子]:由乘法公式
[分母]:由全概率公式
[合成]:
先验概率与后验概率
- : 的先验概率(prior probability),在观测到 之前对 的信念
- : 的后验概率(posterior probability),在观测到 之后对 的修正信念
- 贝叶斯公式实现了"由果溯因":已知结果 发生了,反推哪个原因 更可能
例题
例 1.4.8 — 肝癌普查问题
某地区肝癌发病率0.0004,甲胎蛋白法普查:患肝癌者99%呈阳性,未患肝癌者99.9%呈阴性。某人检查呈阳性,真患肝癌的概率?
解: = “患肝癌”, = “阳性”。
由贝叶斯公式:
直观理解:10000人中约4人患肝癌(真阳性约3.96人),9996人不患(假阳性约9.996人)。阳性者中真患肝癌仅占约28.4%。
复查效果:对阳性人群复查,先验概率更新为 :
复查大幅提高准确率:从28.4%跃升至99.7%。
例 1.4.9 — 孩子与狼(贝叶斯信任更新)
用贝叶斯公式分析村民对小孩信任度的下降过程。
初始先验:(可信),(不可信)
条件概率:(可信小孩说谎),(不可信小孩说谎)
第一次说谎后:
第二次说谎后(以 为新先验):
信任度:,每次说谎都会指数级降低信任度。
三个公式的功能总结
| 公式 | 功能 | 典型应用 |
|---|---|---|
| 乘法公式 | 求事件交的概率 | 多步实验、不放回抽样 |
| 全概率公式 | 求复杂事件的概率 | 分层模型、多原因导致同一结果 |
| 贝叶斯公式 | 求条件概率 $P(B_i | A)$(由果溯因) |
六、知识结构总览
graph TD A[条件概率定义 P_A_B等于P_AB除以P_B] --> B[条件概率是概率] B --> C[乘法公式] C --> D[全概率公式] D --> E[贝叶斯公式] A --> F[样本空间缩小] C --> G[多步实验] D --> H[分层模型] E --> I[由果溯因] E --> J[先验与后验]
七、核心思想与证明技巧
核心思想
- 样本空间缩小:条件概率的本质是将样本空间从 缩小到 ,在缩小后的空间中重新度量事件
- 连锁约分:乘法公式的证明核心是中间项连锁约分,最终只剩
- 分而治之:全概率公式通过分割将复杂事件化为简单事件的加权平均
- 由果溯因:贝叶斯公式是”逆概率”推理,从观测结果反推原因
- 信任更新:贝叶斯公式的迭代使用可以实现信任度的动态更新(先验→后验→新先验→新后验)
证明技巧清单
- 连锁约分法:乘法公式(1.4.3)的证明
- 事件分解法:全概率公式中 的分解
- 分子分母分别处理:贝叶斯公式中分子用乘法公式、分母用全概率公式
- 对称性论证:波利亚模型中 时概率与次序无关的证明
- 迭代更新法:贝叶斯信任更新中用后验概率作为新的先验概率
八、补充理解与易混淆点
条件概率的方向性
来源:教材p37(例1.4.1)、MIT OCW 6.041 Lecture 4
误区1:"P(A|B) = P(B|A)"
❌ 错误解释:条件概率的两个事件可以随意交换位置
✅ 正确解释:,,两者==仅在 时相等==。例1.4.1中 ,(碰巧相等),但例1.4.2中 。==混淆 和 是概率论中最常见的错误之一==,在医学检测中尤其危险(将”患病者阳性的概率”与”阳性者患病的概率”混为一谈)。
条件概率与无条件概率的关系
来源:教材p37、华东师范大学概率论讲义
误区2:"P(A|B) 一定大于等于 P(A)"
❌ 错误解释:已知 发生, 发生的可能性不会变小
✅ 正确解释: 可以大于、小于或等于 ,三种情况都有可能。 说明 的发生”促进”了 (正相关性), 说明 的发生”抑制”了 (负相关性), 说明 与 无关(独立性)。没有额外信息时,不能对 和 的大小关系做出任何判断。
全概率公式的分割条件
来源:教材p40(注意事项)、UCLA Stats 100A Lecture Notes
误区3:"全概率公式中分割必须穷尽整个样本空间"
❌ 错误解释: 必须满足
✅ 正确解释:全概率公式的分割条件可以放宽。实际上只需要:
- 互不相容
- ( 被分割完全覆盖)
不需要 。此外,分割也可以是可列个事件。这个放宽在实际应用中很有用——我们只需要关心与事件 相关的那些”原因”。
贝叶斯公式中先验概率的作用
来源:教材p43-44(例1.4.8)、Stanford Stat 116 Lecture Notes
误区4:"先验概率的选择不影响贝叶斯公式的结论"
❌ 错误解释:无论先验概率如何设定,贝叶斯公式都会给出正确的后验概率
✅ 正确解释:先验概率对后验概率有决定性影响。在例1.4.8中,如果肝癌发病率从0.0004变为0.01(提高25倍),则 会从28.4%大幅提升。先验概率反映了我们在观测数据之前对事件的主观信念,不同的先验会导致完全不同的后验结论。这也是贝叶斯统计学中”先验选择”问题备受关注的原因。
独立性与条件概率
来源:教材性质1.4.1、2015 中山大学 432 真题
误区5:"A 与 B 独立等价于 P(A|B) = P(A)"
❌ 错误解释:这个等价关系无条件成立
✅ 正确解释:” 与 独立 “这个等价关系==仅在 时成立==。当 时, 无定义,但 与 仍然可以独立(因为 )。严格来说,独立性的定义是 (不依赖条件概率),而 只是在 时的等价表述。
“至少一个”条件概率的样本空间陷阱
来源:教材p37(例1.4.1第(2)问)、2020 复旦大学 432 真题
误区6:"已知至少一个女孩,另一个也是女孩的概率是1/2"
❌ 错误解释:两个小孩中已知至少一个女孩,另一个孩子性别独立,所以概率是1/2
✅ 正确解释:在例1.4.1中,“至少一个女孩”对应样本空间 (3个样本点),“两个都是女孩”对应 (1个样本点),所以概率是 而非 。直觉错误的原因是混淆了"指定某个孩子是女孩"和"至少一个孩子是女孩"这两个不同的条件。前者将样本空间缩小为2个样本点(概率1/2),后者缩小为3个样本点(概率1/3)。
九、习题精选
本节习题
编号 标题 核心考点 难度 来源 1 考试不及格条件概率 条件概率基本计算 ★☆☆ 教材习题1.4-1 2 已知一件不合格求另一件 条件概率+古典概型 ★★☆ 教材习题1.4-5 3 乘法公式+加法公式 P(A),P(B A),P(A B)求P(A∪B) 4 钥匙掉落寻找 全概率公式 ★★☆ 教材习题1.4-15 5 两台车床不合格品 全概率+贝叶斯 ★★★ 教材习题1.4-16 6 传球问题 全概率+差分方程 ★★★ 教材习题1.4-22 7 条件概率基本计算 P(A B)公式 ★☆☆ 8 击落飞机概率 全概率+独立性 ★★☆ 2018 东北师范大学 432 9 血液化验贝叶斯 贝叶斯公式 ★★☆ 2021 东北师范大学 432 10 Monty Hall三门问题 条件概率+全概率 ★★★ 2017 北师大 432
习题1:考试不及格条件概率
习题1(教材习题1.4-1)
某班级数学不及格占8%,语文不及格占5%,两门都不及格占2%。 (1) 已知一学生数学不及格,他语文也不及格的概率? (2) 已知一学生语文不及格,他数学也不及格的概率?
查看解答
设 = “数学不及格”, = “语文不及格”。
已知 ,,。
(1)
(2)
习题2:已知一件不合格求另一件
习题2(教材习题1.4-5)
10件产品中有3件不合格品,从中任取两件,已知其中一件是不合格品,求另一件也是不合格品的概率。
查看解答
设 = “两件中至少一件不合格”, = “两件都不合格”。
所求为 (因为 )。
习题3:乘法公式+加法公式
习题3(教材习题1.4-8)
已知 ,,,求 。
查看解答
由乘法公式:
由 :
由加法公式:
习题4:钥匙掉落寻找
习题4(教材习题1.4-15)
钥匙掉在宿舍里、教室里、路上的概率分别为50%、30%和20%,掉在上述三处被找到的概率分别为0.8、0.3和0.1。求找到钥匙的概率。
查看解答
设 分别表示钥匙掉在宿舍、教室、路上, = “找到钥匙”。
由全概率公式:
习题5:两台车床不合格品
习题5(教材习题1.4-16)
两台车床加工同样零件,第一台不合格品概率0.03,第二台0.06,第一台加工量是第二台的2倍。 (1) 任取一件是合格品的概率? (2) 取到不合格品,是第二台加工的概率?
查看解答
设 = “第一台加工”, = “第二台加工”, = “不合格品”。
,,,。
(1) 由全概率公式:
(2) 由贝叶斯公式:
习题6:传球问题
习题6(教材习题1.4-22)
个人相互传球,球从甲手中开始传出,每次等可能传给其余 人。求第 次传球时仍由甲传出的概率。
查看解答
设 = “第 次由甲传出”的概率。
建立递推关系:第 次由甲传出有两种情况:
- 第 次不是甲传出(概率 ),然后传给甲(概率 )
- 第 次是甲传出(概率 ),然后不传给甲(不可能,因为甲不能再传给自己)
求解差分方程:令 ,则
由 (第一次甲传出),,故
当 时,(趋于均匀分布)。
习题7:条件概率基本计算
习题7(2014 兰州大学 432)
已知 ,,,求 。
查看解答
由乘法公式:
由全概率公式:
习题8:击落飞机概率
习题8(2018 东北师范大学 432)
对飞机进行三次独立射击,命中率分别为0.4、0.5、0.7。击中1次坠落概率0.2,击中2次坠落概率0.6,击中3次必坠落。求击落飞机的概率。
查看解答
设 = “恰好击中 次”(), = “飞机坠落”。
计算各 (三次射击独立,命中率分别为 ):
由全概率公式:
习题9:血液化验贝叶斯
习题9(2021 东北师范大学 432)
血液化验95%检出患病者(阳性),2%假阳性。患病率0.5%。阳性者真患病的概率?
查看解答
设 = “患病”, = “阳性”。
,,。
结论:阳性者中仅约19.27%真患病——假阳性数量远超真阳性,这是因为患病率极低(0.5%),导致大量健康人的假阳性”淹没”了真正的患者。
习题10:Monty Hall 三门问题
习题10(2017 北师大 432)
三扇门后有两头羊和一辆车。你随机选A门(得车概率1/3)。主持人(知道车在哪)打开B或C中的一扇羊门。你要不要换门?
查看解答
应该换门。
设 = “换门得车”, = “主持人打开一扇羊门”。
关键分析:主持人知道车的位置,所以无论车在哪扇门后,他都能打开一扇羊门,因此 。
计算 :
- 车在A门后(概率1/3):换门不得车,
- 车在B门后(概率1/3):主持人开C门,换门到B得车,
- 车在C门后(概率1/3):主持人开B门,换门到C得车,
结论:换门得车概率2/3,不换门仅1/3。换门使获胜概率翻倍。
直觉解释:你选A门时,车在A门的概率1/3,在”B或C”的概率2/3。主持人打开一扇羊门,并没有改变”B或C”中有车的概率(2/3),只是将这个概率集中到了剩下那扇未开的门上。
十、教材原文
第一章 随机事件与概率/条件概率