3.5 条件分布与条件期望

本节概览

本节将条件概率的思想推广到随机变量层面,建立条件分布条件期望的完整理论框架。核心是从联合分布出发,在给定一个随机变量取值的条件下,研究另一个随机变量的分布特征,并由此导出全期望公式全方差公式两大恒等式。条件分布是连接联合分布与边缘分布的桥梁,条件期望则是处理分层随机模型的核心工具。

逻辑链条:离散条件分布 → 连续条件密度 → 二维正态条件分布 → 条件期望 → 全期望公式 → 全方差公式

前置依赖§3.1§3.2§3.4

核心主线:以联合分布为基础,通过”固定一个变量、考察另一个变量”的思路定义条件分布,进而引入条件期望,最终建立全期望公式与全方差公式两大恒等式。


一、离散型条件分布

条件分布律

定义 3.5.1 — 条件分布律(公式3.5.1、3.5.2)

为二维离散型随机变量,其联合分布律为 ), 的边缘分布律分别为

,则在 的条件下 条件分布律

,则在 的条件下 的条件分布律为

理解要点:条件分布律的本质是条件概率在随机变量上的直接推广。给定 后,联合概率 被限制在 这一行上,除以该行的边缘概率 进行归一化,就得到 在该条件下的分布。

条件分布函数

定义 3.5.2 — 条件分布函数(公式3.5.3、3.5.4)

的条件下,条件分布函数

的条件下, 的条件分布函数为

乘法关系

由条件分布律的定义,联合分布律可以分解为边缘分布律与条件分布律的乘积:

这与乘法公式 完全对应。

独立性判定

由条件分布律的定义可以直接得到独立性的条件分布刻画:

即: 独立等价于条件分布等于边缘分布——给定 的取值不影响 的分布。

例 3.5.1 — 离散条件分布计算

的联合分布律为

01
0
1
1

条件下的条件分布律。

:由公式 (3.5.1),

仍为两点分布 ,与 的边缘分布相同,说明 独立。


二、连续型条件分布

条件密度函数

定义 3.5.3 — 条件密度函数(公式3.5.6、3.5.8)

为二维连续型随机变量,联合密度为 ,边缘密度为

,则在 的条件下 条件密度函数

,则在 的条件下 的条件密度函数为

理解要点:与离散情形类似,条件密度是联合密度在固定 后关于 的”切片”,除以 进行归一化,使其积分为 1。注意 是关于 的一元密度函数, 在此处被视为参数而非随机变量。

条件分布函数

的条件下, 的条件分布函数为

乘法公式

联合密度可以分解为边缘密度与条件密度的乘积:

这是连续版的乘法公式,与离散情形完全对应。

边缘密度公式(全概率公式的密度形式)

对乘法公式关于另一个变量积分,得到边缘密度的全概率公式:

这可以理解为: 的边缘密度是”在所有可能的 取值下, 的条件密度的加权平均”。

贝叶斯公式(密度形式)

定理 3.5.1 — 贝叶斯公式,密度形式(公式3.5.13、3.5.14)

理解要点:这与贝叶斯公式 完全对应。分母就是边缘密度 ,由全概率公式 (3.5.11) 给出。

例 3.5.2 — 条件密度计算(三角形区域均匀分布)

在区域 上均匀分布。

(1)求联合密度

区域 的面积为 ,故

(2)求边缘密度

(3)求条件密度

,在给定 的条件下, 上均匀分布。


三、二维正态分布的条件分布

定理 3.5.2 — 二维正态分布的条件分布

,则

Abstract

证明思路:以 为例。

第一步:写出联合密度。 的联合密度为

第二步:由条件密度定义 ,其中

第三步:将联合密度中的指数部分关于 进行配方。令 ,则指数部分为

关于 配方,提取不含 的项:

第四步:代入条件密度公式, 的指数部分恰好消去 项,剩余部分为

这正是 的密度函数。

核心结论

  • 条件期望,这是 的线性函数,斜率由 控制
  • 条件方差,与 无关,且小于边缘方差
  • 独立)时,,条件分布等于边缘分布
  • 时,条件方差 ,条件分布退化到一点—— 完全决定

例 3.5.3 — 二维正态条件分布计算

,求

:由定理 3.5.2,


四、条件期望

定义

定义 3.5.4 — 条件期望(公式3.5.15)

离散型:在 的条件下,条件期望

连续型:在 的条件下, 的条件期望为

当上述级数或积分绝对收敛时,条件期望存在。

理解要点:条件期望 就是在给定 的条件下,用条件分布 计算的普通期望。它是一个关于 的函数。

条件期望的基本性质

定理 3.5.3 — 条件期望的线性性质

(1),其中 为常数

(2),即给定 时, 的函数 就是常数

性质(1)的直观理解:条件期望保留了期望的线性性质——在给定条件下对 求期望,线性运算可以提到外面。

性质(2)的直观理解:既然已经知道 ,那么 就不再是随机的了,它的期望就是它本身

作为随机变量

当不指定 的具体取值时, 是关于 的函数,记为 。由于 是随机变量,所以 也是随机变量

  • 取值为 时,
  • 的取值随着 的随机变化而变化

例 3.5.4 — 条件期望计算

在区域 上均匀分布,求

:区域 的面积为 ,联合密度 )。

先求

条件密度:

,故

因此 是一个随机变量。


五、全期望公式与全方差公式

全期望公式(重期望公式)

定理 3.5.4 — 全期望公式 / 重期望公式(公式3.5.17)

即: 的无条件期望等于条件期望 关于 的期望。

Abstract

证明

离散型:设 的联合分布律为

连续型:设 的联合密度为

直观理解:全期望公式的本质是分层平均。先在每一层(给定 的某个取值)内部求平均,再对各层的平均按层的概率加权平均,就得到总平均。这与全概率公式 的思想完全一致。

随机变量随机和的期望

定理 3.5.5 — 随机变量随机和的期望

独立同分布, 为非负整数随机变量且与 独立,则

Abstract

证明:令 。利用全期望公式,对 取条件期望:

给定时,

因此 ,代入全期望公式:

其中最后一步利用了 独立,故 (常数)独立。

直观理解:如果每天来图书馆的读者数平均为 ,每人平均借 本书,那么每天总借书量的期望就是 。全期望公式将”随机个数”的问题分解为”先固定个数再求期望”。

全方差公式(方差恒等式)

定理 3.5.6 — 全方差公式 / 方差恒等式

即: 的总方差 条件方差的期望 条件期望的方差。

Abstract

证明:从方差的定义 出发。

第一步:对 使用全期望公式。注意到

因此 ,两边取期望:

第二步:对 ,由全期望公式 ,故

第三步:代入方差定义:

注意到 (这正是随机变量 的方差定义)。

因此

直观理解

  • 组内方差的平均——在每一组 内部, 的波动程度的平均
  • 组间方差——不同组之间 的条件期望的波动程度
  • 总方差 = 组内变异 + 组间变异

这与统计学中方差分析(ANOVA)的基本思想完全一致。

Beta-Binomial 分布的方差

例 3.5.5 — Beta-Binomial 分布的方差(全方差公式应用)

(给定成功率 服从二项分布),,求

(1)求 :利用全期望公式

给定 时,,故

(2)求 :利用全方差公式

  • ,故

计算第一项:

计算第二项:

合并:

对比:若 是固定的常数 (即二项分布),则 。当 本身也是随机变量时,方差多出了 这一项,反映了参数不确定性带来的额外波动。


六、典型应用场景

随机和模型

随机和 是全期望公式的经典应用场景,其中 是随机变量, 是独立同分布序列。

常见实例:

  • 泊松-二项模型,则
  • 泊松-泊松模型,则 (复合泊松分布)

二重模型(先抽 再抽

许多实际问题具有天然的分层结构:

  1. 先确定”个数” (如:今天来多少人、发生多少次事故)
  2. 再在给定 的条件下,确定每个个体的特征

全期望公式将这种分层模型的总期望分解为两步计算。

全期望公式的实际应用

图书馆借书问题:设每天来图书馆的读者数 ,每位读者借书数 ,且各读者借书数独立。求每天总借书数 的期望。

:由定理 3.5.5,


七、知识结构总览

graph TD
    A[联合分布] --> B[条件分布]
    B --> C[离散条件分布律]
    B --> D[连续条件密度]
    D --> E[贝叶斯公式]
    D --> F[二维正态条件分布]
    F --> G[条件正态分布]
    C --> H[条件期望]
    D --> H
    H --> I[全期望公式]
    H --> J[全方差公式]
    I --> K[随机和的期望]
    J --> L[Beta-Binomial方差]

八、核心思想与证明技巧

全期望公式的证明思路

核心思想:==条件期望对 积分(或求和)==。

  • 离散型:
  • 连续型:

关键步骤:将条件期望的定义代入, 恰好与条件分布律/条件密度中的分母约去,还原为联合分布的期望。

全方差公式的证明思路

核心思想:==从 出发,分别对两项使用全期望公式==。

  1. 相减:

贝叶斯公式的密度形式与离散形式的类比

离散形式密度形式
先验概率 先验密度
似然 似然函数
全概率 边缘密度
后验概率 后验密度

求和对应积分,概率对应密度,结构完全一致。


九、补充理解与易混淆点

条件密度函数的变量角色

来源:茆诗松教材§3.5 + 卡方核心笔记§3.5 + 陈希孺《概率论与数理统计》§3.3 + Ross《A First Course in Probability》Ch.5 + MIT 18.05 Lecture Notes

误区1:"条件密度函数 是关于 的联合密度"

❌ 错误解释: 同时以 为自变量,是二元密度函数。 ✅ 正确解释: 是关于 一元密度函数 被视为参数。对固定的 ;但 通常不等于 1。联合密度是 ,两者不能混淆。

全期望公式的嵌套结构

来源:茆诗松教材§3.5 + 卡方核心笔记§3.5 + 李贤平《概率论基础》§3.4 + 中科大概率论讲义 + 考研真题432综合

误区2:"全期望公式 就是简单的嵌套期望"

❌ 错误解释: 只是把一个期望套在另一个期望里面,没有特殊含义。 ✅ 正确解释:内层 随机变量 ,它是关于 的函数;外层 是对 关于 的分布取期望。全期望公式的本质是分层平均——先在每一层( 的取值)内部求平均,再对各层平均按层概率加权。它对应全概率公式的期望版本。

全方差公式中两项的含义

来源:茆诗松教材§3.5 + 卡方核心笔记§3.5 + 韦来生《数理统计》§1.4 + Casella & Berger《Statistical Inference》Ch.4 + 王兆军《数理统计》讲义

误区3:"全方差公式中两项可以合并"

❌ 错误解释: 都是方差,可以合并为 。 ✅ 正确解释:两项含义完全不同,不可合并。条件方差的平均(组内变异),度量的是各组内部 的波动程度;条件期望的方差(组间变异),度量的是各组之间 的平均水平差异。总方差等于两者之和,这与方差分析(ANOVA)中”总变异 = 组内变异 + 组间变异”的思想一致。

条件期望是随机变量还是常数

来源:茆诗松教材§3.5 + 卡方核心笔记§3.5 + 严士健《概率论基础》§3.2 + Durrett《Probability》Ch.1 + 考研432大纲解析

误区4:"条件期望 是一个常数"

❌ 错误解释:期望是一个数,所以 也是常数。 ✅ 正确解释:需要区分两种写法。常数(给定 取特定值 后的条件期望);而 是关于 的函数 ,是随机变量——它的取值随 的随机变化而变化。全期望公式 中,外层期望正是对这个随机变量取期望。


十、习题精选

习题概览

编号来源题目内容难度
1教材3.5-1离散型条件分布律★★☆
2教材3.5-3条件密度函数计算★★☆
3教材3.5-5条件期望计算★★★
4教材3.5-7全期望公式应用★★★
5教材3.5-9全方差公式应用★★★
6教材3.5-12二维正态条件分布★★★★
72016中山大学432条件密度函数(均匀分布)★★☆
82021东北大学432条件密度/边缘密度/联合密度★★★
92017兰州大学432离散型条件分布(泊松/二项)★★★
102020西南大学432重期望公式(泊松/二项)★★★★

习题1 — 教材3.5-1:离散型条件分布律 ★★☆

题目:设 的联合分布律为

的条件分布律。

解答

时,

时,

习题2 — 教材3.5-3:条件密度函数计算 ★★☆

题目:设 的联合密度为 ),求

解答

),即

),即

习题3 — 教材3.5-5:条件期望计算 ★★★

题目:设 在单位圆 上均匀分布,求

解答

联合密度 )。

给定 ), 的取值范围为

,故

习题4 — 教材3.5-7:全期望公式应用 ★★★

题目:设某昆虫产卵数 ,每颗卵孵化为成虫的概率为 ,且各卵是否孵化相互独立。求成虫数 的期望。

解答

为第 颗卵是否孵化的示性变量,,则

由定理 3.5.5:

习题5 — 教材3.5-9:全方差公式应用 ★★★

题目:设 ),,求

解答

由全方差公式

因此

习题6 — 教材3.5-12:二维正态条件分布 ★★★★

题目:设 ,求

解答

由定理 3.5.2:

习题7 — 2016中山大学432:条件密度函数(均匀分布)★★☆

题目:设 在区域 上均匀分布,求 的条件密度。

解答

联合密度 )。

边缘密度 )。

条件密度 )。

习题8 — 2021东北大学432:条件密度/边缘密度/联合密度 ★★★

题目:设 在由 轴、 轴、 围成的区域 上均匀分布。 (1)求 。 (2)求 。 (3)求

解答

(1) 区域 的面积 ,故 )。

(2) 时, 的范围为 (因为 要求 ,但 ,所以 ),

时, 的范围为

(3) 时,)。

时,)。

习题9 — 2017兰州大学432:离散型条件分布(泊松/二项)★★★

题目:设 的联合分布律为 )。 (1)求 的分布。 (2)求 的分布。

解答

(1) 求和:

(泊松分布)。

(2)

(二项分布)。

习题10 — 2020西南大学432:重期望公式(泊松/二项)★★★★

题目:某图书馆每天来的读者数 ,每位读者借书数 ,且各读者借书数独立。求每天总借书数 的期望。

解答

利用全期望公式(定理 3.5.5):

第一步:求条件期望。给定 时,

因此

第二步:对 取期望,

即每天总借书数的期望为


十一、教材原文

第三章教材PDF尚未上传,待后续补充。

第三章 多维随机变量及其分布/条件分布与条件期望