2.2 数学期望
本节概览
本节介绍随机变量最重要的数字特征——数学期望。数学期望是随机变量取值的”概率加权平均”,它从一个侧面描述了分布的中心位置。本节从历史上著名的分赌本问题出发,建立离散型和连续型随机变量数学期望的严格定义,证明随机变量函数的期望公式(LOTUS法则),并系统讨论期望的线性性质及其应用。
逻辑链条:期望的直觉(分赌本问题)→ 严格定义(离散/连续,绝对收敛)→ 应用实例(分组验血、彩票)→ 函数的期望公式(LOTUS)→ 期望的性质(线性性)→ 综合应用(库存优化)
前置依赖:§2.1(随机变量、分布函数、分布列、密度函数)、§1.3(概率的可加性)、§1.5(事件的独立性)
核心主线:数学期望 是随机变量取值的概率加权平均。离散型 ,连续型 。期望最重要的性质是线性性:,且此性质不要求独立性。LOTUS法则允许直接用 的分布计算 的期望,无需先求 的分布。
一、数学期望的概念与引入
为什么要引入数学期望
分布函数(或分布列、密度函数)能够完整地描述随机变量的统计规律性,但在许多实际问题中,我们往往只需要用少数几个数字来概括分布的某个方面的特征。这些数字被称为随机变量的数字特征。
例如,初生婴儿的体重是一个随机变量,其分布可能很复杂,但医生和家长最关心的往往是”平均体重”这个简单的数字。数字特征包括均值(数学期望)、方差、分位数等,其中数学期望是最基本、最重要的一个。
分赌本问题——期望的起源
例 2.2.1 — 分赌本问题
1654年,帕斯卡(Pascal)与费马(Fermat)通信讨论了著名的”分赌本问题”:
甲乙两人各出50法郎作为赌注,约定先赢三局者获得全部100法郎。比赛中止时,甲赢了2局,乙赢了1局。问这100法郎应如何分配才公平?
帕斯卡的解法:
设 为甲最终获得的金额。再赌两局,共有4种等可能的结果:
| 再赌结果 | 甲获金额 |
|---|---|
| 甲甲 | 100法郎 |
| 甲乙 | 100法郎 |
| 乙甲 | 100法郎 |
| 乙乙 | 0法郎 |
因此 的分布列为:
所以甲应得75法郎,乙应得25法郎。这个”75法郎”就是数学期望的雏形——它不是甲”可能”得到的某个值,而是甲在各种可能结果下的加权平均所得。
从算术平均到概率加权平均
回顾我们熟悉的算术平均:
如果 个数中有重复,设取值为 的有 个(),则:
这里 是频率,作为权重。数学期望的本质就是:用概率替代频率作为权重。当 时,频率 趋近于概率 ,算术平均就趋近于数学期望。
二、数学期望的定义
离散随机变量的数学期望
定义 2.2.1 — 离散随机变量的数学期望
设离散随机变量 的分布列为 , 如果 (绝对收敛),则称
为 的数学期望,简称期望或均值。若级数不绝对收敛,则称 的数学期望不存在。
绝对收敛的必要性
为什么要求绝对收敛而不是仅仅条件收敛?
因为随机变量的取值可正可负,条件收敛的级数在改变求和次序后会得到不同的”和”。而数学期望作为”加权平均”,其值不应依赖于求和次序的排列方式。绝对收敛保证了无论以何种次序求和,结果都是相同的。
注意
如果 只有有限个可能取值,则级数退化为有限和,期望总存在。
连续随机变量的数学期望
定义 2.2.2 — 连续随机变量的数学期望
设连续随机变量 的密度函数为 。如果
则称
为 的数学期望。
物理解释
可以把概率 看作放置在点 上的质量,概率分布看作质量在 轴上的分布。那么 就是该质量分布的重心(center of mass)所在位置。这个物理解释帮助我们直观理解期望的含义——它是概率质量”最平衡”的那个点。
理论意义
数学期望是消除随机性的主要手段。它将一个随机变量映射为一个确定的数值,使得我们可以用这个数值来代表该随机变量的”典型水平”,并参与同类指标的比较。在实际应用中,期望常被用作决策的依据。
均匀分布的期望
例 2.2.4 — 均匀分布的期望
设 ,密度函数为 ,。求 。
计算:
均匀分布的期望恰好等于区间的中点,这与直觉完全一致——概率在 上均匀分布,“平均位置”自然在中点。
柯西分布——期望不存在的经典反例
例 2.2.5 — 柯西分布的期望不存在
设 服从柯西分布,密度函数为 ,。判断 是否存在。
分析:
考察绝对可积性:
令 ,则 :
由于不满足绝对可积条件,故 不存在。
注意
虽然柯西分布的密度函数关于原点对称, 按Cauchy主值意义下确实等于0,但这不等于期望存在。期望存在要求绝对收敛,而不仅仅是主值收敛。
三、数学期望的应用实例
分组验血问题
例 2.2.2 — 分组验血问题
对 个人进行某种疾病普查,设各人是否患病相互独立,患病率为 。为减少检验工作量,采用分组混合检验法:将 个人分为一组,把 个人的血液混合在一起检验。如果结果为阴性,则 个人只需检验1次;如果结果为阳性,则需对这 个人逐一复检,共需 次。
建模:
设 为每人平均所需的验血次数。一组 人检验为阴性的概率为 ( 个人都未患病),因此:
计算期望:
当 时,,即分组验血可以减少工作量。
数值结果:
| 发病率 | 最优分组 | 减少比例 | |
|---|---|---|---|
| — |
当 时,最优分组为 ,,减少约 的检验工作量。
彩票期望值
例 2.2.3 — 彩票期望值
某彩票票价5元,购买者从 中选一个6位号码(均匀分布)。奖级结构如下:
| 奖级 | 奖金(元) | 中奖概率 |
|---|---|---|
| 一等奖 | ||
| 二等奖 | ||
| 三等奖 | ||
| 四等奖 | ||
| 五等奖 | ||
| 六等奖 | ||
| 无奖 |
计算期望奖金:
庄家优势
票价5元远大于期望奖金 元。每张彩票的期望净损失为 元,庄家优势为 。这意味着,从期望的角度看,购买彩票是一项”亏本”的活动。
四、随机变量函数的期望公式
LOTUS法则
定理 2.2.1 — 随机变量函数的期望公式(LOTUS)
若随机变量 的分布用分布列 或密度函数 表示,则 的某一函数 的数学期望为:
- 离散场合:
- 连续场合:E[g(X)] = \displaystyle\int_{-\infty}^{+\infty} g(x)\, p(x)\,dx \tag{2.2.3}
这里所涉及的数学期望都假定存在。
定理的意义
计算 时,==无需先求 的分布==,直接利用 的原分布即可。这大大简化了计算过程,因为求 的分布往往非常繁琐。
证明思路
证明(连续场合): [分布函数法]:设 ,则 的分布函数为 ,密度函数 。
由变量替换(Stieltjes积分)可得:
离散场合的证明类似,只需将积分改为求和。
E(X²)的两种计算方法
例 2.2.6 — E(X²)的两种计算方法
设 的分布列如下:
求 。
方法一(先求 的分布):
的可能取值为 。
方法二(LOTUS法则,直接计算):
两种方法结果一致,但方法二(LOTUS)更为直接,无需先构造 的分布列。
五、数学期望的性质
常数的期望
性质 2.2.1 — 常数的期望
若 是常数,则 。
证明思路
证明:将 看作仅取一个值的(退化)随机变量 ,。
[退化分布]:常数是方差为零的特殊随机变量。
常数倍的期望
性质 2.2.2 — 常数倍的期望
对任意常数 ,有 。\tag{2.2.4}
证明思路
证明(离散场合):在公式 (2.2.3) 中令 :
[提取常数]:将常数 从求和号中提出。连续场合类似,将求和改为积分。
和差的期望
性质 2.2.3 — 和差的期望
对任意的两个函数 和 ,有
证明思路
证明(离散场合):在公式 (2.2.3) 中令 :
[求和的线性性]:有限求和(或绝对收敛的无限求和)可以逐项拆分。
重要推论——期望的线性性
由以上三条性质,可以立即得到期望的线性性:
更一般地,对多个随机变量:
关键要点
期望的线性性不要求各随机变量相互独立。这是期望区别于方差、矩等数字特征的关键特点。无论 之间有何种依赖关系,期望的线性性都成立。
库存优化问题
例 2.2.7 — 库存优化问题
某商品的市场需求量 (单位:吨)。每售出一吨获利 千元;若供过于求,积压的每吨损失 千元。问应组织多少货源使期望利润最大?
建模:
设组织货源 吨(),利润函数为:
计算期望利润:
第一部分:
第二部分:
合并:
求最大值:
对 关于 求导并令其为零:
当 吨时,期望利润最大:
六、知识结构总览
graph TD A[数学期望] --> B[概念引入] A --> C[严格定义] A --> D[函数期望公式] A --> E[期望的性质] A --> F[应用实例] B --> B1[分赌本问题] B --> B2[概率加权平均] C --> C1[离散型定义] C --> C2[连续型定义] C --> C3[绝对收敛条件] D --> D1[LOTUS法则] D --> D2[无需先求函数分布] E --> E1[常数期望] E --> E2[常数倍性质] E --> E3[和差性质] E --> E4[线性性无需独立] F --> F1[分组验血] F --> F2[彩票期望] F --> F3[库存优化]
七、核心思想与证明技巧
期望的线性性不要求独立性
这是本节最重要的核心思想:
- 恒成立,无需任何条件
- 但 需要 与 独立(或至少不相关)
这是期望区别于方差等数字特征的关键特点。在解题时,当我们需要计算 时,完全不需要考虑 之间的依赖关系,直接逐个求期望再相加即可。
LOTUS法则的实用价值
LOTUS(Law Of The Unconscious Statistician)法则的价值在于:
- 计算 时==无需先求 的分布==
- 直接用 的原分布加权求和/积分
- 特别适用于 、 等矩的计算
- 是后续定义方差 的计算基础
绝对收敛条件的必要性
- 保证期望的唯一性(不受求和次序影响)
- 柯西分布是期望不存在的经典反例
- 有限个可能值的随机变量期望总存在
- 对称分布的”主值”不等于期望(除非绝对收敛)
期望作为消除随机性的工具
- 将随机变量映射为一个确定的数值
- 是后续方差、协方差、相关系数等概念的基础
- 大数定律的本质就是期望的体现——样本均值趋近于期望
- 在决策问题中,期望常作为最优化的目标函数
指示变量法(和式分解法)
这是一种非常重要的解题技巧:
- 将复杂随机变量 分解为简单指示变量之和:
- 每个 只取 或 ,
- 利用线性性:
- 无需考虑变量间的依赖关系,这是指示变量法最大的优势
- 是解决组合计数期望问题的利器(见习题7、习题9)
期望的局限性——为什么需要方差
期望相同但分布不同
八、补充理解与易混淆点
期望不一定存在
来源:教材p71 + MIT 18.05 + Stanford Stat 116 + UCLA Stats 100A + 华东师大讲义
误区1:"任何随机变量都有数学期望"
❌ 错误解释:既然期望就是”平均值”,那每个随机变量都应该有一个确定的平均值。比如柯西分布虽然密度函数看起来很正常,它的期望也应该存在。
✅ 正确解释:数学期望不一定存在。定义中要求级数(或积分)绝对收敛,这个条件不是总能满足的。经典反例是柯西分布:,虽然密度函数关于原点对称(直观上”平均值”应该是0),但 ,不满足绝对可积条件,因此 不存在。
对称分布的陷阱
柯西分布的密度函数关于原点对称, 按Cauchy主值意义下等于0,但这不等于期望存在。期望存在要求绝对收敛,而不仅仅是主值收敛。对称性只能保证如果期望存在,则期望为0。
期望的线性性无需独立性
来源:教材p74-75 + MIT 18.05 + 3Blue1Brown概率论系列 + 中科大432真题 + 华东师大讲义
误区2:"E(X+Y) = E(X)+E(Y) 需要X和Y独立"
❌ 错误解释:期望的线性性要求随机变量之间相互独立。如果X和Y不独立(比如Y = X²),那么E(X+Y) ≠ E(X)+E(Y)。
✅ 正确解释: 恒成立,不需要任何独立性条件。这是期望最重要的性质之一。证明直接由LOTUS法则得出——积分(或求和)的线性性保证了期望的线性性。
常见混淆
容易混淆的是: 才需要X与Y独立(或至少不相关)。线性性(加法)和可乘性(乘法)是两个不同的性质,前者无条件成立,后者需要独立性。
期望的平方不等于平方的期望
来源:教材p74 + MIT 18.05 + Stanford Stat 116 + 多校考研真题 + CSDN概率论专栏
误区3:"E(X²) = (E(X))²"
❌ 错误解释:期望是一种”平均”,所以先平方再平均和先平均再平方应该一样。即E(X²) = (E(X))²。
✅ 正确解释:一般情况下 。实际上,由Jensen不等式(或直接展开),,等号成立当且仅当 为常数(方差为零)。
反例
设 取值 ,各概率 。则 ,。但 。
这个关系 正是方差的定义基础,将在 §2.3 中详细讨论。
期望不等于众数或中位数
来源:教材p70-71 + MIT 18.05 + Stanford Stat 116 + UCLA Stats 100A + 华东师大讲义
误区4:"连续随机变量的期望就是密度函数最大值处的x"
❌ 错误解释:密度函数最大的地方就是概率最集中的地方,所以期望应该在密度函数的峰值处。比如正态分布的密度函数在处最大,所以期望就是峰值位置。
✅ 正确解释:期望是概率的加权平均(重心),而不是密度函数的峰值位置(众数),也不是累积概率等于0.5的位置(中位数)。期望、众数、中位数是三个不同的集中趋势度量,它们仅在分布对称时才重合。
反例
- 指数分布 :密度函数在 处最大(众数为0),但 。期望和众数完全不同。
- 右偏分布(如Gamma分布):众数 < 中位数 < 期望,三者依次右移。
- 正态分布:三者重合于 ,但这只是对称分布的特殊性质。
期望一定在取值范围内
来源:教材p70 + MIT 18.05 + Stanford Stat 116 + 多校考研真题 + 华东师大讲义
误区5:"期望可能超出随机变量的取值范围"
❌ 错误解释:期望是”概率加权平均”,权重之和为1,但加权平均的结果可能超出取值范围。比如X取值0和1,E(X)可能大于1或小于0。
✅ 正确解释:期望==一定在随机变量的取值范围 内==。这是因为期望是取值的凸组合(加权平均,权重非负且和为1),而凸组合的结果一定在凸包(即取值范围)内。
数学表述
若 (几乎必然),则 。
证明:令 ,则 (因为非负随机变量的期望非负),故 。同理 。
九、习题精选
习题概览
编号 题目来源 知识点 难度 1 教材 2.2-1 基础期望计算 ★★☆ 2 教材 2.2-4 超几何分布的期望 ★★★ 3 教材 2.2-10 指数分布的期望 ★★☆ 4 教材 2.2-13 由分布函数求期望 ★★★ 5 教材 2.2-15 工程工期与利润 ★★★ 6 教材 2.2-18 期望恒等式证明 ★★★ 7 2015武汉大学432 期望与相关性 ★★★ 8 2019上海财经大学432 平均绝对离差与中位数 ★★★ 9 2020东华大学432 相关系数与期望方差 ★★★ 10 2015中国科学技术大学432 指数分布次序统计量 ★★★
教材习题
习题1
习题1(教材 2.2-1)— 基础期望计算
已知 的分布列:
求 和 。
查看解答
计算 :
计算 : 方法一(利用线性性):
方法二(直接展开验证):
习题2
习题2(教材 2.2-4)— 超几何分布的期望
船上装有20桶化工原料,其中5桶被海水污染。现从中随机抽取8桶,以 表示被污染的桶数。求 的分布列和 。
查看解答
分布列: 的可能取值为 到 。
计算 : 方法一(直接求和):
方法二(超几何分布期望公式):
直观理解:20桶中5桶被污染(比例25%),抽8桶期望被污染 桶。超几何分布的期望与二项分布的期望形式一致:,其中 是总体比例。
习题3
习题3(教材 2.2-10)— 指数分布的期望
某设备维修时间 (小时)的密度函数为 ()。求平均维修时间 。
查看解答
计算:
令 ,则 ,利用指数分布期望公式:
推导过程(分部积分):
一般地,若 ,则 。
习题4
习题4(教材 2.2-13)— 由分布函数求期望
随机变量 的分布函数为
求 。
查看解答
分析分布类型: 是一个混合型随机变量。
求密度函数(在可导处):
- 在 上:
- 在 上:(常数段,无密度)
- 在 上:
检查跳跃点:
- 处:(无跳跃,连续)
- 处:(无跳跃,连续)
计算期望:
第一部分(分部积分,令 ,):
第二部分(令 ):
其中 用分部积分:
而 。
所以第二部分 。
最终结果:
习题5
习题5(教材 2.2-15)— 工程工期与利润
(1) 工程工期 的分布:,,,。求平均工期。 (2) 利润 万元,求平均利润。 (3) 新方案 :,,。求新方案平均利润及利润增加额。
查看解答
(1) 平均工期:
(2) 平均利润: 方法一(利用线性性):(万元)
方法二(直接展开验证): 的取值为 ,对应概率 。
(3) 新方案:
利润增加额 (万元)
习题6
习题6(教材 2.2-18)— 期望恒等式证明
设 为仅取非负整数的离散随机变量,若其数学期望存在,证明:
查看解答
证明:
利用恒等式 ,将期望展开:
画出求和区域: 满足 。交换求和次序(由 存在即绝对收敛保证交换合法性):
= \sum_{i=1}^{\infty} \sum_{k=i}^{\infty} P(X = k) = \sum_{i=1}^{\infty} P(X \geq i) = \sum_{k=1}^{\infty} P(X \geq k) \quad $\square$直观理解: 是 至少为 的概率。对 从1到 求和,恰好”数”出了 的所有可能取值的总”贡献”。这个恒等式在计算非负整数随机变量的期望时非常有用,尤其当 比 更容易计算时。
考研真题
习题7
习题7(2015 武汉大学 432)— 期望与相关性
设 与 为两个随机变量,则下列命题中正确的是( ) A. 若 ,则 与 独立 B. 若 与 独立,则 C. 若 ,则 与 独立 D. 若 与 不相关,则
查看解答
选B。
- A项: 只能推出不相关,不能推出独立。反例:,,则 ,但 完全由 决定,不独立。
- B项:独立性 ⇒ 不相关 ⇒ ,这是基本定理。✓
- C项: 恒成立(期望的线性性),与独立性无关。
- D项:不相关意味着 (协方差为零),但随机变量本身不必恒为零。
习题8
习题8(2019 上海财经大学 432)— 平均绝对离差与中位数
设连续随机变量 的密度函数为 , 为 的中位数。证明:。
查看解答
证明:令 ,需要证明 在 处取最小值。
对 求导:
令 ,得 ,即 (中位数定义)。
又 ,故 是最小值点。
意义:中位数是使”平均绝对离差”最小的点,正如期望是使”均方误差”最小的点。
习题9
习题9(2020 东华大学 432)— 相关系数与期望方差
设随机变量 与 的相关系数 ,,,,。求 和 。
查看解答
由相关系数定义 :
(1)
(2)
习题10
习题10(2015 中国科学技术大学 432)— 指数分布次序统计量的期望
设 为来自 的简单随机样本,。求 。
查看解答
方法一(分布函数法):
的分布函数:
故 ,。
方法二(指示变量法):
注意 ,利用最小值的期望公式:
结论: 个独立指数分布的最小值仍服从指数分布,参数扩大 倍,期望缩小为 。
十、教材原文
以下为教材扫描版原文,可点击翻阅。
第二章 随机变量及其分布/数学期望