2.2 数学期望

本节概览

本节介绍随机变量最重要的数字特征——数学期望。数学期望是随机变量取值的”概率加权平均”,它从一个侧面描述了分布的中心位置。本节从历史上著名的分赌本问题出发,建立离散型和连续型随机变量数学期望的严格定义,证明随机变量函数的期望公式(LOTUS法则),并系统讨论期望的线性性质及其应用。

逻辑链条:期望的直觉(分赌本问题)→ 严格定义(离散/连续,绝对收敛)→ 应用实例(分组验血、彩票)→ 函数的期望公式(LOTUS)→ 期望的性质(线性性)→ 综合应用(库存优化)

前置依赖§2.1(随机变量、分布函数、分布列、密度函数)、§1.3(概率的可加性)、§1.5(事件的独立性)

核心主线:数学期望 是随机变量取值的概率加权平均。离散型 ,连续型 。期望最重要的性质是线性性,且此性质不要求独立性。LOTUS法则允许直接用 的分布计算 的期望,无需先求 的分布。


一、数学期望的概念与引入

为什么要引入数学期望

分布函数(或分布列、密度函数)能够完整地描述随机变量的统计规律性,但在许多实际问题中,我们往往只需要用少数几个数字来概括分布的某个方面的特征。这些数字被称为随机变量的数字特征

例如,初生婴儿的体重是一个随机变量,其分布可能很复杂,但医生和家长最关心的往往是”平均体重”这个简单的数字。数字特征包括均值(数学期望)、方差分位数等,其中数学期望是最基本、最重要的一个。

分赌本问题——期望的起源

例 2.2.1 — 分赌本问题

1654年,帕斯卡(Pascal)与费马(Fermat)通信讨论了著名的”分赌本问题”:

甲乙两人各出50法郎作为赌注,约定先赢三局者获得全部100法郎。比赛中止时,甲赢了2局,乙赢了1局。问这100法郎应如何分配才公平?

帕斯卡的解法

为甲最终获得的金额。再赌两局,共有4种等可能的结果:

再赌结果甲获金额
甲甲100法郎
甲乙100法郎
乙甲100法郎
乙乙0法郎

因此 的分布列为:

所以甲应得75法郎,乙应得25法郎。这个”75法郎”就是数学期望的雏形——它不是甲”可能”得到的某个值,而是甲在各种可能结果下的加权平均所得

从算术平均到概率加权平均

回顾我们熟悉的算术平均

如果 个数中有重复,设取值为 的有 个(),则:

这里 频率,作为权重。数学期望的本质就是:用概率替代频率作为权重。当 时,频率 趋近于概率 ,算术平均就趋近于数学期望。


二、数学期望的定义

离散随机变量的数学期望

定义 2.2.1 — 离散随机变量的数学期望

设离散随机变量 的分布列为 如果 (绝对收敛),则称

数学期望,简称期望均值。若级数不绝对收敛,则称 的数学期望不存在。

绝对收敛的必要性

为什么要求绝对收敛而不是仅仅条件收敛?

因为随机变量的取值可正可负,条件收敛的级数在改变求和次序后会得到不同的”和”。而数学期望作为”加权平均”,其值不应依赖于求和次序的排列方式。绝对收敛保证了无论以何种次序求和,结果都是相同的。

注意

如果 只有有限个可能取值,则级数退化为有限和,期望总存在

连续随机变量的数学期望

定义 2.2.2 — 连续随机变量的数学期望

设连续随机变量 的密度函数为 。如果

则称

数学期望

物理解释

可以把概率 看作放置在点 上的质量,概率分布看作质量在 轴上的分布。那么 就是该质量分布的重心(center of mass)所在位置。这个物理解释帮助我们直观理解期望的含义——它是概率质量”最平衡”的那个点。

理论意义

数学期望是消除随机性的主要手段。它将一个随机变量映射为一个确定的数值,使得我们可以用这个数值来代表该随机变量的”典型水平”,并参与同类指标的比较。在实际应用中,期望常被用作决策的依据。

均匀分布的期望

例 2.2.4 — 均匀分布的期望

,密度函数为 。求

计算

均匀分布的期望恰好等于区间的中点,这与直觉完全一致——概率在 上均匀分布,“平均位置”自然在中点。

柯西分布——期望不存在的经典反例

例 2.2.5 — 柯西分布的期望不存在

服从柯西分布,密度函数为 。判断 是否存在。

分析

考察绝对可积性:

,则

由于不满足绝对可积条件,故 不存在

注意

虽然柯西分布的密度函数关于原点对称, 按Cauchy主值意义下确实等于0,但这不等于期望存在。期望存在要求绝对收敛,而不仅仅是主值收敛。


三、数学期望的应用实例

分组验血问题

例 2.2.2 — 分组验血问题

个人进行某种疾病普查,设各人是否患病相互独立,患病率为 。为减少检验工作量,采用分组混合检验法:将 个人分为一组,把 个人的血液混合在一起检验。如果结果为阴性,则 个人只需检验1次;如果结果为阳性,则需对这 个人逐一复检,共需 次。

建模

为每人平均所需的验血次数。一组 人检验为阴性的概率为 个人都未患病),因此:

计算期望:

时,,即分组验血可以减少工作量。

数值结果

发病率 最优分组 减少比例

时,最优分组为 ,减少约 的检验工作量。

彩票期望值

例 2.2.3 — 彩票期望值

某彩票票价5元,购买者从 中选一个6位号码(均匀分布)。奖级结构如下:

奖级奖金(元)中奖概率
一等奖
二等奖
三等奖
四等奖
五等奖
六等奖
无奖

计算期望奖金

庄家优势

票价5元远大于期望奖金 元。每张彩票的期望净损失 元,庄家优势为 。这意味着,从期望的角度看,购买彩票是一项”亏本”的活动。


四、随机变量函数的期望公式

LOTUS法则

定理 2.2.1 — 随机变量函数的期望公式(LOTUS)

若随机变量 的分布用分布列 或密度函数 表示,则 的某一函数 的数学期望为:

  • 离散场合
  • 连续场合E[g(X)] = \displaystyle\int_{-\infty}^{+\infty} g(x)\, p(x)\,dx \tag{2.2.3}

这里所涉及的数学期望都假定存在。

定理的意义

计算 时,==无需先求 的分布==,直接利用 的原分布即可。这大大简化了计算过程,因为求 的分布往往非常繁琐。

证明思路

证明(连续场合)[分布函数法]:设 ,则 的分布函数为 ,密度函数

由变量替换(Stieltjes积分)可得:

离散场合的证明类似,只需将积分改为求和。

E(X²)的两种计算方法

例 2.2.6 — E(X²)的两种计算方法

的分布列如下:

方法一(先求 的分布)

的可能取值为

方法二(LOTUS法则,直接计算)

两种方法结果一致,但方法二(LOTUS)更为直接,无需先构造 的分布列。


五、数学期望的性质

常数的期望

性质 2.2.1 — 常数的期望

是常数,则

证明思路

证明:将 看作仅取一个值的(退化)随机变量

[退化分布]:常数是方差为零的特殊随机变量。

常数倍的期望

性质 2.2.2 — 常数倍的期望

对任意常数 ,有 \tag{2.2.4}

证明思路

证明(离散场合):在公式 (2.2.3) 中令

[提取常数]:将常数 从求和号中提出。连续场合类似,将求和改为积分。

和差的期望

性质 2.2.3 — 和差的期望

对任意的两个函数 ,有

证明思路

证明(离散场合):在公式 (2.2.3) 中令

[求和的线性性]:有限求和(或绝对收敛的无限求和)可以逐项拆分。

重要推论——期望的线性性

由以上三条性质,可以立即得到期望的线性性

更一般地,对多个随机变量:

关键要点

期望的线性性不要求各随机变量相互独立。这是期望区别于方差、矩等数字特征的关键特点。无论 之间有何种依赖关系,期望的线性性都成立。

库存优化问题

例 2.2.7 — 库存优化问题

某商品的市场需求量 (单位:吨)。每售出一吨获利 千元;若供过于求,积压的每吨损失 千元。问应组织多少货源使期望利润最大?

建模

设组织货源 吨(),利润函数为:

计算期望利润

第一部分:

第二部分:

合并:

求最大值

关于 求导并令其为零:

吨时,期望利润最大:


六、知识结构总览

graph TD
    A[数学期望] --> B[概念引入]
    A --> C[严格定义]
    A --> D[函数期望公式]
    A --> E[期望的性质]
    A --> F[应用实例]

    B --> B1[分赌本问题]
    B --> B2[概率加权平均]

    C --> C1[离散型定义]
    C --> C2[连续型定义]
    C --> C3[绝对收敛条件]

    D --> D1[LOTUS法则]
    D --> D2[无需先求函数分布]

    E --> E1[常数期望]
    E --> E2[常数倍性质]
    E --> E3[和差性质]
    E --> E4[线性性无需独立]

    F --> F1[分组验血]
    F --> F2[彩票期望]
    F --> F3[库存优化]

七、核心思想与证明技巧

期望的线性性不要求独立性

这是本节最重要的核心思想:

  • 恒成立,无需任何条件
  • 需要 独立(或至少不相关)

这是期望区别于方差等数字特征的关键特点。在解题时,当我们需要计算 时,完全不需要考虑 之间的依赖关系,直接逐个求期望再相加即可。

LOTUS法则的实用价值

LOTUS(Law Of The Unconscious Statistician)法则的价值在于:

  • 计算 时==无需先求 的分布==
  • 直接用 的原分布加权求和/积分
  • 特别适用于 等矩的计算
  • 是后续定义方差 的计算基础

绝对收敛条件的必要性

  • 保证期望的唯一性(不受求和次序影响)
  • 柯西分布是期望不存在的经典反例
  • 有限个可能值的随机变量期望总存在
  • 对称分布的”主值”不等于期望(除非绝对收敛)

期望作为消除随机性的工具

  • 将随机变量映射为一个确定的数值
  • 是后续方差、协方差、相关系数等概念的基础
  • 大数定律的本质就是期望的体现——样本均值趋近于期望
  • 在决策问题中,期望常作为最优化的目标函数

指示变量法(和式分解法)

这是一种非常重要的解题技巧:

  • 将复杂随机变量 分解为简单指示变量之和:
  • 每个 只取
  • 利用线性性:
  • 无需考虑变量间的依赖关系,这是指示变量法最大的优势
  • 是解决组合计数期望问题的利器(见习题7、习题9)

期望的局限性——为什么需要方差

期望相同但分布不同

,但 的取值明显比 更分散。

结论数学期望只能描述分布的"中心位置",无法区分分布的"分散程度"。这正是引入方差的动机——方差度量随机变量取值偏离期望的平均程度。


八、补充理解与易混淆点

期望不一定存在

来源:教材p71 + MIT 18.05 + Stanford Stat 116 + UCLA Stats 100A + 华东师大讲义

误区1:"任何随机变量都有数学期望"

错误解释:既然期望就是”平均值”,那每个随机变量都应该有一个确定的平均值。比如柯西分布虽然密度函数看起来很正常,它的期望也应该存在。

正确解释:数学期望不一定存在。定义中要求级数(或积分)绝对收敛,这个条件不是总能满足的。经典反例是柯西分布,虽然密度函数关于原点对称(直观上”平均值”应该是0),但 ,不满足绝对可积条件,因此 不存在。

对称分布的陷阱

柯西分布的密度函数关于原点对称, 按Cauchy主值意义下等于0,但这不等于期望存在。期望存在要求绝对收敛,而不仅仅是主值收敛。对称性只能保证如果期望存在,则期望为0。


期望的线性性无需独立性

来源:教材p74-75 + MIT 18.05 + 3Blue1Brown概率论系列 + 中科大432真题 + 华东师大讲义

误区2:"E(X+Y) = E(X)+E(Y) 需要X和Y独立"

错误解释:期望的线性性要求随机变量之间相互独立。如果X和Y不独立(比如Y = X²),那么E(X+Y) ≠ E(X)+E(Y)。

正确解释 恒成立不需要任何独立性条件。这是期望最重要的性质之一。证明直接由LOTUS法则得出——积分(或求和)的线性性保证了期望的线性性。

常见混淆

容易混淆的是: 才需要X与Y独立(或至少不相关)。线性性(加法)和可乘性(乘法)是两个不同的性质,前者无条件成立,后者需要独立性。


期望的平方不等于平方的期望

来源:教材p74 + MIT 18.05 + Stanford Stat 116 + 多校考研真题 + CSDN概率论专栏

误区3:"E(X²) = (E(X))²"

错误解释:期望是一种”平均”,所以先平方再平均和先平均再平方应该一样。即E(X²) = (E(X))²。

正确解释:一般情况下 。实际上,由Jensen不等式(或直接展开),,等号成立当且仅当 为常数(方差为零)。

反例

取值 ,各概率 。则 。但

这个关系 正是方差的定义基础,将在 §2.3 中详细讨论。


期望不等于众数或中位数

来源:教材p70-71 + MIT 18.05 + Stanford Stat 116 + UCLA Stats 100A + 华东师大讲义

误区4:"连续随机变量的期望就是密度函数最大值处的x"

错误解释:密度函数最大的地方就是概率最集中的地方,所以期望应该在密度函数的峰值处。比如正态分布的密度函数在处最大,所以期望就是峰值位置。

正确解释:期望是概率的加权平均(重心),而不是密度函数的峰值位置(众数),也不是累积概率等于0.5的位置(中位数)。期望、众数、中位数是三个不同的集中趋势度量,它们仅在分布对称时才重合。

反例

  • 指数分布 :密度函数在 处最大(众数为0),但 。期望和众数完全不同。
  • 右偏分布(如Gamma分布):众数 < 中位数 < 期望,三者依次右移。
  • 正态分布:三者重合于 ,但这只是对称分布的特殊性质。

期望一定在取值范围内

来源:教材p70 + MIT 18.05 + Stanford Stat 116 + 多校考研真题 + 华东师大讲义

误区5:"期望可能超出随机变量的取值范围"

错误解释:期望是”概率加权平均”,权重之和为1,但加权平均的结果可能超出取值范围。比如X取值0和1,E(X)可能大于1或小于0。

正确解释:期望==一定在随机变量的取值范围 内==。这是因为期望是取值的凸组合(加权平均,权重非负且和为1),而凸组合的结果一定在凸包(即取值范围)内。

数学表述

(几乎必然),则

证明:令 ,则 (因为非负随机变量的期望非负),故 。同理


九、习题精选

习题概览

编号题目来源知识点难度
1教材 2.2-1基础期望计算★★☆
2教材 2.2-4超几何分布的期望★★★
3教材 2.2-10指数分布的期望★★☆
4教材 2.2-13由分布函数求期望★★★
5教材 2.2-15工程工期与利润★★★
6教材 2.2-18期望恒等式证明★★★
72015武汉大学432期望与相关性★★★
82019上海财经大学432平均绝对离差与中位数★★★
92020东华大学432相关系数与期望方差★★★
102015中国科学技术大学432指数分布次序统计量★★★

教材习题

习题1

习题1(教材 2.2-1)— 基础期望计算

已知 的分布列:

习题2

习题2(教材 2.2-4)— 超几何分布的期望

船上装有20桶化工原料,其中5桶被海水污染。现从中随机抽取8桶,以 表示被污染的桶数。求 的分布列和

习题3

习题3(教材 2.2-10)— 指数分布的期望

某设备维修时间 (小时)的密度函数为 )。求平均维修时间

习题4

习题4(教材 2.2-13)— 由分布函数求期望

随机变量 的分布函数为

习题5

习题5(教材 2.2-15)— 工程工期与利润

(1) 工程工期 的分布:。求平均工期。 (2) 利润 万元,求平均利润。 (3) 新方案 。求新方案平均利润及利润增加额。

习题6

习题6(教材 2.2-18)— 期望恒等式证明

为仅取非负整数的离散随机变量,若其数学期望存在,证明:

考研真题

习题7

习题7(2015 武汉大学 432)— 期望与相关性

为两个随机变量,则下列命题中正确的是( ) A. 若 ,则 独立 B. 若 独立,则 C. 若 ,则 独立 D. 若 不相关,则

习题8

习题8(2019 上海财经大学 432)— 平均绝对离差与中位数

设连续随机变量 的密度函数为 的中位数。证明:

习题9

习题9(2020 东华大学 432)— 相关系数与期望方差

设随机变量 的相关系数 。求

习题10

习题10(2015 中国科学技术大学 432)— 指数分布次序统计量的期望

为来自 的简单随机样本,。求


十、教材原文

以下为教材扫描版原文,可点击翻阅。

第二章 随机变量及其分布/数学期望