2.6 随机变量函数的分布
本节概览
本节讨论一个核心问题:已知随机变量 的分布,如何求 的分布?这是概率论中极具实用价值的技术,在统计模拟、假设检验、数据变换等场景中广泛应用。
逻辑链条:离散型列表法(直接枚举)→ 连续型公式法(严格单调可导)→ 重要结论(正态变换、对数正态、伽马变换)→ 概率积分变换(连接所有连续分布与均匀分布)→ 非单调情形与分布函数法(通用方法)→ 方法总结与对比
前置依赖:§2.1(分布函数、密度函数)、§2.5(正态分布、指数分布、伽马分布)
核心主线:求 的分布有两种基本方法——公式法(适用于 严格单调可导)和分布函数法(适用于一切情形)。概率积分变换 是连接所有连续分布的桥梁,也是随机模拟的理论基础。
一、离散型随机变量函数的分布
当 是离散型随机变量时,求 的分布列使用列表法,思路非常直接:逐一列出 的每个取值对应的 值,合并相同的 值并累加概率。
列表法的基本步骤
- 列出 的所有可能取值 及其概率 ;
- 计算 ,得到 的所有可能取值;
- 合并相同的 值,将对应概率相加;
- 写出 的分布列。
例 2.6.1 — 离散型列表法
设 的分布列为
求 的分布列。
解:逐一计算 :
合并相同 值:
- :
- :
- :
因此 的分布列为
列表法的关键注意事项:
- 当 不是一一映射时,不同的 可能映射到相同的 ,此时需要合并概率;
- 需要检查 的取值是否有遗漏或重复;
- 离散型情形不存在”单调性”的要求,列表法始终适用。
列表法与连续型的本质区别:离散型随机变量的函数分布问题本质上是”映射 + 合并”的组合操作。由于离散型随机变量只取有限或可列个值,我们完全可以枚举所有情况。而连续型随机变量的取值不可枚举,必须借助分析工具(公式法或分布函数法)来处理。
验证概率守恒:在例 2.6.1 中,合并后的概率之和为 ,验证了概率守恒。这是检查答案正确性的基本方法—— 的分布列中所有概率之和必须等于 1。
二、连续型随机变量函数的分布(公式法)
当 是连续型随机变量且 时,如果 是严格单调可导函数,则可以直接使用公式法求 的密度函数。
定理 2.6.1 — 公式法(变量代换公式)
定理 2.6.1 — 随机变量函数的密度(严格单调情形)
设 是连续型随机变量,其密度函数为 。若 在 的取值范围内严格单调可导,且其反函数为 ,则 的密度函数为
Abstract
证明: [反函数代换与雅可比因子]
不妨设 严格单调递增(递减情形类似)。
第一步:从分布函数出发
其中 是 的反函数,且由于 严格单调递增,不等号方向不变。
第二步:对 求导得密度函数
最后一步使用了链式法则:。
第三步:处理单调递减情形
若 严格单调递减,则
求导得 (因为递减时 )。
综合两种情形,统一写为
其中 就是变量代换中的雅可比因子,它保证了概率的守恒。
公式法的使用要点
使用公式法时需要注意以下几点:
- 单调性检查:必须先验证 在 的取值范围内严格单调;
- 反函数存在性:严格单调保证反函数 存在且可导;
- 的取值范围:需要根据 的取值范围和 的映射关系确定 的支撑集;
- 因子:绝对值确保密度函数非负,本质是变量代换的雅可比行列式。
雅可比因子的直观理解
公式法的核心是雅可比因子 。为了理解它为什么存在,考虑一个简单的例子:
设 ,。那么 。
- 的密度:,
- 的密度:,
为什么 而不是 ?因为变换 将 区间”拉伸”了两倍变成 。同样的概率质量被分散到了两倍长的区间上,所以密度减半。雅可比因子 正好反映了这个”拉伸”效应。
一般规律:
- 当 时,变换”拉伸”区间,密度函数变矮();
- 当 时,变换”压缩”区间,密度函数变高();
- 当 时,区间长度不变,密度函数不变()。
这与微积分中积分换元的几何直觉完全一致。
直观理解:公式法的本质是变量代换。就像积分换元 时需要乘以 来补偿”拉伸”或”压缩”效应一样,密度函数在变量代换时也需要乘以这个因子来保证概率守恒。
例 2.6.2 — 正态线性变换
设 ,求 的分布。
解:这里 ,严格单调递增,反函数 ,。
的密度函数为
由公式法:
化简指数部分:
因此
即 ,验证了 。
三、重要结论
本节给出三个重要的分布变换结论,它们是公式法的直接应用,在理论和实践中都有广泛用途。
定理 2.6.2 — 正态分布的线性变换
定理 2.6.2 — 正态线性变换
若 ,则对任意常数 和 ,
特别地,标准化变换 。
Abstract
证明: [标准化与线性性]
令 ,则由公式法(或直接标准化)知 。
于是 。
由于 ,由正态分布的线性性质(或再次应用公式法):
因此 。
意义:正态分布在线性变换下保持正态性,这是正态分布的标志性性质之一。它说明正态分布的”家族”在线性变换下是封闭的。
推论:若 ,则
- (标准化)
- (关于原点对称翻转)
- (平移不改变形状)
定理 2.6.3 — 对数正态分布
定理 2.6.3 — 对数正态分布
若 ,则 服从参数为 的对数正态分布,记为 ,其密度函数为
其期望和方差分别为
Abstract
证明: [指数变换与对数代换]
令 ,严格单调递增,反函数 ,。
由公式法:
期望的推导:
合并指数:
对指数部分配方:
因此
方差的推导类似,利用 ,再由 可得。
应用场景:对数正态分布广泛用于描述股票价格、收入分布、保险索赔额等”正偏”数据。其特点是取值恒正、右偏分布,且取对数后服从正态分布。
对数正态分布与正态分布的关系总结:
| 性质 | 正态分布 | 对数正态分布 |
|---|---|---|
| 取值范围 | ||
| 对称性 | 关于 对称 | 右偏(正偏) |
| 与正态的关系 | 本身 | 取对数后为正态 |
| 期望 | ||
| 方差 | ||
| 众数 |
注意:对数正态分布的期望 大于 (几何均值),这是右偏分布的典型特征——均值被右侧长尾拉高。
定理 2.6.4 — 伽马分布的尺度变换
定理 2.6.4 — 伽马尺度变换
若 ,则对任意常数 ,
Abstract
证明: [尺度参数代换]
的密度函数为
令 (),严格单调递增,反函数 ,。
由公式法:
这正是 的密度函数。
意义:尺度变换只改变伽马分布的速率参数 ,不改变形状参数 。特别地,当 时,,则 。
伽马尺度变换的直观理解:如果 表示等待 个事件发生的时间(事件发生率 ),那么 就是在时间尺度放大 倍后的等待时间。时间尺度放大等价于事件发生率缩小为 ,因此 。
与卡方分布的关系:当 , 时, 就是自由度为 的卡方分布 。由伽马尺度变换,,这不是卡方分布。但若 ,则 ()服从尺度化的卡方分布,这一性质在统计推断中经常用到。
四、概率积分变换
概率积分变换(Probability Integral Transform)是概率论中一个优美而深刻的结果,它建立了所有连续分布与均匀分布之间的桥梁。
定理 2.6.5 — 概率积分变换
定理 2.6.5 — 概率积分变换
设 是连续型随机变量,其分布函数为 ,则
即 服从 上的标准均匀分布。
Abstract
证明: [分布函数法与均匀性]
设 ,我们需要证明对任意 ,。
第一步:写出 的分布函数
第二步:利用 的单调性反解
由于 是单调不减函数(分布函数的基本性质),且 连续( 为连续型),故 存在反函数 (推广意义下的广义反函数)。
第三步:验证边界
- 当 时,(因为 );
- 当 时,。
因此 ,这正是 的分布函数。
求导得 。
逆变换法(Inverse Transform Method)
概率积分变换的直接应用是逆变换法,它是随机模拟中最基本的抽样方法。
逆变换法的步骤:
- 生成 ;
- 令 ,则 的分布函数恰好为 。
正确性验证:
最后一步利用了 的性质:(当 )。
直观理解:分布函数 给出了随机变量落在 的概率。如果我们”按概率比例”在 轴上均匀取点,然后通过 映射回 轴,那么落在每个区间的比例恰好等于该区间的概率——这正是分布 所要求的。
应用举例:
- 指数分布:,反函数 ;
- 均匀分布 :;
- 韦布尔分布:,反函数 。
概率积分变换的深入理解
概率积分变换之所以成立,关键在于分布函数 的三个核心性质:
- 单调不减:保证了 等价于 ;
- 连续性: 为连续型保证了 连续,从而 不会取到 和 (概率为零的事件);
- 值域为 :保证了 的取值范围恰好是 。
为什么要求 是连续型? 如果 是离散型, 是阶梯函数, 的分布就不是均匀分布。例如,若 (伯努利分布),则 以概率 取 ,以概率 取 ,显然不是均匀分布。
概率积分变换与随机模拟:在蒙特卡洛模拟中,计算机只能直接生成均匀分布 的随机数。通过逆变换法,我们可以从均匀分布”变换”出任意连续分布的随机数。这是所有随机模拟算法的基础。
推广:概率积分变换可以推广到多维情形。若 是连续型随机向量,则通过 Rosenblatt 变换可以将它们变换为 个独立的 随机变量。这在Copula理论和多元统计模拟中有重要应用。
五、非单调情形与分布函数法
当 不是严格单调函数时,公式法不再直接适用。此时需要使用更通用的分布函数法(又称 CDF 法)。
分布函数法的基本步骤
- 写出 的分布函数 ;
- 利用 的分布函数或密度函数,将 化为关于 的概率;
- 对 求导,得到 。
分段单调推广公式
当 在不同区间上分别单调时,可以将公式法推广为分段单调公式:
定义 2.6.1 — 分段单调推广公式
设 将 的取值范围分为 个区间 ,在每个 上 严格单调可导,反函数为 ,则
这个公式可以理解为:在每个单调区间上分别应用公式法,然后将结果相加。
例 2.6.3 — 卡方分布的推导( ,)
设 ,求 的密度函数。
解: 不是单调函数,使用分布函数法。
第一步:求
当 时:
当 时,。
第二步:求导得
代入 :
这正是自由度为 1 的卡方分布 的密度函数。
卡方分布的参数形式:一般地,若 ,则 。更一般地,若 独立同分布 ,则 。卡方分布在假设检验(拟合优度检验、独立性检验)和置信区间估计中有核心地位。
用分段单调公式验证: 在 上单调递减,反函数 ;在 上单调递增,反函数 。
结果一致,验证了分段单调公式的正确性。
例 2.6.4 — 的密度函数
设 ,求 的密度函数。
解: 在 上不是单调函数,使用分布函数法。
第一步:分析 的取值范围
。
第二步:求
对 ,方程 在 上有两个解:
当 时:
需要找到 中满足 的 的集合。由于 在 上先增后减,在 上先减后增:
第三步:求导得
用分段单调公式验证: 在 上递增(反函数 ),在 上递减(反函数 ),在 上递增(反函数 )。
两种方法结果一致。
六、方法总结与对比
公式法 vs 分布函数法
| 对比维度 | 公式法 | 分布函数法 |
|---|---|---|
| 适用条件 | 严格单调可导 | 无限制(通用方法) |
| 基本思路 | 利用反函数和雅可比因子直接写出密度 | 先求分布函数,再求导 |
| 计算复杂度 | 较低(一步到位) | 较高(需要求分布函数再求导) |
| 非单调情形 | 不直接适用(需分段推广) | 直接适用 |
| 结果形式 | 直接得到密度函数 | 先得到分布函数,再导出密度 |
| 典型应用 | 线性变换、指数变换、对数变换 | 平方变换、三角变换等非单调情形 |
| 易错点 | 忘记绝对值 $ | h’(y) |
方法选择流程
- 是离散型 → 使用列表法;
- 是连续型且 严格单调可导 → 优先使用公式法(简洁高效);
- 是连续型且 非单调 → 使用分布函数法(或分段单调推广公式);
- 需要生成指定分布的随机数 → 使用逆变换法(概率积分变换的逆应用)。
常见变换类型与方法选择速查
| 变换类型 | 是否单调 | 推荐方法 | 典型例子 |
|---|---|---|---|
| 线性变换 | 是 | 公式法 | 正态标准化 |
| 指数变换 | 是 | 公式法 | 对数正态分布 |
| 对数变换 | 是() | 公式法 | 正态化变换 |
| 幂变换 () | 是() | 公式法 | Box-Cox变换 |
| 平方变换 () | 否 | 分布函数法 | 卡方分布 |
| 绝对值 $ | X | $ | 否 |
| 三角函数 | 否 | 分布函数法 | 弧度分布 |
分布函数法的详细操作指南
分布函数法的核心难点在于第二步:将 转化为关于 的概率。以下是常见情形的处理策略:
情形1: 严格单调递增
情形2: 严格单调递减
情形3: 先增后减(如 ,)
需要解不等式 ,找到满足条件的 的集合。
情形4: 周期性振荡(如 ) 需要在一个完整周期内分析 的解集,然后利用周期性推广。
求导时的注意事项:
- 使用链式法则时不要遗漏因子;
- 注意积分上下限可能依赖于 (此时需要使用 Leibniz 积分法则);
- 检查最终密度函数是否非负且积分为 1。
七、知识结构总览
graph TD A["随机变量函数的分布"] --> B["离散型"] A --> C["连续型"] A --> D["概率积分变换"] B --> B1["列表法"] B1 --> B2["枚举取值 → 合并概率"] C --> C1["公式法"] C --> C2["分布函数法"] C1 --> C1a["严格单调可导"] C1 --> C1b["p_Y = p_X ∘ h · |h'|"] C2 --> C2a["非单调情形"] C2 --> C2b["先求F_Y再求导"] C2 --> C2c["分段单调推广"] C1b --> D1["正态线性变换"] C1b --> D2["对数正态分布"] C1b --> D3["伽马尺度变换"] D --> D4["F_X(X) ~ U(0,1)"] D --> D5["逆变换法"] D4 --> D5 D5 --> D5a["随机模拟与抽样"] style A fill:#8b5cf6,color:#fff,stroke:#7c3aed style B fill:#06b6d4,color:#fff style C fill:#06b6d4,color:#fff style D fill:#06b6d4,color:#fff style D1 fill:#22c55e,color:#fff style D2 fill:#22c55e,color:#fff style D3 fill:#22c55e,color:#fff style D4 fill:#22c55e,color:#fff style D5 fill:#22c55e,color:#fff
八、核心思想与证明技巧
变量代换与概率守恒
求随机变量函数分布的核心思想是概率守恒:变换前后,对应事件的概率必须相等。公式法中的 因子(雅可比因子)正是为了保证这一点。直观地说,当 将 轴上的区间”拉伸”或”压缩”映射到 轴时,密度函数需要相应地”变矮”或”变高”,以保持概率面积不变。
分布函数法的普适性
分布函数法之所以是”万能方法”,是因为它直接从概率的定义出发:。无论 的形式如何,这个等式始终成立。关键在于第二步——如何将 用 的分布来表示。这一步需要根据 的具体形式灵活处理,是不等式求解和集合运算的综合运用。
证明技巧
- 链式法则:在公式法的证明中, 是核心步骤;
- 绝对值的来源:单调递减时 ,取绝对值保证密度非负;
- 分段处理:非单调函数需要分段考虑每个单调区间,然后叠加贡献;
- 配方技巧:在对数正态分布期望的推导中,指数部分的配方是关键代数技巧。
与微积分中变量代换的类比
概率论中求随机变量函数的分布,与微积分中的变量代换(换元积分法)有深刻的类比关系:
| 微积分 | 概率论 |
|---|---|
| $\displaystyle\int_a^b f(x),dx = \int_{g(a)}^{g(b)} f(h(y)) | h’(y) |
| (微分代换) | $ |
| 积分值不变(积分守恒) | 概率值不变(概率守恒) |
| 换元后积分区间改变 | 变换后支撑集改变 |
这个类比帮助我们理解:公式法本质上就是密度函数层面的”换元”。密度函数不是一个普通的函数,它必须满足归一化条件(积分为 1),因此变量代换时必须乘以雅可比因子来”补偿”区间长度的变化。
分布函数法的理论地位
分布函数法虽然计算上可能比公式法繁琐,但它在理论上具有特殊地位:
- 普适性:不依赖 的任何特殊性质(单调性、可导性等),适用于所有情形;
- 理论价值:许多重要分布(如卡方分布、 分布、 分布)的推导都依赖分布函数法;
- 教学价值:分布函数法直接体现了”概率 = 分布函数”这一基本关系,有助于建立正确的概率直觉。
在实际应用中,建议的策略是:先判断能否用公式法,能用就用(简洁);不能用则毫不犹豫地使用分布函数法(通用)。
九、补充理解与易混淆点
误区一:公式法适用于所有函数
来源:教材定理2.6.1条件 + Ross《概率论》第五章 + MIT OCW 18.05 + 考研真题非单调误用公式 + 跨考考研复习指南
Danger
误区:认为只要 可导,就可以直接套用公式 。
❌ 错误原因:公式法要求 严格单调可导。如果 不是严格单调的(如 ),则 的反函数 不存在(或不是单值的),公式法不能直接使用。
✅ 正确理解:公式法仅适用于严格单调可导函数。对于非单调函数,应使用分布函数法或分段单调推广公式。
误区二:分布函数法比公式法更高级
来源:教材§2.6方法选择 + Casella & Berger《统计推断》+ 陈希孺《概率论》+ 网课讲解中方法对比不足 + 考研复习常见方法混淆
Danger
误区:认为分布函数法是”更高级”的方法,应该优先使用。
❌ 错误原因:两种方法各有适用场景。公式法在严格单调情形下更简洁高效,一步到位得到密度函数;分布函数法虽然通用,但计算步骤更多,容易出错。
✅ 正确理解:严格单调情形优先用公式法,非单调情形才用分布函数法。选择方法的标准是适用性和简洁性,而非”高级程度”。
误区三:概率积分变换只适用于均匀分布
来源:教材定理2.6.5 + Ross《概率模型》+ MIT OCW 6.041 + Wikipedia概率积分变换词条 + 随机数生成教材
Danger
误区:认为概率积分变换只是均匀分布的一个特殊性质。
❌ 错误原因:概率积分变换的深刻意义在于它建立了所有连续分布与均匀分布之间的桥梁。任何连续分布都可以通过 变换为均匀分布,反过来也可以通过逆变换从均匀分布生成任意连续分布。
✅ 正确理解:概率积分变换是连接所有连续分布的”万能接口”,是随机模拟(蒙特卡洛方法)的理论基石。
误区四: 的密度函数可以直接套公式
来源:教材§2.6分段单调 + 卡方核心笔记分段处理策略 + 考研真题Y=X²常见错误 + Stack Exchange + 跨考考研复习指南
Danger
误区:认为 可以直接使用公式法 。
❌ 错误原因: 在 上不是单调函数(在 递减,在 递增)。如果只考虑 这一支,会遗漏 的贡献,导致密度函数少了一半。
✅ 正确理解: 需要使用分布函数法或分段单调推广公式,正确结果为 。只有当 的取值范围为 时, 才是严格单调的,才能直接套用公式。
误区五:忘记考虑 的取值范围
来源:教材习题常见错误 + Ross《概率论》变换后支撑集讨论 + MIT OCW 18.05 + 考研真题漏掉支撑集 + 跨考考研复习指南
Danger
误区:求出 的表达式后,忘记标注 的取值范围(支撑集)。
❌ 错误原因:密度函数的定义域是变换结果的一部分。例如 的取值范围是 而非 ; 的取值范围是 。忽略支撑集会导致密度函数不完整甚至错误。
✅ 正确理解:求 的密度函数时,必须同步确定 的取值范围。可以先分析 的值域,也可以在分布函数法中自然得到( 或 的区间就是支撑集之外)。
十、习题精选
习题概览
编号 题目来源 核心考点 难度 方法 1 教材2.6-1 离散型函数的分布列 ★★☆ 列表法 2 教材2.6-4 均匀分布线性变换 ★★☆ 公式法 3 教材2.6-8 均匀分布平方变换 ★★★☆ 分布函数法 4 教材2.6-12 正态分布平方变换 ★★★☆ 分布函数法 5 教材2.6-16 指数分布与均匀分布 ★★★☆ 公式法/概率积分变换 6 教材2.6-18 对数正态分布概率计算 ★★★☆ 公式法应用 7 2016山东大学432 柯西分布线性变换 ★★★☆ 公式法 8 2015山东大学432 平方变换一般推导 ★★★★ 分布函数法 9 2017兰州大学432 正态→对数正态 ★★★☆ 公式法 10 2022上海财经大学432 逆变换法求函数 ★★★★ 概率积分变换
习题 1 — 教材2.6-1:离散型 与 的分布列
设 的分布列为
分别求 和 的分布列。
查看解答
的分布列:
合并:,,。
的分布列:
$z = x $ 合并:,,。
习题 2 — 教材2.6-4:均匀分布的线性变换
设 ,求 的分布。
查看解答
,严格单调递减,反函数 ,。
,。
因此 。
结论:均匀分布关于 对称, 与 同分布。更一般地,若 ,则 。
习题 3 — 教材2.6-8:均匀分布的平方变换
设 ,求 的密度函数。
查看解答
,,。
在 上严格单调递增,反函数 ,。
的取值范围:。
验证:。 ✓
习题 4 — 教材2.6-12:正态分布的平方变换
设 ,求 的分布。
查看解答
。
非单调,使用分布函数法。
当 时:
令 ,则 的密度函数为
这正是 分布。因此 ,即 。
习题 5 — 教材2.6-16:指数分布与概率积分变换
设 ,证明 。
查看解答
方法一:概率积分变换
的分布函数为 ,。
由概率积分变换定理,。直接得证。
方法二:公式法验证
,在 上严格单调递增。
反函数:。
。
因此 。 ✓
习题 6 — 教材2.6-18:对数正态分布概率计算
设 ,,求 。
查看解答
。
。
其中 。
因此 。
习题 7 — 2016山东大学432:柯西分布的线性变换
设 服从标准柯西分布,密度函数为 ,求 的密度函数。
查看解答
严格单调递增,反函数 ,。
即 ,。
验证:。 ✓
注:柯西分布的一个重要特征是它的期望和方差都不存在(因为积分 发散)。线性变换 ()将标准柯西分布变为位置参数 、尺度参数 的一般柯西分布。
习题 8 — 2015山东大学432:平方变换的一般推导
设 为连续型随机变量,密度函数为 ,求 的密度函数。
查看解答
使用分布函数法。
当 时:
当 时,。
特殊情形:若 的密度关于原点对称(即 ),则
习题 9 — 2017兰州大学432:正态分布的指数变换
设 ,求 的密度函数。
查看解答
严格单调递增,反函数 ,。
这正是 的密度函数。
习题 10 — 2022上海财经大学432:逆变换法求函数
设 ,求函数 使得 。
查看解答
这是概率积分变换的逆问题:已知目标分布,求从均匀分布到目标分布的变换。
的分布函数为
由逆变换法,令 :
因此 。
验证:。 ✓
注:由于 , 也是正确的答案。
十一、教材原文
第二章 随机变量及其分布/随机变量函数的分布