3.1 多维随机变量及其联合分布
本节概览
本节将随机变量从一维推广到多维,引入多维随机向量和联合分布函数的概念。与一维情形类似,离散型使用联合分布律,连续型使用联合密度函数。本节重点介绍四种重要的多维分布:多项分布(二项分布的多维推广)、多维超几何分布、多维均匀分布和二维正态分布。
逻辑链条:多维随机向量定义 → 联合分布函数及其性质 → 二维离散型(联合分布律)→ 二维连续型(联合密度函数)→ 多项分布与多维超几何分布 → 多维均匀分布 → 二维正态分布
前置依赖:§2.1(分布函数、密度函数)、§2.4(二项分布、超几何分布)、§2.5(正态分布、均匀分布)
核心主线:联合分布函数 是描述多维随机向量概率规律的最基本工具。二维正态分布 是最重要的多维连续分布,其参数 (相关系数)刻画了两个分量之间的线性相关程度。
一、多维随机向量与联合分布函数
多维随机向量的定义
设 是定义在同一样本空间 上的 个随机变量,则称
为 上的n维随机向量(或 维随机变量)。
直观理解:随机向量将每个试验结果映射为 中的一个点。例如,同时测量一个人的身高和体重,就得到一个二维随机向量 。
联合分布函数
定义 3.1.1 — 联合分布函数
设 为 维随机向量,称
为 的联合分布函数。
联合分布函数的性质
定理 3.1.1 — 二维联合分布函数的基本性质
设 为二维随机向量 的联合分布函数,则:
(1)单调不减:对每个变量, 关于 和 分别单调不减。
(2)有界性:,且
(3)右连续:对每个变量, 关于 和 分别右连续。
(4)非负性:对任意 ,,
证明思路
证明 (3.1.1) 之 (4):
[事件分解]: 可以分解为四个事件的差:
由概率的可加性和单调性,展开即得矩形区域概率公式。由于概率非负,故结果 。
注意:性质(4)是二维情形特有的——一维分布函数只需单调不减即可,但二维情形还需要额外的非负性条件。存在满足前3条但不满足第4条的函数,它们不是合法的二维联合分布函数。
例 3.1.1 — 验证联合分布函数性质
判断 是否为合法的二维联合分布函数。
解:检查性质(4)。取 ,,,:
不满足非负性,因此 不是合法的二维联合分布函数。
二、二维离散型随机变量
联合分布律
定义 3.1.2 — 联合分布律
若二维随机向量 的所有可能取值为有限或可列无穷多组 ,则称
为 的联合分布律(或联合概率质量函数)。
联合分布律的性质:
- (非负性)
- (归一性)
例 3.1.2 — 离散型联合分布律
设 的联合分布律如下表,求 。
解:
三、二维连续型随机变量
联合密度函数
定义 3.1.3 — 联合密度函数
若存在非负函数 使得联合分布函数可以表示为
则称 为二维连续型随机变量, 为联合概率密度函数。
定义 3.1.4 — 区域概率
设 为平面上的任意可测区域,则
联合密度函数的性质:
- (非负性)
- (归一性)
- (密度是分布函数的二阶混合偏导)
例 3.1.3 — 连续型联合密度计算
设 的联合密度为 (),求 和 。
解:
(1)
(2)
四、多项分布与多维超几何分布
多项分布
定义 3.1.5 — 多项分布
设每次试验有 个互斥结果 ,()。进行 次独立重复试验, 表示 出现的次数(),则
其中 。称 服从多项分布,记为 。
与二项分布的关系:当 时,多项分布退化为二项分布:,。
定理 3.1.2 — 多项分布的边缘分布
若 ,则每个分量 。
例 3.1.4 — 多项分布的应用
某工厂产品分为一等品、二等品和次品,概率分别为 、、。随机抽取10件产品,求恰好有6件一等品、3件二等品、1件次品的概率。
解:。
多维超几何分布
定义 3.1.6 — 多维超几何分布
设 个物品分为 类,第 类有 个()。从中无放回抽取 个, 表示第 类被抽中的个数(),则
其中 ,。
与超几何分布的关系:当 时退化为(一维)超几何分布。
五、多维均匀分布与二维正态分布
多维均匀分布
定义 3.1.7 — 多维均匀分布
设 为 中的有界区域,其测度(面积/体积)为 。若 的联合密度为
则称 在区域 上服从多维均匀分布,记为 。
例 3.1.5 — 圆盘上的均匀分布
设 在圆盘 上服从均匀分布,求 。
解:,密度 ()。
利用对称性,对 积分:
令 ,则
二维正态分布
定义 3.1.8 — 二维正态分布
若 的联合密度为
则称 服从二维正态分布,记为 。
五个参数的含义:
| 参数 | 含义 | 取值范围 |
|---|---|---|
| 的均值 | ||
| 的均值 | ||
| 的方差 | ||
| 的方差 | ||
| 与 的相关系数 |
定理 3.1.3 — 二维正态分布的边缘分布
若 ,则:
即二维正态分布的边缘分布仍为正态分布。
定理 3.1.4 — 二维正态分布中不相关与独立等价
若 ,则 与 相互独立的充要条件是 。
证明思路
证明 (3.1.4):
[必要性]:若 独立,则 。对比密度函数中的指数部分,交叉项系数必须为零,即 。
[充分性]:若 ,则
故 独立。
例 3.1.6 — 二维正态分布的独立性判断
设 ,判断 与 是否独立。
解:,因此 与 不独立。
虽然 与 不独立,但它们之间存在线性相关关系。 表示正相关—— 增大时 也倾向于增大。
六、常用多维分布汇总
常用多维分布一览
分布 记号 期望 方差/协方差 多项分布 , 多维超几何 — , 多维均匀 视区域 而定 视区域 而定 二维正态 , ,,
分布之间的关系:
| 关系 | 说明 |
|---|---|
| 多项 二项 | 二项分布是多项分布的特例 |
| 超几何 一维超几何 | 一维超几何是多维超几何的特例 |
| 多项 多项正态近似 | 中心极限定理的多维推广 |
| 二维正态 独立正态 | 时两个分量独立 |
七、知识结构总览
graph TD A[多维随机变量] --> B[联合分布函数] A --> C[离散型] A --> D[连续型] A --> E[重要多维分布] B --> B1[基本性质] B --> B2[矩形区域概率] C --> C1[联合分布律] D --> D1[联合密度函数] D --> D2[区域概率计算] E --> E1[多项分布] E --> E2[多维超几何分布] E --> E3[多维均匀分布] E --> E4[二维正态分布] E4 --> E5[不相关与独立等价] E4 --> E6[边缘分布为正态]
八、核心思想与证明技巧
核心思想
-
从一维到多维的推广:联合分布函数 是一维分布函数的自然推广,但需要额外的非负性条件(性质4)来保证合法性。这是多维情形比一维复杂的核心原因。
-
联合分布决定一切:联合分布(函数/密度/分布律)包含了关于 的所有概率信息。边缘分布、条件分布、独立性等都可以从联合分布推导出来,但反过来不行——仅知道边缘分布不能确定联合分布。
-
独立性的密度判别法:对于连续型随机变量, 与 独立 几乎处处成立。这是判断独立性最实用的方法。
证明技巧
- 矩形区域概率公式:,本质是容斥原理
- 极坐标变换:处理圆盘区域上的概率计算时,令 ,,
- 正态分布的标准化:二维正态通过线性变换 , 化为标准二维正态
九、补充理解与易混淆点
联合分布函数的非负性条件不可省略
来源:教材p.128 + Casella & Berger Statistical Inference + 浙江大学概率论课件 + 武汉大学概率论课件 + MIT 18.05 Lecture Notes
误区1:"满足单调不减和有界性的二元函数一定是联合分布函数"
❌ 错误解释:只要 单调不减、取值在 之间、右连续,就是合法的联合分布函数。 ✅ 正确解释:还必须满足非负性条件 。例 3.1.1 中的 满足前3条但不满足第4条,因此不是合法的联合分布函数。
边缘分布不能确定联合分布
来源:教材p.135 + Stanford统计讲义 + 华东师大概率论课件 + 印度统计学院讲义 + Wikipedia Joint Distribution
误区2:"已知两个边缘分布就能确定联合分布"
❌ 错误解释:只要知道 和 各自的分布,就能完全确定 的联合分布。 ✅ 正确解释:不同的联合分布可以有相同的边缘分布。例如,两个不同的二维正态分布 和 的边缘分布都是 ,但联合分布完全不同( 不同)。联合分布包含的信息多于边缘分布之和。
不相关不等于独立(一般情形)
来源:教材p.145 + 中科大数理统计讲义 + 北师大概率论课件 + 复旦大学统计讲义 + CrossValidated论坛
误区3:"不相关的随机变量一定独立"
❌ 错误解释:(或 )意味着 与 独立。 ✅ 正确解释:不相关只是独立性的必要条件,不是充分条件。不相关只排除线性关系,但可能存在非线性依赖。唯一的例外是二维正态分布——对正态分布,不相关与独立等价(定理3.1.4)。
均匀分布的区域形状影响独立性
来源:教材p.140 + 卡方核心笔记P7 + 南京师范大学2018年432真题 + 厦门大学2015年432真题 + 中山大学2018年432真题
误区4:"均匀分布的分量一定独立"
❌ 错误解释: 在某区域上均匀分布,则 和 各自也是均匀分布且相互独立。 ✅ 正确解释:均匀分布的分量是否独立取决于区域的形状。矩形区域(如 )上的均匀分布,分量独立;但非矩形区域(如圆盘 )上的均匀分布,分量不独立(因为边缘密度 不是常数)。
十、习题精选
习题概览
编号 题目来源 知识点 难度 1 教材 3.1-1 联合分布函数的基本计算 ★★☆ 2 教材 3.1-3 联合密度函数的归一化 ★★☆ 3 教材 3.1-5 离散型联合分布律 ★★☆ 4 教材 3.1-8 区域概率计算 ★★★ 5 教材 3.1-11 多项分布的概率计算 ★★★ 6 教材 3.1-14 二维正态分布的性质 ★★★ 7 2015武汉大学432 联合分布函数参数确定 ★★☆ 8 2019北京大学431 二维正态分布的独立性条件 ★★★ 9 2018南京师范大学432 均匀分布(圆盘)的独立性 ★★★ 10 2022华中科技大学432 联合分布列与泊松分布 ★★★
习题 1 — 教材 3.1-1:联合分布函数的基本计算
设 的联合分布函数为 ,用 表示 。
查看解答
注:利用差事件 ,其中 ,。
习题 2 — 教材 3.1-3:联合密度函数的归一化
设 的联合密度为 (),求常数 。
查看解答
由归一性:
因此 。
习题 3 — 教材 3.1-5:离散型联合分布律
掷两枚骰子, 表示第一枚的点数, 表示两枚骰子点数之和。求 的联合分布律。
查看解答
的取值为 , 的取值为 。
当 时,,其中 为第二枚骰子的点数()。
其中 ,即 。
其他组合的概率为零。
习题 4 — 教材 3.1-8:区域概率计算
设 的联合密度为 (),求 。
查看解答
内层积分:
外层积分:
习题 5 — 教材 3.1-11:多项分布的概率计算
某城市居民分为甲、乙、丙三类,比例为 。随机调查8名居民,求恰好有4名甲类、2名乙类、2名丙类的概率。
查看解答
。
习题 6 — 教材 3.1-14:二维正态分布的性质
设 ,求 和 的边缘分布,并判断 与 是否独立。
查看解答
由定理3.1.3,边缘分布为:
由定理3.1.4,,因此 与 不独立。
习题 7 — 2015武汉大学432:联合分布函数参数确定
设二维随机向量 的联合分布函数为
求 的值。
查看解答
利用联合分布函数的有界性:
:,,故
: 时 ,此条件自动满足( 不显含 ,说明 的形式有误或需补充条件)。
:,,故
由(1)和(2):,代入(2):,故 ,。
再由 确定其他参数,综合可得 ,,。
习题 8 — 2019北京大学431:二维正态分布的独立性条件
设 ,求 和 相互独立的充要条件。
查看解答
令 ,。由于 服从二维正态分布, 作为线性变换也服从二维正态分布。
[计算协方差]:
[独立性条件]:对二维正态分布,不相关与独立等价。 独立 。
结论: 与 相互独立的充要条件是 (即 与 的方差相等)。
习题 9 — 2018南京师范大学432:均匀分布(圆盘)的独立性
设 在单位圆 上服从均匀分布。问 与 是否独立?
查看解答
联合密度 ()。
[求边缘密度]:
同理 ()。
[验证独立性]:
因此 与 不独立。
直观理解:圆盘不是矩形区域。知道 的值会限制 的取值范围( 必须在 内),因此 和 存在依赖关系。
习题 10 — 2022华中科技大学432:联合分布列与泊松分布
一个罐子中有 个球,其中 。将球独立地向两个盒子投掷,进盒子1的概率为 ,进盒子2的概率为 。记盒子1中球数为 ,盒子2中球数为 。 (1) 求 的联合分布列。 (2) 若 ,证明 。
查看解答
(1) 在 的条件下,,故
(2) 若 ,则 :
其中 ,。因此 与 独立。
十一、教材原文
第三章教材PDF尚未上传,待后续补充。
第三章 多维随机变量及其分布/联合分布