3.1 多维随机变量及其联合分布

本节概览

本节将随机变量从一维推广到多维,引入多维随机向量联合分布函数的概念。与一维情形类似,离散型使用联合分布律,连续型使用联合密度函数。本节重点介绍四种重要的多维分布:多项分布(二项分布的多维推广)、多维超几何分布多维均匀分布二维正态分布

逻辑链条:多维随机向量定义 → 联合分布函数及其性质 → 二维离散型(联合分布律)→ 二维连续型(联合密度函数)→ 多项分布与多维超几何分布 → 多维均匀分布 → 二维正态分布

前置依赖§2.1(分布函数、密度函数)、§2.4(二项分布、超几何分布)、§2.5(正态分布、均匀分布)

核心主线:联合分布函数 是描述多维随机向量概率规律的最基本工具。二维正态分布 是最重要的多维连续分布,其参数 (相关系数)刻画了两个分量之间的线性相关程度。


一、多维随机向量与联合分布函数

多维随机向量的定义

是定义在同一样本空间 上的 个随机变量,则称

上的n维随机向量(或 维随机变量)。

直观理解:随机向量将每个试验结果映射为 中的一个点。例如,同时测量一个人的身高和体重,就得到一个二维随机向量

联合分布函数

定义 3.1.1 — 联合分布函数

维随机向量,称

联合分布函数

联合分布函数的性质

定理 3.1.1 — 二维联合分布函数的基本性质

为二维随机向量 的联合分布函数,则:

(1)单调不减:对每个变量, 关于 分别单调不减。

(2)有界性,且

(3)右连续:对每个变量, 关于 分别右连续。

(4)非负性:对任意

证明思路

证明 (3.1.1) 之 (4)

[事件分解] 可以分解为四个事件的差:

由概率的可加性和单调性,展开即得矩形区域概率公式。由于概率非负,故结果

注意:性质(4)是二维情形特有的——一维分布函数只需单调不减即可,但二维情形还需要额外的非负性条件。存在满足前3条但不满足第4条的函数,它们不是合法的二维联合分布函数。

例 3.1.1 — 验证联合分布函数性质

判断 是否为合法的二维联合分布函数。

:检查性质(4)。取

不满足非负性,因此 不是合法的二维联合分布函数。


二、二维离散型随机变量

联合分布律

定义 3.1.2 — 联合分布律

若二维随机向量 的所有可能取值为有限或可列无穷多组 ,则称

联合分布律(或联合概率质量函数)。

联合分布律的性质

  1. (非负性)
  2. (归一性)

例 3.1.2 — 离散型联合分布律

的联合分布律如下表,求


三、二维连续型随机变量

联合密度函数

定义 3.1.3 — 联合密度函数

若存在非负函数 使得联合分布函数可以表示为

则称 二维连续型随机变量联合概率密度函数

定义 3.1.4 — 区域概率

为平面上的任意可测区域,则

联合密度函数的性质

  1. (非负性)
  2. (归一性)
  3. (密度是分布函数的二阶混合偏导)

例 3.1.3 — 连续型联合密度计算

的联合密度为 ),求

(1)

(2)


四、多项分布与多维超几何分布

多项分布

定义 3.1.5 — 多项分布

设每次试验有 个互斥结果 )。进行 次独立重复试验, 表示 出现的次数(),则

其中 。称 服从多项分布,记为

与二项分布的关系:当 时,多项分布退化为二项分布:

定理 3.1.2 — 多项分布的边缘分布

,则每个分量

例 3.1.4 — 多项分布的应用

某工厂产品分为一等品、二等品和次品,概率分别为 。随机抽取10件产品,求恰好有6件一等品、3件二等品、1件次品的概率。

多维超几何分布

定义 3.1.6 — 多维超几何分布

个物品分为 类,第 类有 个()。从中无放回抽取 个, 表示第 类被抽中的个数(),则

其中

与超几何分布的关系:当 时退化为(一维)超几何分布。


五、多维均匀分布与二维正态分布

多维均匀分布

定义 3.1.7 — 多维均匀分布

中的有界区域,其测度(面积/体积)为 。若 的联合密度为

则称 在区域 上服从多维均匀分布,记为

例 3.1.5 — 圆盘上的均匀分布

在圆盘 上服从均匀分布,求

,密度 )。

利用对称性,对 积分:

,则

二维正态分布

定义 3.1.8 — 二维正态分布

的联合密度为

则称 服从二维正态分布,记为

五个参数的含义

参数含义取值范围
的均值
的均值
的方差
的方差
的相关系数

定理 3.1.3 — 二维正态分布的边缘分布

,则:

即二维正态分布的边缘分布仍为正态分布。

定理 3.1.4 — 二维正态分布中不相关与独立等价

,则 相互独立的充要条件是

证明思路

证明 (3.1.4)

[必要性]:若 独立,则 。对比密度函数中的指数部分,交叉项系数必须为零,即

[充分性]:若 ,则

独立。

例 3.1.6 — 二维正态分布的独立性判断

,判断 是否独立。

,因此 不独立

虽然 不独立,但它们之间存在线性相关关系。 表示正相关—— 增大时 也倾向于增大。


六、常用多维分布汇总

常用多维分布一览

分布记号期望方差/协方差
多项分布
多维超几何
多维均匀视区域 而定视区域 而定
二维正态

分布之间的关系

关系说明
多项 二项二项分布是多项分布的特例
超几何 一维超几何一维超几何是多维超几何的特例
多项 多项正态近似中心极限定理的多维推广
二维正态 独立正态 时两个分量独立

七、知识结构总览

graph TD
    A[多维随机变量] --> B[联合分布函数]
    A --> C[离散型]
    A --> D[连续型]
    A --> E[重要多维分布]

    B --> B1[基本性质]
    B --> B2[矩形区域概率]

    C --> C1[联合分布律]

    D --> D1[联合密度函数]
    D --> D2[区域概率计算]

    E --> E1[多项分布]
    E --> E2[多维超几何分布]
    E --> E3[多维均匀分布]
    E --> E4[二维正态分布]

    E4 --> E5[不相关与独立等价]
    E4 --> E6[边缘分布为正态]

八、核心思想与证明技巧

核心思想

  1. 从一维到多维的推广:联合分布函数 是一维分布函数的自然推广,但需要额外的非负性条件(性质4)来保证合法性。这是多维情形比一维复杂的核心原因。

  2. 联合分布决定一切:联合分布(函数/密度/分布律)包含了关于 的所有概率信息。边缘分布、条件分布、独立性等都可以从联合分布推导出来,但反过来不行——仅知道边缘分布不能确定联合分布。

  3. 独立性的密度判别法:对于连续型随机变量, 独立 几乎处处成立。这是判断独立性最实用的方法。

证明技巧

  • 矩形区域概率公式,本质是容斥原理
  • 极坐标变换:处理圆盘区域上的概率计算时,令
  • 正态分布的标准化:二维正态通过线性变换 化为标准二维正态

九、补充理解与易混淆点

联合分布函数的非负性条件不可省略

来源:教材p.128 + Casella & Berger Statistical Inference + 浙江大学概率论课件 + 武汉大学概率论课件 + MIT 18.05 Lecture Notes

误区1:"满足单调不减和有界性的二元函数一定是联合分布函数"

❌ 错误解释:只要 单调不减、取值在 之间、右连续,就是合法的联合分布函数。 ✅ 正确解释:还必须满足非负性条件 。例 3.1.1 中的 满足前3条但不满足第4条,因此不是合法的联合分布函数。

边缘分布不能确定联合分布

来源:教材p.135 + Stanford统计讲义 + 华东师大概率论课件 + 印度统计学院讲义 + Wikipedia Joint Distribution

误区2:"已知两个边缘分布就能确定联合分布"

❌ 错误解释:只要知道 各自的分布,就能完全确定 的联合分布。 ✅ 正确解释:不同的联合分布可以有相同的边缘分布。例如,两个不同的二维正态分布 的边缘分布都是 ,但联合分布完全不同( 不同)。联合分布包含的信息多于边缘分布之和

不相关不等于独立(一般情形)

来源:教材p.145 + 中科大数理统计讲义 + 北师大概率论课件 + 复旦大学统计讲义 + CrossValidated论坛

误区3:"不相关的随机变量一定独立"

❌ 错误解释:(或 )意味着 独立。 ✅ 正确解释:不相关只是独立性的必要条件,不是充分条件。不相关只排除线性关系,但可能存在非线性依赖。唯一的例外是二维正态分布——对正态分布,不相关与独立等价(定理3.1.4)。

均匀分布的区域形状影响独立性

来源:教材p.140 + 卡方核心笔记P7 + 南京师范大学2018年432真题 + 厦门大学2015年432真题 + 中山大学2018年432真题

误区4:"均匀分布的分量一定独立"

❌ 错误解释: 在某区域上均匀分布,则 各自也是均匀分布且相互独立。 ✅ 正确解释:均匀分布的分量是否独立取决于区域的形状。矩形区域(如 )上的均匀分布,分量独立;但非矩形区域(如圆盘 )上的均匀分布,分量不独立(因为边缘密度 不是常数)。


十、习题精选

习题概览

编号题目来源知识点难度
1教材 3.1-1联合分布函数的基本计算★★☆
2教材 3.1-3联合密度函数的归一化★★☆
3教材 3.1-5离散型联合分布律★★☆
4教材 3.1-8区域概率计算★★★
5教材 3.1-11多项分布的概率计算★★★
6教材 3.1-14二维正态分布的性质★★★
72015武汉大学432联合分布函数参数确定★★☆
82019北京大学431二维正态分布的独立性条件★★★
92018南京师范大学432均匀分布(圆盘)的独立性★★★
102022华中科技大学432联合分布列与泊松分布★★★

习题 1 — 教材 3.1-1:联合分布函数的基本计算

的联合分布函数为 ,用 表示


习题 2 — 教材 3.1-3:联合密度函数的归一化

的联合密度为 ),求常数


习题 3 — 教材 3.1-5:离散型联合分布律

掷两枚骰子, 表示第一枚的点数, 表示两枚骰子点数之和。求 的联合分布律。


习题 4 — 教材 3.1-8:区域概率计算

的联合密度为 ),求


习题 5 — 教材 3.1-11:多项分布的概率计算

某城市居民分为甲、乙、丙三类,比例为 。随机调查8名居民,求恰好有4名甲类、2名乙类、2名丙类的概率。


习题 6 — 教材 3.1-14:二维正态分布的性质

,求 的边缘分布,并判断 是否独立。


习题 7 — 2015武汉大学432:联合分布函数参数确定

设二维随机向量 的联合分布函数为

的值。


习题 8 — 2019北京大学431:二维正态分布的独立性条件

,求 相互独立的充要条件。


习题 9 — 2018南京师范大学432:均匀分布(圆盘)的独立性

在单位圆 上服从均匀分布。问 是否独立?


习题 10 — 2022华中科技大学432:联合分布列与泊松分布

一个罐子中有 个球,其中 。将球独立地向两个盒子投掷,进盒子1的概率为 ,进盒子2的概率为 。记盒子1中球数为 ,盒子2中球数为 。 (1) 求 的联合分布列。 (2) 若 ,证明


十一、教材原文

第三章教材PDF尚未上传,待后续补充。


第三章 多维随机变量及其分布/联合分布