3.4 多维随机变量的特征数

本节概览

本节将§2.2§2.3中一维随机变量的数字特征推广到多维情形。核心任务是研究多个随机变量之间的线性关系度量——从期望与方差的运算性质出发,引入协方差相关系数两个关键概念,最终建立n维正态分布的完整框架。协方差和相关系数是刻画随机变量间线性关联程度的基石,在回归分析、主成分分析、多元统计分析中具有核心地位。

逻辑链条:函数期望 → 期望方差性质 → 协方差 → 方差展开 → 相关系数 → n维正态分布

前置依赖§3.1§3.2§2.2§2.3

核心主线:从一维数字特征出发,通过期望的线性性质(无需独立)和方差的展开性质(需要协方差项),引入协方差和相关系数来度量多维随机变量间的线性关系,最终推广到n维正态分布。


一、多维随机变量函数的期望

定义与公式

定义 3.4.1 — 多维随机变量函数的期望(公式3.4.1)

为二维随机变量, 为二元连续函数。

离散型:若 的联合分布律为 ),则

连续型:若 的联合密度函数为 ,则

当上述级数或积分绝对收敛时,期望存在。

边缘期望与边缘方差作为特例

定义 3.4.1 的强大之处在于:==不需要先求 的分布==,直接用联合分布计算期望。

边缘期望 的特例:

这正是用联合密度求边缘期望的过程——先对 积分得到边缘密度 ,再对 积分。

边缘方差 的特例:

例 3.4.1 — ,独立指数分布

相互独立,),求 的期望。

:先求 的分布函数。由§3.3最大值分布公式:

利用非负随机变量期望的积分公式

验证,符合直觉——最大值倾向于比单个变量更大。


二、期望与方差的性质

期望的线性性质

定理 3.4.2 — 期望的线性性质(无需独立)

对任意两个随机变量 (无论是否独立),只要期望存在,就有

推论:对任意常数

Abstract

证明:以连续型为例。设 的联合密度为

离散型类似,将积分改为求和。

关键点:期望的线性性质不需要独立性。这是因为期望本质上是”加权平均”,而加权平均天然满足线性性。

定理 3.4.3 — 期望线性性质的推广

对任意 个随机变量 (无论是否独立),只要期望存在,就有

对任意常数

独立随机变量乘积的期望

定理 3.4.4 — 独立随机变量乘积的期望

相互独立,且期望存在,则

Abstract

证明:以连续型为例。由独立性,联合密度等于边缘密度之积

离散型类似。

定理 3.4.5 — 独立乘积期望的推广

相互独立,且期望存在,则

独立随机变量和/差的方差

定理 3.4.6 — 独立随机变量和/差的方差

相互独立,则

Abstract

证明:以 为例:

由独立性, 也独立(常数平移不改变独立性),故

因此

注意 中是 号而非 号!这是因为方差度量的是偏离程度,减法的偏离程度仍然叠加。

推论 — 样本均值的方差

独立同分布,,则

推导

例 3.4.2 — 线性组合的期望与方差

,且三者相互独立。令 ,求

(1)求 :利用期望的线性性质(无需独立):

其中

(2)求 :利用独立性和方差的数乘性质

其中


三、协方差

定义

定义 3.4.2 — 协方差(公式3.4.7)

为二维随机变量,若 存在,则称之为 协方差,记为

计算公式

展开定义式,利用期望的线性性质:

这个计算公式比定义式更实用——只需计算 三个量。

协方差的含义

协方差度量的是 共同偏离各自均值的趋势

  • 大于均值时 也倾向于大于均值(同向变化
  • 大于均值时 倾向于小于均值(反向变化
  • 之间没有线性关系(但可能有非线性关系)

生活类比:协方差就像衡量两个人的消费习惯是否同步。如果一个人花钱多时另一个人也花钱多,协方差为正;如果一个人节俭时另一个人奢侈,协方差为负。

不相关与独立的关系

不相关与独立

  • 不相关(即
  • 独立(联合分布等于边缘分布之积)

关系

  • 独立 不相关(由定理 3.4.4 直接得出)
  • 不相关 独立(一般情形下不成立!)
  • 二维正态分布是例外:不相关 独立

例 3.4.3 — 协方差的计算

的联合密度为 ),求

(1)求

(2)求

(3)求

(4)计算协方差


四、方差展开与协方差性质

一般方差展开公式

定理 3.4.7 — 方差展开公式(公式3.4.8)

对任意两个随机变量 (不要求独立),有

Abstract

证明:以 为例:

类似,交叉项取负号。

与定理 3.4.6 的关系:当 独立时,,定理 3.4.7 退化为定理 3.4.6。因此定理 3.4.7 是更一般的公式。

定理 3.4.8 — n个随机变量和的方差(公式3.4.9)

记忆方式:展开 的交叉项,每个 出现两次(),所以乘以 2。

协方差的运算性质

协方差的四条运算性质

(1)对称性

(2)常数协方差为零 为常数)

(3)数乘性质 为常数)

(4)分配律(双线性)

Abstract

证明

(1)由定义直接得出:

(2)

(3)

(4)

例 3.4.4 — 方差展开的完整计算

的联合密度为 ),求

:由方差展开公式(常数不影响方差):

(1)求边缘密度和各阶矩

(2)求

(3)求

(4)求

(5)最终结果


五、相关系数

定义

定义 3.4.3 — 相关系数(公式3.4.10)

,则 (皮尔逊)相关系数定义为

其中

标准化变量的解释

定义标准化变量

标准化变量满足

此时:

即相关系数等于标准化变量的乘积期望。这揭示了相关系数的本质:协方差除以标准差后的标准化版本,消除了量纲的影响。

二维正态分布中 的含义

§3.1的二维正态分布 中,参数 正是 的相关系数。 的取值决定了联合密度的等高线形状:

  • :等高线为圆(两个方向等程度伸展)
  • :等高线被压扁为狭长椭圆(强线性关系)

柯西-施瓦茨不等式

定理 3.4.9 — 柯西-施瓦茨不等式(公式3.4.11)

对任意两个随机变量 ,有

Abstract

证明思路:构造关于 的二次函数

由于 对一切实数 成立(平方的期望非负),故判别式

推论 — 相关系数的取值范围

由柯西-施瓦茨不等式直接得到

相关系数等于 的条件

定理 3.4.10 — 的充要条件

即相关系数的绝对值等于 1 当且仅当 以概率 1 具有线性关系

Abstract

证明思路 等价于柯西-施瓦茨不等式取等号,等价于二次函数 有重根 ,即 。而 意味着 几乎必然成立,即 几乎必然成立。

相关系数的几何意义

的值含义散点图特征
完全正线性相关所有点在一条上升直线上
正部分线性相关点大致沿上升趋势分布
无线性相关点无明显的线性趋势
负部分线性相关点大致沿下降趋势分布
完全负线性相关所有点在一条下降直线上

例 3.4.5 — 相关系数的计算

的联合密度为 ),求

:需要计算

(1)确定积分区域:条件 等价于 ,结合

分两种情况:

  • 时: 自动满足)
  • 时:(因为 ,被 截断)

(2)求

内层积分

(3)求

(4)求 (类似方法,利用二重积分计算):

(5)计算方差和协方差

(6)计算相关系数


六、n维正态分布

期望向量与协方差矩阵

定义 3.4.4 — 期望向量与协方差矩阵

维随机向量,则

期望向量

协方差矩阵

其中 ,特别地

协方差矩阵是对称矩阵:

n维正态分布的密度函数

定义 3.4.5 — n维正态分布(公式3.4.13)

维随机向量 的联合密度函数为

其中 为期望向量, 为正定协方差矩阵, 的行列式,则称 服从 维正态分布,记为

参数含义

  • 个分量的期望值组成的向量
  • 协方差矩阵,对角线元素为各分量的方差,非对角线元素为两两协方差

线性变换性质

定理 3.4.11 — n维正态分布的线性变换性质

常数矩阵(), 常数向量,则

推论:若 服从二维正态分布,则 的任何线性组合 仍服从(一维)正态分布。

例 3.4.6 — 不相关不等于独立的反例

为标准正态密度函数,。定义

(1)验证边缘分布:对 积分,由于 是奇函数的变形),得

同理 。因此

(2)验证不相关

由于 ,且 是奇函数( 为偶函数),,故

因此

(3)但不独立:可以验证 (第二项不为零),故 不独立。

结论 各自服从标准正态分布且不相关,但不独立。这说明”各自正态 + 不相关”不能推出独立,必须”联合正态”才行。


七、知识结构总览

graph TD
    A[多维随机变量特征数] --> B[函数期望]
    A --> C[期望与方差性质]
    A --> D[协方差]
    A --> E[相关系数]
    A --> F[n维正态分布]

    B --> B1[连续型二重积分]
    B --> B2[离散型双重求和]

    C --> C1[期望线性: 无需独立]
    C --> C2[乘积期望: 需要独立]
    C --> C3[和的方差: 需要独立]

    D --> D1[定义与计算公式]
    D --> D2[不相关与独立]
    D --> D3[方差展开公式]

    E --> E1[标准化变量]
    E --> E2[柯西施瓦茨不等式]
    E --> E3[正负一充要条件]

    F --> F1[期望向量与协方差阵]
    F --> F2[密度函数]
    F --> F3[线性变换性质]

八、核心思想与证明技巧

期望线性性质不要求独立性

这是本节最重要的对比之一:

性质是否需要独立原因
期望是加权平均,天然满足线性性
需要将联合分布分解为边缘分布之积
展开后的交叉项 只有独立时才为零

记忆口诀:期望加法无条件,乘积方差需独立。

协方差是”标准化前的相关系数”

协方差和相关系数度量的是同一个东西——线性关系强度,但尺度不同:

  • 协方差 :有量纲( 的单位 的单位),大小受变量尺度影响
  • 相关系数 :无量纲,取值在 之间,具有可比性

类比:协方差像”身高与体重的协方差”(单位 cmkg),相关系数像”身高与体重的相关程度”(纯数字)。

柯西-施瓦茨不等式的证明思路

核心技巧是构造非负二次函数

  1. 考虑 ,其中
  2. 展开得
  3. 非负二次函数的判别式
  4. 得到

这个技巧在概率论中反复出现(如证明 ),值得熟练掌握。


九、补充理解与易混淆点

期望线性性质与独立性

来源:茆诗松教材§3.4 + 卡方核心笔记 + 概率论考研真题 + 课堂讨论 + 统计学入门教材

误区1:"期望的线性性质需要独立性"

❌ 错误解释: 都需要 独立。 ✅ 正确解释: 不需要独立性,这是期望作为”加权平均”的天然性质。但 确实需要独立性。两者条件不同,不可混淆。

协方差为零与独立

来源:茆诗松教材§3.4 + 卡方核心笔记 + 概率论考研常见错题 + 数理统计教材 + 线性代数教材

误区2:"协方差为零意味着独立"

❌ 错误解释: 说明 之间没有任何关系,因此独立。 ✅ 正确解释: 只说明 之间没有线性关系(不相关),但可能存在非线性关系。独立 不相关,但不相关 独立。唯一的例外是联合正态分布:在联合正态下,不相关等价于独立。

相关系数为零的含义

来源:茆诗松教材§3.4 + 卡方核心笔记 + 回归分析教材 + 考研真题解析 + 数据科学入门教材

误区3:"相关系数为零意味着没有任何关系"

❌ 错误解释: 说明 完全无关,互不影响。 ✅ 正确解释:相关系数只度量线性关系 只排除线性关系, 之间可能存在非线性关系(如 )。经典反例:,则 (因为 对称,),但 完全由 决定。

方差的可加性条件

来源:茆诗松教材§3.4 + 卡方核心笔记 + 概率论考研真题 + 课堂练习 + 概率论进阶教材

误区4:"方差性质 总成立"

❌ 错误解释:方差的加法公式和期望的加法公式一样,不需要任何条件。 ✅ 正确解释: 需要独立性(或至少 )。一般公式为 ,只有当协方差项为零时才能简化。==注意 也是加号==:

正态变量线性组合的条件

来源:茆诗松教材§3.4 + 卡方核心笔记 + 概率论考研常见错题 + 数理统计教材 + 多元统计分析教材

误区5:"正态变量的线性组合一定服从正态分布"

❌ 错误解释:只要 都服从正态分布, 就一定服从正态分布。 ✅ 正确解释: 需要 独立联合正态。如果 各自正态但不独立(即不联合正态),线性组合不一定正态。反例见例 3.4.6。定理 3.4.11 的条件是” 服从 维正态分布”,即要求联合正态,而不仅仅是边缘正态。


十、习题精选

习题概览

编号来源知识点方法难度
1教材3.4-1 的计算期望线性性质★★☆
2教材3.4-3 与独立性的关系乘积期望★★☆
3教材3.4-5 的计算协方差计算公式★★★
4教材3.4-7 的计算方差展开公式★★★
5教材3.4-9 的计算相关系数定义★★★
6教材3.4-12维正态分布的性质线性变换性质★★★★
72022东北财经大学432 的方差联合分布+协方差★★☆
82019北京大学432条件分布+联合分布+边际分布重期望+方差恒等式★★★★
92019北京大学431 独立的充要条件正态下不相关等价独立★★★
102020东北大学432正态分布线性组合+分布线性组合+卡方分布★★★

习题1 — 教材3.4-1: 的计算 ★★☆

的联合分布律如下表,求

习题2 — 教材3.4-3: 与独立性的关系 ★★☆

的联合密度为 ),判断 是否独立,并计算

习题3 — 教材3.4-5: 的计算 ★★★

的联合密度为 ),求

习题4 — 教材3.4-7: 的计算 ★★★

独立,,求

习题5 — 教材3.4-9: 的计算 ★★★

的联合密度为 ),求

习题6 — 教材3.4-12: 维正态分布的性质 ★★★★

,其中 。令 ,求 的联合分布。

习题7 — 2022东北财经大学432: 的方差 ★★☆

,定义 。求 的方差。

习题8 — 2019北京大学432:条件分布+联合分布+边际分布 ★★★★

。求 的联合分布和 的边际分布。

习题9 — 2019北京大学431: 独立的充要条件 ★★★

,求 相互独立的充要条件。

习题10 — 2020东北大学432:正态分布线性组合+ 分布 ★★★

独立同分布,。 (1)求 的分布。 (2)求常数 使得


十一、教材原文

第三章教材PDF尚未上传,待后续补充。

第三章 多维随机变量及其分布/特征数