3.4 多维随机变量的特征数
本节将§2.2 和§2.3 中一维随机变量的数字特征推广到多维情形。核心任务是研究多个随机变量之间的线性关系度量 ——从期望与方差的运算性质出发,引入协方差 和相关系数 两个关键概念,最终建立n维正态分布 的完整框架。协方差和相关系数是刻画随机变量间线性关联程度的基石,在回归分析、主成分分析、多元统计分析中具有核心地位。
逻辑链条 :函数期望 → 期望方差性质 → 协方差 → 方差展开 → 相关系数 → n维正态分布
前置依赖 :§3.1 、§3.2 、§2.2 、§2.3
核心主线 :从一维数字特征出发,通过期望的线性性质(无需独立)和方差的展开性质(需要协方差项),引入协方差和相关系数来度量多维随机变量间的线性关系,最终推广到n维正态分布。
一、多维随机变量函数的期望
定义与公式
定义 3.4.1 — 多维随机变量函数的期望(公式3.4.1)
设 ( X , Y ) 为二维随机变量,g ( x , y ) 为二元连续函数。
离散型 :若 ( X , Y ) 的联合分布律为 P ( X = x i , Y = y j ) = p ij (i , j = 1 , 2 , … ),则
E [ g ( X , Y )] = i = 1 ∑ + ∞ j = 1 ∑ + ∞ g ( x i , y j ) p ij
连续型 :若 ( X , Y ) 的联合密度函数为 p ( x , y ) ,则
E [ g ( X , Y )] = ∬ R 2 g ( x , y ) p ( x , y ) d x d y
当上述级数或积分绝对收敛 时,期望存在。
边缘期望与边缘方差作为特例
定义 3.4.1 的强大之处在于:==不需要先求 g ( X , Y ) 的分布==,直接用联合分布计算期望。
边缘期望 是 g ( X , Y ) = X 的特例:
E ( X ) = ∬ R 2 x p ( x , y ) d x d y = ∫ − ∞ + ∞ x [ ∫ − ∞ + ∞ p ( x , y ) d y ] d x = ∫ − ∞ + ∞ x p X ( x ) d x
这正是用联合密度求边缘期望的过程——先对 y 积分得到边缘密度 p X ( x ) ,再对 x 积分。
边缘方差 是 g ( X , Y ) = ( X − EX ) 2 的特例:
Var ( X ) = ∬ R 2 ( x − EX ) 2 p ( x , y ) d x d y = ∫ − ∞ + ∞ ( x − EX ) 2 p X ( x ) d x
例 3.4.1 — E ( max { X 1 , X 2 }) ,独立指数分布
设 X 1 , X 2 相互独立,X i ∼ Exp ( λ ) (i = 1 , 2 ),求 Y = max { X 1 , X 2 } 的期望。
解 :先求 Y 的分布函数。由§3.3 最大值分布公式:
F Y ( y ) = P ( Y ≤ y ) = P ( X 1 ≤ y ) P ( X 2 ≤ y ) = ( 1 − e − λ y ) 2 , y > 0
利用非负随机变量期望的积分公式 E ( Y ) = ∫ 0 + ∞ ( 1 − F Y ( y )) d y :
E ( Y ) = ∫ 0 + ∞ [ 1 − ( 1 − e − λ y ) 2 ] d y = ∫ 0 + ∞ [ 1 − ( 1 − 2 e − λ y + e − 2 λ y ) ] d y
= ∫ 0 + ∞ ( 2 e − λ y − e − 2 λ y ) d y = λ 2 − 2 λ 1 = 2 λ 3
验证 :E ( X i ) = 1/ λ ,E ( max { X 1 , X 2 }) = 3/ ( 2 λ ) > 1/ λ ,符合直觉——最大值倾向于比单个变量更大。
二、期望与方差的性质
期望的线性性质
对任意两个随机变量 X , Y (无论是否独立),只要期望存在,就有
E ( X + Y ) = E ( X ) + E ( Y )
推论 :对任意常数 a , b ,E ( a X + bY ) = a E ( X ) + b E ( Y ) 。
证明 :以连续型为例。设 ( X , Y ) 的联合密度为 p ( x , y ) :
E ( X + Y ) = ∬ R 2 ( x + y ) p ( x , y ) d x d y = ∬ R 2 x p ( x , y ) d x d y + ∬ R 2 y p ( x , y ) d x d y
= E ( X ) + E ( Y )
离散型类似,将积分改为求和。□
关键点 :期望的线性性质不需要独立性 。这是因为期望本质上是”加权平均”,而加权平均天然满足线性性。
对任意 n 个随机变量 X 1 , X 2 , … , X n (无论是否独立),只要期望存在,就有
E ( i = 1 ∑ n X i ) = i = 1 ∑ n E ( X i )
对任意常数 a 1 , a 2 , … , a n ,E ( ∑ i = 1 n a i X i ) = ∑ i = 1 n a i E ( X i ) 。
独立随机变量乘积的期望
若 X 与 Y 相互独立 ,且期望存在,则
E ( X Y ) = E ( X ) E ( Y )
证明 :以连续型为例。由独立性,联合密度等于边缘密度之积 p ( x , y ) = p X ( x ) p Y ( y ) :
E ( X Y ) = ∬ R 2 x y p ( x , y ) d x d y = ∬ R 2 x y p X ( x ) p Y ( y ) d x d y
= ( ∫ − ∞ + ∞ x p X ( x ) d x ) ( ∫ − ∞ + ∞ y p Y ( y ) d y ) = E ( X ) E ( Y )
离散型类似。□
若 X 1 , X 2 , … , X n 相互独立 ,且期望存在,则
E ( i = 1 ∏ n X i ) = i = 1 ∏ n E ( X i )
独立随机变量和/差的方差
若 X 与 Y 相互独立 ,则
Var ( X ± Y ) = Var ( X ) + Var ( Y )
证明 :以 Var ( X + Y ) 为例:
Var ( X + Y ) = E [( X + Y − E ( X + Y ) ) 2 ] = E [( X − EX + Y − E Y ) 2 ]
= E [( X − EX ) 2 + 2 ( X − EX ) ( Y − E Y ) + ( Y − E Y ) 2 ]
= Var ( X ) + 2 E [( X − EX ) ( Y − E Y )] + Var ( Y )
由独立性,X − EX 与 Y − E Y 也独立(常数平移不改变独立性),故
E [( X − EX ) ( Y − E Y )] = E ( X − EX ) E ( Y − E Y ) = 0 ⋅ 0 = 0
因此 Var ( X + Y ) = Var ( X ) + Var ( Y ) 。□
注意 :Var ( X − Y ) = Var ( X ) + Var ( Y ) 中是 + 号而非 − 号!这是因为方差度量的是偏离程度,减法的偏离程度仍然叠加。
设 X 1 , X 2 , … , X n 独立同分布,E ( X i ) = μ ,Var ( X i ) = σ 2 ,X ˉ = n 1 i = 1 ∑ n X i ,则
Var ( X ˉ ) = n σ 2
推导 :Var ( X ˉ ) = Var ( n 1 i = 1 ∑ n X i ) = n 2 1 i = 1 ∑ n Var ( X i ) = n 2 n σ 2 = n σ 2 。
设 X 1 ∼ U ( 0 , 6 ) ,X 2 ∼ N ( 1 , 3 ) ,X 3 ∼ Exp ( 3 ) ,且三者相互独立。令 Y = X 1 − 2 X 2 + 3 X 3 ,求 E ( Y ) 和 Var ( Y ) 。
解 :
(1)求 E ( Y ) :利用期望的线性性质(无需独立):
E ( Y ) = E ( X 1 ) − 2 E ( X 2 ) + 3 E ( X 3 ) = 3 − 2 × 1 + 3 × 3 1 = 3 − 2 + 1 = 2
其中 E ( X 1 ) = 2 0 + 6 = 3 ,E ( X 2 ) = 1 ,E ( X 3 ) = 3 1 。
(2)求 Var ( Y ) :利用独立性和方差的数乘性质 Var ( a X ) = a 2 Var ( X ) :
Var ( Y ) = Var ( X 1 ) + 4 Var ( X 2 ) + 9 Var ( X 3 )
其中 Var ( X 1 ) = 12 ( 6 − 0 ) 2 = 3 ,Var ( X 2 ) = 3 ,Var ( X 3 ) = 3 2 1 = 9 1 。
Var ( Y ) = 3 + 4 × 3 + 9 × 9 1 = 3 + 12 + 1 = 16
三、协方差
定义
设 ( X , Y ) 为二维随机变量,若 E [( X − EX ) ( Y − E Y )] 存在,则称之为 X 与 Y 的协方差 ,记为
Cov ( X , Y ) = E [( X − EX ) ( Y − E Y )]
计算公式
展开定义式,利用期望的线性性质:
Cov ( X , Y ) = E [ X Y − X ⋅ E Y − Y ⋅ EX + EX ⋅ E Y ] = E ( X Y ) − EX ⋅ E Y − E Y ⋅ EX + EX ⋅ E Y Cov ( X , Y ) = E ( X Y ) − E ( X ) E ( Y )
这个计算公式比定义式更实用——只需计算 E ( X Y ) 、E ( X ) 、E ( Y ) 三个量。
协方差的含义
协方差度量的是 X 和 Y 共同偏离各自均值的趋势 :
Cov ( X , Y ) > 0 :X 大于均值时 Y 也倾向于大于均值(同向变化 )
Cov ( X , Y ) < 0 :X 大于均值时 Y 倾向于小于均值(反向变化 )
Cov ( X , Y ) = 0 :X 和 Y 之间没有线性关系 (但可能有非线性关系)
生活类比 :协方差就像衡量两个人的消费习惯是否同步。如果一个人花钱多时另一个人也花钱多,协方差为正;如果一个人节俭时另一个人奢侈,协方差为负。
不相关与独立的关系
不相关 :Cov ( X , Y ) = 0 (即 E ( X Y ) = E ( X ) E ( Y ) )
独立 :p ( x , y ) = p X ( x ) p Y ( y ) (联合分布等于边缘分布之积)
关系 :
X 与 Y 独立 ⟹ X 与 Y 不相关(由定理 3.4.4 直接得出)
X 与 Y 不相关 \centernot ⟹ X 与 Y 独立(一般情形下不成立!)
二维正态分布 是例外:不相关 ⟺ 独立
设 ( X , Y ) 的联合密度为 p ( x , y ) = 3 x (0 < y < x < 1 ),求 Cov ( X , Y ) 。
解 :
(1)求 E ( X ) :
E ( X ) = ∫ 0 1 ∫ 0 x x ⋅ 3 x d y d x = ∫ 0 1 3 x 2 ⋅ x d x = ∫ 0 1 3 x 3 d x = 4 3
(2)求 E ( Y ) :
E ( Y ) = ∫ 0 1 ∫ 0 x y ⋅ 3 x d y d x = ∫ 0 1 3 x ⋅ 2 x 2 d x = 2 3 ∫ 0 1 x 3 d x = 8 3
(3)求 E ( X Y ) :
E ( X Y ) = ∫ 0 1 ∫ 0 x x y ⋅ 3 x d y d x = ∫ 0 1 3 x 2 [ ∫ 0 x y d y ] d x = ∫ 0 1 3 x 2 ⋅ 2 x 2 d x = 2 3 ∫ 0 1 x 4 d x = 2 3 ⋅ 5 1 = 10 3
(4)计算协方差 :
Cov ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) = 10 3 − 4 3 ⋅ 8 3 = 10 3 − 32 9 = 320 96 − 90 = 64 3
四、方差展开与协方差性质
一般方差展开公式
定理 3.4.7 — 方差展开公式(公式3.4.8)
对任意两个随机变量 X , Y (不要求独立),有
Var ( X ± Y ) = Var ( X ) + Var ( Y ) ± 2 Cov ( X , Y )
证明 :以 Var ( X + Y ) 为例:
Var ( X + Y ) = E [( X + Y − E ( X + Y ) ) 2 ] = E [( X − EX + Y − E Y ) 2 ]
= E [( X − EX ) 2 + 2 ( X − EX ) ( Y − E Y ) + ( Y − E Y ) 2 ]
= E [( X − EX ) 2 ] + 2 E [( X − EX ) ( Y − E Y )] + E [( Y − E Y ) 2 ]
= Var ( X ) + 2 Cov ( X , Y ) + Var ( Y )
Var ( X − Y ) 类似,交叉项取负号。□
与定理 3.4.6 的关系 :当 X 与 Y 独立时,Cov ( X , Y ) = 0 ,定理 3.4.7 退化为定理 3.4.6。因此定理 3.4.7 是更一般的公式。
定理 3.4.8 — n个随机变量和的方差(公式3.4.9)
Var ( i = 1 ∑ n X i ) = i = 1 ∑ n Var ( X i ) + 2 1 ≤ i < j ≤ n ∑ Cov ( X i , X j )
记忆方式 :展开 ( X 1 + ⋯ + X n ) 2 的交叉项,每个 Cov ( X i , X j ) 出现两次(i < j 和 j < i ),所以乘以 2。
协方差的运算性质
(1)对称性 :Cov ( X , Y ) = Cov ( Y , X )
(2)常数协方差为零 :Cov ( X , a ) = 0 (a 为常数)
(3)数乘性质 :Cov ( a X , bY ) = ab Cov ( X , Y ) (a , b 为常数)
(4)分配律(双线性) :Cov ( X 1 + X 2 , Y ) = Cov ( X 1 , Y ) + Cov ( X 2 , Y )
证明 :
(1)由定义直接得出:E [( X − EX ) ( Y − E Y )] = E [( Y − E Y ) ( X − EX )] 。
(2)Cov ( X , a ) = E [( X − EX ) ( a − a )] = E [ 0 ] = 0 。
(3)Cov ( a X , bY ) = E [( a X − a EX ) ( bY − b E Y )] = ab E [( X − EX ) ( Y − E Y )] = ab Cov ( X , Y ) 。
(4)Cov ( X 1 + X 2 , Y ) = E [( X 1 + X 2 − E ( X 1 + X 2 )) ( Y − E Y )]
= E [( X 1 − E X 1 + X 2 − E X 2 ) ( Y − E Y )]
= E [( X 1 − E X 1 ) ( Y − E Y )] + E [( X 2 − E X 2 ) ( Y − E Y )]
= Cov ( X 1 , Y ) + Cov ( X 2 , Y ) 。□
设 ( X , Y ) 的联合密度为 p ( x , y ) = 3 x + y (0 < x < 1 ,0 < y < 2 ),求 Var ( 2 X − 3 Y + 8 ) 。
解 :由方差展开公式(常数不影响方差):
Var ( 2 X − 3 Y + 8 ) = Var ( 2 X − 3 Y ) = 4 Var ( X ) + 9 Var ( Y ) − 12 Cov ( X , Y )
(1)求边缘密度和各阶矩 :
p X ( x ) = ∫ 0 2 3 x + y d y = 3 2 x + 2 = 3 2 ( x + 1 ) (0 < x < 1 )
p Y ( y ) = ∫ 0 1 3 x + y d x = 6 1 + 2 y (0 < y < 2 )
(2)求 E ( X ) 、E ( X 2 ) :
E ( X ) = ∫ 0 1 x ⋅ 3 2 ( x + 1 ) d x = 3 2 ∫ 0 1 ( x 2 + x ) d x = 3 2 ⋅ 6 5 = 9 5
E ( X 2 ) = ∫ 0 1 x 2 ⋅ 3 2 ( x + 1 ) d x = 3 2 ∫ 0 1 ( x 3 + x 2 ) d x = 3 2 ⋅ 12 7 = 18 7
Var ( X ) = E ( X 2 ) − [ E ( X ) ] 2 = 18 7 − 81 25 = 162 63 − 50 = 162 13
(3)求 E ( Y ) 、E ( Y 2 ) :
E ( Y ) = ∫ 0 2 y ⋅ 6 1 + 2 y d y = 6 1 ∫ 0 2 ( y + 2 y 2 ) d y = 6 1 ⋅ 3 22 = 9 11
E ( Y 2 ) = ∫ 0 2 y 2 ⋅ 6 1 + 2 y d y = 6 1 ∫ 0 2 ( y 2 + 2 y 3 ) d y = 6 1 ⋅ 3 44 = 9 22
Var ( Y ) = E ( Y 2 ) − [ E ( Y ) ] 2 = 9 22 − 81 121 = 81 198 − 121 = 81 77
(4)求 E ( X Y ) 和 Cov ( X , Y ) :
E ( X Y ) = ∫ 0 1 ∫ 0 2 x y ⋅ 3 x + y d y d x = 3 1 ∫ 0 1 ∫ 0 2 ( x 2 y + x y 2 ) d y d x
= 3 1 ∫ 0 1 [ x 2 ⋅ 2 + x ⋅ 3 8 ] d x = 3 1 ∫ 0 1 ( 2 x 2 + 3 8 x ) d x = 3 1 ( 3 2 + 3 4 ) = 9 2
Cov ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) = 9 2 − 9 5 ⋅ 9 11 = 9 2 − 81 55 = 81 18 − 55 = − 81 37
(5)最终结果 :
Var ( 2 X − 3 Y + 8 ) = 4 ⋅ 162 13 + 9 ⋅ 81 77 − 12 ⋅ ( − 81 37 ) = 162 52 + 81 693 + 81 444
= 81 26 + 81 693 + 81 444 = 81 1163
五、相关系数
定义
定义 3.4.3 — 相关系数(公式3.4.10)
设 Var ( X ) > 0 ,Var ( Y ) > 0 ,则 X 与 Y 的(皮尔逊)相关系数 定义为
Corr ( X , Y ) = ρ X Y = σ X ⋅ σ Y Cov ( X , Y ) = Var ( X ) Var ( Y ) Cov ( X , Y )
其中 σ X = Var ( X ) ,σ Y = Var ( Y ) 。
标准化变量的解释
定义标准化变量 :X ∗ = σ X X − EX ,Y ∗ = σ Y Y − E Y 。
标准化变量满足 E ( X ∗ ) = E ( Y ∗ ) = 0 ,Var ( X ∗ ) = Var ( Y ∗ ) = 1 。
此时:
Corr ( X , Y ) = E ( X ∗ Y ∗ )
即相关系数等于标准化变量的乘积期望。这揭示了相关系数的本质:协方差除以标准差后的标准化版本 ,消除了量纲的影响。
二维正态分布中 ρ 的含义
在§3.1 的二维正态分布 N ( μ 1 , μ 2 ; σ 1 2 , σ 2 2 ; ρ ) 中,参数 ρ 正是 X 与 Y 的相关系数。ρ 的取值决定了联合密度的等高线形状:
ρ = 0 :等高线为圆(两个方向等程度伸展)
∣ ρ ∣ → 1 :等高线被压扁为狭长椭圆(强线性关系)
柯西-施瓦茨不等式
定理 3.4.9 — 柯西-施瓦茨不等式(公式3.4.11)
对任意两个随机变量 X , Y ,有
[ Cov ( X , Y ) ] 2 ≤ Var ( X ) Var ( Y )
证明思路 :构造关于 t 的二次函数
g ( t ) = E [( X − EX + t ( Y − E Y ) ) 2 ] = Var ( X ) + 2 t Cov ( X , Y ) + t 2 Var ( Y )
由于 g ( t ) ≥ 0 对一切实数 t 成立(平方的期望非负),故判别式 Δ ≤ 0 :
[ 2 Cov ( X , Y ) ] 2 − 4 Var ( X ) Var ( Y ) ≤ 0
即 [ Cov ( X , Y ) ] 2 ≤ Var ( X ) Var ( Y ) 。□
由柯西-施瓦茨不等式直接得到
∣ Corr ( X , Y ) ∣ = σ X σ Y ∣ Cov ( X , Y ) ∣ ≤ 1
相关系数等于 ± 1 的条件
∣ Corr ( X , Y ) ∣ = 1 ⟺ P ( Y = a X + b ) = 1 ( a = 0 )
即相关系数的绝对值等于 1 当且仅当 X 与 Y 以概率 1 具有线性关系 。
证明思路 :∣ ρ ∣ = 1 等价于柯西-施瓦茨不等式取等号,等价于二次函数 g ( t ) 有重根 t = t 0 ,即 g ( t 0 ) = 0 。而 g ( t 0 ) = E [( X − EX + t 0 ( Y − E Y ) ) 2 ] = 0 意味着 X − EX + t 0 ( Y − E Y ) = 0 几乎必然成立,即 Y = a X + b 几乎必然成立。□
相关系数的几何意义
ρ 的值含义 散点图特征 ρ = 1 完全正线性相关 所有点在一条上升直线上 0 < ρ < 1 正部分线性相关 点大致沿上升趋势分布 ρ = 0 无线性相关 点无明显的线性趋势 − 1 < ρ < 0 负部分线性相关 点大致沿下降趋势分布 ρ = − 1 完全负线性相关 所有点在一条下降直线上
设 ( X , Y ) 的联合密度为 p ( x , y ) = 3 8 (0 < x − y < 0.5 ,0 < x , y < 1 ),求 Corr ( X , Y ) 。
解 :需要计算 E ( X ) 、E ( Y ) 、Var ( X ) 、Var ( Y ) 、Cov ( X , Y ) 。
(1)确定积分区域 :条件 0 < x − y < 0.5 等价于 y < x < y + 0.5 ,结合 0 < x , y < 1 。
分两种情况:
当 0 < y < 0.5 时:y < x < y + 0.5 (y + 0.5 < 1 自动满足)
当 0.5 ≤ y < 1 时:y < x < 1 (因为 y + 0.5 > 1 ,被 x < 1 截断)
(2)求 E ( X ) :
E ( X ) = 3 8 [ ∫ 0 0.5 ∫ y y + 0.5 x d x d y + ∫ 0.5 1 ∫ y 1 x d x d y ]
内层积分 ∫ y y + 0.5 x d x = 2 ( y + 0.5 ) 2 − y 2 = 2 y + 0.25
∫ y 1 x d x = 2 1 − y 2
E ( X ) = 3 8 [ ∫ 0 0.5 2 y + 0.25 d y + ∫ 0.5 1 2 1 − y 2 d y ]
= 3 8 [ 2 1 ( 2 0.125 + 0.125 ) + 2 1 ( 0.5 − 24 7 ) ] = 3 8 [ 2 0.125 + 48 5 ] = 3 8 ⋅ 48 11 = 18 11
(3)求 E ( Y ) :
E ( Y ) = 3 8 [ ∫ 0 0.5 ∫ y y + 0.5 y d x d y + ∫ 0.5 1 ∫ y 1 y d x d y ]
= 3 8 [ ∫ 0 0.5 0.5 y d y + ∫ 0.5 1 y ( 1 − y ) d y ]
= 3 8 [ 2 0.5 × 0.125 + ( 8 3 − 24 7 ) ] = 3 8 [ 32 1 + 24 1 ] = 3 8 ⋅ 96 7 = 36 7
(4)求 E ( X 2 ) 、E ( Y 2 ) 、E ( X Y ) (类似方法,利用二重积分计算):
E ( X 2 ) = 3 8 [ ∫ 0 0.5 ∫ y y + 0.5 x 2 d x d y + ∫ 0.5 1 ∫ y 1 x 2 d x d y ] = 108 53
E ( Y 2 ) = 3 8 [ ∫ 0 0.5 ∫ y y + 0.5 y 2 d x d y + ∫ 0.5 1 ∫ y 1 y 2 d x d y ] = 27 5
E ( X Y ) = 3 8 [ ∫ 0 0.5 ∫ y y + 0.5 x y d x d y + ∫ 0.5 1 ∫ y 1 x y d x d y ] = 144 43
(5)计算方差和协方差 :
Var ( X ) = 108 53 − ( 18 11 ) 2 = 108 53 − 324 121 = 324 159 − 121 = 324 38 = 162 19
Var ( Y ) = 27 5 − ( 36 7 ) 2 = 27 5 − 1296 49 = 1296 240 − 49 = 1296 191
Cov ( X , Y ) = 144 43 − 18 11 ⋅ 36 7 = 144 43 − 648 77 = 3888 1293 − 1104 = 3888 189 = 144 7
(6)计算相关系数 :
Corr ( X , Y ) = Var ( X ) Var ( Y ) Cov ( X , Y ) = 19/162 ⋅ 191/1296 7/144 = 19 × 191 / ( 162 × 36 ) 7/144
= 144 × 3629 7 × 162 × 36 = 8 × 3629 7 × 81 × 2 = 8 3629 1134 = 4 3629 567 ≈ 0.742
六、n维正态分布
期望向量与协方差矩阵
设 X = ( X 1 , X 2 , … , X n ) ⊤ 为 n 维随机向量,则
期望向量 :
E ( X ) = μ = ( E ( X 1 ) , E ( X 2 ) , … , E ( X n ) ) ⊤
协方差矩阵 :
Cov ( X ) = Σ = ( σ ij ) n × n
其中 σ ij = Cov ( X i , X j ) = E [( X i − E X i ) ( X j − E X j )] ,特别地 σ ii = Var ( X i ) 。
协方差矩阵是对称矩阵:σ ij = σ ji 。
n维正态分布的密度函数
定义 3.4.5 — n维正态分布(公式3.4.13)
若 n 维随机向量 X 的联合密度函数为
p ( x ) = ( 2 π ) − n /2 ∣ B ∣ − 1/2 exp { − 2 1 ( x − a ) ⊤ B − 1 ( x − a ) }
其中 a = ( a 1 , … , a n ) ⊤ 为期望向量,B = ( σ ij ) n × n 为正定协方差矩阵,∣ B ∣ 为 B 的行列式,则称 X 服从 n 维正态分布,记为 X ∼ N n ( a , B ) 。
参数含义 :
a :n 个分量的期望值组成的向量
B :n × n 协方差矩阵,对角线元素为各分量的方差,非对角线元素为两两协方差
线性变换性质
定理 3.4.11 — n维正态分布的线性变换性质
若 X ∼ N n ( μ , Σ ) ,A 为 m × n 常数矩阵(m ≤ n ),b 为 m × 1 常数向量,则
Y = AX + b ∼ N m ( A μ + b , A Σ A ⊤ )
推论 :若 ( X 1 , X 2 ) 服从二维正态分布,则 X 1 和 X 2 的任何线性组合 a X 1 + b X 2 仍服从(一维)正态分布。
设 φ ( x ) 为标准正态密度函数,g ( x ) = 2 π 1 e − x 2 /2 cos ( 2 π x ) 。定义
p ( x , y ) = φ ( x ) φ ( y ) + 2 π 1 e − π 2 g ( x ) g ( y )
(1)验证边缘分布 :对 y 积分,由于 ∫ − ∞ + ∞ g ( y ) d y = 0 (g 是奇函数的变形),得
p X ( x ) = φ ( x ) ∫ − ∞ + ∞ φ ( y ) d y + 2 π e − π 2 g ( x ) ∫ − ∞ + ∞ g ( y ) d y = φ ( x )
同理 p Y ( y ) = φ ( y ) 。因此 X ∼ N ( 0 , 1 ) ,Y ∼ N ( 0 , 1 ) 。
(2)验证不相关 :
E ( X Y ) = ∬ R 2 x y p ( x , y ) d x d y = E ( X ) E ( Y ) + 2 π e − π 2 ( ∫ − ∞ + ∞ xg ( x ) d x ) ( ∫ − ∞ + ∞ y g ( y ) d y )
由于 E ( X ) = E ( Y ) = 0 ,且 xg ( x ) 是奇函数(g 为偶函数),∫ − ∞ + ∞ xg ( x ) d x = 0 ,故 E ( X Y ) = 0 。
因此 Cov ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) = 0 ,Corr ( X , Y ) = 0 。
(3)但不独立 :可以验证 p ( x , y ) = φ ( x ) φ ( y ) (第二项不为零),故 X 与 Y 不独立。
结论 :X 和 Y 各自服从标准正态分布且不相关,但不独立 。这说明”各自正态 + 不相关”不能推出独立,必须”联合正态”才行。
七、知识结构总览
graph TD
A[多维随机变量特征数] --> B[函数期望]
A --> C[期望与方差性质]
A --> D[协方差]
A --> E[相关系数]
A --> F[n维正态分布]
B --> B1[连续型二重积分]
B --> B2[离散型双重求和]
C --> C1[期望线性: 无需独立]
C --> C2[乘积期望: 需要独立]
C --> C3[和的方差: 需要独立]
D --> D1[定义与计算公式]
D --> D2[不相关与独立]
D --> D3[方差展开公式]
E --> E1[标准化变量]
E --> E2[柯西施瓦茨不等式]
E --> E3[正负一充要条件]
F --> F1[期望向量与协方差阵]
F --> F2[密度函数]
F --> F3[线性变换性质]
八、核心思想与证明技巧
期望线性性质不要求独立性
这是本节最重要的对比之一:
性质 是否需要独立 原因 E ( X + Y ) = E ( X ) + E ( Y ) 否 期望是加权平均,天然满足线性性 E ( X Y ) = E ( X ) E ( Y ) 是 需要将联合分布分解为边缘分布之积 Var ( X + Y ) = Var ( X ) + Var ( Y ) 是 展开后的交叉项 Cov ( X , Y ) 只有独立时才为零
记忆口诀 :期望加法无条件,乘积方差需独立。
协方差是”标准化前的相关系数”
协方差和相关系数度量的是同一个东西——线性关系强度,但尺度不同:
协方差 Cov ( X , Y ) :有量纲(X 的单位 × Y 的单位),大小受变量尺度影响
相关系数 Corr ( X , Y ) :无量纲,取值在 [ − 1 , 1 ] 之间,具有可比性
类比:协方差像”身高与体重的协方差”(单位 cm⋅ kg),相关系数像”身高与体重的相关程度”(纯数字)。
柯西-施瓦茨不等式的证明思路
核心技巧是构造非负二次函数 :
考虑 g ( t ) = E [( X ∗ + t Y ∗ ) 2 ] ≥ 0 ,其中 X ∗ = X − EX ,Y ∗ = Y − E Y
展开得 g ( t ) = Var ( X ) + 2 t Cov ( X , Y ) + t 2 Var ( Y )
非负二次函数的判别式 Δ ≤ 0
得到 [ Cov ( X , Y ) ] 2 ≤ Var ( X ) Var ( Y )
这个技巧在概率论中反复出现(如证明 ∣ ρ ∣ ≤ 1 ),值得熟练掌握。
九、补充理解与易混淆点
期望线性性质与独立性
来源 :茆诗松教材§3.4 + 卡方核心笔记 + 概率论考研真题 + 课堂讨论 + 统计学入门教材
❌ 错误解释:E ( X + Y ) = E ( X ) + E ( Y ) 和 E ( X Y ) = E ( X ) E ( Y ) 都需要 X 与 Y 独立。
✅ 正确解释:E ( X + Y ) = E ( X ) + E ( Y ) 不需要独立性 ,这是期望作为”加权平均”的天然性质。但 E ( X Y ) = E ( X ) E ( Y ) 确实需要独立性 。两者条件不同,不可混淆。
协方差为零与独立
来源 :茆诗松教材§3.4 + 卡方核心笔记 + 概率论考研常见错题 + 数理统计教材 + 线性代数教材
❌ 错误解释:Cov ( X , Y ) = 0 说明 X 和 Y 之间没有任何关系,因此独立。
✅ 正确解释:Cov ( X , Y ) = 0 只说明 X 和 Y 之间没有线性关系 (不相关),但可能存在非线性关系。独立 ⇒ 不相关,但不相关 \centernot ⇒ 独立。唯一的例外是联合正态分布 :在联合正态下,不相关等价于独立。
相关系数为零的含义
来源 :茆诗松教材§3.4 + 卡方核心笔记 + 回归分析教材 + 考研真题解析 + 数据科学入门教材
❌ 错误解释:Corr ( X , Y ) = 0 说明 X 和 Y 完全无关,互不影响。
✅ 正确解释:相关系数只度量线性关系 。ρ = 0 只排除线性关系,X 和 Y 之间可能存在非线性关系 (如 Y = X 2 )。经典反例:X ∼ U ( − 1 , 1 ) ,Y = X 2 ,则 Cov ( X , Y ) = 0 (因为 X 对称,E ( X 3 ) = 0 ),但 Y 完全由 X 决定。
方差的可加性条件
来源 :茆诗松教材§3.4 + 卡方核心笔记 + 概率论考研真题 + 课堂练习 + 概率论进阶教材
误区4:"方差性质 Var ( X + Y ) = Var ( X ) + Var ( Y ) 总成立"
❌ 错误解释:方差的加法公式和期望的加法公式一样,不需要任何条件。
✅ 正确解释:Var ( X + Y ) = Var ( X ) + Var ( Y ) 需要独立性 (或至少 Cov ( X , Y ) = 0 )。一般公式为 Var ( X + Y ) = Var ( X ) + Var ( Y ) + 2 Cov ( X , Y ) ,只有当协方差项为零时才能简化。==注意 Var ( X − Y ) 也是加号==:Var ( X − Y ) = Var ( X ) + Var ( Y ) − 2 Cov ( X , Y ) 。
正态变量线性组合的条件
来源 :茆诗松教材§3.4 + 卡方核心笔记 + 概率论考研常见错题 + 数理统计教材 + 多元统计分析教材
❌ 错误解释:只要 X 和 Y 都服从正态分布,a X + bY 就一定服从正态分布。
✅ 正确解释:a X + bY ∼ N ( ⋅ , ⋅ ) 需要 X 和 Y 独立 或联合正态 。如果 X 和 Y 各自正态但不独立(即不联合正态),线性组合不一定正态。反例见例 3.4.6。定理 3.4.11 的条件是”( X 1 , … , X n ) 服从 n 维正态分布”,即要求联合正态 ,而不仅仅是边缘正态。
十、习题精选
编号 来源 知识点 方法 难度 1 教材3.4-1 E ( X + Y ) 的计算期望线性性质 ★★☆ 2 教材3.4-3 E ( X Y ) 与独立性的关系乘积期望 ★★☆ 3 教材3.4-5 Cov ( X , Y ) 的计算协方差计算公式 ★★★ 4 教材3.4-7 Var ( X + Y ) 的计算方差展开公式 ★★★ 5 教材3.4-9 Corr ( X , Y ) 的计算相关系数定义 ★★★ 6 教材3.4-12 n 维正态分布的性质线性变换性质 ★★★★ 7 2022东北财经大学432 X + Y 的方差联合分布+协方差 ★★☆ 8 2019北京大学432 条件分布+联合分布+边际分布 重期望+方差恒等式 ★★★★ 9 2019北京大学431 X + Y 和 X − Y 独立的充要条件正态下不相关等价独立 ★★★ 10 2020东北大学432 正态分布线性组合+F 分布 线性组合+卡方分布 ★★★
习题1 — 教材3.4-1: E ( X + Y ) 的计算 ★★☆
设 ( X , Y ) 的联合分布律如下表,求 E ( X + Y ) 。
X ∖ Y 0 1 2 0 0.1 0.2 0.1 1 0.3 0.2 0.1
解 :利用期望的线性性质 E ( X + Y ) = E ( X ) + E ( Y ) 。
求 E ( X ) :
E ( X ) = 0 × ( 0.1 + 0.2 + 0.1 ) + 1 × ( 0.3 + 0.2 + 0.1 ) = 0 + 0.6 = 0.6
求 E ( Y ) :
E ( Y ) = 0 × ( 0.1 + 0.3 ) + 1 × ( 0.2 + 0.2 ) + 2 × ( 0.1 + 0.1 ) = 0 + 0.4 + 0.4 = 0.8
E ( X + Y ) = 0.6 + 0.8 = 1.4
验证 :直接计算 E ( X + Y ) :
E ( X + Y ) = 0 × 0.1 + 1 × 0.2 + 2 × 0.1 + 1 × 0.3 + 2 × 0.2 + 3 × 0.1 = 0 + 0.2 + 0.2 + 0.3 + 0.4 + 0.3 = 1.4 ✓
习题2 — 教材3.4-3: E ( X Y ) 与独立性的关系 ★★☆
设 ( X , Y ) 的联合密度为 p ( x , y ) = 6 x (0 < x < y < 1 ),判断 X 与 Y 是否独立,并计算 E ( X Y ) 。
解 :
(1)判断独立性 :求边缘密度。
p X ( x ) = ∫ x 1 6 x d y = 6 x ( 1 − x ) (0 < x < 1 )
p Y ( y ) = ∫ 0 y 6 x d x = 3 y 2 (0 < y < 1 )
p X ( x ) ⋅ p Y ( y ) = 6 x ( 1 − x ) ⋅ 3 y 2 = 18 x ( 1 − x ) y 2 = 6 x = p ( x , y )
因此 X 与 Y 不独立 。
(2)计算 E ( X Y ) :
E ( X Y ) = ∫ 0 1 ∫ x 1 x y ⋅ 6 x d y d x = ∫ 0 1 6 x 2 ⋅ 2 1 − x 2 d x = 3 ∫ 0 1 ( x 2 − x 4 ) d x = 3 ( 3 1 − 5 1 ) = 3 ⋅ 15 2 = 5 2
(3)验证 :E ( X ) = ∫ 0 1 x ⋅ 6 x ( 1 − x ) d x = 6 ∫ 0 1 ( x 2 − x 3 ) d x = 6 ⋅ 12 1 = 2 1
E ( Y ) = ∫ 0 1 y ⋅ 3 y 2 d y = 3 ∫ 0 1 y 3 d y = 4 3
E ( X ) E ( Y ) = 2 1 ⋅ 4 3 = 8 3 = 5 2 = E ( X Y ) ,验证了不独立时 E ( X Y ) = E ( X ) E ( Y ) 。
习题3 — 教材3.4-5: Cov ( X , Y ) 的计算 ★★★
设 ( X , Y ) 的联合密度为 p ( x , y ) = 2 (0 < x < y < 1 ),求 Cov ( X , Y ) 。
解 :
(1)求 E ( X ) :
E ( X ) = ∫ 0 1 ∫ 0 y x ⋅ 2 d x d y = ∫ 0 1 y 2 d y = 3 1
(2)求 E ( Y ) :
E ( Y ) = ∫ 0 1 ∫ 0 y y ⋅ 2 d x d y = ∫ 0 1 2 y 2 d y = 3 2
(3)求 E ( X Y ) :
E ( X Y ) = ∫ 0 1 ∫ 0 y x y ⋅ 2 d x d y = ∫ 0 1 y 3 d y = 4 1
(4)计算协方差 :
Cov ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) = 4 1 − 3 1 ⋅ 3 2 = 4 1 − 9 2 = 36 9 − 8 = 36 1
习题4 — 教材3.4-7: Var ( X + Y ) 的计算 ★★★
设 X 与 Y 独立,X ∼ U ( 0 , 1 ) ,Y ∼ U ( 0 , 1 ) ,求 Var ( X + Y ) 。
解 :由独立性,Var ( X + Y ) = Var ( X ) + Var ( Y ) 。
Var ( X ) = 12 ( 1 − 0 ) 2 = 12 1 ,Var ( Y ) = 12 1 。
Var ( X + Y ) = 12 1 + 12 1 = 6 1
对比验证 :由§3.3 例题,X + Y 服从三角分布,密度为 p ( z ) = { z , 2 − z , 0 < z < 1 1 ≤ z < 2 。
E ( X + Y ) = 1 ,E [( X + Y ) 2 ] = ∫ 0 1 z 2 ⋅ z d z + ∫ 1 2 z 2 ( 2 − z ) d z = 4 1 + 4 7 = 2 。
Var ( X + Y ) = 2 − 1 = 1 = 6 1 。这里出现矛盾,说明需要重新验证。
实际上 E [( X + Y ) 2 ] = ∫ 0 1 z 3 d z + ∫ 1 2 ( 2 z 2 − z 3 ) d z = 4 1 + [ 3 2 z 3 − 4 1 z 4 ] 1 2 = 4 1 + ( 3 16 − 4 − 3 2 + 4 1 ) = 4 1 + 3 14 − 4 15 = 4 1 + 3 14 − 4 15 = 6 7 。
Var ( X + Y ) = 6 7 − 1 = 6 1 ✓
习题5 — 教材3.4-9: Corr ( X , Y ) 的计算 ★★★
设 ( X , Y ) 的联合密度为 p ( x , y ) = π 1 (x 2 + y 2 ≤ 1 ),求 Corr ( X , Y ) 。
解 :由对称性,E ( X ) = E ( Y ) = 0 。
E ( X Y ) = ∬ x 2 + y 2 ≤ 1 x y ⋅ π 1 d x d y = 0 (被积函数关于 x 为奇函数,积分区域关于 y 轴对称)。
Cov ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) = 0 − 0 = 0 。
因此 Corr ( X , Y ) = 0 。
注意 :X 和 Y 不独立(因为 p ( x , y ) = 1/ π 在单位圆内,而 p X ( x ) = π 2 1 − x 2 ,p X ( x ) ⋅ p Y ( y ) = p ( x , y ) ),这是不相关但不独立的又一个经典反例。
习题6 — 教材3.4-12: n 维正态分布的性质 ★★★★
设 X = ( X 1 , X 2 , X 3 ) ⊤ ∼ N 3 ( μ , Σ ) ,其中 μ = ( 1 , 2 , 3 ) ⊤ ,Σ = 4 1 0 1 9 2 0 2 16 。令 Y 1 = X 1 + X 2 ,Y 2 = X 2 − X 3 ,求 ( Y 1 , Y 2 ) 的联合分布。
解 :令 Y = ( Y 1 Y 2 ) = ( 1 0 1 1 0 − 1 ) X 1 X 2 X 3 = AX 。
由定理 3.4.11,Y ∼ N 2 ( A μ , A Σ A ⊤ ) 。
期望 :
A μ = ( 1 0 1 1 0 − 1 ) 1 2 3 = ( 3 − 1 )
协方差矩阵 :
A Σ = ( 1 0 1 1 0 − 1 ) 4 1 0 1 9 2 0 2 16 = ( 5 1 10 7 2 − 14 )
A Σ A ⊤ = ( 5 1 10 7 2 − 14 ) 1 1 0 0 1 − 1 = ( 15 8 8 23 )
因此 ( Y 1 , Y 2 ) ∼ N 2 ( ( 3 − 1 ) , ( 15 8 8 23 ) ) 。
习题7 — 2022东北财经大学432: X + Y 的方差 ★★☆
设 U ∼ U [ − 2 , 2 ] ,定义 X = { − 1 , 1 , U ≤ − 1 U > − 1 ,Y = { − 1 , 1 , U ≤ 1 U > 1 。求 X + Y 的方差。
解 :
(1)求 ( X , Y ) 的联合分布 :
P ( X = − 1 , Y = − 1 ) = P ( U ≤ − 1 ) = 4 − 1 − ( − 2 ) = 4 1
P ( X = − 1 , Y = 1 ) = P ( − 1 < U ≤ 1 ) = 4 1 − ( − 1 ) = 2 1
P ( X = 1 , Y = − 1 ) = P ( U > − 1 且 U ≤ 1 ) = 0 (不可能同时 U > − 1 和 U ≤ − 1 )
等等,重新分析:X = 1 要求 U > − 1 ,Y = − 1 要求 U ≤ 1 ,所以 P ( X = 1 , Y = − 1 ) = P ( − 1 < U ≤ 1 ) = 4 2 = 2 1 。
重新梳理:
P ( X = − 1 , Y = − 1 ) = P ( U ≤ − 1 ) = 4 1
P ( X = − 1 , Y = 1 ) = P ( − 1 < U ≤ 1 且 U ≤ − 1 ) = 0 (X = − 1 要求 U ≤ − 1 ,Y = 1 要求 U > 1 ,矛盾)
P ( X = 1 , Y = − 1 ) = P ( − 1 < U ≤ 1 ) = 2 1
P ( X = 1 , Y = 1 ) = P ( U > 1 ) = 4 1
联合分布表:
(2)求 E ( X ) 、E ( Y ) 、E ( X Y ) :
E ( X ) = − 1 × 4 1 + 1 × 4 3 = 2 1
E ( Y ) = − 1 × 4 3 + 1 × 4 1 = − 2 1
E ( X Y ) = ( − 1 ) ( − 1 ) × 4 1 + ( − 1 ) ( 1 ) × 0 + ( 1 ) ( − 1 ) × 2 1 + ( 1 ) ( 1 ) × 4 1 = 4 1 − 2 1 + 4 1 = 0
(3)计算方差和协方差 :
Var ( X ) = E ( X 2 ) − [ E ( X ) ] 2 = 1 − 4 1 = 4 3
Var ( Y ) = E ( Y 2 ) − [ E ( Y ) ] 2 = 1 − 4 1 = 4 3
Cov ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) = 0 − 2 1 ⋅ ( − 2 1 ) = 4 1
(4)Var ( X + Y ) :
Var ( X + Y ) = Var ( X ) + Var ( Y ) + 2 Cov ( X , Y ) = 4 3 + 4 3 + 2 × 4 1 = 2 3 + 2 1 = 2
习题8 — 2019北京大学432:条件分布+联合分布+边际分布 ★★★★
设 X 1 ∼ N ( μ 1 , σ 1 2 ) ,X 2 ∣ X 1 = x 1 ∼ N ( μ 2 + σ 1 2 σ 2 ( x 1 − μ 1 ) , 4 3 σ 2 2 ) 。求 ( X 1 , X 2 ) 的联合分布和 X 2 的边际分布。
解 :利用重期望公式 和方差恒等式 。
(1)求 E ( X 2 ) :由重期望公式
E ( X 2 ) = E [ E ( X 2 ∣ X 1 )] = E [ μ 2 + σ 1 2 σ 2 ( X 1 − μ 1 ) ] = μ 2 + σ 1 2 σ 2 ⋅ 0 = μ 2
(2)求 Var ( X 2 ) :由方差恒等式 Var ( X 2 ) = E [ Var ( X 2 ∣ X 1 )] + Var [ E ( X 2 ∣ X 1 )]
Var ( X 2 ∣ X 1 ) = 4 3 σ 2 2 ,故 E [ Var ( X 2 ∣ X 1 )] = 4 3 σ 2 2 。
E ( X 2 ∣ X 1 ) = μ 2 + σ 1 2 σ 2 ( X 1 − μ 1 ) ,故
Var [ E ( X 2 ∣ X 1 )] = Var [ σ 1 2 σ 2 ( X 1 − μ 1 ) ] = σ 1 2 4 σ 2 2 ⋅ σ 1 2 = 4 σ 2 2
Var ( X 2 ) = 4 3 σ 2 2 + 4 σ 2 2 = 4 19 σ 2 2
(3)求 Cov ( X 1 , X 2 ) :
Cov ( X 1 , X 2 ) = E ( X 1 X 2 ) − E ( X 1 ) E ( X 2 )
由重期望:E ( X 1 X 2 ) = E [ X 1 ⋅ E ( X 2 ∣ X 1 )] = E [ X 1 ( μ 2 + σ 1 2 σ 2 ( X 1 − μ 1 ) ) ]
= μ 2 E ( X 1 ) + σ 1 2 σ 2 [ E ( X 1 2 ) − μ 1 E ( X 1 ) ] = μ 1 μ 2 + σ 1 2 σ 2 ⋅ σ 1 2 = μ 1 μ 2 + 2 σ 1 σ 2
Cov ( X 1 , X 2 ) = μ 1 μ 2 + 2 σ 1 σ 2 − μ 1 μ 2 = 2 σ 1 σ 2
(4)求相关系数 :
ρ = σ 1 ⋅ 19 σ 2 2 /4 Cov ( X 1 , X 2 ) = σ 1 σ 2 19 /2 2 σ 1 σ 2 = 19 4
(5)联合分布 :由于 X 1 正态,X 2 ∣ X 1 正态(均值是 X 1 的线性函数),故 ( X 1 , X 2 ) 服从二维正态分布:
( X 1 , X 2 ) ∼ N ( μ 1 , μ 2 ; σ 1 2 , 4 19 σ 2 2 ; 19 4 )
X 2 的边际分布为 X 2 ∼ N ( μ 2 , 4 19 σ 2 2 ) 。
习题9 — 2019北京大学431: X + Y 和 X − Y 独立的充要条件 ★★★
设 ( X , Y ) ∼ N ( μ 1 , μ 2 ; ω 1 2 , ω 2 2 ; ρ ) ,求 X + Y 和 X − Y 相互独立的充要条件。
解 :由于 ( X , Y ) 服从二维正态分布,X + Y 和 X − Y 都是 X , Y 的线性组合,故 ( X + Y , X − Y ) 服从二维正态分布。
对于二维正态分布,不相关等价于独立 。因此只需 Cov ( X + Y , X − Y ) = 0 。
Cov ( X + Y , X − Y ) = Cov ( X , X ) − Cov ( X , Y ) + Cov ( Y , X ) − Cov ( Y , Y )
= Var ( X ) − Var ( Y ) = ω 1 2 − ω 2 2
令其等于零,得 ω 1 2 = ω 2 2 。
结论 :X + Y 和 X − Y 相互独立的充要条件是 ω 1 2 = ω 2 2 (即 X 和 Y 的方差相等),与 ρ 无关。
习题10 — 2020东北大学432:正态分布线性组合+ F 分布 ★★★
设 X 1 , X 2 , X 3 , X 4 独立同分布,X i ∼ N ( 0 , 1 ) 。
(1)求 X 1 + X 2 − 2 X 3 的分布。
(2)求常数 k 使得 ( X 1 + X 2 − 2 X 3 ) 2 k ( X 1 + X 2 + X 3 + X 4 ) 2 ∼ F ( 1 , 1 ) 。
解 :
(1)X 1 + X 2 − 2 X 3 的分布 :
由独立正态变量的线性组合性质:
E ( X 1 + X 2 − 2 X 3 ) = 0 + 0 − 0 = 0
Var ( X 1 + X 2 − 2 X 3 ) = 1 + 1 + 4 = 6
因此 X 1 + X 2 − 2 X 3 ∼ N ( 0 , 6 ) 。
(2)求 k :
令 U = X 1 + X 2 + X 3 + X 4 ,V = X 1 + X 2 − 2 X 3 。
E ( U ) = 0 ,Var ( U ) = 1 + 1 + 1 + 1 = 4 ,故 U ∼ N ( 0 , 4 ) 。
V ∼ N ( 0 , 6 ) (已求出)。
检验独立性:Cov ( U , V ) = Cov ( X 1 + X 2 + X 3 + X 4 , X 1 + X 2 − 2 X 3 )
= Var ( X 1 ) + Var ( X 2 ) − 2 Var ( X 3 ) = 1 + 1 − 2 = 0
由 U , V 联合正态且 Cov ( U , V ) = 0 ,知 U 与 V 独立 。
标准化:2 U ∼ N ( 0 , 1 ) ,6 V ∼ N ( 0 , 1 ) 。
因此 ( 2 U ) 2 ∼ χ 2 ( 1 ) ,( 6 V ) 2 ∼ χ 2 ( 1 ) ,且两者独立。
V 2 k U 2 = k ⋅ V 2 /6 U 2 /4 ⋅ 6 4 = k ⋅ 6 4 ⋅ V 2 /6 U 2 /4 = 3 2 k ⋅ χ 2 ( 1 ) /1 χ 2 ( 1 ) /1
要使上式 ∼ F ( 1 , 1 ) ,需要 3 2 k = 1 ,即 k = 2 3 。
答案 :k = 2 3 。
十一、教材原文
第三章 多维随机变量及其分布/特征数