多维随机变量

本节讲述了多维随机变量的基本知识,包括了多维分布与边际分布。我们把多个随机变量放在一起组成向量,称为多维随机变量或者随机向量。随机向量分为离散型、连续型以及其他类型。通过例题学习什么是边际分布。
展开查看详情

1. 2-3: 多维随机变量 张伟平 课件 http://staff.ustc.edu.cn/~zwp/ 论坛 http://fisher.stat.ustc.edu.cn

2.第二章随机变量及其分布 2.3 多维分布与边际分布 . . . . . . . . . . . . . . 1 2.3.1 多维分布 . . . . . . . . . . . . . . . . 1 2.3.2 边缘分布 . . . . . . . . . . . . . . . . 14 Previous Next First Last Back Forward 1

3. 2.3 多维分布与边际分布 2.3.1 多维分布 在实际应用中,经常需要对所考虑的问题用多个变量来描述. 我 们把多个随机变量放在一起组成向量,称为多维随机变量或者随机向 量. ↑Example 从一副扑克牌中抽牌时, 可以用纸牌的花色和数字来说明其特征. ↓Example ↑Example 考虑一个打靶的试验. 在靶面上取定一个直角坐标系. 则命中的 位置可由其坐标 (X, Y ) 来刻划. X,Y 都是随机变量. ↓Example Previous Next First Last Back Forward 1

4.设 X = (X1 , . . . , Xn ). 如果每个 Xi 都是一个随机变量, Definition i = 1, · · · , n,则称 X 为 n 维随机变量或者随机向量. 我们可以按照对常用一维随机变量的分类把常用的随机向量分 为离散型、连续型以及其他类型. Previous Next First Last Back Forward 2

5.如果每一个 Xi 都是一个离散型随机变量,i = 1, ..., n,则称 X = (X1 , . . . , Xn ) 为一 n 维离散随机变量. 设 Xi 的所有 可能取值 (有限或可数个) 为 {ai1 , ai2 , · · · }, i = 1, . . . , n, 则称 Definition p(j1 , · · · , jn ) = P (X1 = a1j1 , . . . , Xn = anjn ), j1 , ..., jn = 1, 2, ... (2.1) 为 n 维随机变量 X 的概率函数. 容易证明概率函数具有下列性质: (1) p(j1 , . . . , jn ) ≥ 0, ji = 1, 2, · · · , i = 1, 2, . . . , n; ∑ (2) p(j1 , . . . , jn ) = 1. j1 ,··· ,jn Previous Next First Last Back Forward 3

6. ↑Example 设 A1 , · · · , An 为某一实验下的完备事件群,即 A1 , · · · , An 两 两互斥且和为 Ω。记 pk = P (Ak )(k = 1, . . . , n),则 pk ≥ 0, p1 + · · · + pn = 1。现将实验独立的重复作 N 次,分别用 Xi 表示事 件 Ai 出现的次数 (i = 1, · · · , n)。则 X = (X1 , . . . , Xn ) 为一离散 型随机向量,试求 X 的概率函数。此分布律称为多项分布, 记为 M (N ; p1 , . . . , pn ). ↓Example 解: 由于试验独立进行, 总的结果数为 N ,记结果 Ai 出现的次数为 ki ,则 k1 + · · · + kn = N 。因此相当于多组组合,所以 N! P (X1 = k1 , · · · , Xn = kn ) = P (A1 · · · A1 . . . An · · · An ) k1 ! · · · kn ! N! = pk1 · · · pknn , k1 ! · · · kn ! 1 其中 k1 , . . . , kn 为非负整数且 k1 + · · · + kn = N . Previous Next First Last Back Forward 4

7. 我们来看一下 Xi 的分布:此时我们把试验结果分为两类, Ai 和 A¯i ,则显然就是一个 N 重贝努里试验,因此 ( ) N ki P (Xi = ki ) = p (1 − pi )N −ki , ki = 1, · · · , N. ki i 类似我们也可以找出 (Xi , Xj )(i ̸= j) 的联合分布律,即为 M (N, pi , pj , 1− pi − pj ). Previous Next First Last Back Forward 5

8. 我们具体来看一下二维离散分布. 设二维离散型随机变量 (X, Y ) 的所有可能取值为 {(xi , yj ) : i = 1, ..., n, j = 1, 2, ..., m}. 这里 n, m 为有限数或者无穷. 我们经常以列联表的形式来表示二维离散型随机 变量的概率分布. 记 pij = P (X = xi , Y = yj ), i = 1, ..., n, j = 1, ..., m. 则 (X, Y ) 的概率函数可以用下表表示: ❍❍ Y ❍❍ y1 x2 ··· ym 行和 X ❍❍ x1 p11 p12 ··· p1m p1· x2 p12 p22 ··· p2m p2· .. .. .. .. .. .. . . . . . . .. xn pn1 pn2 . pnm pn· 列和 p·1 p·2 ··· p·m 1 Previous Next First Last Back Forward 6

9. ↑Example 从一个包含五个黑球, 六个白球和七个红球的罐子里抽取四个 球. 令 X 是抽到白球的数目, Y 是抽到红球的数目. 则二维随机变量 (X, Y ) 的概率函数为 (6)(7)( 5 ) x y p(x, y) = (184−x−y ) , 0 ≤ x + y ≤ 4. (2.2) 4 ↓Example 以列联表表示, 即为 Previous Next First Last Back Forward 7

10. ❍❍ X ❍❍ 0 1 2 3 4 行和 Y ❍❍ 1 1 5 5 1 11 0 612 51 102 153 204 102 7 7 35 7 77 1 306 51 204 153 204 7 7 7 7 2 102 34 68 17 35 7 77 3 612 102 612 7 7 4 612 612 列和 99 612 22 51 11 34 4 51 1 204 1 类似于一维连续型随机变量, 连续型随机向量的也是由密度函数 来刻画的. Previous Next First Last Back Forward 8

11.称 X = (X1 , . . . , Xn ) 为 n 维连续型随机变量,如果存在 Rn 上的非负函数 f (x1 , . . ., xn ),使得对任意的 −∞ < a1 ≤ b1 < +∞, ..., −∞ < an ≤ bn < +∞, 有 ∫ bn ∫ b1 Definition P (a1 ≤ X1 ≤ b1 , ..., an ≤ Xn ≤ bn ) = ... f (x1 , . . . , xn )dx1 · · · dxn , an a1 则称 f 为 X 的概率密度函数. Previous Next First Last Back Forward 9

12.称 X = (X1 , . . . , Xn ) 为 n 维连续型随机变量,如果存在 Rn 上的非负函数 f (x1 , . . ., xn ),使得对任意的 −∞ < x1 < +∞, ..., −∞ < xn < +∞, 有 ∫ xn ∫ x1 Definition F (x1 , ..., xn ) = ... f (t1 , . . . , tn )dt1 · · · dtn , −∞ −∞ 则称 f 为 X 的概率密度函数. 对 n 维随机变量我们也有分布函数的概念. Previous Next First Last Back Forward 10

13.设 X = (X1 , . . . , Xn ) 为 n 维 随 机 变 量. 对任意的 (x1 , . . . , xn ) ∈ Rn ,称 Definition F (x1 , . . . , xn ) = P (X1 ≤ x1 , . . . , Xn ≤ xn ) (2.3) 为 n 维随机变量 X 的 (联合) 分布函数. 可以验证分布函数 F (x1 , . . . , xn ) 具有下述性质: (1) F (x1 , · · · , xn ) 对每个变元单调非降; (2) 对任意的 1 ≤ j ≤ n 有, lim F (x1 , · · · , xn ) = 0; xj →−∞ (3) lim F (x1 , · · · , xn ) = 1. x1 →∞,··· ,xn →∞ Previous Next First Last Back Forward 11

14. 对 n 维连续型随机变量, 从密度的定义我们有, ∫ xn ∫ x1 F (x1 , . . . , xn ) = ... f (x1 , ..., xn )dx1 ...dxn . −∞ −∞ 对高维离散型随机变量, 一般我们不使用分布函数. ↑Example 考虑二维随机变量 X = (X1 , X2 ),其概率密度函数为 { 1/[(b − a)(d − c)] 当 a ≤ x1 ≤ b, c ≤ x2 ≤ d, f (x1 , x2 ) = 0 其它. 称此概率密度为 [a, b] × [c, d] 上的均匀分布. ↓Example Previous Next First Last Back Forward 12

15. ↑Example 设 (X, Y ) 的概率密度函数有形式 { [ 1 1 (x − a)2 f (x, y) = √ exp − 2πσ1 σ2 1 − ρ2 2(1 − ρ2 ) σ12 ]} (x − a)(y − b) (y − b) 2 −2ρ + σ1 σ2 σ22 其中 −∞ < a, b < ∞, 0 < σ1 , σ2 < ∞, −1 ≤ ρ ≤ 1. 称 (X, Y ) 服从 参数为 a, b, σ1 , σ2 , ρ 的二元正态分布,记为 N (a, b, σ12 , σ22 , ρ). ↓Example Previous Next First Last Back Forward 13

16.2.3.2 边缘分布 设 (X1 , ..., Xn ) ∼ F 已知. 令 (i1 , ..., im ) ⊂ (1, ..., n), 则 Xi1 , ..., Xim 的分布称为 X1 , ..., Xn 或 F 的一个m 维边缘分布. 如何得到该分布? 我们先考虑离散型随机向量. 设二维离散随机变量 (X, Y ) 的所 有可能取值为 {(xi , yj ) : i = 1, ..., n, j = 1, 2, ..., m.}(这里 n, m 为有 限数或者无穷),则 (X, Y ) 的联合分布律为 P (X = xi , Y = yj ) = pij i = 1, ..., n, j = 1, 2, ..., m. Previous Next First Last Back Forward 14

17.以列联表的形式表示就是 ❍❍ X ❍❍ x1 x2 ··· xn 行和 Y ❍❍ y1 p11 p21 ··· pn1 p·1 y2 p12 p22 ··· pn2 p·2 .. .. .. .. .. .. . . . . . . .. ym p1m p2m . pnm p·m 列和 p1· p2· ··· pn· 1 从上述列联表我们可以计算随机变量 X 和 Y 的分布. 固定某个 xi . 因为 Y 在使得 X = xi 的那些样本点上必取值为 y1 , ..., ym 中之 一, 故有 ∑ m ∑ m pX (xi ) = P (X = xi ) = P (X = xi , Y = yj ) = pij = pi· , i = 1, 2, · · · n. j j Previous Next First Last Back Forward 15

18.所以上述列联表的行和所表示的正是 X 的分布. 因为这个分布是从 X 和 Y 的联合分布推导出来的, 我们称其为 X 的边缘分布. 类似可以得到 Y 的边缘分布律 ∑ n pY (yj ) = P (Y = yj ) = pij = p·j , j = 1, 2, · · · m. i 它是上述列联表的列和. Previous Next First Last Back Forward 16

19. n 维场合: 类 似 地, 可 对 n (n > 2) 维 的 随 机 变 量 定 义 边 缘 分 布. 设 X1 , ..., Xn 为 n 维随机变量,其概率分布 F 已知. 令 i1 < · · · < im 为 1, ..., n 的任一子集,则 Xi1 , ..., Xim 的概率函数为 pi1 ...im (ji1 , ..., jim ) = P (Xi1 = ai1 ji1 , ..., Xim = aim jim ) = P (Xi1 = ai1 ji1 , ..., Xim = aim jim ) ∑ = P (X1 = a1j1 , ..., Xi1 = ai1 ji1 , ..., Xim = aim jim , jim+1 ,...,jin Xim+1 = aim+1 jim+1 , ..., Xn = anjn ) ∑ = p(j1 , ..., jn ). 除ji1 ,...,jim 的所有 其中和是对除 Xi1 , ..., Xim 之外的所有变量来求和. Previous Next First Last Back Forward 17

20. ↑Example 袋中有 5 张外形相同的卡片,其中 3 张写上数字”0”,另 2 张写 上”1”。现从袋中任取两张卡片,分别以 ξ, η 表示第一张和第二张卡 片上的数字,试求分别在有放回和不放回两种情形下 (ξ, η) 的联合分 布律及边际分布律. ↓Example 解:简单计算得到 η\ξ 0 1 p·j η\ξ 0 1 p·j 0 9/25 6/25 3/5 0 6/20 6/20 3/5 1 6/25 4/25 2/5 1 6/20 2/20 2/5 pi· 3/5 2/5 1 pi· 3/5 2/5 1 这个例子说明边际分布律不能决定联合分布律。 Previous Next First Last Back Forward 18

21. 现考虑连续型随机向量的边缘分布. 先考虑二维的情形. 设 (X, Y ) 有概率密度函数 f (x, y). 则 P (x1 ≤ X ≤ x2 ) = P (x1 ≤ X ≤ x2 , −∞ < Y < +∞) ∫ +∞ ∫ x2 = f (u, v)dudv −∞ x1 ∫ x2 = fX (u)du, (2.4) x1 其中 ∫ +∞ fX (u) = f (u, v)dv. (2.5) −∞ 从 (2.4) 我们可以看出, X 的边缘密度函数即为 (2.5). 类似地, Y 的 边缘密度函数为 ∫ +∞ fY (u) = f (u, v)du. (2.6) −∞ Previous Next First Last Back Forward 19

22. 当 n > 2 时, 令 f (x1 , ..., xn ) 为 n 维连续型随机变量 (X1 , ..., Xn ) 的概率密度函数. 设 (i1 , · · · , im ) 为 (1, 2, ..., n) 的一个子集. 则同上 可证, 则 (Xi1 , ..., Xim ) 的概率密度函数是联合密度函数 f (x1 , ..., xn ) 对除 Xi1 , ..., Xim 之外的所有变量求积分. ↑Example 设 (X1 , X2 ) 服从 N (a, b, σ12 , σ22 , ρ). 则可证明 X1 的边缘分布为 N (a, σ12 ),X2 的边缘分布为 N (b, σ22 ). ↓Example Previous Next First Last Back Forward 20

23. 例2.3.2说明了虽然 n 维随机变量 X = (X1 , ..., Xn ) 的分布可以 唯一决定其所有的边缘分布,但边缘分布不足以决定 X 的联合分布. ↑Example 考虑两个概率密度函数 p(x, y) = x + y, 0 < x, y < 1 1 1 q(x, y) = (x + )(y + ), 0 < x, y < 1 2 2 试求边际概率密度。 ↓Example 解:易得所求边际概率密度都是如下形式 1 f (t) = t + , 0 < t < 1. 2 说明边际概率密度不能决定联合概率密度。 Previous Next First Last Back Forward 21

24. ↑Example 设 (X, Y ) 的联合概率密度有形式 (∀(x, y) ∈ R2 ) { [ 1 1 (x − a)2 f (x, y) = √ exp − 2πσ1 σ2 1 − ρ2 2(1 − ρ2 ) σ12 ]} (x − a)(y − b) (y − b) 2 −2ρ + σ1 σ2 σ22 其中 −∞ < a, b < ∞; 0 < σ1 , σ2 < ∞; −1 ≤ ρ ≤ 1. 则称 (X, Y ) 服 从参数为 a, b, σ1 , σ2 , ρ 的二元正态分布,记为 N (a, b, σ12 , σ22 , ρ). 试 计算 X 和 Y 的边际概率密度。 ↓Example Previous Next First Last Back Forward 22

25. 解: ∫ ∞ fX (x) = f (x, y)dy −∞ ∫ ∞ { [ 1 1 (x − a)2 = √ exp − −∞ 2πσ1 σ2 1 − ρ2 2(1 − ρ ) 2 σ12 ]} (x − a)(y − b) (y − b)2 −2ρ + dy σ1 σ2 σ22 ∫ ∞ { } 1 u2 − 2ρuv + v 2 = √ exp − dv −∞ 2πσ1 1 − ρ2 2(1 − ρ2 ) ∫ ∞ 1 1 v − ρu 2 = exp{− [( √ ) + u2 ]}dv −∞ 2πσ 1 2 1 − ρ 2 1 (x − a)2 = √ exp{− } 2πσ1 2σ12 即 X ∼ N (a, σ12 ). 类 似 可 得 Y ∼ N (b, σ22 ), 其 边 际 概 率 密 度 为 2 1 fY (y) = √2πσ 2 exp{− (y−b) 2σ 2 }. 2 Previous Next First Last Back Forward 23