随机变量的函数的分布

本节主要介绍了 随机变量的函数的分布。包括了随机变量的函数的概率分布、离散型随机变量的情形、连续型随机变量的情形、极小值和极大值的分布。
展开查看详情

1.2.5: 随机变量的函数的分布 张伟平 课件 http://staff.ustc.edu.cn/~zwp/ 论坛 http://fisher.stat.ustc.edu.cn

2.第二章随机变量及其分布 2.5 随机变量的函数的概率分布 . . . . . . . . . . 1 2.5.1 离散型随机变量的情形 . . . . . . . . . 1 2.5.2 连续型随机变量的情形 . . . . . . . . . 5 2.5.3 极小值和极大值的分布 . . . . . . . . . 28 Previous Next First Last Back Forward 1

3. 2.5 随机变量的函数的概率分布 最简单的情形,是由一维随机变量 X 的概率分布去求其一给定 函数 Y = g(X) 的分布。较常见的,是由 (X1 , X2 , · · · , Xn ) 的分布去 求 Y = g(X1 , X2 , · · · , Xn ) 的分布。更一般地,由 (X1 , X2 , · · · , Xn ) 的分布去求 (Y1 , Y2 , · · · , Ym ) 的分布,其中 Yi = gi (X1 , X2 , · · · , Xn ), i = 1, 2, · · · , m。 这一部分内容,与数理统计中求统计量的分布有密切的联系。 2.5.1 离散型随机变量的情形 设 X 的分布律为 P (X = xi ) = pi , i = 1, 2, · · · g : R → R,令 Y = g(X),则 Y 的分布律为 ∑ ∑ P (Y = yj ) = P (g(X) = yj ) = P (X = xi ) = pi xi :g(xi )=yj i:g(xi )=yj Previous Next First Last Back Forward 1

4. ↑Example 设 X 的概率函数为 X -1 0 1 2 P 1/4 1/2 1/8 1/8 试求 Y = X 2 , Z = X 3 + 1 的分布律。 ↓Example 解: 容易求得 Y 的分布律为: Y 0 1 4 P 1/2 3/8 1/8 Z 的分布律 Z 0 1 2 9 P 1/4 1/2 1/8 1/8 Previous Next First Last Back Forward 2

5. 上述结论可以推广到多维随机变量的情形: 设随机向量 X 的分布律为 P (X = x),则 X 的函数 Y = g(X) 的分布律为 ∑ P (Y = y) = P (g(X) = y) = P (X = x) x:g(x)=y 特别当 ξ, η 是相互独立的非负整值随机变量,各有分布律 {ak } 与 {bk }. 那么 ξ + η 有分布律 ∑ n P (ξ + η = n) = ak bn−k k=0 称此公式为离散卷积公式 Previous Next First Last Back Forward 3

6. ↑Example 设 X ∼ B(n, p),Y ∼ B(m, p) 且 X 和 Y 相互独立,则 X+Y ∼ B(n + m, p)。 ↓Example 这种性质称为再生性。可推广至多项和:设 Xi ∼ B(ni , p), (i = ∑ m ∑ m 1, 2, · · · , m),且 X1 , X2 , · · · , Xm 独立,则有: Xi ∼ B( ni , p)。 i=1 i=1 特别,若 X1 , X2 , · · · , Xn 为独立同分布,且 Xi ∼ B(1, p), i = ∑ n 1, · · · , n. 则有: Xi ∼ B(n, p)。此结论揭示了二项分布与 0 − 1 分 i=1 布之间的密切关系。 ↑Example 设 X ∼ P (λ),Y ∼ P (µ),且 X 和 Y 独立,则有 X + Y ∼ P (λ + µ)。即 P oisson 分布亦具有再生性。 ↓Example Previous Next First Last Back Forward 4

7.2.5.2 连续型随机变量的情形 定理 1. [密度变换公式] 设随机变量 X 有概率密度函数 f (x), x ∈ (a, b)(a, b 可以为 ∞), 而 y = g(x) 在 x ∈ (a, b) 上是严格单调的连 续函数,存在唯一的反函数 x = h(y), y ∈ (α, β) 并且 h′ (y) 存在且 连续,那么 Y = g(X) 也是连续型随机变量且有概率密度函数 p(y) = f (h(y))|h′ (y)|, y ∈ (α, β). Previous Next First Last Back Forward 5

8. ↑Example 设随机变量 X ∼ U (− π2 , π2 ), 求 Y = tgX 的概率密度函数。 ↓Example 解: 由于函数 g(x) = tg(x) = y 为单调可微函数,其反函数 x = arctg(y) 连续可微,因此由密度变换公式知 Y 的概率密度函数为 1 1 f (y) = arctg ′ (y) = , −∞ < y < ∞ π π(1 + y 2 ) 此分布称为 Cauchy 分布。本题我们也可以用一般的方法求解,即先 求出分布函数,然后对分布函数求导数得到。 F (y) = P (Y ≤ y) = P (tg(X) ≤ y) ∫ arctg(y) 1 1 1 = P (X ≤ arctg(y)) = dy = arctg(y) + . − π π π 2 2 所以 Y 的概率密度为 1 f (y) = F ′ (y) = . π(1 + y 2 ) Previous Next First Last Back Forward 6

9.这种方法更具有一般性。 注: 当 g 不是在全区间上单调而是逐段单调时,密度变换公式为 下面的形式: 设随机变量 ξ 的密度函数为 pξ (x), a < x < b. 如果可 以把 (a, b) 分割为一些 (有限个或可列个) 互不重叠的子 ∪ 区间的和 (a, b) = j Ij , 使得函数 u = g(t), t ∈ (a, b) ′ 在每个子区间上有唯一的反函数 hj (u), 并且 hj (u) 存 在连续, 则 η = g(ξ) 是连续型随机变量, 其密度函数为: ∑ ′ pη (x) = pξ (hj (x))|hj (x)| . j Previous Next First Last Back Forward 7

10. ↑Example 设 X ∼ N (0, 1),求 Y = X 2 的概率密度。 ↓Example 解: 由于函数 y = x2 在 (−∞, 0) 和 [0, ∞) 上严格单调,因此由上述 定理知 Y 的概率密度为 √ √ √ √ f (y) = ϕ(− y)| − y ′ |I{y>0} + ϕ( y)| y ′ |I{y>0} 1 1 y = √ y − 2 e− 2 I{y>0} 2π Previous Next First Last Back Forward 8

11.定理 2. 设 (ξ1 , ξ2 ) 是 2 维连续型随机向量, 具有联合密度函数 p(x1 , x2 ), 设 ζj = fj (ξ1 , ξ2 ), j = 1, 2. 若 (ξ1 , ξ2 ) 与 (ζ1 , ζ2 ) 一一对 应, 逆映射 ξj = hj (ζ1 , ζ2 ), j = 1, 2. 假定每个 hj (y1 , y2 ) 都有一阶连 续偏导数. 则 (ζ1 , ζ2 ) 亦为连续型随机向量, 且其联合概率密度为 { p (h1 (y1 , y2 ), hn (y1 , y2 )) |J|, (y1 , y2 ) ∈ D, q(y1 , y2 ) = (2.1) 0, (y1 , y2 ) ̸∈ D, 其中 D 是随机向量 (ζ1 , ζ2 ) 的所有可能值的集合, J 是变换的 Jaccobi 行列式,即 ∂h1 ∂h1 ∂y1 ∂y2 J= ∂h2 ∂h2 ∂y1 ∂y2 Previous Next First Last Back Forward 9

12. 在多元随机变量场合,更一般地有 定理 3. 如果 (ξ1 , · · · , ξn ) 是 n 维连续型随机向量, 具有联合密度函 数 p(x1 , · · · , xn ). 假设存在 n 个 n 元函数 yj = fj (x1 , · · · , xn ), j = 1, · · · , n, 使得 ζj = fj (ξ1 , · · · , ξn ), j = 1, · · · , n, 若 (ξ1 , · · · , ξn ) 与 (ζ1 , · · · , ζn ) 之间一一对应, 逆映射为 ξj = hj (ζ1 , · · · , ζn ), j = 1, · · · , n. 其中每个 hj (y1 , · · · , yn ) 都有一阶连续偏导数, 那么随 机向量 (ζ1 , · · · , ζn ) 是连续型的, 且具有联合密度函数 { p (h1 (y1 , · · · , yn ), · · · , hn (y1 , · · · , yn )) |J|, (y1 , · · · , yn ) ∈ D, q(y1 , · · · , yn ) = 0, (y1 , · · · , yn ) ̸∈ D, Previous Next First Last Back Forward 10

13. 其中 D 是随机向量 (ζ1 , · · · , ζn ) 的所有可能值的集合, J 是变换 的 Jaccobi 行列式,即 ∂h1 ∂y1 ··· ∂h1 ∂yn .. .. .. J= . . . ∂hn ∂y1 ··· ∂hn ∂yn Previous Next First Last Back Forward 11

14. ↑Example 在直角坐标平面上随机选取一点, 分别以随机变量 ξ 与 η 表示其 横坐标和纵坐标, 可以认为 ξ 与 η 相互独立. 如果 ξ 与 η 都服从正态 分布 N (0, 1), 试求其极坐标 (ρ, θ) 的分布. ↓Example 解: 易知 { x = r cos t y = r sin t 是 (0, ∞) × [0, 2π) 与 R2 (原点除外) 之间的一一变换, 变换的 Jaccobi 行列式 ∂x ∂r ∂x ∂t cos t −r sin t J = ∂y ∂y = = r. ∂r ∂t sin t r cos t Previous Next First Last Back Forward 12

15.由于 (ξ, η) 的联合密度为 { } 1 x2 + y 2 p(x, y) = exp − , 2π 2 所以由 (??) 式得知, (ρ, θ) 的联合密度为 { 2} 1 r q(r, t) = r exp − = q1 (r)q2 (t), r > 0, t ∈ [0, 2π). (2.3) 2π 2 { 2} 其中 q1 (r) = r exp − r2 , r > 0; q2 (t) = 1 2π ,t ∈ [0, 2π). 这一 结果表明: θ 与 ρ 相互独立, 其中 θ 服从 [0, 2π) 上的均匀分布; 而 ρ 则服从 Weibull 分布 (参数 λ = 1/2, α = 2). Previous Next First Last Back Forward 13

16. 在计算两个随机变量之和时,我们还经常用到如下定理 定理 4. 设 X, Y 的联合概率密度为 f (x, y),则 X + Y 的概率密度 p(z) 为 ∫ ∞ ∫ ∞ p(z) = f (x, z − x)dx = f (z − y, y)dy −∞ −∞ 证一: 先求 X + Y 的分布函数 F (z). 我们有 ∫ ∫ ∫ ∞ ∫ z−x F (z) = P (X + Y ≤ z) = f (x, y)dxdy = dx f (x, y)dy x+y≤z −∞ −∞ ∫ ∞ ∫ z ∫ z {∫ ∞ } = du f (x, t − x)dt = f (x, t − x)dx dt. −∞ −∞ −∞ −∞ 这就说明,X + Y 的分布函数 F (z) 是其中的花括弧中的函数在区间 (−∞, z) 上的积分, 所以 X + Y 是连续型随机变量, 其密度函数如定 理所述。 Previous Next First Last Back Forward 14

17.证二: 令 X = Z1 , X + Y = Z2 , 利用单调映射的密度变换公式 (2.1) 可求得 (Z1 , Z2 ) 的联合概率密度函数为 g(z1 , z2 ) = f (z1 , z2 − z1 ). 再 对 g(z1 , z2 ) 关于 z1 在 R 上积分, 便求得 Z2 = X + Y 的密度为 ∫ ∞ ∫ ∞ g(z1 , z2 )dz1 = f (z1 , z2 − z1 )dz1 , −∞ −∞ 故得所证. 特别,当 X 与 Y 独立时,分别记 X 和 Y 的概率密度为 f1 (x) 和 f2 (y),则 X + Y 的概率密度为 ∫ ∞ ∫ ∞ p(z) = f1 (x)f2 (z − x)dx = f1 (z − y)f2 (y)dy f1 ∗ f2 (z) = f2 ∗ f1 (z) −∞ −∞ 称此公式为卷积公式。 Previous Next First Last Back Forward 15

18. ↑Example 设 X 服从期望为 2 的指数分布,Y ∼ U (0, 1),且 X 和 Y 相 互独立。求 X − Y 的概率密度和 P (X ≤ Y )。 ↓Example 解一: 由题设知 −Y ∼ U (−1, 0),并记 X 和 −Y 的密度分别为 f1 和 f2 ,从而由卷积公式有 ∫ ∞ fX−Y (z) = f1 (x)f2 (z − x)dx −∞   −z −1  e 2 (1 − e 2 ),  z+1 z≥0 = 1 − e− 2 , −1 < z < 0    0, z ≤ −1 1 所以 P (X ≤ Y ) = P (X − Y ≤ 0) = 2e− 2 − 1。 Previous Next First Last Back Forward 16

19.解二: 由于 ∫ P (X − Y ≤ z) = P (X ≤ z + y|Y = y)f (y)dy  ∫  1  ∫ 0 P (X ≤ z + y)dy  z≥0 1 = P (X ≤ z + y)dy −1 < z < 0   −z  0 z ≤ −1   −z/2 (1 − e−1/2 ),  1 − 2e  z≥0 −(z+1)/2 = z + 2e − 1, −1 < z < 0    0, z ≤ −1 再对分布函数求导数即得所求. Previous Next First Last Back Forward 17

20. ∑n ↑Example 设 X1 , . . . , Xn i.i.d ∼ N (0, 1), 试求 Yn = i=1 Xi2 的分布. ↓Example 解: 由前例知 Y1 = X12 的概率密度函数为 1 1 f1 (y) = √ y −1/2 e−y/2 I(y > 0) = 1/2 1 y 1/2−1 e−y/2 I(y > 0) 2π 2 Γ( 2 ) 由卷积公式知 Y2 = X12 + X22 的概率密度函数为 ∫ f2 (z) = f1 (y)f2 (z − y)dy R ∫ 1 1 = e−z/2 I(z > 0) t−1/2 (1 − t)−1/2 dt 2Γ2 ( 12 ) 0 1 = z 2/2−1 e−z/2 I(z > 0) 22/2 Γ( 22 ) 从而由归纳法, 假设 Yn−1 = X12 + · · · + Xn−1 2 的概率密度函数 Previous Next First Last Back Forward 18

21.为 1 fn−1 (z) = z (n−1)/2−1 e−z/2 I(z > 0) 2(n−1)/2 Γ( n−1 2 ) 则 Yn = Yn−1 + Xn2 的概率密度函数可由卷积公式得 ∫ fn (z) = fn−1 (y)f1 (z − y)dy R ∫ 1 1 = z n/2−1 e−z/2 I(z > 0) t(n−1)/2−1 (1 − t)1/2−1 dt 2n/2 Γ( n−1 2 )Γ( 12 ) 0 1 = z n/2−1 e−z/2 I(z > 0) 2n/2 Γ( n2 ) Previous Next First Last Back Forward 19

22. 由归纳法得 Yn 的密度函数. 称 Yn 的分布为自由度 n 的卡方分 布, 记为 Yn ∼ χ2n . • χ2n 具有再生性 • X ∼ χ2n , 则 EX = n, V ar(X) = 2n. • http://en.wikipedia.org/wiki/Chi-squared_distribution Previous Next First Last Back Forward 20

23. 一些连续型随机变量,也有再生性性质。 ↑Example 设 X ∼ N (µ1 , σ12 ), Y ∼ N (µ2 , σ22 ) 且 X 与 Y 相互独立,则: X + Y ∼ N (µ1 + µ2 , σ12 + σ22 ). 更一般地, 设 Xi ∼ N (µi , σi2 ), i = 1, · · · , n, X1 , · · · , Xn 相互独立. a1 , · · · , an , b 为任意 n + 1 个实数, 其中 a1 , · · · , an 不全为零. 令 ∑n ∑n X = ai Xi + b, 则 有: X ∼ N (µ, σ 2 ), 其中 µ = ai µi + b, i=1 i=1 2 ∑ n σ = a2i σi2 . i=1 ↓Example ↑Example 设 X1 ∼ χ2n , X2 ∼ χ2m , 且 X1 和 X2 相互独立, 则 X1 + X2 ∼ χ2n+m . ↓Example Previous Next First Last Back Forward 21

24.我们把具有再生性性质的分布总结一下为 • 二项分布 (关于试验次数具有再生性) • P oisson 分布 (关于参数 λ 具有再生性) • P ascal 分布 (关于成功次数 r 具有再生性) • 正态分布 (关于两个参数都具有再生性) • χ2 分布具有再生性 Previous Next First Last Back Forward 22

25. 有时我们还会碰到计算随机变量之商的概率密度. 我们有 定理 5. 如果 (ξ, η) 是二维连续型随机向量, 它们的联合密度为 f (x, y), 则它们的商 ξ/η 是连续型随机变量, 具有密度函数 ∫ ∞ p ξ (x) = |t|f (xt, t)dt, ∀ x ∈ R. η −∞ ∫ ∞ (2.4) 而 p η (x) = |u|f (u, xu)du, ∀ x ∈ R. ξ −∞ Previous Next First Last Back Forward 23

26. ↑Example 设随机变量 ξ 与 η 相互独立, 同服从参数 λ = 1 的指数分布, 试 求 ξ/η 的密度函数. ↓Example 解: 我们利用 (2.4) 式求 p ξ (x). 由于 (ξ, η) 的联合密度为 η p(u, v) = e−u−v , u > 0, v > 0, 所以欲 (2.4) 式中的被积函数 |t|p(xt, t) ̸= 0, 当且仅当, t > 0 和 xt > 0, 从而知有 { ∫∞ 0 t e−xt−t dt = 1 (1+x)2 x > 0; p ξ (x) = η 0 x ≤ 0. 易见 p η (x) 同上。 ξ Previous Next First Last Back Forward 24

27. ↑Example 设 X1 ∼ N (0, 1),X2 ∼ χ2n ,且 X1 与 X2 独立。求 Y = √ X1 X2 /n 的概率密度函数. ( 记 Y ∼ tn , 称为自由度为 n 的 t 分布)。 ↓Example √ 解: 先求 Z = X2 /n 的密度 g(z): g(z) = 2nzfX2 (nz 2 )I(z > 0) 其中 fX2 为 X2 的密度函数. 利用商的密度变换公式, 可得 ∫ fY (y) = fX1 /Z (y) = |t|ϕ(yt)g(t)dt ∫ R 1 2 2nt 2 = |t| √ e−(yt) /2 n/2 n (nt2 )n/2−1 e−nt /2 I(t > 0)dt R 2π 2 Γ( 2 ) ∫ ∞ 1 2nn/2 n −(y 2 +n)t2 /2 = √ n t e dt 2π 2n/2 Γ( 2 ) 0 Previous Next First Last Back Forward 25

28. 令 x = (n + y 2 )t2 /2, 则上述积分为 ∫ ∞ ( )(n+1)/2 1 2nn/2 1 2 fY (y) = √ n x(n−1)/2 e−x dx · n/2 2π 2 Γ( 2 ) 0 2 n + y2 ( )− n+1 Γ( n+1 ) y2 2 = √ 2 n 1+ nπΓ( 2 ) n • tn 的分布关于原点对称 • limn→∞ fY (y) = ϕ(y). • http://en.wikipedia.org/wiki/Student's_t-distribution Previous Next First Last Back Forward 26

29. ↑Example 设 X1 ∼ χ2n ,X2 ∼ χ2m ,且 X1 与 X2 独立,求 Y = X X1 /n 2 /m 的 概率密度函数. (记 Y ∼ Fn,m , 称为自由度为 n, m 的 F 分布)。 ↓Example 解: 由密度变换公式易知 X1 /n 的密度函数为 ngn (nz), 类似 X2 /m 的密度为 mgm (mz), 其中 gn 为自由度 n 的 χ2n 的密度函数. 从而 Y 的密度函数为 ∫ fY (y) = |t|ngn (nty)mgm (mt)I(t > 0)dz R m n = [2(n+m)/2 Γ( )Γ( )]−1 nn/2 mm/2 y n/2−1 ∫ ∞ 2 2 −(ny+m)t/2 (n+m)/2−1 · e t dt 0 Γ( n+m ) n/2 m/2 n/2−1 = 2 n m y (ny + m)−(n+m)/2 Γ( n2 )Γ( m 2 ) • http://en.wikipedia.org/wiki/F-distribution Previous Next First Last Back Forward 27