随机变量的数字特征

本文主要介绍了随机变量的数字特征。包括了数学期望和条件期望以及中位数(Median)。数学期望也称均值(Mean), 是随机变量的一个最基本的数字特征。通过例题学习数学期望的性质及条件期望、中位数的定义。
展开查看详情

1.3-1: 随机变量的数字特征 张伟平

2.第三章随机变量的数字特征 3.1 数学期望 (均值) 及中位数 . . . . . . . . . . . 2 3.1.1 数学期望 (Expectation) . . . . . . . . 2 3.1.2 数学期望的性质 . . . . . . . . . . . . . 15 3.1.3 条件期望 (Conditional Mean) . . . . . 20 3.1.4 中位数 (Median) . . . . . . . . . . . . 25 Previous Next First Last Back Forward 1

3.随机变量的性质描述 1. 随机变量的分布函数是对随机变量的概率性质最完整的刻画. 2. 有些时候我们更关心随机变量的某方面 “特征”(完全由分布函 数决定的): • 某行业工人的平均工资 (这里工资的分布情况不是最关心 的), 或者某行业工人的工资散布程度 3. 能够刻画随机变量某些方面的性质特征的量称为随机变量的数 字特征。 • 度量” 中心”: 期望, 中位数 • 度量散布程度: 方差, 绝对偏差, 极差 • 分布形状: 偏度系数, 峰度系数 • 相关程度: 相关系数 Previous Next First Last Back Forward 1

4. 3.1 数学期望 (均值) 及中位数 3.1.1 数学期望 (Expectation) 数学期望也称均值 (Mean), 是随机变量的一个最基本的数字特 征. 我们先看如下的一个例子 ↑Example 一甲乙两人赌技相同, 各出赌金 100 元, 约定先胜三局者为胜, 取 得全部 200 元. 现在甲胜 2 局乙胜 1 局的情况下中止, 问赌本该如何 分? ↓Example 解: 如果继续赌下去而不中止, 则甲有 3/4 的概率取胜, 而乙胜的概 率为 1/4. 所以, 在甲胜 2 局乙胜 1 局的这个情况下, 甲能期望 “得 到” 的数目, 应当确定为 3 1 200 × + 0 × = 150(元), 4 4 Previous Next First Last Back Forward 2

5.而乙能 “期望” 得到的数目, 则为 1 3 200 × + 0 × = 50(元). 4 4 如果引进一个随机变量 X, X 等于在上述局面 (甲值 2 胜乙 1 胜) 之下, 继续赌下去甲的最终所得, 则 X 有两个可能的值: 200 和 0, 其概率分别为 3/4 和 1/4. 而甲的期望所得, 即 X 的 “期望” 值, 即等于 X的可能值与其概率之积的累加 这就是 “数学期望” 这个名称的由来. 另一个名称 “均值” 形象易懂, 也很常用. Previous Next First Last Back Forward 3

6. ↑Example 甲乙两人射击水平如下所示 击中环数 8 9 10 击中环数 8 9 10 甲: 乙: 概率 0.3 0.1 0.6 概率 0.2 0.5 0.3 试问两人谁的水平高? ↓Example 假设两人分别射击 N 次, 则他们各自射击的总环数大概为 甲: 8 ∗ 0.3N + 9 ∗ 0.1N + 10 ∗ 0.6N = 9.3N 乙: 8 ∗ 0.2N + 9 ∗ 0.5N + 10 ∗ 0.3N = 9.1N 因此, 在 N 次射击后, 两人的平均击中环数分别为 9.3 和 9.1, 因 此甲的水平稍高一些. 下面我们就给出数学期望 (均值) 的定义: 对一般的离散型分布, 我们有 Previous Next First Last Back Forward 4

7.设 X 为一离散型随机变量, 其分布律为 P (X = xi ) = pi , i = 1, 2, · · · ∑ ∞ 如果 |xi |pi < +∞, 则称 i=1 Definition ∑ ∞ xi pi i=1 为随机变量 X 的数学期望 (均值), 用符号 EX 表示. 若 ∑ ∞ |xi |pi = +∞, 则称 X 的数学期望 (均值) 不存在. i=1 Previous Next First Last Back Forward 5

8.设 X 为一离散型随机变量, 其分布律为 P (X = xi ) = pi , i = 1, 2, · · · ∑ ∞ 如果 x2i pi < +∞, 则称 i=1 Definition ∑ ∞ (xi − EX)2 pi i=1 ∑ ∞ 为随机变量 X 的方差, 用符号 V ar(X) 表示. 若 x2i pi = i=1 +∞, 则称 X 的方差不存在. Previous Next First Last Back Forward 6

9.0.3N ∗ (8 − 9.3)2 + 0.1N ∗ (9 − 9.3)2 + 0.6N ∗ (10 − 9.3)2 = 0.81N 0.2N ∗ (8 − 9.1)2 + 0.5N ∗ (9 − 9.1)2 + 0.3N ∗ (10 − 9.1)2 = 0.49N 对连续型随机变量, 其数学期望的定义如下 不 妨 设 连 续 型 随 机 变 量 X 的 密 度 f (x) 的 非 零 取 值 范 围 为 (a, b), a < b 可以为 ∓∞, 则可以通过将 X 离散化来考虑 X 的期望: 1. 取点集 {xi }, 使得 a = x0 < x1 < . . . < xn = b, 区间长为 ∆xi = xi − xi−1 . 2. 定义一个新的离散型随机变量 X ′ , 其所有可能取值点为 {ti }, xi−1 < ti ≤ xi 且有分布律 P (X ′ = ti ) = pi = P (xi−1 < X ≤ xi ) ≈ f (ti )∆xi Previous Next First Last Back Forward 7

10.3. 从而有离散型随机变量期望的定义有:(∆xi → 0) ∑ ∑ ∫ EX ′ = ti pi ≈ ti f (ti )∆xi → xf (x)dx := EX < ∞, R ∑ ∑ ∫ 如果 |xi |pi ≈ |ti |f (ti )∆xi → |x|f (x)dx < ∞. R Previous Next First Last Back Forward 8

11.如果连续型随机变量 X 的概率密度函数为 f (x), 则当 ∫ ∞ |x|f (x)dx < ∞ −∞ 时, 我们将积分 ∫ ∞ xf (x)dx Definition −∞ 的值称为 X 的数学期望, 记作 EX. 如果 ∫ ∞ |x|f (x)dx = ∞, −∞ 则称 X 的数学期望不存在. 下面求解几种常见分布的数学期望. Previous Next First Last Back Forward 9

12.1. 二项分布 X ∼ B(n, p): ∑ n n! EX = k. pk (1 − p)n−k k=0 k!(n − k)! ∑ n−1 (n − 1)! = np · pi (1 − p)n−1−i i=0 i!(n − 1 − i)! = np. 2. Poisson 分布 X ∼ P (λ): EX = λ. Previous Next First Last Back Forward 10

13.3. 正态分布 X ∼ N (µ, σ 2 ): ∫ +∞ (x−µ)2 x − EX = √ e 2σ2 dx −∞ 2πσ ∫ +∞ 1 2 = (σy + µ). √ e−y /2 dy −∞ 2π = µ. 4. 均匀分布 X ∼ U [a, b]: ∫ b 1 a+b EX = x dx = . a b−a 2 5. 指数分布 X ∼ Exp(λ): ∫ ∞ EX = xλe−λx dx = 1/λ. 0 6. 卡方分布 X ∼ χ2n : EX = n. Previous Next First Last Back Forward 11

14.7. t 分布 X ∼ tn : EX = 0. Previous Next First Last Back Forward 12

15. ↑Example 设 r.v. X 的分布律为 ( k ) k2 1 P X = (−1) = k, k = 1, 2, · · · k 2 则 X 的数学期望不存在。 ↓Example 解: 由于 ∑ ∞ 2k 1 ∑1 ∞ |(−1)k | k = = +∞ k=1 k 2 k=1 k 因此 X 的数学期望不存在。而尽管 ∑ ∞ 2k 1 ∑ ∞ 1 (−1)k k = (−1)k = −ln2. k=1 k 2 k=1 k Previous Next First Last Back Forward 13

16. ↑Example (Cauchy 分布) 设 1 p(x) = , x ∈ R, π(1 + x2 ) 则: 该分布的期望不存在. ↓Example 解: 容易看出,p(x) 非负, 并且 ∫ ∞ ∫ 1 ∞ 1 1 p(x)dx = 2 dx = arctan x |∞ −∞ = 1, −∞ π −∞ 1 + x π 所以 p(x) 是一个密度函数 (称为 Cauchy 分布), 但是 ∫ ∞ ∫ 2 ∞ x |x|p(x)dx = dx = ∞, −∞ π 0 1 + x2 所以 Cauchy 分布的期望不存在. # Previous Next First Last Back Forward 14

17.3.1.2 数学期望的性质 1. 若干个随机变量线性组合的期望, 等于各变量期望的线性组 合. 假设 c1 , c2 , . . . , cn 为常数, 则有 E(c1 X1 + c2 X2 + · · · + cn Xn ) = c1 EX1 + c2 EX2 + · · · + cn EXn , 这里假定各变量的期望都存在. ↑Example 假设随机变量 X ∼ B(n, p), 求 EX. ↓Example ∑n 解: 令 Ii ∼ B(1, p), i = 1, 2, . . . , n, 则 X = Ii 且 EIi = p. 所 ∑ i=1 以,EX = n i=1 EIi = np. Previous Next First Last Back Forward 15

18. 2. 若干个独立随机变量之积的期望, 等于各变量的期望之积, 即 E(X1 X2 · · · Xn ) = EX1 EX2 · · · EXn , 这里假定各变量相互独立且期望都存在. 3. (随机变量函数的期望) 设随机变量 X 为离散型, 有分布 P (X = ai ) = pi , i = 1, 2, . . ., 或者为连续型, 有概率密度函数 f (x). 则 { ∑ ∑ i g(ai )pi , i |g(ai )|pi < ∞; Eg(X) = ∫ +∞ ∫ +∞ −∞ g(x)f (x)dx, −∞ |g(x)|f (x)dx < ∞. Previous Next First Last Back Forward 16

19. ↑Example 假设 c 为常数, 则 EcX = cEX. ↓Example ↑Example 设随机变量 X ∼ N (0, 1), 求 Y = X 2 + 1 的数学期望. ↓Example 解: 由 X ∼ N (0, 1), 我们有 ∫ +∞ 1 x2 EX 2 = x2 . √ e− 2 dx −∞ 2π = 1. 所以, EY = EX 2 + 1 = 2. Previous Next First Last Back Forward 17

20. ↑Example 设随机变量 X ∼ B(n, p), 求 Y = X(n − X) 的数学期望. ↓Example 解: 由 X ∼ B(n, p), 则 EX = np, EX 2 = V ar(X) + (EX)2 = np(1 − p) + n2 p2 . 我们有 ( ) ∑ n n k EY = EX(n − X) = k(n − k) p (1 − p)n−k k=0 k = nEX − EX 2 = n(n − 1)p(1 − p). Previous Next First Last Back Forward 18

21. ↑Example 飞机场载客汽车上有 20 位乘客, 离开机场后共有 10 个车站可以 下车, 若某个车站没有人下车则该车站不停车. 设乘客在每个车站下 车的可能性相等, 以 X 表示停车的次数, 求 EX. ↓Example 解: 设 { 1, 第 i 个车站有人下车 Yi = i = 1, · · · , 20. 0, 第 i 个车站无人下车 ∑ 20 则显然 X = Yi , 所以 i=1 ∑ 20 ∑ 20 EX = EYi = P (第 i 个车站有人下车) i=1 i=1 ∑ 20 = [1 − 0.920 ] = 8.784. i=1 Previous Next First Last Back Forward 19

22.3.1.3 条件期望 (Conditional Mean) 我们知道条件分布也是一个概率分布, 因此类似数学期望的定义, 我们可以给出条件期望的定义. 在给定了随机变量 X 取值 x 的条件 之下, Y 的条件期望, 我们记为 E(Y |X = x), 也可简记为 E(Y |x). 设 X 和 Y 为随机变量, 若 (X, Y ) 为离散型, 且在给 定 X = x 之 下, Y 有 分 布 P (Y = ai |X = x) = pi , i = 1, 2, . . ., 或者 (X, Y ) 为连续型, 且在给定 X = x 之 下, Y 的条件密度函数为 f (y|x). 则 Definition { ∫ +∞ −∞ yf (y|x)dy, (X, Y ) 为连续型; E(Y |X = x) = ∑ i ai pi , (X, Y ) 为离散型. Previous Next First Last Back Forward 20

23. 期望所具有的性质条件期望同样满足. ↑Example 设 (X, Y ) ∼ N (a, b, σ12 , σ22 , ρ), 试计算 E(Y |X = x). ↓Example 解: 由于 Y |X = x ∼ N (b + ρ σσ21 (x − a), (1 − ρ2 )σ22 ), 所以由二维正 态分布的性质知 E(Y |X = x) = b + ρ σσ21 (x − a). [注]: 条件期望 E(Y |X = x) 是 x 的函数, 当我们将 x 换为 X 时, E(Y |X) 就是一个随机变量. 我们有如下的公式成立: Previous Next First Last Back Forward 21

24.定理 1 (Law of total of expectation). 设 X, Y 为两个随机变量. 则 有 EX = E{E[X|Y ]} [全期望公式] 证: 我们仅在连续型随机变量的情形下证明此定理. 设 X 的 p.d.f 为 f (x), Y 的 p.d.f 为 p(y), X|Y = y 的 p.d.f 为 q(x|y). 则 ∫ ∞ ∫ ∞ ∫ ∞ EX = xf (x)dx = x q(x|y)p(y)dydx −∞ −∞ −∞ ∫ ∫ ∞ ∫ ∞ = xq(x|y)dxp(y)dy = E[X|Y = y]p(y)dy −∞ −∞ = E{E[X|Y ]} [推广]: 当 g(X) 为可积随机变量时, 有 Eg(X) = E{E[g(X)|Y ]}. 由此得到求解期望的第二种方法: 先求解 h(x) = E(Y |X = x), 再求解 Eh(X), 即可求得 EY . Previous Next First Last Back Forward 22

25. ↑Example 一窃贼被关在有 3 个门的地牢里, 其中第一个门通向自由. 出这 门走 3 个小时便可以回到地面; 第 2 个门通向另一个地道, 走 5 个小 时将返回到地牢; 第 3 个门通向更长的地道, 走 7 个小时也回到地牢. 若窃贼每次选择 3 个门的可能性总相同, 求他为获得自由而奔走的平 均时间. ↓Example 解: 设这个窃贼需要走 X 小时才能到达地面, 并设 Y 代表他每次对 3 个门的选择情况, Y 各以 1/3 的概率取值 1, 2, 3. 则 ∑ 3 EX = E[E(X|Y )] = E(X|Y = i)P (Y = i) i=1 注意到 E(X|Y = 1) = 3, E(X|Y = 2) = 5 + EX, E(X|Y = 3) = Previous Next First Last Back Forward 23

26.7 + EX, 所以 1 EX = [3 + 5 + EX + 7 + EX] 3 即得到 EX = 15. ↑Example 设 (X, Y ) ∼ N (a, b, σ12 , σ22 , ρ), 试计算 EXY . ↓Example 解: 先算得 σ2 E(XY |X = x) = xE(Y |X = x) = x(b + ρ (x − a)); σ1 所以 σ2 2 σ2 EXY = E(bX + ρ X − ρ aX) σ1 σ1 σ2 2 σ2 = ab + ρ (a + σ1 ) − ρ a2 2 σ1 σ1 = ab + ρσ1 σ2 . Previous Next First Last Back Forward 24

27.3.1.4 中位数 (Median) 我们已经知道, 随机变量 X 的数学期望就是它的平均值, 因此从 一定意义上, 数学期望刻画了随机变量所取之值的 “中心位置”. 但是, 我们也可以用别的数字特征来刻画随机变量的 “中心位置”. 中位数就 是这样一种数字特征. 称 m 为连续型随机变量 X 的中位数, 如果 Definition 1 1 P (X ≤ m) ≥ , P (X ≥ m) ≥ . 2 2 从定义上可以看出, m 这个点把 X 的分布从概率上一分两半: 在 Previous Next First Last Back Forward 25

28.m 左边占一半, m 右边也占一半, 从概率上说, m 这个点正好居于中 央, 这就是 “中位数” 得名的由来. • 中位数总是存在的. • 和期望值相比中位数的一个优点是它受个别特别大或特别小的 值的影响很小, 而期望则不然: 收入差距非常大时, 中位数比均 值更加有效 虽则中位数有这些优点, 但在概率统计中, 无论理论和应用上, 数学期 望的重要性都超过中位数, 其原因有一下两个方面: 1. 均值有很多优良的性质, 这些性质时使得在数学处理上很方便. 例如, E(X1 + X2 ) = EX1 + EX2 , 而 X1 + X2 的中位数与 X1 , X2 各自的中位数之间, 不存在简单的联系, 这使中位数在 数学上的处理很复杂且不方便; 2. 中位数本身固有的某些缺点:中位数可以不唯一, 且对于离散 型随机变量不易定义. Previous Next First Last Back Forward 26

29. ↑Example 设随机变量 X ∼ B(1, 21 ), 求 X 的中位数. ↓Example 解: 由于 X 的分布函数为    x≤0  0, 1 F (x) = , 0<x<1   2  1, x≥1 由中位数的定义知区间 (0,1) 内的每一个数都是 X 的中位数, 所 以此例说明中位数可以不唯一. 中位数的定义是 p 分位数定义的特例: 设 0 < p < 1,称 µp 是随机变量 X 的 p 分位数,如果 Definition P (X ≤ µp ) ≥ p, P (X ≥ µp ) ≥ 1 − p. Previous Next First Last Back Forward 27