概率论与数理统计第十一章---区间估计

本章主要讲述了区间估计。其中包括置信区间的定义,求未知参数θ的置信区间的一般方法:枢轴变量法,枢轴函数的两大特点;正态总体下的置信区间:均值估计与均值的置信区间,方差的估计与方差的置信区间,两个正态总体的情形。
展开查看详情

1.第十一章 区间估计 置信区间 正态总体下的置信区间

2. 第一节 置信区间 对应总体的某一个样本观测值,我们可以得到点估计量 ˆ 的一个观测值,但是它仅仅是参数 θ 的一个近似值 . 由于 ˆ 是一个随机变量,它会随着样本的抽取而随机变 化,不会总是和 θ 相等,而存在着或大、或小,或正、或负 的误差 . 即便点估计量具备了很好的性质,但是它本身无法 反映这种近似的精确度,且无法给出误差的范围 . 为了弥补这些不足,我们希望估计出一个范围,并知道 该范围包含真实值的可靠程度 . 这样的范围通常以区间的形 式给出,同时还要给出该区间包含参数 θ 真实值的可靠程度 . 这种形式的估计称之为区间估计 .

3. 第一节 置信区间 例 对明年小麦的亩产量作出估计为 : 明年小麦亩产量八成为 800-1000 斤 . 若设 X 表示明年小麦亩产量 , 则估计结果为 P(800≤X≤1000)=80% 区间估计

4. 第一节 置信区间 例 1某农作物的平均亩产量 X( 单位 ) 服从正态分布 N(μ,σ2), 今随机抽取 100 亩进行试验 , 观察其亩产量值 x1,x2,…,x100, 基此算出 , 因此 x 500( kg ) μ 的点估计值为 500. 由于抽 样的随机性 , μ 的真值与 的值总有误差 x , 我们希望以 95% 的可靠度估计 与 x μ 的最大误差是多少 ? 2 因为 , x ~ N ( , 从而存在 ) c>0, 使得 , n P (| X   |c) 0.95 因此 ,这个 c 就是可允许的最大误差

5. 第一节 置信区间 定义 设 X1,X2,…,Xn 是来自总体 f(x,) 的样本 ,  未 知 , 对于任给( 0< <1), 若有统计量     ( X 1 , X 2 ,..., X n ),   ( X 1 , X 2 ,..., X n ), 使得 P {   } 1     则称随机区间 [ ,  ]为的双侧 1 的置信区间 ,1 为置信水平 , θ,和θ分别称为置信度为1  α的置信上限和置信下的置信上限和置信下限。

6. 几点说明 1 、参数的置信水平为 1- 的置信区间(  1 ,  2 ) 表示该区间有 100 ( 1- ) % 的可能性包含总体参 数的真值。 2 、不同的置信水平, 参数的置信区间不同。 3 、置信区间越小, 估计越精确, 但置信水平会降低; 相反, 置信水平越大, 估计越可靠, 但精确度会降 低, 置信区间会较长。一般:对于固定的样本容量, 不能同时做到精确度高( 置信区间小), 可靠程度也 高( 1-  大)。如果不降低可靠性, 而要缩小估计范 围, 则必须增大样本容量, 增加抽样成本。

7. 第一节 置信区间 在上述讨论中, 对于未知参数  , 我们给出两个 统计量  ,  , 得到  的双侧置信区间(  ,  ). 但在一 些实际问题中, 例如, 对于设备, 元件的寿命来说, 平均寿命长是我们所希望的, 我们关心的是平均寿 命  的"下限", 与此相反, 在考虑化学药品中杂质含 量的均值 E(X )时, 我们常关心参数 E(X )的"上限". 这就引出了单侧置信区间的概念.

8. 第一节 置信区间 对于给定值  (0<  <1), 若由样本 ( X 1 , X 2 ,, X n ) 确定的 统计量   ( X 1 , X 2 ,, X n ) , 对于任意   满足 P{   }1-  , 称随机区间(- , )是  的置信水平为 1-  的单侧置信 区间,  称为  的置信水平为 1-  的单侧置信上限. 对于给定值  (0<  <1), 若由样本 ( X 1 , X 2 ,, X n ) 确定的统 计量   ( X 1 , X 2 ,, X n ) , 对于任意   满足 P{  >  }1-  , 称随机区间(  , )是  的置信水平为 1-  的单侧置信区 间,  称为  的置信水平为 1-  的单侧置信下限.

9. 对于给定的置信度 , 怎样根据样本来确定未知参 数 θ 的置信区间 , 就是参数 θ 的区间估计问题 . 求 未知参数 θ 的置信区间的一般方法:(枢轴变量法) 以例 1 为例, μ 的点估计 X ( 也是极大似然估计 ) 有 分布   2  def nX   X ~ N   ,  G X ,    ~ N  0,1  n   对于给定 α=0.05 ,可通过查正态分布表得:     P G X,    1.96  1    2   由随机事件的等价性 G  X ,    X   1.96 n      P    X  1.96 , X  1.96     n n   c值 置信区间  X  c, X  c

10.G  X ,  称为枢轴函数,它有以下两个特点: 1. 枢轴函数除含有关心的未知参数 μ 外,不再有 其他未知参数; 2. 枢轴函数的分布式完全已知的或完全可以确定。

11. 第一节 置信区间 对于给定的置信度 1   ,怎样根据样本来确定 未知参数θ的置信区间 的置信区间 (ˆ1 ,ˆ2 ) ,步骤如下:   (1)先求出未知参数θ的置信区间 的一个点估计   ( X 1 , X 2 ,..., X n ) . (2)构造一个 含有未知参数 θ的置信区间 而不含有其他未 知参数的枢轴函数 G G ( X 1 , X 2 ,, X n , ) ,且已知其分 布. (3)对给定的置信度 1   ,根据 G ( X 1 , X 2 , , X n ; ) 的分布定出分位点 a 和 b,使得 P a  G ( X 1 , X 2 ,  , X n )  b 1  

12. 第一节 置信区间 (4)将不等式 a  G ( X 1 , X 2, , X n ; )  b 中解出 θ的置信区间 ,得 出其等价形式   X 1 , X 2 ,, X n       X 1 , X 2 ,, X n  这时必有  P  ( X 1 , X 2 , , X n )     ( X 1 , X 2 ,, X n ) 1    于是 ( , ) ,即为θ的置信度为θ的置信度为的置信度为θ的置信度为1   的置信区间.

13.例 1某农作物的平均亩产量 X( 单位 ) 服从正态分布 N(μ,σ2), 今随机抽取 100 亩进行试验 , 观察其亩产量值 x1,x2,…,x100, 基此算出 , 因此 x 500( kg ) μ 的点估计值为 500. 由于抽 样的随机性 , μ 的真值与 的值总有误差 x , 我们希望以 95% 的可靠度估计 与 x μ 的最大误差是多少 ? 2 解 因为 , x ~ N (  , 此处 ) , n=100, 因此 n def n(X  ) G( X ,  )  ~ N (0,1)  对于给定的 1   0.95   0.05  G ( X ,  ) 1.96  | X   |1.96 n   P (   [ X  1.96 , X  1.96 ]) 1   n n  因此 , 1.96 就是 c 值, 置信区间 [ X  c, X  c ] n

14. 第二节 正态总体下的置信区间 单个正态总体 N(μ,σ2) 的情形 一、均值估计(均值 μ 的置信区间) X1,X2,…,Xn 为取自 N(μ,σ2) 的样本 , 求 μ 的 1-α 置信区间 1. σ2 已知时 n(X  ) X 是的一个点估计,U  ~ N (0,1)  因此U是枢轴函数, 当k u1- / 2时 P (| U |k ) 1   σ σ | U |k等价于 {μ  [X - k ,X  k ]} n n σ σ 的1 - 置信区间为θ的置信度为:[ X -k ,X  k ] n n

15. 第二节 正态总体下的置信区间 单个正态总体 N(μ,σ2) 的情形 2. σ2 未知时  1   2 2 用S * 作的估计  t0 t0 n(X  ) 得到枢轴函数为θ的置信度为, T * ~ t (n  1) S 取k t1- / 2 (n  1), P (| T |k ) 1   S* S* 的1 - 置信区间为θ的置信度为:[X-k ,X  k ] n n

16. 第二节 正态总体下的置信区间 单个正态总体 N(μ,σ2) 的情形 例 为估计一批钢索所能承受的平均张力(单位: kg/cm2 ) , 从中随机抽取 10 个样品作试验,由实验数据算出 x 6.720 , 假定张力服从正态分布,求平均张力的置信水平 S * 220, 为 95% 的置信区间 . 解 平均张力的95%的置信区间为θ的置信度为: 此处未知, S* S* [ X -t0.975 (n  1) ,X  t0.975 (n  1) ] n n 代入数据 x 6720, S * 220, n 10, 查表t0 .975 2.2622 平均张力的置信区间的观察值是 [6562.6185, 6877.6815]

17. 第二节 正态总体下的置信区间 单个正态总体 N(μ,σ2) 的情形 二、方差的估计(方差 σ2 的置信区间) X1,X2,…,Xn 为取自 N(μ,σ2) 的样本 , 求 σ2 的 1-α 置信区间 1. μ 已知时 2 2 1 n 2 n 2 σ   ( X i   ) 是 的点估计,且 2 2   2 ~  ( n) n i 1  因此 2 是枢轴函数, 容易找到a  b,使得 P (a   2 b) 1   一般取 a  χ α2 (n),b  χ 2 α (n) 1 2 2 2 2 n σ n σ 此时对应的  2的1 - 置信区间为θ的置信度为:[ , ] b a

18. 第二节 正态总体下的置信区间 单个正态总体 N(μ,σ2) 的情形 1. μ 未知时  2  1  2  2 12  2 2 2 2 nS 用X 代替,可得枢轴变量为θ的置信度为,    由基本抽样定理,  2 ~  2 (n  1) 2 2 nS nS  2的1 - 置信区间为θ的置信度为:[ 2 , 2 ] χ α (n  1 ) χ α (n  1 ) 1 2 2

19. 第二节 正态总体下的置信区间 两个正态总体 N(μ1,σ12), N(μ2,σ22) 的情形 设 X1,X2,…,Xm 为取自 N(μ1,σ12) 的样本 , Y1,Y2,…,Yn 为取自 N(μ2,σ22) 的样本 , 且( X1,X2,…,Xm ,)与 ( Y1,Y2,…,Yn )相互独立,求二总体均值差 μ1- μ2 的 1-α 置信区间

20. 第二节 正态总体下的置信区间 两个正态总体 N(μ1,σ12), N(μ2,σ22) 的情形 μ1- μ2 的置信区间 1. σ12, σ22 已知时  12  22 X  Y 是1   2的点估计,且由 X  Y ~ N ( 1   2 ,  ) m n X  Y  ( 1   2 ) 可导出枢轴函数为θ的置信度为 U   2  2 , 1  2 1 m 1 m m n 此处, X   X i , Y   Yi m i 1 n i 1 1) 取k u1- / 2,有 P (| U |k ) 1   显然,U ~ N(0, 1   2的1-α置信区间为θ的置信度为: σ 12 σ 22 σ 12 σ 22 [X  Y  μ α  ,X  Y  μ α  ] 1 2 m n 1 2 m n

21. 第二节 正态总体下的置信区间 两个正态总体 N(μ1,σ12), N(μ2,σ22) 的情形 2. σ12=σ22=σ2 未知时 m n 1 记, S w2  [ ( X i  X ) 2   (Yi  Y ) 2 ], m  n  2 i 1 j 1 X  Y  (μ1  μ2 ) 令 T  2 2 , T ~ t ( m  n  2) σ σ Sw 1  2 m n 1   2的1-α置信区间为θ的置信度为: σ 12 σ 22 σ 12 σ 22 [ X  Y  kS w  ,X  Y  kS w  ] m n m n 其中 k t1- / 2(m  n  2 )

22. 第二节 正态总体下的置信区间 两个正态总体 N(μ1,σ12), N(μ2,σ22) 的情形 例 甲、乙两台机床加工同一种零件,今在机床甲加工的零 件中随机抽取 9 件,在乙加工的零件中随机抽取 6 件,分 别测量零件的长度(单位: mm ),由测得的数据可算出 *2 *2 x 2.0648, y 2.0594, S 0.245, S 0.257. 1 2 假定零件长度服从正态分布,试求两台机床加工零件长 度的均值差 μ1-μ2 的水平为 95% 的置信区间。 解 令 n1=9, n2=6 1 Sw  [8 0.245  5 0.357] 0.5367 13 1 1 k t0.975 (13) 2.1604  9 6 水平为 95% 的 μ1-μ2 的置信区间为 [-0.6056 , 0.6164]

23.例1 某工厂生产一批滚珠 , 其直径 X 服从正态 分布 N(  2), 现从某天的产品中随机抽 取 6 件 , 测得直径为 15.1 , 14.8 , 15.2 , 14.9 , 14.6 , 15.1 (1) 若 2=0.06, 求 的置信区间 (2) 若 未知 , 求  的置信区间 2 置信水平 (3) 求方差 2 的置信区间 . 均为 0.95 解 (1) X ~ N (  , 0.06 / 6) 即 N (  ,0.01) X   ~ N (0,1) u1  u0.975 1.96 0.1 2

24. 的置信区间为 0.1 0.1 ( 14.95  1.96  , 14.95  1.96  ) 6 6 X  (2) 取T  S * ~ t (5) 查表 t0.975 (5) 2.5706 6 由给定数据算得 x 14.95 6 *2 1 s  ( xi  6 x ) 0.051. s 0.226 2 2 * 5 i 1

25. 的置信区间为 * * s s (x t0.975 (5), x t0.975 (5) ) 6 6 (14.71, 15.187 ) 5S 2 (3) 选取枢轴量 K  2 ~  2 (5) s 2 0.051.  2 2 查表得  0.025 (5) 12.831,  0975 (5) 0.832  2 的置信区间为 2 2 5s 5s ( 2 , 2 ) ( 0.0199 , 0.3069 )  0.025 (5)  0.975 (5)