概率论与数理统计第十一章---区间估计

下载 0

知秋一叶

发布于

2636

人观看

#信息技术

本章主要讲述了区间估计。其中包括置信区间的定义，求未知参数θ的置信区间的一般方法：枢轴变量法，枢轴函数的两大特点；正态总体下的置信区间：均值估计与均值的置信区间，方差的估计与方差的置信区间，两个正态总体的情形。

展开查看详情

1 .第十一章区间估计 置信区间 正态总体下的置信区间

2 . 第一节置信区间对应总体的某一个样本观测值，我们可以得到点估计量 ˆ 的一个观测值，但是它仅仅是参数 θ 的一个近似值 . 由于 ˆ 是一个随机变量，它会随着样本的抽取而随机变化，不会总是和 θ 相等，而存在着或大、或小，或正、或负的误差 . 即便点估计量具备了很好的性质，但是它本身无法反映这种近似的精确度，且无法给出误差的范围 . 为了弥补这些不足，我们希望估计出一个范围，并知道该范围包含真实值的可靠程度 . 这样的范围通常以区间的形式给出，同时还要给出该区间包含参数 θ 真实值的可靠程度 . 这种形式的估计称之为区间估计 .

3 . 第一节置信区间例对明年小麦的亩产量作出估计为 : 明年小麦亩产量八成为 800-1000 斤 . 若设 X 表示明年小麦亩产量 , 则估计结果为 P(800≤X≤1000)=80% 区间估计

4 . 第一节置信区间例 1某农作物的平均亩产量 X( 单位 ) 服从正态分布 N(μ,σ2), 今随机抽取 100 亩进行试验 , 观察其亩产量值 x1,x2,…,x100, 基此算出 , 因此 x 500( kg ) μ 的点估计值为 500. 由于抽样的随机性 , μ 的真值与的值总有误差 x , 我们希望以 95% 的可靠度估计与 x μ 的最大误差是多少 ? 2 因为 , x ~ N ( , 从而存在 ) c>0, 使得 , n P (| X   |c) 0.95 因此 ,这个 c 就是可允许的最大误差

5 . 第一节置信区间定义设 X1,X2,…,Xn 是来自总体 f(x,) 的样本 ,  未知 , 对于任给（ 0< <1), 若有统计量     ( X 1 , X 2 ,..., X n ),   ( X 1 , X 2 ,..., X n ), 使得 P {   } 1     则称随机区间 [ ,  ]为的双侧 1 的置信区间 ,1 为置信水平 , θ,和θ分别称为置信度为1  α的置信上限和置信下的置信上限和置信下限。

6 . 几点说明 1 、参数的置信水平为 1- 的置信区间（  1 ，  2 ）表示该区间有 100 （ 1- ） % 的可能性包含总体参数的真值。 2 、不同的置信水平，参数的置信区间不同。 3 、置信区间越小，估计越精确，但置信水平会降低；相反，置信水平越大，估计越可靠，但精确度会降低，置信区间会较长。一般：对于固定的样本容量，不能同时做到精确度高（置信区间小），可靠程度也高（ 1-  大）。如果不降低可靠性，而要缩小估计范围，则必须增大样本容量，增加抽样成本。

7 . 第一节置信区间在上述讨论中, 对于未知参数  , 我们给出两个统计量  ,  , 得到  的双侧置信区间(  ,  ). 但在一些实际问题中, 例如, 对于设备, 元件的寿命来说, 平均寿命长是我们所希望的, 我们关心的是平均寿命  的"下限", 与此相反, 在考虑化学药品中杂质含量的均值 E(X )时, 我们常关心参数 E(X )的"上限". 这就引出了单侧置信区间的概念.

8 . 第一节置信区间对于给定值  (0<  <1), 若由样本 ( X 1 , X 2 ,, X n ) 确定的统计量   ( X 1 , X 2 ,, X n ) , 对于任意   满足 P{   }1-  , 称随机区间(- ， )是  的置信水平为 1-  的单侧置信区间,  称为  的置信水平为 1-  的单侧置信上限. 对于给定值  (0<  <1), 若由样本 ( X 1 , X 2 ,, X n ) 确定的统计量   ( X 1 , X 2 ,, X n ) , 对于任意   满足 P{  >  }1-  , 称随机区间(  , )是  的置信水平为 1-  的单侧置信区间,  称为  的置信水平为 1-  的单侧置信下限.

9 . 对于给定的置信度 , 怎样根据样本来确定未知参数 θ 的置信区间 , 就是参数 θ 的区间估计问题 . 求未知参数 θ 的置信区间的一般方法：（枢轴变量法）以例 1 为例， μ 的点估计 X ( 也是极大似然估计 ) 有分布   2  def nX   X ~ N   ,  G X ,    ~ N  0,1  n   对于给定 α=0.05 ，可通过查正态分布表得：     P G X,    1.96  1    2   由随机事件的等价性 G  X ,    X   1.96 n      P    X  1.96 , X  1.96     n n   c值置信区间  X  c, X  c

10 .G  X ,  称为枢轴函数，它有以下两个特点： 1. 枢轴函数除含有关心的未知参数 μ 外，不再有其他未知参数； 2. 枢轴函数的分布式完全已知的或完全可以确定。

11 . 第一节置信区间对于给定的置信度 1   ,怎样根据样本来确定未知参数θ的置信区间的置信区间 (ˆ1 ,ˆ2 ) ,步骤如下：   (1)先求出未知参数θ的置信区间的一个点估计   ( X 1 , X 2 ,..., X n ) . (2)构造一个含有未知参数 θ的置信区间而不含有其他未知参数的枢轴函数 G G ( X 1 , X 2 ,, X n , ) ，且已知其分布. (3)对给定的置信度 1   ，根据 G ( X 1 , X 2 , , X n ; ) 的分布定出分位点 a 和 b，使得 P a  G ( X 1 , X 2 ,  , X n )  b 1  

12 . 第一节置信区间 (4)将不等式 a  G ( X 1 , X 2, , X n ; )  b 中解出 θ的置信区间，得出其等价形式   X 1 , X 2 ,, X n       X 1 , X 2 ,, X n  这时必有  P  ( X 1 , X 2 , , X n )     ( X 1 , X 2 ,, X n ) 1    于是 ( , ) ,即为θ的置信度为θ的置信度为的置信度为θ的置信度为1   的置信区间.

13 .例 1某农作物的平均亩产量 X( 单位 ) 服从正态分布 N(μ,σ2), 今随机抽取 100 亩进行试验 , 观察其亩产量值 x1,x2,…,x100, 基此算出 , 因此 x 500( kg ) μ 的点估计值为 500. 由于抽样的随机性 , μ 的真值与的值总有误差 x , 我们希望以 95% 的可靠度估计与 x μ 的最大误差是多少 ? 2 解因为 , x ~ N (  , 此处 ) , n=100, 因此 n def n(X  ) G( X ,  )  ~ N (0,1)  对于给定的 1   0.95   0.05  G ( X ,  ) 1.96  | X   |1.96 n   P (   [ X  1.96 , X  1.96 ]) 1   n n  因此 , 1.96 就是 c 值，置信区间 [ X  c, X  c ] n

14 . 第二节正态总体下的置信区间单个正态总体 N(μ,σ2) 的情形一、均值估计（均值 μ 的置信区间） X1,X2,…,Xn 为取自 N(μ,σ2) 的样本 , 求 μ 的 1-α 置信区间 1. σ2 已知时 n(X  ) X 是的一个点估计，U  ~ N (0,1)  因此U是枢轴函数, 当k u1- / 2时 P (| U |k ) 1   σ σ | U |k等价于 {μ  [X - k ,X  k ]} n n σ σ 的1 - 置信区间为θ的置信度为：[ X -k ,X  k ] n n

15 . 第二节正态总体下的置信区间单个正态总体 N(μ,σ2) 的情形 2. σ2 未知时  1   2 2 用S * 作的估计  t0 t0 n(X  ) 得到枢轴函数为θ的置信度为, T * ~ t (n  1) S 取k t1- / 2 (n  1), P (| T |k ) 1   S* S* 的1 - 置信区间为θ的置信度为：[X-k ,X  k ] n n

16 . 第二节正态总体下的置信区间单个正态总体 N(μ,σ2) 的情形例为估计一批钢索所能承受的平均张力（单位： kg/cm2 ），从中随机抽取 10 个样品作试验，由实验数据算出 x 6.720 ，假定张力服从正态分布，求平均张力的置信水平 S * 220, 为 95% 的置信区间 . 解平均张力的95%的置信区间为θ的置信度为：此处未知， S* S* [ X -t0.975 (n  1) ,X  t0.975 (n  1) ] n n 代入数据 x 6720, S * 220, n 10, 查表t0 .975 2.2622 平均张力的置信区间的观察值是 [6562.6185， 6877.6815]

17 . 第二节正态总体下的置信区间单个正态总体 N(μ,σ2) 的情形二、方差的估计（方差 σ2 的置信区间） X1,X2,…,Xn 为取自 N(μ,σ2) 的样本 , 求 σ2 的 1-α 置信区间 1. μ 已知时 2 2 1 n 2 n 2 σ   ( X i   ) 是 的点估计，且 2 2   2 ~  ( n) n i 1  因此 2 是枢轴函数, 容易找到a  b,使得 P (a   2 b) 1   一般取 a  χ α2 (n),b  χ 2 α (n) 1 2 2 2 2 n σ n σ 此时对应的  2的1 - 置信区间为θ的置信度为：[ , ] b a

18 . 第二节正态总体下的置信区间单个正态总体 N(μ,σ2) 的情形 1. μ 未知时  2  1  2  2 12  2 2 2 2 nS 用X 代替，可得枢轴变量为θ的置信度为,    由基本抽样定理，  2 ~  2 (n  1) 2 2 nS nS  2的1 - 置信区间为θ的置信度为：[ 2 , 2 ] χ α (n  1 ) χ α (n  1 ) 1 2 2

19 . 第二节正态总体下的置信区间两个正态总体 N(μ1,σ12), N(μ2,σ22) 的情形设 X1,X2,…,Xm 为取自 N(μ1,σ12) 的样本 , Y1,Y2,…,Yn 为取自 N(μ2,σ22) 的样本 , 且（ X1,X2,…,Xm ，）与（ Y1,Y2,…,Yn ）相互独立，求二总体均值差 μ1- μ2 的 1-α 置信区间

20 . 第二节正态总体下的置信区间两个正态总体 N(μ1,σ12), N(μ2,σ22) 的情形 μ1- μ2 的置信区间 1. σ12, σ22 已知时  12  22 X  Y 是1   2的点估计，且由 X  Y ~ N ( 1   2 ,  ) m n X  Y  ( 1   2 ) 可导出枢轴函数为θ的置信度为 U   2  2 , 1  2 1 m 1 m m n 此处， X   X i , Y   Yi m i 1 n i 1 1）取k u1- / 2，有 P (| U |k ) 1   显然，U ~ N（0， 1   2的1-α置信区间为θ的置信度为： σ 12 σ 22 σ 12 σ 22 [X  Y  μ α  ,X  Y  μ α  ] 1 2 m n 1 2 m n

21 . 第二节正态总体下的置信区间两个正态总体 N(μ1,σ12), N(μ2,σ22) 的情形 2. σ12=σ22=σ2 未知时 m n 1 记， S w2  [ ( X i  X ) 2   (Yi  Y ) 2 ], m  n  2 i 1 j 1 X  Y  (μ1  μ2 ) 令 T  2 2 , T ~ t ( m  n  2) σ σ Sw 1  2 m n 1   2的1-α置信区间为θ的置信度为： σ 12 σ 22 σ 12 σ 22 [ X  Y  kS w  ,X  Y  kS w  ] m n m n 其中 k t1- / 2(m  n  2 )

22 . 第二节正态总体下的置信区间两个正态总体 N(μ1,σ12), N(μ2,σ22) 的情形例甲、乙两台机床加工同一种零件，今在机床甲加工的零件中随机抽取 9 件，在乙加工的零件中随机抽取 6 件，分别测量零件的长度（单位： mm ），由测得的数据可算出 *2 *2 x 2.0648, y 2.0594, S 0.245, S 0.257. 1 2 假定零件长度服从正态分布，试求两台机床加工零件长度的均值差 μ1-μ2 的水平为 95% 的置信区间。解令 n1=9, n2=6 1 Sw  [8 0.245  5 0.357] 0.5367 13 1 1 k t0.975 (13) 2.1604  9 6 水平为 95% 的 μ1-μ2 的置信区间为 [-0.6056 ， 0.6164]

23 .例1 某工厂生产一批滚珠 , 其直径 X 服从正态分布 N(  2), 现从某天的产品中随机抽取 6 件 , 测得直径为 15.1 , 14.8 , 15.2 , 14.9 , 14.6 , 15.1 (1) 若 2=0.06, 求 的置信区间 (2) 若 未知 , 求  的置信区间 2 置信水平 (3) 求方差 2 的置信区间 . 均为 0.95 解 (1) X ~ N (  , 0.06 / 6) 即 N (  ,0.01) X   ~ N (0,1) u1  u0.975 1.96 0.1 2

24 . 的置信区间为 0.1 0.1 ( 14.95  1.96  , 14.95  1.96  ) 6 6 X  (2) 取T  S * ~ t (5) 查表 t0.975 (5) 2.5706 6 由给定数据算得 x 14.95 6 *2 1 s  ( xi  6 x ) 0.051. s 0.226 2 2 * 5 i 1

25 . 的置信区间为 * * s s (x t0.975 (5), x t0.975 (5) ) 6 6 (14.71, 15.187 ) 5S 2 (3) 选取枢轴量 K  2 ~  2 (5) s 2 0.051.  2 2 查表得  0.025 (5) 12.831,  0975 (5) 0.832  2 的置信区间为 2 2 5s 5s ( 2 , 2 ) ( 0.0199 , 0.3069 )  0.025 (5)  0.975 (5)

1点赞

0收藏

0下载