概率论与数理统计第八章---统计与统计学

本章主要讲述了统计与统计学。其中包括统计的研究对象;总体和样本:总体和个体,总体、样本、样本观察值的关系;统计学的主要内容有:抽样调查,试验设计,点估计,区间估计以及假设检验;统计方法的特点;统计思想:对随机性的把握,对差异的把握。
展开查看详情

1.第八章 统计与统计学 统计的研究对象 总体和样本 什么是统计学 统计方法的特点 统计思想

2. 第八章 统计与统计学 引 言 前面七章讲述了概率论的基本内容,随后的五章讲述 的是数理统计。数理统计是一门广泛应用的数学分支,它 以概率论为理论基础,根据试验或观察得到的数据来研究 随机现象,对研究对象的客观规律性作出种种合理的估计 和判断。 在概率论中,我们所研究的随机变量,它的分布都是 假设已知的,在这一前提下去研究它的性质、特点和规律 ,例如求它的数字特征,讨论它的函数的分布,介绍常用 的各种分布等等。

3. 第八章 统计与统计学 在数理统计中,我们研究的随机量,它的分布是 未知的,或者是不完全知道的,人们是通过对所研究的 随机变量进行重复独立的观察,得到许多观察值,对这 些数据进行分析,从而对所研究的随机变量的分布作出 种种推断。 概率论是统计学的数学基础,统计学从某种角度上也 可看成概率论的重要应用, 本章将陈述统计学的基本概 念,统计方法的特点和主要内容。

4. 第一节 统计的研究对象 例 1 某厂生产大批某种型号的元件,从某天生产的 元件中随机抽取若干个进行寿命试验,检验该厂生产 的元件是否合格。 例 2 在美国总统选举年,从所有合法选民中随机抽 出一部分进行民意测验,评估两党候选人获胜的机会 。 1. 涉及经济、社会现象 特点: 2. 有相应的数量特征,称之为统计指标 1. 必须是大量的现象 统计研究的对象:2. 现象所表现的数量特征 ( 统计指标 ) 3. 统计指标有客观性 统计的应用范畴涵盖了 社会、经济、自然科学等领域

5. 第二节 总体和样本 一、总体和个体 定义 在一个统计问题中,研究对象的全体称为总体 . 定义 总体中的每一个研究对象称为个体 . 例如,我们要研究某学校的学生身高情况,则该学校的全体学生构成 此问题的总体,而每一个学生就是一个个体。 在该问题中,每个学生(个体)有许多特征:姓名、年龄、身高、体 重、籍贯、民族等等,而在该问题中,我们只关心该校学生的身高, 对其他特征不考虑。这样,每个学生(个体)所具有的指标值——身高 就是个体,而将身高全体看成总体,这样一来,若抛开实际背景,总 体就是一堆数,这堆数中有大有小,有的出现的机会多,有的出现的 机会少,因此用一个概率分布去描述和归纳总体是恰当的,从这个意 义上说,总体就是一个分布,而其数量指标就是服从这个分布的随机 变量。以后说“从总体中抽样”与“从某分布中抽样”是同一个意思。 换句话说,总体就是试验的全部可能观察值,而每一个可能的观 察值就是个体。

6. 第二节 总体和样本 一、总体和个体 再如 总 体 … 研究某批灯泡的质量 总体中所包含个体的个数称为总体的容量 容量为有限的称为有限总体 容量为无限的称为无限总体

7. 第二节 总体和样本 二、样本 为推断总体分布及各种特征,按一定规则从总体中抽 取若干个体进行观察试验,以获得有关总体的信息,这一 抽取过程称为“抽样”,抽取规则称之为抽样方案,所抽取 的部分个体称为样本 . 样本中所包含的个体数目称为样本 容量 . 样本是随机变量 容量为 n 的样本可以看作 n 维随机变量 . , 但是,一旦取定一组样本,得到的是 n 个具体的数 (x1,x2,…,xn) ,称为样本的一次观察值,简称样本值 .

8. 第二节 总体和样本 二、样本 从总体中抽取样本时 , 不仅要求每一个个体被抽 到的机会均等 , 同时还要求每次的抽取是独立的 , 即 每次抽样的结果不影响其他各次的抽样结果 , 同时也 不受其他各次抽样结果的影响 . 这种抽样方法称为简 单随机抽样 . 由简单随机抽样得到的样本叫做简单随 机样本 . 往后如不作特别说明 , 提到“样本”总是指简 单随机样本 . 简单随机样本要求抽取的样本满足下面两点: 1. 代表性: X1,X2,…,Xn 中每一个与所考察的总体有 相同的分布 . 2. 独立性: X1,X2,…,Xn 是相互独立的随机变量 .

9. 第二节 总体和样本 二、样本 设总体 X 的分布函数为 F(x), 若 (X1,X2,…,Xn) 为 X 的一个 样本 , 则 (X1,X2,…,Xn) 的联合分布函数为 n F ( x1 , x2 ,..., xn )  F ( xi ) i 1 若总体 X 是离散型随机变量 , 其概率分布律为 P(X=xi) (i=1,2,..), 则样本 (X1,X2,…,Xn ) 的联合概率分布律为 n p ( X 1  x1 , X 2  x2 ,..., X n  xn )  p( xi ) i 1 若总体 X 是连续型随机变量 , 其概率密度函数为 f(x), 则 样本 (X1,X2,…,Xn ) 的联合概率概率密度为 n f ( x1 , x2 ,..., xn )  f ( xi ) i 1

10. 第二节 总体和样本 二、样本 例 设总体 X~E(λ), X1,X2,…,Xn 是来自 X 的一个样本 . 求样本 X1,X2,…,Xn 的联合概率密度函数   e  x , x0 解 因为 X~E(λ), 所以 f ( x )   0, x 0  n  n e   xi n 从而 f ( x1 , x2 ,..., xn )  f ( xi )   i 1 , xi  0, i 1,2,..., n i 1  0, x 0

11. 第二节 总体和样本 二、样本 例 设总体 X~P(λ), X1,X2,…,Xn 是来自 X 的一个样本 . 求样本 X1,X2,…,Xn 的联合概率分布律 x  解 因为 X~P(λ), 所以 P( X  x)  e   , x 0,1,2,... x! 从而 n xi   n  xi P( X 1  x1 , X 2  x2 ,..., X n  xn )  e  e  n  i 1 xi ! i 1 xi !

12. 第二节 总体和样本 二、样本 例 ( 抽样检查 ) 设批量为 N 的产品 , 其中次品数为 Nθ, 0<θ<1 未知 , 今分别按有放回和无放回 , 两种方法从 中 随机抽取 n(≤N) 件 . 定义  1, 第i次取得次品 X i  i 1,...,n  0, 第i次取得正品 则 X1,X2,…,Xn 即是样本 (1) 有放回抽样 n  xi  n xi n P( X 1  x1 , X 2  x2 ,..., X n  xn )   i 1 (1   ) i1 ( xi 0 or 1, i 1,.., n) (2) 无放回抽样 C Nt  C Nn (1t  ) n P( X 1  x1 , X 2  x2 ,..., X n  xn )  n t  xi C N i 1 ( xi 0 or 1, i 1,.., n)

13. 第二节 总体和样本 总体、样本、样本观察值的关系 总体 理论分布 样本 样本观察值 统计是从手中已有的资料——样本观察值,去推断 总体的情况——总体分布。样本是联系两者的桥梁。总体 分布决定了样本取值的概率规律,也就是样本取到样本 观察值的规律,因而可以用样本观察值去推断总体 .

14. 第三节 什么是统计学 数理统计的任务是从抽样数据出发 , 估计各种概率数字特 征和对研究对象的某个命题作出判断 , 其应用十分广泛 . 描述性统计 : 对数据的收集和整理; 统计 推断统计 : 遵循一定的统计规律对数据资料进行 分析推断 , 并作出结论。 统计学就是使用有效的方法收集数据、分析数据,并基 于数据作出结论的一门方法论科学 .

15. 第三节 什么是统计学 抽样调查 统 计 试验设计 学 的 点估计 主 要 区间估计 内 容 假设检验

16. 第四节 统计方法的特点  一切由数据说话  统计分析的结果往往会出错 , 且这种错误并非是由方 法的误用所引起的,错出的机会不会超过一个较小的界限  统计方法研究和揭示现象之间在数量表现参面上的相 互关系 , 但不肯定有因果关系  使用归纳推理

17. 第五节 统计思想 “ 十九世纪以来统计学面临种种问题 , 要回答这种类型 的问题的主要障碍 , 是随机性 - 缺乏原因与结果之间的 一一对应关系。基于随机性的基础,人们如何行动呢? 这是个长时间困扰人类的问题,直到本世纪初,我们 才学会了掌握随机性,发展成能做出聪明决策的科学 - 统计学” ---C.R.Rao 《 Statistics and Truth 》 对随机性的把握 对差异的把握