您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第4章抽样调查(6)
1、第4章抽样估计第一节抽样的基本概念第二节抽样分布与中心极限定理第三节总体参数估计第四节抽样方案的设计与实施*统计推断的过程样本总体样本统计量,如样本均值、样本比例、样本标准差等检验一批灯泡的使用寿命节目的收视率水库中的鱼苗数•抽样估计包括抽样调查和抽样推断两个部分。•抽样调查是一种非全面的调查方法,是从总体中按照随机原则抽取样本单位进行调查•抽样推断是利用样本信息推断总体的数量特征。•抽样估计不论在统计调查还是在统计分析中都有广泛的应用。抽样调查的概念•广义:凡是抽取一部分单位进行观察,并根据观察结果来推断全体的都是抽样调查,其中又可分为非随机抽样和随机抽样两种。•狭义:根据大数定律的要求,在抽取调查单位时应保证总体中的各个单位都有同等的中选可能性。•一般所讲的抽样调查,大多数是指这种随机调查,即狭义的抽样调查。指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会按照随机抽样原则抽取总体中的部分单位进行调查,用部分单位的指标数值作为代表,对总体的指标数值作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法。什么是抽样推断?例1:一汽车轮胎制造商。
2、生产一种被认为寿命更长的新型轮胎。120个样本测试平均里程:36,500公里推断新轮胎平均寿命400个样本支持人数:160推断支持该候选人的选民占全部选民的比例例2:某党派想支持某一候选人参选美国某州议员,为了决定是否支持该候选人,该党派领导需要估计支持该候选人的民众占全部登记投票人总数的比例。由于时间及财力的限制:抽样调查的基本特点:非全面调查目的是推断总体的数量特征,抽样推断结果具有一定的可靠程度抽样调查中的抽样误差是不可避免的,但在事先是可以计算并加以控制的节省调查费调查速度快调查结果准确可靠应用范围广不可能进行全面调查时对于具有破坏性的产品质量检测只能进行抽样调查对某些现象进行全面调查,在经济上不合算,在资料上未必能保证,也只能采用抽样调查。对于时效性要求较高的某些调查对全面调查资料进行补充修正时抽样调查的作用,书P112-113设计抽样方案抽取样本单位收集样本数据计算样本统计量推断总体参数抽样估计的一般步骤第六章抽样与参数估计第一节抽样调查的含义第二节抽样调查的基本概念第三节抽样调查的数理基础第四节抽样推断的方法第二节抽样调查的基本概念•一、全及总体和样本总体。
3、•二、全及指标和样本指标•三、抽样方法和样本可能数目★全及总体研究对象的全体,即第一章中学过的总体。样本总体按随机原则从全及总体中抽取一部分单位组成的集合体,又叫样本总体。样本总体中所包括的单位数叫样本容量,一般用n表示1、大样本(n≥30)2、小样本(n30)全及总体中所包括的单位数一般用N表示。1、有限总体2、无限总体设总体中个总体单位某项标志的标志值分别为,其中具有某种属性的有个单位,不具有某种属性的有个单位,则NNXXX,,210N1N指被估计的总体指标,又被称为总体参数。(确定的、未知的)全及指标⒉总体标准差:⒊总体方差:⒈总体平均数(又叫总体均值):⒋总体比例:⒌是非标志总体的标准差:PPP1⒍是非标志总体的方差:PPP12有最大值时,当PP5.0设样本中个样本单位某项标志的标志值分别为,其中具有和不具有某种属性的样本单位数目分别为和个,则nnxxx,,210n1n指根据样本单位的标志值计算的用以估计和推断相应总体指标的综合指标,又被称为估计量或统计量。样本指标⒉样本单位标志值的标准差:⒊样本单位标志值的方差:211xxns。
4、2211xxns⒈样本平均数(又叫样本均值):nxxnii1当样本容量很大时,1/n,与1/(n-1)相差不大,样本方差的公式,可以直接除以n,此时与总体的方差计算公式一致。22111xxnsxxnsnx很大pnnqnnp1,01⒋样本成数:⒌样本单位是非标志的标准差:()ppsp-1=⒍样本单位是非标志的方差:()ppsp-1=2体重1.8.8.832.52.53.31.8.84.132.52.56.654.14.110.71.8.811.621.71.713.21.8.814.032.52.516.51613.213.229.832.52.532.232.52.534.754.14.138.854.14.143.0108.38.351.21.8.852.121.71.753.721.71.755.41.8.856.21915.715.771.91310.710.782.6129.99.992.621.71.794.243.33.397.51.8.898.321.71.7100.0121100.0100.025404143454647。
5、48495051525354555657585960616263656667TotalValidFrequencyPercentValidPercentCumulativePercent从全部学生中随机抽取20人组成样本并计算平均体重:样本一:52.35样本二:50.26样本三:53.19…真值:51.18抽样方法重复抽样又被称作重置抽样、有放回抽样继续抽取抽出个体登记特征放回总体特点同一总体单位有可能被重复抽中,而且每次抽取都是独立进行不重复抽样又被称作不重置抽样、不放回抽样抽出个体登记特征继续抽取特点同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不是独立进行是最为常用的抽样方法,用于无限总体和许多有限总体样本单位的抽样。抽样方法第4章抽样估计第一节抽样的基本概念第二节抽样分布与中心极限定理第三节总体参数估计第四节抽样方案的设计与实施*一、抽样分布举例:【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为X1=1、X2=2、X3=3、X4=4。总体的均值、方差及分布如下:总体分布14230.1.2.35.244321μX总体平均数:。
6、25.14)5.24()5.23()5.22()5.21()(222222NXXσx总体标准差:现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表:3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值样本均值的抽样分布1.00.1.2.3P(x)1.53.04.03.52.02.5x样本均值的分布与总体分布的比较(图示)抽样分布总体分布14230.1.2.3P(x)1.00.1.2.31.53.04.03.52.02.5x1.255.2σμ总体标准差:总体平均数:nxEx21.255.2)(样本平均数的标准差:样本平均数的平均数:不重复抽样分布,自学二、大数定律大数定律表明:如果随机。
7、变量总体存在着有限的平均数和方差,则对于充分大的抽样单位数n,可以几乎趋近于1的概率,来期望抽样平均数与总体平均数的绝对离差为任意小。大数定律对于抽样推断的意义:从理论上解释了样本与总体之间的内在联系,即随着抽样单位数n的增加,抽样平均数有接近于总体平均数的趋势。三、中心极限定理及其重要意义•大数定律论证了抽样平均数趋近于总体平均数的趋势,这为抽样推断提供了重要依据。但是:抽样平均数和总体平均数的离差究竟有多大?离差不超过一定范围的概率究竟有多少?离差的分布状况怎样?•大数定律和正态分布没有给出任何这方面的信息。中心极限定理研究的是变量和的分布和变量平均数的分布。它论证了以下几点:第一,如果总体很大,而且服从正态分布,则样本平均数的分布也服从正态分布;第二,如果总体很大,但不服从正态分布,只要样本足够大(n≥30),样本平均数的分布也趋近于正态分布。第三,样本平均数分布的平均数,等于总体的平均数。中心极限定理的重要意义中心极限定理的重要意义•第四,样本分布的标准差为:•这是在有限总体场合下使用的公式,其中:,称为修正因子。•当N趋向于无穷大时,其值趋近于1,在允许重复抽样的条件下。
8、,总体在任何时候都成为无限总体,这时:1NnN中心极限定理(图示)中心极限定理:设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从正态分布。当样本容量足够大时(n30),样本均值的抽样分布逐渐趋于正态分布一个任意分布的总体X1.重复抽样条件下,记算公式为:2.不重复抽样条件下,计算公式为:3.小于总体标准差抽样平均误差4.与样本容量的关系X某个样本容量的抽样分布更大样本容量的抽样分布nx抽样分布P119例4-5某班组有5个工人,他们的单位工时工资分别是4、6、8、10、12元,总体服从于正态分布。现用重复抽样方式从5个工人中抽出2人,计算样本的平均工时工资的抽样平均误差。解:总体分布的平均数与方差分别是:46810128(5xN元)2222222(48)(68)(88)(108)(128)58xN元抽样平均误差为:822Xn元样本成数分布总体成数P是指具有某种特征的单位在总体中的比重。在前面我们已经知道,成数是一个特殊平均数,设总体单位总数目是N,总体中。
9、有该特征的单位数是。设X是0、1变量,即:总体单位有该特征,则X取1,否则取0,则有:(4.8)现从总体中抽出n个单位,如果其中有相应特征的单位数是,则样本成数是:1nPn(4.9)P也是一个随机变量,利用样本平均数分布性质的结论,有:()EPp(4.10)(1)(1)()ppppPnn(4.11)1NXNNp11nP120例4-6已知一批产品的合格率为90%,现采用重复抽样方式从中取出400件,求样本合格率的抽样平均误差。解:()90%EPp(1)0.90.1()1.5%400ppPn由于样本容量大,样本成数的平均误差就大大减小。练习1、对某乡进行简单重复抽样调查,抽出100个农户,户均年收入2000元,年收入标准差100元。(1)求抽样平均误差。(2)若抽取的是200户,则抽样平均误差是多少?(3)若要使抽样平均误差降低为原来(1)的一半,则应抽多少户。2、对某县人口用不重复抽样方法按1/10比例抽出1万人进行调查,得知样本平均年龄40岁,年龄标准差20岁,求抽样平均误差。练习:计算样本比例的抽样平均误差1、某县人口10万人,用简单随机不重复抽样方。
10、法抽取1/10的人口进行调查,得知男性人口比重为51%,求男性人口比重的抽样平均误差。2、对某乡进行简单随机重复抽样调查,抽出100个农户进行调查,得知年收入在1800元以上的占95%,求农户年收入在1800元以上比重的抽样平均误差。简单回顾:抽样平均误差•抽样平均误差的计算公式:第4章抽样估计第一节抽样的基本概念第二节抽样分布与中心极限定理第三节总体参数估计第四节抽样方案的设计与实施*一、总体参数估计概述总体参数估计就是以样本统计量来估计总体参数。比如:用样本均值X去估计总体均值用样本方差2S去估计总体方差2用样本比例P去估计总体比例p如果我们将总体参数笼统地用一个符号表示,参数估计也就是如何用样本统计量去估计总体参数。用来估计总体参数的统计量的名称,称为估计量,用表示。样本均值、样本比例、样本方差都可以是一个估计量。用来估计总体参数时计算出来的估计量的具体数值,称为估计值。ˆ点估计就是根据样本资料得出的样本指标数值,直接用以代表相应的总体指标,即:。根据给定的估计可靠程度的要求,利用实际样本资料,指出包含总体被估计值的区间范围。点估计区间估计二、参数估计的基本方法点估计。
本文标题:第4章抽样调查(6)
链接地址:https://www.777doc.com/doc-419442 .html