您好,欢迎访问三七文档
任务九抽样推断一、抽样估计的意义二、抽样估计的基本概念三、抽样误差四、总体参数估计方法五、抽样组织形式主要内容(一)概念抽样估计是按照随机原则从总体中抽取部分单位进行观察,并依据调查所得的指标推断总体指标的统计方法。(二)特点1、遵循随机原则抽取样本单位。2、用样本指标的数值推断总体指标的数值。3、抽样误差可以计算和控制。(三)抽样估计的作用1、有一些无法或很难进行全面调查的现象,可以用抽样估计进行。2、可以对全面调查的数据进行补充或修正。3、可以用于大批量生产过程中产品的质量检验和控制。一、抽样估计的意义和作用二、抽样估计中的基本概念(一)全及总体和抽样总体全及总体是指所研究现象的总体,简称总体。全及总体的单位数用N表示。抽样总体是从全及总体中按照随机原则抽取的那部分单位的集合体,简称样本。抽样总体的单位数称样本容量,用n表示。样本按照样本容量的多少分为大样本和小样本。若n≥30时,则称大样本,若n﹤30,则称小样本。(二)全及指标和抽样指标全及指标是根据全及总体各单位标志值或标志特征计算的综合指标,又称总体指标或总体参数。1、全及平均数(总体平均数)NXXFXFX(已分组资料)(未分组资料)变量总体2、总体标准差NXX2)(FFXX2)((未分组资料)(已分组资料)1、全及成数(总体成数)总体成数是全及总体中具有某种属性的单位数在总体单位数中所占的比重,用P表示。若N1代表具有某种属性的单位数,则总体成本表现为:NNP1抽样指标是根据样本总体各单位标志值或标志特征计算的,用来估计总体指标的综合指标,又称样本指标。1、抽样平均数(样本平均数)nxxfxfx(已分组资料)(未分组资料)2、抽样标准差(样本标准差)nxxs2)(ffxxs2)((未分组资料)(已分组资料)1、抽样成数(样本成数)抽样成数是抽样总体中具有某种属性的单位数在抽样总体单位数中所占的比重,用p表示。若n1代表具有某种属性的单位数,则总体成本表现为:nnp1(三)重复抽样和不重复抽样重复抽样也称重置抽样或有放回抽样,是指从总体N个单位中随机抽选第一个样本单位后,将它的标志记录下来后放回总体再次参加抽选,重复这个步骤,直到抽满n个样本单位为止。1、每次抽选时,总体单位数是不变的。2、各单位被抽中的可能性前后相同。3、各单位有重复抽中的可能。1、每次抽选时,总体单位数在逐渐减少。2、各单位被抽中的可能性前后不断变化。3、各单位没有被重复抽中的可能。不重复抽样也称不重置抽样或无放回抽样,是指从总体N个单位中随机抽选第一个样本单位后,将它的标志记录下来后不放回总体,再从N-1个单位中抽选第二个样本单位,将它的标志记录下来后也不放回总体,重复这个步骤,直到抽满n个样本单位为止。样本可能数目样本可能数目又称样本个数,是指从一个总体中可能抽取的样本个数。注意样本个数和样本容量的区别重复抽样条件下nNk不重复抽样条件下)1()2)(1(nNNNNk设有一总体有4个单位,分别为A、B、C、D,现从中抽取一个样本容量为2的样本。试确定在重复抽样和不重复抽样下的样本个数并列示出各样本。二抽样误差(一)抽样误差的概念抽样误差登记性误差代表性误差偏差(非随机误差)随机误差抽样实际误差抽样平均误差抽样误差是指在抽样中,用样本指标推断总体指标而产生的误差。影响抽样误差的因素1、全及总体的标志变异程度2、样本总体单位数3、抽样方法4、抽样调查的组织形式样本容量抽样方式总体差异程度抽样方法二、抽样平均误差抽样平均误差是一系列样本指标(样本平均数或样本成数)的标准差。用于衡量抽样指标对于全及指标代表性程度。样本平均数的标准差(抽样平均数的抽样误差)kXxkxxx22)()(以样本平均数的标准差为例1、概念2、计算(抽样平均误差用表示)(1)抽样平均数的抽样平均误差()重复抽样条件下nnx2不重复抽样条件下)1()1(22NnnNnNnx不重复抽样的抽样平均误差小于重复抽样的抽样平均误差;当N资料未知或N很大时,一般可用重复抽样的抽样平均误差公式代替不重复抽样的抽样平均误差公式。x(2)抽样成数的抽样平均误差()重复抽样条件下nPPp)1(不重复抽样条件下)1()1()1()1(NnnPPNnNnPPpp抽样成数P即为是是非标志的平均数,而是非标志的方差为P(1-P)。所以,将抽样平均数抽样误差公式中总体数量标志的方差换成是非标志的方差即可。上述公式中,总体的方差和成数都是未知的,所以,可以用以下四种方法解决。(1)用过去调查所得的资料代替。(2)用样本的方差代替总体的方差。(3)用小规模调查资料数据代替。(4)用估计的资料代替。三、抽样极限误差xXxpPp抽样极限误差是指抽样指标与总体指标之间抽样误差的可能范围,也称为允许误差,通常用△表示。设为抽样平均数的的抽样极限误差;为抽样成数的抽样极限误差。xpxxXxXppPpPxxxXxpppPp四、抽样极限误差与抽样平均误差的关系抽样极限误差是用一定倍数的抽样平均误差表示的抽样指标与全及指标之间的绝对离差。其倍数通常用t表示,t称为概率度。即ppt在一定的条件下,概率度越大,抽样误差范围越大,总体指标落在误差范围内的概率越大,从而抽样估计的可信程度也就越高;反之,概率度越小,抽样误差范围越小,总体指标落在误差范围内的概率越小,从而抽样估计的可信程度也就越低。xxt概率度t与概率保证程度F(t)之间的关系是函数关系,可通过查正态分布表获得。t=1,F(t)=68.27%t=2,F(t)=95.45%t=3,F(t)=99.73%F(t)=90%,t=1.64F(t)=95%,t=1.96F(t)=99%,t=2.58一般情况下,常用的概率度t与概率保证程度F(t)之间的关系如下:第三节总体参数估计方法总体参数估计就是用抽样指标估计相应的总体指标。比如,用抽样平均数估计总体平均数,用抽样成数估计总体成数。总体参数估计有点估计和区间估计两种。一、点估计点估计就是直接用抽样指标作为总体指标的估计值。比如,预计的粮食产量、产品的合格率、产品的使用寿命、汽车的标准油耗等。二、区间估计首先,应根据实际抽样资料计算抽样指标和;其次,应对估计量给出允许的可能误差围,提出估计的准确性要求;第三,应考虑估计的可信程度,提出估计的可靠性要求。区间估计是根据抽样指标推断总体指标可能范围的估计方法。进行区间估计,应具备一定条件:xpx)(tFpppPpxxxXxxxxxpppp置信下限置信上限置信下限置信上限xxxx,置信区间pppp,置信区间1、用抽样平均数估计总体平均数某村播种小麦5000亩,收割前随机抽取100亩进行实割实测,测得其平均亩产300千克,标准差为15千克,试以95.45%的概率保证程度估计全村小麦的平均亩产量和总产量。已知:千克千克,亩,亩,153001005000sxnN求:XNX,解:千克)(5.110015nx%45.94)(tF2t(千克)35.12xxt千克)(2973300xx千克)++(3033300xx置信下限置信上限所以,小麦亩产量置信区间在297-303千克之间。小麦总产量置信区间在297×5000-303×5000千克之间。结果表明,该村小麦亩产量在297-303千克之间,总产量在1485000-151000千克的概率保证程度为95.45%。2、用抽样成数估计总体成数某仓库保管员为了了解库存农机配件的锈蚀情况,出售前随机抽取了200件,发现其中有80件需要除锈,试以90%的置信度估计全部农机配件需除锈的比例。第四节抽样组织形式抽样的组织方式简单随机抽样类型抽样机械抽样整群抽样多阶段抽样。一、简单随机抽样1、概念:简单随机抽样是按随机原则直接从总体中抽选样本单位。2、抽选样本的方法直接抽选法抽签法随机数码表法3、适用情况:适用于均匀分布的总体4、抽样平均误差的计算重复抽样:nnx2nPPp)1(不重复抽样:)1(2Nnnx)1()1(NnnPPp5、必要样本容量的确定(1)概念:必要的样本容量是在保证抽样推断能达到预期的可靠程度和精确程度下的一个恰当的或最小的样本单位的数目。(2)影响因素可靠程度和精确程度△总体标志的变异程度()抽样的组织方式和方法)(tF(3)必要样本容量的计算重复抽样222xtn22)1(pPPtn不重复抽样22222tNNtnx)1()1(222PPtNPPNtnpnx22xnxxttxx222xtn∴∵公式推倒如下:以重复抽样为例二、类型抽样1、概念2、抽样方法等比例类型抽样NnNnNnNnNnKk332211nNNnii类型抽样又称分类抽样或分层抽样,是指把总体单位按一定标志加以分组,再从各组中随机抽选样本单位,构成样本。3、抽样平均误差的计算影响类型抽样抽样平均误差的方差是组内方差。重复抽样:为样本各组组内方差为总体各组组内方差或其中:22222iiiiiiisnnsNN)(nnppppnppiiip)1()1()1(2nix不重复抽样:)1(2Nnnix)1()1(Nnnppp4、类型抽样的必要抽样单位数的公式重复抽样:222xtn22)1(ppptn不重复抽样:22222tNNtnx)1()1(222pptNppNtnp三、机械抽样1、概念机械抽样又称为等距抽样或系统抽样,它是对研究的总体按一定的顺序排列,每隔一定的间隔抽取一个或若干个单位,并把这些抽取的单位组成样本进行观察的一种抽样方法。设总体有N个单位,间隔为,若在第一个间隔中抽取了随机数为i,则第n个单位数为i+(n-1)k.机械抽样按排队标志不同,分为无关标志排队和有关标志排队。按样本单位抽选的方法不同,分为随机起点等距抽样、半距起点等距抽样。nNk2、抽样误差的计算无关标志排队的等距抽样近似于简单随机抽样,因此,可以按简单随机抽样的方法计算抽样误差。有关标志排队的等距抽样相当于等比例类型抽样,因此可用等比例类型抽样的公式计算抽样误差。并用不重复抽样的公式。)1(2Nnnix)1()1(Nnnppp四、整群抽样1、概念整群抽样是将总体划分为由总体单位所组成的若干个群,然后,以群为单位,从总体中抽取若干个群作为样本,而对中选群内的所有单位进行全面调查的调查方式。2、影响整群抽样抽样误差的因素(1)抽出群数的多少(2)群间方差(3)抽样方法3、抽样误差的计算整群抽样均采用不重复抽样。(1)抽样平均数的抽样误差)1()1(22RrrRrRrxxxrxxix22)(群的各群平均数-群平均数的平均数)-样本平均数(-抽中群数-群间方差rxrxrix2(2)抽样成数的抽样平均误差)1()1(22RrrRrRrppprppiP22)(-样本成数-各群成数ppi4、样本容量的确定22222xxxtRRtn22222PpPtRRtn如果缺少p的资料,可以用p=0.5代替。
本文标题:任务九抽样调查
链接地址:https://www.777doc.com/doc-417737 .html