您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 抽样调查-第3章分层随机抽样
返回§3.1引言一、定义先将总体N个单元划分成L个互不重复的子总体,每个子总体称为层,它们的大小分别为LNNN,,,21)(1LhhNN然后,在每个层中独立地进行抽样,称为分层抽样.返回二、作用分层抽样在实际工作中应用的非常广泛,主要是因为它具有其它抽样方法所没有的特点:1.分层抽样的抽样效率较高,也就是说,分层抽样的估计精度较高。2.分层抽样不仅能对总体指标进行推算,而且能对各层指标进行推算。3.层内抽样方法可以不同,而且便于抽样工作的组织。返回三、使用场合在对分层进行具体划分时,通常考虑如下原则:1.层内单元具有相同性质,通常按调查对象的不同类型进行划分。2.尽可能使层内单元的标志值相近,层间单元的差异尽可能大。3.既按类型又按层内单元标志值相近的原则进行多重分层,同时达到实现估计类值以及提高估计精度的目的。4.抽样组织实施的方便,通常按行政管理机构设置进行分层。返回四、符号说明我们用下标h表示层号(h=1,2,……,L)。关于第h层的记号如下:单元总数:hN样本单元数:hn第i个单元标志值(观察值):hiy返回单元权数:NNWhhhY总体均值:hNihihYN11第L层总体方差:hNihhihhYYNS122)(11返回抽样比:hhhNnf样本均值:hyhnihihyn11第L层样本方差:hnihhihhyyns122)(11返回§3.2简单估计量及其性质一、总体均值的估计1.估计量的定义总体均值Y的估计:hYLh1stYhW=LhhhYNN11如果得到的是分层随机样本,则总体均值Y的简单估计为:LhhhLhhhstyNNyWy111返回2.估计量的性质性质一对于一般的分层抽样,如果hY是hY的无偏估计(h=1,2,……,L),则stY是Y的无偏估计。stY的方差为:V(stY)=)(12LhhhYVW值得注意的是:只要对各层估计是无偏的,则对总体的估计也是无偏的。因此,各层可以采用不同的抽样方法,只要相应的估计量是无偏的,则对整体的推算也是无偏的。返回性质一的证明:由于对每一层有hhYYE)(YNYYNYNNYWYEWYWEYELhhhLhhhLhhhLhhhLhhst1111111)()()(因此返回性质二对于分层简单随机抽样,Ysty是的无偏估计,sty的方差为:LhhhhhLhhhstSnfWyVWyV122121)()(返回性质二的证明:若各层独立进行简单随机抽样,对每一层有LhhhststhhyVWyVYyEYyE12)()(,)(,)(21)(hhhhSnfyV由第二章性质二得212121)()(hhhLhhhLhhstSnfWyVWyV因此返回LhhhhhLhhhstsnfWyvWyv122121)()(性质三对于分层随机抽样,的无偏估计为:)(styV返回性质三的证明:对于分层随机抽样,各层独立进行简单随机抽样,由第二章性质三,得21)(hhhhsnfyv212121)()(hhhLhhhLnhstsnfWyvWyv因此,)(styV的一个无偏估计为:返回二、总体总量的估计1.估计量的定义总体总量Y的估计为:LhhstYYNY1如果得到的是分层随机样本,则总体总量Y的简单估计为:styNY2.估计量的性质Y由于Ysty与只差一个常数,因此,sty与具有相同的性质。返回性质一对于一般的分层随机抽样,如果Y是sty)()()(12LhhstYVYVNYV的无偏估计,则Y是的无偏估计,Y的方差为:)()(12122LhhhLhhhYVNYVWN性质二对于分层随机抽样,Y的方差为:)(YV)(12LhhhYVNLhhhhhSnfN1221=返回)(Yv)(12LhhhYvNLhhhhhsnfN1221=性质三对于分层随机抽样,)(YV的无偏估计为:【例3.1】调查某地区的居民奶制品年消费支出,以居民户为调查单元,根据经济及收入水平将居民户划分为4层,每层按简单随机抽样抽出10户,调查获得如下数据(单位:元)估计该地区居民奶制品年消费总支出及估计的标准差。(数据见下表)返回•样本户奶制品年消费支出层居民户总数样本户奶制品年消费支出(元)1234567891012001040011015104080900240050130608010055160851601703750180260110014060200180300220415005035150203025103025返回05.020010,07018.0285020011111NnfNNW025.040010,14035.0285040022222NnfNNW由上表,N=2850,各层的层权及抽样比为:0133.075010,26316.0285075033333NnfNNW0067.0150010,52632.02850150044444NnfNNW),4,3,2,1(,10hnh返回各层样本均值及样本方差为:5.39111111niiyny722.1624)(1121111211yynsnii同理有333.193,24556.8205,165667.2166,105244233222sysysy返回因此,估计奶制品年消费总支出为:2096502415001657501054005.3920041hhhyNY8241241221039.51)()(hhhhhhhhsnfNyvWNYv估计量方差及标准差的样本估计23208)()(YvYs返回三、总体比例的估计1.估计量的定义总体比例P的估计为:LhhhstpWp12.估计量的性质如果定义,0,1iY第i个单元具有所考虑的特征;其他。(i=1,2,…,N)则对总体比例的估计类似对总体均值的估计,这时,stpsty与具有同样的性质。返回的无偏估计(h=1,2,…,L),则性质一对于一般的分层随机抽样,如果hhPp是stp是P的无偏估计。stp的方差为:LhhhstpVWpV12)()(性质二对于分层随机抽样,stp是P的无偏估计。证明:注意到hhhhhhhnQPNnNpV1)(及hhNN1因而stp的方差为:返回LhhhhhhhhLhhhstnQPNnNNNpVWpV121221)(1)()(LhhhhhhhhnQPNnNNN122)(1LhhhhhhnQPfW12)1(性质三对于分层随机抽样,stp的无偏估计为V()LhhhhhhhhLhhhstnqpNnNNNpvWpv1212211)(1)()(LhhhhhhnqpfW121)1(返回【例3.2】在例3.1的调查中,同时调查了居民拥有家庭电脑的情况,获得如下数据(单位:台),如表3.2。估计该地区居民拥有家庭电脑的比例及估计的标准差。(数据见下表)返回•样本户拥有家庭电脑情况层居民户总数样本户拥有家庭电脑情况12345678910120000010001002400010000001037501100001010415001000000000表3.2返回1.0,4.0,2.0,2.04321pppp2.0)1.015004.07502.04002.0200(2850114141hhhhhhstpNNpWp005.0)0099.015004.07500173.04000169.0200(28501)(1)(222224122hhhhpvNNpv解:由上表可得该地区居民拥有家庭电脑比例的估计为:估计量的方差为:返回§3.3比率估计量及其性质将比率估计的思想和技术用于分层随机样本时,对总体参数的估计有两种途径:一种是对每层样本分别考虑比估计量,然后对各层的比估计量进行加权平均,此时所得的估计量称为分别估计(separateratioestimator);另一种是对比率的分子、分母分别加权计算出分层估计量,然后用对应的估计量来构造比估计,这样所得的估计量称为联合比估计(combinedratioestimator).返回1.分别比率估计总体均值Y总体总量Y的分层比率估计为:hLhhhhLhRhhRsXxyWyWy11总体均值:总体总量:LhRhhLhhhRsRsYXxyyNY11:hW层权L:层数hy的简单估计为hY:hx的简单估计为hX:Rhy为hY的比率估计,RhY为hY比率估计返回比率估计量的方差:)2()1()(22212xhyhhhxhhyhLhhhRsSSRSRSnfWyV)2()1()(22212xhyhhhxhhyhLhhhRsSSRSRSnfNYV式中,hxhyhhhhSSNnf;;;22分别为第i层指标Y,X的方差及相关系数.分别比率估计量要求每一层的样本量都比较大,否则,偏倚可能比较大.返回2.联合比率估计(combinedratioestimator)总体均值:XRXxyycststRc总体总量:XRXxyYcststRc式中:sty表示Y的无偏估计;stx表示X的无偏估计.均方误差为:)2()1()()(22222yxhxhyhhhRcRcRSSRSnNfNyVyMSE)2()1()()(2222yxhxhyhhhRcRcRSSRSnfNYVYMSE返回3.分别比率估计量与联合比率估计量的比较一般而言,分别比率估计量的方差小于联合比率估计量的方差。但当每层的样本量不太大时,还是采用联合比率估计量更可靠些,因为这时分别比率估计量的偏倚很大,从而使总的均方误差增大。实际使用时,如果各层的样本量都较大,且有理由认为各层的比率Rh差异较大,则分别比率估计优于联合比率估计。当各层的样本量不大,或各层比率Rh差异很小,则联合比率估计更好些。返回【例4.4】某市1996年对950家港口生产单位完成的吞吐量进行了调查,1997年欲对全市港口生产单位完成的吞吐量进行调查。对港口生产单位按非国有(h=1)和国有(h=2)分为两层,单位数分别为800家和150家,分别在两层中调查了10家和15家港口生产单位,调查数据如下表,试计算1997年全市港口生产单位完成的吞吐量。1997年国有和非国有企业调查数据如下页返回ixiyiixiyi19580149553022202102210320335938433604964120117423040051771805600651625325861000880730234977005608332286811001230927221597208231013797103103901147846512817650139191160141160107015735698返回(将上述数据计算的中间结果列于P77的表中)1.按分别比率估计量估计68.91938925)2()1()(5.2725362221221yxhhxhhyhLhhhhRShhhRSsRsRsnfNYvXRY返回2.按联合比率估计量估计84.86293698)2()1()(1.271956274300279700277310222212yxhxhyhLhhhhRCststRCsRsRsnfNYvXXYY按联合比率估计量估计比按分别比率估计量估计要好一些!返回三、分别比率估计与联合比率估计的比较])(2)[()1()()(22212xhyhhhxhhLhhhhRSRCSSRRSRRnfWyVyV
本文标题:抽样调查-第3章分层随机抽样
链接地址:https://www.777doc.com/doc-418864 .html