您好,欢迎访问三七文档
2019/8/201第三章分层随机抽样3.1概述3.2简单估计量及其性质3.3比率估计量及其性质3.4回归估计量及其性质3.5各层样本量的分配3.6总样本量的确定3.7分层抽样的其他方面2019/8/202第一节概述定义3.1层:如果一个包含𝑁个单位的总体可以分成“不重不漏”的𝐿个子总体,亦即每个单元必属于且仅属于一个子总体,则称这样的子总体为层(stratum)设𝐿个子总体所包含的单位数分别为𝑁1,𝑁2,…,𝑁𝐿,则有:𝑁1+𝑁2+⋯+𝑁𝐿=𝑁2019/8/203定义3.2分层抽样(stratifiedsampling):又称为类型抽样或分类抽样,即抽样在每一层中独立进行,总的样本由各层样本组成,总体参数则根据各层样本参数的汇总做出估计,这种抽样就称为分层抽样,所得样本称为分层样本。设总的样本量为𝑛,从𝐿个子总体中所抽取的样本量分别为𝑛1,𝑛2,…,𝑛𝐿,则有:𝑛1+𝑛2+⋯+𝑛𝐿=𝑛定义3.3分层随机抽样(stratifiedrandomsampling):如果每层中的抽样都是独立地按照简单随机抽样进行的,那么这样的分层抽样称为分层随机抽样,所得的样本称为分层随机样本(stratifiedrandomsample)。2019/8/2042019/8/205二、作用由于每层都进行抽样,这就可使样本在总体中分布更加均匀,从而具有更好的代表性。由于抽样在每一层中独立进行,所以一者允许各层选择不同的适合本层的抽样方法,二则可同时对各子总体(层)进行参数估计,而不单是对整个总体的参数进行估计。由于各层的总体方差因单元之间差异小而肯定小于整个总体的方差,而抽样精度与此成正比,所以分层抽样可以提高参数估计的精度。三、符号2019/8/206所有总体参数的估计量都采用下标“st”以示区别:记号hihNhnhiYhiy代表的含义下标第h层下标层内单位号第h层的单位总数第h层的样本数第h层第i个总体单元的取值第h层第i个样本单元取值记号hWhfhYhy公式hNNhhnN11hNhiihYN11hnhiihyn代表的含义第h层的层权第h层的抽样比第h层的总体均值第h层的样本均值2019/8/207记号hYhy2hS2hs公式1hNhihhiYNY1hnhihhiyny21()1hNhihihYYN21()1hnhihihyyn代表的含义第h层的总体总量第h层的样本总量第h层的总体方差第h层的样本方差2019/8/208第二节简单估计量及其性质一、对总体均值的估计分层样本,总体均值的估计分层随机样本,总体均值的简单估计YWYNNYsthhhLhhhL111yWyNNysthhhLhhhL111YY2019/8/209估计量的性质性质1&2:对于一般的分层抽样,如果是的无偏估计(),则是的无偏估计。的方差为:只要对各层估计无偏,则总体估计也无偏。各层可以采用不同的抽样方法,只要相应的估计量是无偏的,则对总体的推算也是无偏的。YhYhhL12,,,YstYYstVYWVYsthhhL212019/8/2010证明性质1由于对每一层有因此,估计量的方差由于各层是独立抽取的,因此上式第二项中的协方差全为0,从而有hhYYEˆLhhhLhhhstYEWYWEYE11ˆˆˆYNYYNYNNYWLhhLhhhLhhh11111LhLhkkhkhLhhhLhhhstYYCovWWYVWYWVYV1121ˆ,ˆ2ˆˆˆLhhhstYVWYV12ˆˆ2019/8/2011性质3:对于分层随机抽样,是的无偏估计,的方差为:YystystVyWVyWfnSsthhhLhhhhhL2122112019/8/2012证明性质3:对于分层随机抽样,各层独立进行简单随机抽样,对每一层有因此,由性质1,有由第二章性质2,得因此hhYyEYyEstLhhhstyVWyV1221hhhhSnfyVVyWVyWfnSsthhhLhhhhhL2122112019/8/2013性质4:对于分层随机抽样,的一个无偏估计为:VystvyWvyWfnssthhhLhhhhhL2122112019/8/2014证明性质4:对于分层随机抽样,各层独立进行简单随机抽样,由第二章性质3,得的无偏估计为:因此,的一个无偏估计为:hyV21hhhhsnfyvVystLhhhhhLhhhstsnfWyvWyv1221212019/8/2015二、对总体总量的估计总体总量的估计为:如果得到的是分层随机样本,则总体总量的简单估计为:LhhstYYNY1ˆˆˆYNystY2019/8/20162.估计量的性质性质1:对于一般的分层抽样,如果是的无偏估计,则是的无偏估计。的方差为:YstYYˆYLhhstYVYVNYV12ˆˆˆYˆLhhhLhhhYVNYVWN12122ˆˆ2019/8/2017性质2:对于分层随机抽样,的方差为:YˆLhhhhhLhhhSnfNyVNYV122121ˆ2019/8/2018性质3:对于分层随机抽样,的一个无偏估计为:YVˆLhhhhhLhhhsnfNyvNYv122121ˆ2019/8/2019例3.1调查某地区的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户划分为4层,每层按简单随机抽样抽取10户,调查获得如下数据(单位:元),要估计该地区居民奶制品年消费总支出及其95%的置信区间。层居民户总数样本户奶制品年消费支出12345678910120010400110151040809002400501306080100551608516017037501802601100140602001803002204150050351502030251030252019/8/2020112000.070182850NWN111100.05200nfN11111139.5niiyyn1221111111624.7221niisyyn2105y3165y424y222166.667s238205.556s24193.333s同理,求得:2019/8/202141ˆhhhyNY4422228111ˆ5.9310hhhhhhhhfvYNWvyNsnˆ23208vYˆsYˆ209650223208tsYˆY=2096502019/8/2022三、对总体比例的估计总体比例P的估计为:估计量的性质pWpsthhhL1性质1:对于一般的分层抽样,如果是的无偏估计(),则是的无偏估计。的方差为:hphPhL12,,,pstPpstVpWVpsthhhL212019/8/2023性质2:对于分层随机抽样,是的无偏估计,pstPVpNnNPQnhhhhhhh1NNhh1因而的方差为:pstVpWVpNNNnNPQnsthhhLhhhhhhhhL21221111221NNNnNPQnhhhhhhhhLWfPQnhhhhhhL2112019/8/2024性质3:对于分层随机抽样,的一个无偏估计为:VpstLhhhhhLhhhstsnfNNpvWpv12221211WfpqnhhhhhhL2111第三节比率估计量及其性质先“比”后“加权”,此时所得的估计量称为分别比估计(separateratioestimator)先“加权”后“比”,这样所得的估计量称为联合比估计(combinedratioestimator)2019/8/2025分别比估计定义3.4总体均值和总体总量的分别比估计为:2019/8/2026YY11LLhRShRhhhhhhyyWyWXx111ˆˆLLLhhRSRShhhRhhhhhhyyYNyNXXYxx定理3.5对于分层随机抽样的分别比估计,若各层的样本量都比较大,则有2019/8/2027hn()RSEyY()()RSRSMSEyVy22221(1)(2)LhhyhhxhhhyhxhhhWfSRSRSSn证明根据比估计量的性质,当比较大时,有2019/8/2028hn()RhhEyY()()RhRhMSEyVy222(1)(2)hyhhxhhhyhxhhfSRSRSSn11()()LLRShRhhhhhEyWEyWYY1()()LRShRhhMSEyMSEWy21()LhRhhWMSEy21()LhRhhWVy()RSVy22221(1)(2)LhhyhhxhhhyhxhhhWfSRSRSSn联合比估计定义3.5总体均值和总体总量的联合比估计为:𝑦𝑅𝐶=𝑦𝑠𝑡𝑥𝑠𝑡𝑋≝𝑅𝑐𝑋𝑌𝑅𝐶=𝑁𝑦𝑅𝐶=𝑁𝑦𝑠𝑡𝑥𝑠𝑡𝑋≝𝑅𝑐𝑋2019/8/2029YY定理3.6对于分层随机抽样的联合比估计,若总样本量𝒏比较大,则有2019/8/2030()RCEyY()()RCRCMSEyVy22221(1)(2)LhhyhxhhyhxhhhWfSRSRSSn分别比估计与联合比估计的比较2019/8/2031由于()()RCRSVyVy22221(1)()2()LhhhxhhhyhxhhhWfRRSRRSSn\\\222212221(1)()2()()(1)()()2()LhhhxhhhyhxhhxhhhLhhhhxhhyhxhhxhhhWfRRSRRSSRSnWfRRRRSSSRSn1)当,即或分别比估计的精度与联合比估计的精度是一样的。2)当,即,分别比估计的精度不低于联合比估计的精度。3)当且,这意味着分别比估计的精度要高于联合比估计的精度。2019/8/2032()0hRRhRR22()2()0hxhhyhxhhxhRRSSSRS()0hRRhRR2221(1)()()()0LhhRCRShxhhhWfVyVyRRSn()0hRR2hxhxhhyhyhRRSSRSS4)当且,或且,联合比估计的精度要高于分别比估计的精度。5)当,即比估计量的方差小于简单估计量的方差时,需视具体情况而定。2019/8/2033()0hRR2hxhxhhhyhyhRRSSRSS()0hRR2hxhxhhhyhyhRRSSRSS12xhhhyhhSXSY第四节回归估计量及其性质与比估计相似,将回归估计的思想与技术用于分层随机样本时,同样有两种可行的办法:先“回归”后“加权”,此时所得的估计量称为分别回归估计;先“加权”后“回归”,这时所得的估计量称为联合回归估计3.4.1分别回归估计定义3.6分别回归估计是指在分层随机抽样中,先在每层中对层均值或层总和做回归估计,然后再对各层的回归估计按总体层权进行加权平均。具体的,对Y−的分别回归估计为:y−lrs=∑h=1LWhy−lrh=∑h=1LWhy−h+βh(X−h-x−h)对Y的分别回归估计为:Y^lrs=Ny−lrs=N∑h=1LWhy−h+βh(X−h-x−h)=∑h=1LNhy−h+βh(X−h-
本文标题:抽样技术-第三章
链接地址:https://www.777doc.com/doc-418251 .html