您好,欢迎访问三七文档
第7章其它抽样方法第一节样本轮换第二节双重抽样第三节随机化装置问题提出时间序列数据以及随后出现的面板数据都是经济统计分析和计量分析中非常重要的数据类型。当我们在研究应该应用什么统计和计量的方法去分析既定的时间序列数据时,是否考虑过以下几个问题?时间序列数据是如何产生的?所产生的时间序列数据是否准确?如何让时间序列数据更加准确?随着社会经济现象的不断变化和发展,很多调查对象的总体也在不断变化和发展。为了能够及时反映调查总体的这种变化和发展,调查部门就需要对同一总体在不同时间上进行连续性抽样调查(SuccessiveSamplingSurvey),并定期公布调查结果,形成一系列时序统计数据。因此,社会经济抽样调查一般都应该是连续性的定期调查。一次性抽样调查与截面数据连续性抽样调查与时间序列数据及面板数据抽样调查除了对总体的一次性抽样以外,很多重要的调查是隔一段时间重复进行的,对于这种经常性的抽样问题,就必须重视其样本轮换问题的研究。对于样本轮换问题,我们至少应考虑以下问题:每次调查的样本如何组成?是采用固定样本还是采用全新的样本,或者是部分保留部分替换,即样本轮换;在估计后期的总量或均值时,是否需要利用前期的信息来改进现期的估计,以及如何利用;如果采用样本轮换的方法,如何确定最优的保留比例或替换比例。第一节样本轮换连续性抽样设计方法按抽取样本的不同划分轮换样本重复样本固定样本单水平轮换不完全的单水平轮换多水平轮换轮换模式应用举例加拿大劳动力调查(LFS)使用6~0单水平轮换模式美国现时人口调查(CPS)使用4~8~4不完全单水平轮换模式美国消费者支出的季度调查(CEQ)便采用4~0三水平轮换模式中国城市住户抽样调查中国规模以下工业企业抽样调查中国农产量抽样调查一、样本轮换的原因如果是单纯地估计现值的情况,当然最好每次重新抽取新样本,这样必然会增加费用;如果要逐期地与上期比较,则采用固定样本的方法为好,固定样本可以消除样本的因素而只观察动态的变化。然而,样本长期不变,随着时间的推移,固定样本会显露它的弊端,既难以反映总体的变化,而且受访者也会产生厌烦心理,出现不合作或回答质量下降等问题,从而影响调查质量。另外,无论是采用固定样本还是全新样本都难以正确地反映总体在各个不同时间上的水平及变化,因此,一种广泛采用的方法是样本轮换,即每隔一定时间(一个月、一季或一年)更换一定比例的单元,保留其余单元。第一节样本轮换与传统的一次性抽样调查相比,轮换的抽样调查具有以下特有的优势:节省调查费用和调查资源在一定程度上减轻被调查者回答负担利用前后各期之间的相关关系提高估计精度我国1996年新修订的《统计法》第十条明确规定:“统计调查应当以周期性普查为基础,以经常性抽样调查为主体,以必要的统计报表、重点调查、综合分析等为补充,搜集、整理基本统计资料。”因此,在今后我国政府统计部门开展的统计调查制度与方法改革的过程中,最重要的就是围绕如何更好地发挥经常性抽样调查的主体作用,研究并应用更加符合我国国情的经常性抽样调查方法,以此得出更加准确的统计数据,为我国政府部门、研究机构以及各类企事业单位等社会各界服务。我国抽样调查制度与方法改革的方向二、样本轮换的最优比例第一个时期采用有放回简单随机抽样方式抽出样本量为n的样本;在第二个时期采用有放回简单随机抽样方式选出样本量为nq的旧有样本点以便替换掉,即保留的样本量为np,保留样本的比例为p,同时独立地依有放回简单随机样本方式补充新的nq个新样本点,这里p+q=1,这样第二个时期的样本量仍旧为n。设:第一节样本轮换为第一个时期与第二个时期相同的np个单元在第一个时期的均值。为第一个时期nq个单元在第一个时期的均值。为np个单元在第二个时期的样本均值。为nq个补充单元在第二个时期的样本均值。ρ为和之间的相关系数。如果希望估计第二个时期的样本均值并充分利用第一个时期的信息,令该估计量为,那么它应该是充分利用前后期中保留样本、不保留样本和后期新补充样本的加权平均数。第一节样本轮换xxxxyyxxywy设我们希望得到的估计量是两期估计量的线性函数,即=a+b+c+d(7.1)要求估计其参数a,b,c,d。因为E()=E()=,E()=E()=,所以E()=(a+b)+(c+d)。要使成为的无偏估计量,需a+b=0,c+d=1,也即b=-a,d=1-c。代入(7.1),有=a(-)+c+(1-c)第一节样本轮换xyyxxywywyxywywyXXYYYwyxxyy第一节样本轮换xxx该估计量的方差可以求得为:22222211(1)2()()...yyxyxwccacVyaqpnpnqnpn其中是第一个时期的方差,是第二个时期的方差。我们要求出a和c,使得达到最小,就要以上公式分别对a和c求偏微分并使之等于0,即可求出a和c的最优值分别为:2x2y()wVy第一节样本轮换该估计量的方差可以求得为:22.1yxpqaq第一节样本轮换xxx将其代入公式(7.1),就得到2222222(1)()111ywxpqpqqyxxyyqqq该估计量的方差为:22221()1ywqVynq第一节样本轮换如果不利用前期信息,只根据第二期的结果来估计均值,那么:其方差为:ypyqy2()yVyn第一节样本轮换xxx故利用前期信息后的设计效果为:从上式可以看出,当ρ的值比较大时,利用上期信息可以较大地提高的效率。表7.1给出了不同的q,ρ值时的值。222()1()1wVyqVyqwy()()wVyVy第一节样本轮换xxx表7.1不同的q,ρ值时的值()()wVyVy若对上式关于q求偏导,并使之等于0,那么便可得到最优轮换比:第一节样本轮换xxx三、样本轮换方法(一)随机轮换法在进行轮换时按确定的轮换单位数目或比例,从原有样本中随机抽出若干单位不再调查,而从其余未包括在样本中的总体单位中抽取同样数目的单位来代替。第一节样本轮换xxx(二)等距轮换法在总体抽样框中确定出各个等距抽样的样本,在各次的调查中,按相应位置的等距样本单位进行轮换。我国农村住户调查就是采用这种轮换方式。(三)子样本轮换法从总体中抽出若干套子样本,每次调查一定数量的子样本,逐次轮换其中的部分子样本。第一节样本轮换xxx子样本轮换实际上就是每次采用交叉子样本,而交叉子样本不仅能有效地减少和控制估计偏差,而且由于每个交叉子样本都能代表总体,即使有的子样本资料搜集不到,我们也可以用其他的子样本甚至一个子样本来观察和推断总体。此外,用交叉子样本还可以考察非抽样误差发生的程度。因此,一般来说,子样本轮换方法是以上三种样本轮换方法中最好的。第一节样本轮换xxx五、案例介绍美国人口现状调查(currentpopulationsurvey,CPS)是国际上最著名的抽样调查项目之一,已经成为美国以及许多国家进行居民调查的参考模型,其实施是在每个月包含19号的那一周进行,调查的问题涉及受访者此前一周内的活动。调查氛围覆盖全美50个州和哥伦比亚地区。CPS采用的就是样本轮换的方法,即每位受访者连续4个月接受访问,然后退出样本,8个月后再进入样本,连续4个月接受访问,最后永久地退出样本。第一节样本轮换xxxCPS在1995年7月的抽样设计方案中样本轮换的特征:1.在任意一个月内,都有1/8的住户单元第一次接受调查,1/8的住户单元第二次接受调查,依次类推。2.每个月都由新的样本组代替从样本中永久退出的老样本组。3.每个月都有一个样本组在闲置8个月后重新接受调查,以此代替刚刚进入闲置期的样本组。4.通过轮换设计,保证每个样本单元在2个年份的4个相同月份里接受调查。5.在连续的2个月内,有3/4的样本点是相同的;在连续的2年内,有1/2的样本点是相同的。二维平衡单水平轮换模式的轮换过程2148~轮换样本1234轮换组g12345678123456781234567812第t月t+1月t+2月t+3月t+4月t+5月t+6月t+7月t+8月t+9月t+10月t+11月t+12月t+13月……⑧⑦⑧⑥⑦⑧⑤⑥⑦⑧⑤⑥⑦⑧⑤⑥⑦⑧⑤⑥⑦⑧⑤⑥⑦⑧⑤⑥⑦⑧⑤⑥⑦⑧⑤⑥⑦⑧⑤⑥⑦⑧④⑤⑥⑦⑧③④⑤⑥⑦⑧②③④⑤⑥⑦①②③④⑤⑥①②③④⑤①②③④①②③④①②③④①②③④①②③④①②③④①②③④①②③④①②③④二维平衡单水平轮换模式的轮换过程2148~轮换组g调查月份12345678第t月t+1月t+2月t+3月t+4月t+5月t+6月t+7月t+8月t+9月t+10月t+11月t+12月t+13月……⑧①①②②③③④④⑤⑤⑥⑥⑦⑦⑧⑧①②③④⑤⑦⑧⑧①①②②③③④④⑤⑤⑥⑥⑦⑦⑧①②③④⑥⑦⑧①②③④⑤⑥⑦⑧①②③⑤⑥⑦⑧①②③④⑤⑥⑦⑧①②④⑤⑥⑦⑧①②③④⑤⑥⑦⑧①③④⑤⑥⑦⑧①②③④⑤⑥⑦⑧②③④⑤⑥⑦⑧①②③④⑤⑥⑦①②③④⑤⑥⑦⑧①②③④⑤⑥第二节双重抽样xxx我们可以先从总体中抽取一个大的初始样本,从而获得总体的辅助信息,然后再从初始样本或从总体中再抽一个子样本,这种方法就是双重抽样。第二节双重抽样xxx一、定义双重抽样(doublesampling),也称二相抽样或二重抽样(two-phasesampling),是指在抽样时分两步抽取样本。一般情况下,先从总体N中抽取一个较大的样本,称为第一重(相)样本(thefirstphasesample),对之进行调查以获取总体的某些辅助信息,为下一步的抽样估计提供条件;然后进行第二重抽样(thesecondphasesampling)。第二重抽样所抽的样本n相对较小,但是第二重抽样调查才是主调查。第二节双重抽样xxx二、双重抽样与两阶段抽样的区别(一)两阶段抽样(two-stagesampling)是先从总体N个单元(初级单元)中抽出n个样本单元,却并不对这n个样本单元中的所有小单元(二级单元)都进行调查,而是在其中再抽出若干个二级单元进行调查;双重抽样则不同,要对第一重(相)样本进行调查以获取总体的某些辅助信息,并且要利用这些辅助信息进行排序、分层、抽样或估计等。第二节双重抽样xxx(二)两阶段抽样的第二阶段抽样单元和第一阶段抽样单元往往是不同的;双重抽样要有一份最终单元的完整名册(总体所有单元的抽样框),而两阶段抽样只是需要第一阶段单元(初级单元)名册,然后在中选的初级单元中构造第二阶段抽样的抽样框。第二节双重抽样xxx三、双重抽样的作用(一)有助于筛选主调查对象,如对高血压病人的调查、银行对储户存款的调查等;(二)提高抽样效率,因为第二重抽样可利用第一重样本的信息进行分层和比率估计;(四)可用于研究样本轮换中的某些问题;(五)降低无回答偏差,对无回答层进行第二重抽样并对其推断。第二节双重抽样xxx四、双重抽样的应用(一)为分层的双重抽样分层抽样如果事先无法知道总体的层权,可以采用双重抽样。具体实施过程如下:第一步:利用简单随机抽样,从总体的N个单元中随机抽取第一重样本,样本单元数为;根据已知的分层标志将第一重样本分层,令,则是总体层权的无偏估计。n(1,2,,)hhnwhLnhwhW第二节双重抽样第二步:利用分层随机抽样,从第一重样本中抽取出第二重样本,样本单元数为n,第h层样本单元数为,。hn1lhhnn采用双重分层抽样,对总体均值的无偏估计量为:Y1LstDhhhywy的方差为:stDy21)111()()(1)LhhstDhhDWSVySnNnf第二节双重抽样xxx上式可简化为:的样本估计量为:()stDVy222111111()()()()LLstDhhhhstDhhhhvywswyyn
本文标题:第7章其它抽样方法
链接地址:https://www.777doc.com/doc-419564 .html