您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 我国居民住房情况及其满意度调查的抽样方案
更多精彩文章欢迎来访统计之都——我国居民住房情况及其满意度调查的抽样方案硕士一年级赵玉磊宋玲摘要:本文介绍我国居民住房情况及其满意度调查的抽样方案,旨在为分析研究当前我国居民居住的情况提供全面系统的各项资料。方案以家庭户为初级抽样单元,考虑城乡差异划分城、乡两个研究域。在抽样时在两个研究域中分别进行分层四阶不等概抽样。在估计时按所在地区的非农业人口数与农业人口数加权。文中也给出了与抽样方案配套的总体和域目标量的估计及相应的方差估计公式。关键字:居民住房满意度,分层不等概抽样本次调查的目的是全面系统地搜集反映全国居民住房情况的各项资料,并调查居民对住房情况的满意度,在此基础上分析研究当前我国居民居住的情况。调查采用入户问卷调查与统计文献调查结合的方式,其中入户调查是调查的主体。调查的对象是城乡居住家庭户,并主要调查长期居住的家庭户。下面是本次调查的方案设计。1.本方案设计的原则、特点与类型1.1设计原则本期调查抽样设计按照科学效率便利连贯的原则。首先,作为一项全国性大规模抽样调查,整体抽样方案必须是严格的概率(随机)抽样。要求样本既对全国有代表性,也对部分有条件的省(自治区、直辖市)有代表性。其次,抽样方案必须保证有较高的效率,即在相同样本量的条件下,方案设计应使最后得到的调查精度尽可能高,也即目标量估计的抽样误差尽可能小。第三,抽样方案必须有较强的可操作性,不仅便于具体抽样的实施,而且也要求便于后期的数据处理。1.2总体的确定本期调查的总体是全国除港澳台以外的家庭住户,主要指在本地长期居住的家庭住户。1.3抽样方案的类型与特点本抽样方案采用分域分层四阶不等概抽样,按城、乡分成两个研究域,抽样时按居住在居委会的居民(城市域)与居住在村委会的村民(农村域)划分。在估计时,按所在地区的非农业人口数与农业人口数加权。针对全国的基本方案采用多阶抽样,在城、乡两个研究域中,本方案在分层基础上对家庭户的抽样采用四阶抽样,各阶抽样单元如下:第一阶:市辖区(地级以下的城市,以下简称区)、县(包括县级市);更多精彩文章欢迎来访统计之都——第二阶:街道、乡、镇;第三阶:居民委员会(家属委员会)、村民委员会;第四阶:家庭户。为提高抽样效率,减少抽样误差,在对区、县的第一阶抽样中,对区县采用按地域及类别分层;而第二、三阶抽样均采用按与非农业户口或农业户口成比例的概率比例(PPS)抽样。2.各阶样本的选取方案2.1初级样本单元的确定对于一个全国性的调查,初级样本的选取有两种方案第一种方案是将全国的省(自治区、直辖市)作为初级样本单元,这种方法虽可以节省开支,保证调查经费,但由于各个省、自治区、直辖市的经济发展程度,人们的消费观念等存在着很大的差异,这样就会造成这一级的抽样误差较大。第二种方案是将县级单位(区、县)作为抽样的初级单元,这种方法虽然造成调查费用较高,但这样会使初级样本的方差比较小由于在多阶段抽样误差的估计中,方差的大小受初级单元的方差影响较大,所以我们选择第二种方案。2.2区县的分层第一阶段抽样总体:根据1998年底的全国行政区域划分资料,全国(除港澳台外)共有1689个县级行政单位,437个县级市,227个地级市,这些地级市及北京、天津、上海、重庆四个直辖市中共包含737个市辖区。上述2126个县(及县级市)与737个区域及5个不设区的地级市即构成第一阶抽样的抽样总体。为了便于调查后的资料分类汇总及提高精度,我们将全国所有区、县进行分层,分层是按以下两种标识进行:(一)地域由于各地区经济、文化差异较大,我们首先将所有区、县按所在省(自治区、直辖市)的地理位置分成三大层:第一大层(东部地区):北京、天津、上海、辽宁、山东、江苏、浙江、福建、广东;第二大层(中部地区):黑龙江、吉林、河北、河南、山西、安徽、江西、湖北、湖南、广西、海南;第三大层(西部地区):内蒙、陕西、宁夏、甘肃、青海、新疆、重庆、四川、云南、贵州、西藏。(二)区、县类别更多精彩文章欢迎来访统计之都——我们根据非农业人口在总人口中的比例将区分为两类;根据人均GDP的数量将县分为三类:A.区类别的划分标准东部地区与中部地区:非农业人口在总人口中的比例大于或等于80%为一类区,小于80%为二类区;西部地区:非农业人口在总人口中的比例大于或等于70%为一类区,小于70%为二类区。B.县类别的划分标准东部地区:人均GDP在6000元以上为一类县;6000元以下,4000元以上为二类县;4000元以下为三类县;中部地区:人均GDP在5000元以上为一类县;5000元以下,3000元以上为二类县;3000元以下为三类县;西部地区:人均GDP在3500元以上为一类县;3500元以下,2000元以上为二类县;2000元以下为三类县。根据以上标准,各小层的区县数量如表一:地域一类区二类区县级市一县类二类县三类县合计东部地区125154169847889699中部地区1591751851493002291197西部地区577397188237242894合计3414034464216155642790表一全国(除西藏外)分类别的区县、数由于西藏自治区的特殊性,我们将拉萨市所辖的城关区及日喀则市作为城市域的自我代表层,其余76个县(不区分类别)作为农村域的1个小层处理。3.样本区、县的抽样方法3.1基本方案—全国样本的抽样方案层内对地区、县的抽样按有放回的与人口成比例的概率抽样进行,其中城市域的抽样使用非农业人口,农村域的抽样使用农业人口。具体方法如下:设某小层共有N个区(或县),第i个区(县)的人口数为Mi,i=1,2,…,N,记该小层人口总数为M0。若分配给该层的区、县样本量为m,则需独立进行m次有放回的抽样。每次抽样第i个区县被抽中的概率为Zi=Mi/M0。记第i个区、县在m次独立抽样中被抽中的次数为ti,0≤ti≤m,i=1,2,…,N,(Σti=m),更多精彩文章欢迎来访统计之都——则每个被抽到的样本区(或县),需抽的二级单元(街道、乡、镇)数是规定数的ti倍。3.2样本区、县内的抽样方法每个样本区、县内的抽样方法相同,都采用多阶段抽样。A.样本区、县内对街道、乡、镇的抽样样本区、县内对街道(乡、镇)的抽样采用按人口的PPS系统抽样。每个样本区县内抽三个街道(乡、镇)。B.样本街道、乡、镇内对居委会或村委会的抽样样本街道(乡、镇)内对居委会(家属委员会)或村委会的抽样采用按人口的系统PPS抽样。这里的人口用户数,且对城市域,仅指居委会或家属委员会建制的人口(户数);对农村域,仅指村委会建制的人口(户数)。每个样本街道(乡、镇)各抽2个居委会或2个村委会。以上两阶抽样在实施时需要提供相应单元的清单与人口(或户数)的详细资料。样本居、村委会内对家庭的抽样样本居委会或村委会对家庭户的抽样采用随机起点的等概率系统抽样,即等距抽样。每个居委会或村委会固定抽取8户。在抽样时,必须首先清点居(村)委会管辖范围内的实际家庭户数且规定排列顺序。对每个被抽中的样本户,随机抽取一人为具体调查对象。4.样本量的确定与分配根据本次调查的工作量并参考以前的统计数据,本方案全国的样本量为19392人,其中城市域与农村域各为9696人,每个样本区、县(当样本区、县在抽样过程中重复抽中时,样本量需成倍计算)的样本量均为48,因此对每个域,区、县样本量各为202,其中西藏自治区的样本县数为2。各层的区、县样本量原则上按人口(城市域为非农业人口,农村域为农业人口)比例分配,根据实际情况作适当调整,调整原则按最优分配思想,层内差异小,而总体区、县数量又大的,适当少抽;层内差异大,而总体区、县数量小的,适当多抽,并要求每层至少抽两个区县。城市域及农村域各层非农业或农业人口在全国相应人口的比例及实际抽取的全国除西藏外的样本区县数如表二与表三所示。更多精彩文章欢迎来访统计之都——东部地区中部地区西部地区合计比例[%]样本区县数比例[%]样本区县数比例[%]样本区县数比例[%]样本区县数一类区15.303011.45234.68931.4063二类区8.13167.62153.54719.3438县级市9.15188.24163.91821.2542一类县2.2353.3772.4358.0316二类县2.2256.10123.29711.6123三类县2.4653.9581.9848.3818合计39.517940.738119.8340100200表二各层非农业人口在全国非农业人口的比例及城市域区、县样本量东部地区中部地区西部地区合计比例[%]样本区县数比例[%]样本区县数比例[%]样本区县数比例[%]样本区县数市辖区3.9384.0182.67510.7121县级市11.47249.96203.46724.3951一类县3.5675.47113.87812.9426二类县4.07814.35288.331626.8052三类县5.441111.32228.401725.1750合计28.475845.128926.7253100200表三各层农业人口在全国农业人口的比例及农村域区、县样本量5.实际数据处理本节根据抽样方案给出全国及省级目标量的估计及其精度估计方法,并对抽样误差及设计效应进行评估。根据抽样方案,两个研究域—城市域与农村域的抽样是相互独立的,且第一个域除第一更多精彩文章欢迎来访统计之都——阶抽样单元(区、县)中区的分层方式以及居委会与村委会少数资料形式稍有不同外,其余完全相同,故以下讨论主要针对城市域进行。此外,根据本项调查的内容,需要估计的目标量包括:人均住房面积(平方米/人)、住房价值(元/平方米)、住房结构(平方米/人,其中又分钢筋混凝土结构和砖木结构)以及满意度,基本上都是以总体均值或比例形式出现。由于总体比例是指标值仅取0,1两值变量的总体均值,因此讨论也只需要针对总体均值的估计即可。5.1全国均值的估计及其方差估计根据抽样方案,对每个域均采用分层四阶抽样,其中层是对地域及区县类别分的,目标量估计首先在层内进行,有了层目标量即可经加权获得东、中、西三个地区与全国目标量的相应估计。设所考虑的小层内共有县级单位N个,非农业人口总数为M,其中样本区(县/县级市)a有非农业人口aM人。设区(县/县级市)a的第b个样本街道(乡/镇)中第g个样本居(村)委会的8个样本户平均每户有人口abgm,其中第d个家庭户共abgN人,具体被调查者的某个调查指标值为abgdy。假定方案中规定在该层内抽取n个样本区县,即该层内第一阶抽样中实施了n次独立按(非农业)人口的放回PPS抽样,设共抽到*n个不同的县级单位,其中区(县/县级市)a被重复抽到at次,则ntn=∑=*1aa。抽样方案又规定每个样本区县中按PPS抽样抽取3个街道(乡/镇),每个街道(乡/镇)中也按同样方法抽取2个居(村)委会,而在每个样本居(村)委会中按等概率系统抽样(等距抽样)抽取8个样本户,在每个户中随机抽取一个符合条件的家庭成员为调查对象。因此,如果忽略家庭规模差异的话,样本可以看成是自加权的。从而总体均值Y采用估计abgdabgdabgdayWYnt∑∑∑∑=====*1312181^,(1)其中abgabgdabgdmNnW•=481。(2)考虑到从N个区县中实际抽取到*n个样本县的有限总体的修正,方差)(^YV可用更多精彩文章欢迎来访统计之都——*^^*)1(/1)(∑=∧∧⎟⎟⎠⎞⎜⎜⎝⎛---=nYYtnnNnYVaaa,(3)来估计,其中abgdbgdabgabgdaaaymNtYt∑∑∑===∧=312181481。(4)根据抽样方案,全国城市域由18个层组成。记i为大层(东、中、西部地区)编号,i=1,2,3;
本文标题:我国居民住房情况及其满意度调查的抽样方案
链接地址:https://www.777doc.com/doc-418129 .html