您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 抽样调查理论与实践.
抽样调查理论与实践赵继东2014年10月主要内容一、抽样方法选择二、样本量的确定三、方案及问卷设计四、抽样调查的组织实施五、质量控制六、数据汇总七、推算总体与权重使用八、数据分析与报告撰写抽样方法选择1、纯随机抽样:纯随机抽样是在总体中以完全随机的方法抽取一部分观察单位组成样本(即每个观察单位有同等的概率被抽中)。其优点是简单直观;缺点是当总体较大时,难以对每个体一一编号,且抽到的样本分散,可能也不均匀。2、系统抽样:系统抽样又称等距抽样或机械抽样,即先将总体中的全部个体按与研究现象无关的特征排序编号;然后根据样本含量大小,规定抽样间隔(步长)k;随机选定第i(i<k)号个体开始,每隔一个k,抽取一个个体,组成样本。系统抽样的优点是:易于理解,简便易行;容易得到一个在总体中分布均匀的样本,其抽样误差小于单纯随机抽样。缺点是:抽到的样本较分散,不易组织调查;当总体中观察单位按顺序有周期趋势或单调增加(减小)趋势时,容易产生偏倚。PPS抽样法即属此列,实践中大多采用此法。3、整群抽样:整群抽样是先将总体划分为K个“群”,每个群包含若干个观察单位,再随机抽取k个群(k<K),由抽中的各群的全部观察单位组成样本。整群抽样的优点是便于组织调查,节省经费,容易控制调查质量;缺点是当样本含量一定时,抽样误差大于单纯随机抽样。4.分层抽样:分层抽样是先将总体中全部个体按对主要研究指标影响较大的某种特征分成若干“层”,再从每一层内随机抽取一定数量的观察单位组成样本。分层抽样的优点是样本具有较好的代表性,抽样误差较小,分层后可根据情况对不同的层采用不同的抽样方法。四种抽样方法的抽样误差大小一般是:整群抽样≥单纯随机抽样≥系统抽样≥分层抽样。此外还有选择性抽样、指定性抽样、滚雪球式抽样等。选择抽样方法的原则:方便、快速、精确、节省1、代表性—要紧紧围绕调查项目的特点和要求。2、精确性—以样本信息代表母体信息,可测量其可信度3、可行性—要全面考虑每一种统计抽样方法各自的优点和运用条件。4、低成本在实际工作中,常常将两种或几种抽样方法结合使用,进行多阶段抽样。有的需要重点调查和抽样调查结合。社保调查人口抽样调查住户收支调查物价调查采购经理调查农产量调查小微企业调查其他市场调查等样本量的确定总原则:用最经济的样本量,取得尽可能准确的数据一、离散度1、极差2、离均差平方和3、方差4、标准差:表示的是样本数据的离散程度。标准差就是样本平均数方差的开平方。标准差越小,表明数据越聚集,需要的样本量越少;标准差越大,表明数据越离散,需要的样本量越多。5、变异系数二、置信度也称为可靠度,或置信水平、置信系数,即在抽样对总体参数作出估计时,由于样本的随机性,其结论总是不确定的。置信水平是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。置信水平表示区间估计的把握程度,置信区间的跨度是置信水平的正函数,即要求的把握程度越大,势必得到一个较宽的置信区间,这就相应降低了估计的准确程度。可靠度要求越高,需要的样本量越大。实际工作中如何确定样本量1、调查对于决策的重要性。重要的决策,需要更多更准确的信息,需要较大的样本;探索性研究,样本量可以较小。2、收集有关许多变量的数据,样本量就要大一些,以减少抽样误差的累积效应。3、如果需要采用多元统计方法对数据进行复杂的高级分析,样本量就应当较大。4、如做许多分类等,也需要大样本。针对子样本分析比只限于对总样本分析,所需样本量要大得多。5、可操作性。容易操作,简单易行,样本量可以多些;操作难度较大,样本就少些。6、调查经费。科学做法:在调查前先抽取少量的样本,得到标准差S的估计,然后代入公式,得到下一步抽样所需样本量n。如果有以前类似调查的数据,可以使用以前调查的方差作为总体方差的估计。经验做法:如果是多省市或者全国性的研究,则样本量可能在1000--3000之间比较适合;大型城市、省市一级的地区性研究,样本数在500--1000之间比较适合;中小城市,样本量在200--300之间比较适合;如果要进行分组研究,每组样本量应该不少于50个。在经费有限的情况下,每组的样本量可降至30个左右。每组超过100个可能是资源浪费。方案及问卷设计总原则:切忌贪大求全,问题不宜太多,研究的问题要集中,时间不宜过长。考虑要素:研究目标、调查报告的大致框架、覆盖的地理范围、将做哪些分组(涉及样本量)、所设问题之间的逻辑关系、调查对象及其配合度、调查所需时间及每份问卷的回答时间、所需人力和经费,等等。《人力资源和社会保障基本情况调查住户居民问卷》内容过多,时间太长,可以拆分:例如可拆分一个离退休人员的问卷,一个失业人员的问卷,等等《企业税负调查问卷》、《融资成本调查问卷》等抽样调查的组织实施以社保调查为例(抽样方法,样本量:南京76村,南通75村、宿迁64村,另外各市1000农民工)人员准备:选什么人作为调查员调查员培训:调查要求及技巧、熟悉问卷样本抽取:样本框准备、PPS抽样、拒访处理、封闭式抽样(见下页)问卷及礼品准备:根据问卷时长准备礼品试调查及入户调查:试调查可了解难点所在,掌握时间;入户调查需要的车辆、雨具,用餐,礼品,安全,等等复查及质量控制(另讲)问卷录入及汇总(另讲)调查报告撰写(另讲)封闭式抽样:如何抽取最后一个样本举例:样本框总量127个,每10个抽1个,应该抽13个样本最好。抓阄确定的起始号为8,则抽取的样本应该为8、18、28……108、118。至此共抽取了12个样本,此后还有9个号没抽中,最后一个样本该怎么抽呢?社保调查的抽样方法是抓阄。我提供两个方法:①将剩下的9个号与起始号前面的1-7号连起来,使样本框形成一个封闭的圆环:8、9、10…118、119…126、127、1、2…6、7、8,从119号开始数到第10,即是最后一个样本(即1号);②将圆环中119号之后的16个号除2,抽取中间的那个号为最后一个样本,即16/2=8,即抽取第126号(118+8)为最后一个样本。这就叫封闭式抽样。质量控制调查员素质决定调查质量调查经费影响调查质量调查问卷决定调查质量:时间长短,问题设计(答案的唯一性、私密性、逻辑性等)过程控制提升调查质量:自查、复查、录入、奖罚资料汇总根据研究目标汇总数据,要有缜密的汇总思路社保调查按人口的年龄、性别分:男16-59岁,女16-54岁,按每5岁一组分,男9组,女8组,另外有其他年龄。按户口性质分:7组按最高学历分:8组按专业职称、技工技师资格分:6组+7组按专业技术岗位分:10组按行业分:20组按职业分:8大组,若干小组按就业身份/形式分:9组按工作单位/雇主的性质分:10组按所在企业的注册类型分:10组按参保种类分:5组。养老保险再分8类,养老保险中再分6类失业保险中再分多类其他内容汇总此外,还可进行多种交叉分组汇总:例如:技术职称与技术岗位;学历与岗位;保险种类与职业等还要,根据调查报告写作的需要,随时增补汇总数据推算总体与权重使用如果是按总体的一定比例抽样的,则可以直接推算总体。例如人口抽样调查,按10%抽样,则扩大10倍即是人口总量。如果调查得出的结果是比例或平均值,则该比例或平均值即可认为是总体的水平。例如社保调查,调查结果,南京的农民工中有36%有技术职称,每个农民工平均休假时间为15天,那么可以认为南京所有的农民工中有技术职称的人占36%,所有农民工的平均休假时间为15天。但是,此次调查每市调查的农民工总数1000人是人为确定的,他们在总体中占多大比重无从得知,所以,不能推算全市的农民工总数。如果是分层抽样的,要推算总体则需要给每个层确定权重。例如PMI调查(见下表)。2014年X月全省非制造业PMI行码行业名称样本量权数PMI合计100.049.447-50建筑业17016.152.051-52批发和零售业25429.751.753-60交通运输、仓储和邮政业13311.451.861-62住宿和餐饮业1377.447.463-65信息传输、计算机服务和软件业1197.551.470房地产业15015.343.571-75租赁和商务服务业1037.043.876-78水利、环境和公共设施管理业352.146.979-85居民服务和其他服务业323.549.9社保调查如果13个市都开展调查,在推算全省数据时,就可以采用加权方式计算,权数计算的基础就是人口数。权数计算方法:一般采用最新的年度数据,如物价指数计算时采用上一年居民消费支出数据等。我们计算权数时采用的是最近三年的数据,但不是将三年数据简单平均,而是按时间先后给予相应的权重,然后加权计算权数。例如,上表中,我省非制造业PMI的分行业权数就是用最近三年各行业的增加值加权计算所得。20%、30%、50%。数据分析与报告撰写调查数据是富矿,金、银、铜、铁、锡一应俱全,就看开采者的水平。数据分析与报告撰写紧密相关。在一般性汇总的基础上,首先要对数据进行深入的研究,寻找规律,发现问题,形成调查报告的大致思路:多做数据间的加减乘除;多绘制各种图表寻找数据后面的数据:交叉运算;对有典型意义小类拎出来汇总;小类间比较(如税负调查、融资成本调查等)充分利用大数据,如:统计年鉴、人口数据、工资数据、社保数据、城乡住户调查数据、基尼系数、恩格尔系数等全省城镇居民农村居民201320122011可支配收入元人23188.2㈠工资性收入元人14344.1⒈工资及补贴收入元人13267.5⒉其它劳动收入元人1076.5㈡经营净收入元人4101.5㈢财产性收入元人791.2㈣转移性收入元人5245.2⒈养老金或离退休金元人4030.7⒉社会救济收入元人52.7其中:最低生活保障收入元人24.85.失业保险金元人9.8⒍赡养收入元人289.9⒎捐赠收入元人30.88提取住房公积金元人39.29记帐补贴元人173.810其它转移性收入元人67.0全省城镇居民农村居民201320122011家庭总支出元人31501.10(一)消费性支出元人17924.97(二)财产性支出元人69.94(三)转移性支出元人1293.811.交纳所得税元人64.502.捐赠支出元人66.334.赡养支出元人105.496.其它转移性支出元人59.47(四)社会保障支出元人959.911.个人交纳的养老基金元人636.982.个人交纳的住房公积金元人120.003.个人交纳的医疗基金元人254.714.个人交纳的失业基金元人43.495.其它社会保障支出元人24.73(五)购房与建房支出元人1012.1转移受益增加拉动城乡居民收入增长受上调企业退休人员养老金、城乡居民基础养老金标准和城乡低保标准等政策性作用影响,前三季度,江苏城乡居民人均转移净收入3567元,较上年同期增加298元,增长9.1%,对可支配收入增长的贡献率达16.1%,拉动收入增长2.0个百分点。其中,农村居民增速较快,人均转移净收入1734元,增加188元,增长12.1%;城镇居民人均4665元,增加338元,增长7.8%。社会保险基本情况年份失业保险城镇职工基本医疗保险工伤保险年末参加生育保险人数(万人)年末参保人数(万人)全年发放失业保险金人数(万人)全年发放失业保险金(亿元)年末参保职工人数(万人)年末参保退休人员(万人)年末参保人数(万人)年末享受工伤待遇的人数(万人)2001750.9053.709.16367.64122.65473.940.79483.462002733.8776.7113.00507.69183.24480.001.44486.062003761.6288.2513.92608.41226.67503.021.68504.062004797.0985.9814.73715.11261.62577.202.28552.682005838.4867.0212.03821.07303.02680.213.22630.922006901.0
本文标题:抽样调查理论与实践.
链接地址:https://www.777doc.com/doc-2373371 .html