您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 综合/其它 > 抽样调查方法MBA2014-抽样调查方法MBA2014
第八章抽样调查方法主要内容一、为什么要采用抽样调查方法二、如何确定调查方案三、如何确定抽样框四、如何选取样本和确定样本容量五、抽样调查的误差来源六、问卷设计技术七、统计数据分析八、调研报告的文本结构8.1为什么要采用抽样调查方法普查的代价:1.费用昂贵2.时间过长3.观测值几乎是无穷个4.毁坏性实验5.精度:由一个训练有素的调查人员得到的样本统计结果,可能比没有受过训练的人进行普查得到的结果更准确.抽样主要考虑:调查的效率和精确性研究样本比研究总体的速度更快,花费更少;可以把花费在不必要的数量过大的群体资料的精力和经费用在监测数据收集质量上.8.2如何确定调查方案1、调查目的指出调查所要达到的具体目标。调查研究的目的是进行调查的原因。(1)对特定人群的调查研究,可以描述、比较、预测他们的认知、态度及行为。(2)可以对所发生的事实进行调查。例如:(1)某社会组织可以通过抽样调查,分析人们对某项政策的看法,或者调查某项政策实施是否有效。(2)一批灯泡的废品率或平均寿命(3)国家创新研究群体的意义、作用、成果、管理中需要改进的问题,以及预测我国应保持多大的团队规模。(4)北京市出租车司机的工作负荷情况和劳动收入情况。(5)国外技术性贸易措施(TBT)对我国对外贸易的影响情况;国外实施TBT的特点,我国企业在应对TBT时面临的困难,以及政府急需采取的对策措施。2、调查大纲(调查研究的具体内容)只有在调查目的和内容都明确后,才能确定向谁调查、调查什么,以及采取什么方法。案例1:对中国妇女参政的看法(1)第一次研讨会的主要议题是什么?(主持人应如何把握会场研讨)(2)向谁发问卷?(3)根据调查结果,要向上级领导说明什么问题?注意:在进行调查方案设计之前,必须准确地陈述调查目的以及调查研究的内容(应该有详细的提纲)案例2:2007年中国机电行业自主品牌产品出口情况抽样调查(商务部)总目的:对2007年全国机电行业自主品牌产品出口情况调查调查大纲:统计报告期内,全国机电行业出口企业的自主品牌出口额占该行业总出口额的比例;分析自主品牌出口额比例在金属制品、机械及设备、电器及电子产品、运输工具、仪器仪表等产品的分布情况;分析机电行业自主品牌出口额比例在各地区分布情况;了解我国机电行业企业在发展自主品牌方面的认识现状;了解企业采用贴牌出口的主要原因;了解我国机电行业企业在发展自主品牌出口方面多面临的主要困难,以及对政府扶持品牌发展的意见与建议。8.3如何确定抽样框1、目标总体:所有要调查的个体的集合例如:一批灯泡北京市全体出租车司机案例:2007年中国机电行业自主品牌产品出口情况抽样调查调查范围:2007年1月1日至2007年12月31日的全国机电行业出口企业。(产品类型包括金属制品、机械及设备、电器及电子产品、运输工具、仪器仪表。)统计调查的报告期:2007年1月1日—2007年12月31日有时需要按照调查要求,分别调查几个不同的目标总体.案例2:《关于创新研究群体的调查问卷》一共分为三套:第一套:针对参加创新研究群体评审的专家,以及国家自然科学基金委七个学部的管理人员。从专家角度了解他们对创新研究群体资助计划的评价以及对管理问题的看法;第二套:针对已经获得创新研究群体项目资助的群体负责人。了解群体成员对相关问题的看法以及他们的学术进展情况;第三套:发放给已获得创新研究群体及杰出青年科学基金项目资助的各高校和科研机构的科技处的管理人员(基金负责人)。除了解部分观点性问题外,主要调查相关科研机构在创新研究群体的人才储备及研究基础方面的情况。2、样本:样本是目标总体的一部分在总体中抽取一部分个体进行观测统计,再根据这部分个体的观测信息推断总体的性质。3、样本容量n:样本中的个体数目大样本:n30小样本:n30什么是一个好的样本:是总体的代表(缩影),非常像,但是小一些。样本中的重要特征应该与总体基本近似。例如:在TBT调查中,要了解出口企业受限比例目标:样本中的受限企业比例=总体中的受限企业比例4、抽样框:实施抽样的总体名单进行抽样的第一步是获得一个符合条件的个体组成的总体名单,样本将在这个总体名单中抽取.在实际操作时,我们是从抽样框中抽取一部分个体进行观测统计。一个好的抽样框:但是,在实际情况下,有时抽样框并不等于目标总体例如:(1)如果采用2002年出口企业名录做关于2003年TBT影响调查(2)银行关于某项政策的调研以一个旧的单位职员名单为抽样框(3)国家杰出青年科学基金实施效果的评价(可否采用大众评估?)(4)哪些管理期刊在各个学科中是比较重要的?(让所有管理专家来评分?)应包括所有的目标总体的成员案例:《文学摘要》民意测验1936年美国总统选举F.D.Roosevelt(罗斯福)任美国总统的第一任期届满(民主党)A.Landon(兰登)Kansas州州长(共和党)经济背景:国家正努力从大萧条中恢复,失业人数高达九百万人。TheliteraryDigest《文学摘要》进行民意测验,将问卷邮寄给一千万人,他们的名字和地址摘自电话簿或俱乐部会员名册。其中240万人寄回答案(回收率24%)。预测结果:Roosevelt43%,Landon57%竞选结果:Roosevelt62%,Landon38%主要原因:选择偏倚——将一类人排除在样本框之外(当时四个家庭中,只有一家安装电话)不回答偏倚——低收入和高收入的人倾向不回答抽样框目标总体1936年美国总统竞选(Gallup的预测)样本容量3000人,在《摘要》公布其预测结果之前,仅以一个百分位数的误差预言了《摘要》的预测结果。利用一个约5万人的样本,正确地预测了Roosevelt的胜利。Roosevelt的百分数盖洛普预言《摘要》的预测结果44《摘要》预测的选举结果43盖洛普预测的选举结果56选举结果62方法:从《摘要》要用的名单中随机选取3000人,并给他们每人寄去一张明信片,询问他们打算怎样投票。大样本并不能防止偏倚:当抽样框不正确时,抽取一个大的样本并无帮助,它只不过是在较大的规模下,去重复基本错误。案例(P34):以固定电话为基础进行选民投票民调,没有考虑到只使用移动电话的用户——这些用户一般更年轻和热爱自由。2008年在奥巴马与麦凯恩进行的美国总统大选中,盖洛普、《华盛顿邮报》等民调组织都发现,如果不考虑移动用户,民调结果会有3个点的偏差;如果考虑进来,则只有1个点的偏差。鉴于此次大选的票数差距极其微弱,这个偏差就显得特别严重了。随机采样需要严密的安排和执行。一旦采样过程存在任何偏见,分析结果就会相去甚远。(一)设计抽样方案的基本原则(1)效果最佳原则:—在固定费用下,选取调查精度最大的方案;—在要求的精度下,做到调查费用最小。(2)可操作原则根据现有的数据条件以及时间进度要求,设计便于操作的抽样方案。8.4如何选取样本(3)代表性原则:样本尽可能对总体有很好的代表性调查者不根据主观意图挑选调查单位定额抽样:样本被精心挑选,以使在某些关键特征上与总体相似。例如:在St.Louis的访问人员访问13个对象,并规定其中s6人住在近郊,7人住在市中心;s男人7名,女人6名;s在男人中,3人40岁以下,4人40岁以上;1名黑人,6名白人。s6名白人支付的月租:1人支付的金额不少于44.01$3人支付的金额为18.01~44.00$2人支付的金额不超过18.00$年份预测共和党得票共和党实际得票偏差193644386194048453194448462194850455在规定定额内,访问人员可以自由选取任何人。有利于共和党的案例:Gallup1936~1948年采用定额抽样Gallup民意测验在1948年后总统选举中的记录(随机抽样:访问员无任何自主处理的权利)年份样本容量获胜候选人预测值选举结果误差19525385艾森豪威尔51.0%55.4%+4.4%19568144艾森豪威尔59.5%57.8%-1.7%19608015肯尼迪51.0%50.1%-0.9%19646625约翰逊64.0%61.3%-2.7%19684414尼克松43.0%43.5%-0.5%19723689尼克松62.0%61.8%-0.2%19763439卡特49.5%51.1%+1.6%19803500里根55.3%51.6%-3.7%19843456里根59.0%59.2%-0.2%19884089布什56.0%53.9%-2.1%(二)常见的抽样方法(1)简单随机抽样对北航学生的研究能力进行抽样测试。在北航全校学生中随机抽取n名学生。(2)分层抽样分层次抽样:专科、本科、研究生、博士、博士后。(3)整群抽样在本科生中,随机抽取若干个班,观察每个班的全部学生。(4)分段抽样全国调查,随机抽取若干省,再随机抽取若干市,再随机抽取若干区,...(5)非随机抽样在临沂农贸市场抽样,询问进货地点。编制抽样框很困难。原则:调查者不能根据主观意图挑选调查单位。而是在总体中,按照随机原则和纯粹偶然性的方法抽取样本。8.5简单随机抽样方法简单随机抽样:每一个容量为n的可能样本被抽到的概率都是一样的。方法:(1)抽签法(2)乱数表法(随机数字表)抽签法:先将调查总体的每个单位编上号码,然后将号码写在卡片上搅拌均匀,任意从中选取。抽到一个号码,就对上一个单位,直到抽足预先规定的样本数目为止。放回抽样无限总体有限总体无放回抽样简单随机抽样NN优点:可以获得一个无偏倚的样本使用限制:实施操作并不简单(1)保证样本点被充分搅拌均匀;或需要使用随机数表;(2)调查人员要寻找所有样本中的个体,有时是很困难的。(3)样本容量较小时,一些比例少但是很重要的个体不能入样,使样本的代表性受到影响。例如:在人民银行随机抽取100名职员,可能会抽不到高层管理人员。2007年全国有将近20万家出口企业。如果TBT调查在全国抽1000家企业,很可能会有许多大型企业不能入样。8.6系统抽样方法又称“等距抽样”或“机械抽样”特点:组织形式简单:不需要在抽样前对每一个单位进行编号。只要确定抽样起点和间隔,就可以确定整个样本单位。(1)按照无关标志排队,按间隔抽取例如:调查某企业职工收入时,按照姓氏比画排列职工名单,进行抽样。显然,职工工资与姓氏比画之间没有必然联系;(2)按照有关标志排队,按间隔抽取例如:进行农产量调查时,将总体单位按照上一年度的产量高低排序。这样,可以使标志值高低不同的单位均进入样本,样本单位在总体中分布均匀,抽样误差较小。(3)按照自然位置顺序排列,按间隔抽取例如:工业产品检验时,按照生产时间顺序,每间隔一定时间抽取一定数量的样本;检验一打发票时,可以按照顺序,每隔10张抽取1张;在估计果园的产量时,每隔7株抽取1株。方法:随机起点,等距抽取。(1)按照某种顺序给总体中的N个单元排列编号;(2)计算间距:(3)随机选取起始的样本点编号数。然后依次抽取编号如下的n个单元作为样本点。如果得到某编号数M大于N,则抽取的编号为(M–N)nNkknikikii)1(,,2,,总体N=60从此开始123456789101112131415抽中抽中161718192021222324252627282930抽中313233343536373839404142434445抽中抽中464748495051525354555657585960(10660K)71727374757样本n=6例如:中央电视台在建立收视率调查网时,要在某居委会拥有电视的512户中抽取5个样本户。在随机数表中任意确定一个三位数,例如是071。则被抽中的5户为:71,173,275,377,479如果开始的编号如果是135,则被抽中的5户的编号为:135,237,339,441,31其中:441+102=542543-512=311025512,5,512knN抽样误差的大小与总体单位的排列顺序有关:(1)如果总体中所有单元的排列编号是随机的,并且n比N小得多的话,那么等距抽样的精度和简单随机
本文标题:抽样调查方法MBA2014-抽样调查方法MBA2014
链接地址:https://www.777doc.com/doc-664371 .html