您好,欢迎访问三七文档
(一)简单随机抽样(simplerandomsampling)或纯随机抽样:是随机抽样技术中最简单的一种,它对调查母体不做任何分组、排队,完全凭偶然的机会从中抽取样本。第四章抽样设计技术三、随机抽样(randomsampling)或概率抽样(probabilitysampling):不依主观判断,而是随机选择样本,母体中每一个样本单位均有相同地位,各样本单位被抽中的概率完全相等,能用统计概率理论分析。(区别于随便)1、适用情况:样本单位差异不大;样本单位不多,且有完备名册.2、具体方法:抽签法和乱数表法(1)抽签法:先将母体中每一个样本单位按顺序编号,然后将号码写在卡片上搅拌均匀,任意从中抽取,抽到一个号码就确定一个对应样本单位,直到抽足预先确定的样本数。也可以利用摇码机,摇码机号码为0—9,对于母体单位数不足两位数的,一次只需摇一个号码;对于母体单位数为两位数的,则一次要连续摇两个号码,第一个号码作为十位数,第二个号码为个位数;其它情况依次类推。第四章抽样设计技术(2)乱数表法:乱数表是将0—9的10个自然数,按编码位数的要求(两位、三位、甚至十位等),利用特制摇码器(电子计算机),自动地逐个摇出一定数目的号码编成表,以备查用。表内任何一个号码出现,都具有同等可能性。479325118375875083981835376256740351837926382033401312172870620945174954962747094434176057384407425282075664782986162133757150109819675595165978632661674774047788065524577153171141031021071067075012055066039027082028068101079081048107066089097055108015009045111003两位数乱数表三位数乱数表第四章抽样设计技术479325118375875083981835376256740351837926382033401312172870620945174954962747094434176057384407425282075664782986162133757150109819675595165978632661674774047788065524577153171141使用乱数表:A、先要把调查母体样本单位加以编号,根据编号位数确定在乱数表中应该抽查的号码位数。例如,母体样本单位编号数为100以下,则在乱数表中按照一定顺序一次抽选连续两位数作为一个样本。在上述两个表中,如从表中第一个数开始,从左到右不间断地选择5个样本号码,则按左表得5个号码为41、11、17、、53、71;按右表得5个号码为00、31、11、04、50、09。又如,母体样本单位数为6位数以下,则从左表第一个数字开始,从左到右不间断地选择5个样本号码为41111、75371、57245、50688、77047。当然,如果母体单位数为两位数,则一般使用两位数的乱数表,如果母体单位数为三位数,则一般使用三位数的乱数表,其他情况类推。031021071067075012055066039027082028068101079081048107066089097055108015009045111003第四章抽样设计技术使用乱数表:B、抽取第一个号码没有任何限制,可以随机指定一个,然后按照随机设定的顺序,如上下左右顺序或按一定间隔顺序抽取样本;C、碰到超出母体样本单位数的号码应该舍弃,如果不是重复抽样,碰到重复号码应舍弃。479325118375875083981835376256740351837926382033401312172870620945174954962747094434176057384407425282075664782986162133757150109819675595165978632661674774047788065524577153171141例1,从94家上市公司中抽取不同的12家作为样本,先对94家公司编号从1到94,由于94为两位数,所以在乱数表中每连续的两个数字为一个样本号码,本例假设从下表第二行第5个号码开始,按从左到右顺序抽取样本号码为:59、16、55、67、19、10、50、71、75、33、21、86。第四章抽样设计技术3、优缺点(1)优点:A、母体有限且不大时,样本抽取方便,方法简单;B、由样本推断母体简单。(2)缺点:A、不易取得完整母体名册,或成本太大;B、母体样本单位数过多时,抽样不方便;C、样本分散,增加调查行政作业上的困难;D、样本差异过大时,样本代表性不足。(二)分层随机抽样(stratifiedrandomsampling):将母体按照某种属性分成若干不重叠的组群(层),再在各层中按某种方式抽取样本。要求:层与层之间有明显差异,而层内单位之间应尽量保持一致性;分层数目不宜太多;了解各层单位数以及其占母体单位数的比例。1、适用情况:母体内样本单位差异较大,但分层后,层间差异变大,层内差异变小。(总体具有非常明显的分层特性。)2、具体方法:均等配置、等比例分层抽样和分层最佳抽样第四章抽样设计技术例2:某地共有居民20000户,按收入高低分层为,高收入居民为4000户,占总体20%;中等收入居民为12000户,占总体的60%;低收入居民围4000户,占总体的20%。从中抽取200户进行购买力调查,则各层应抽取的样本数分别为:高收入层样本数目为200×20%=40(户)中等收入层样本数目为200×60%=120(户)低收入层样本数目为200×20%=40(户)(1)等比例分层抽样,按照各个层次样本单位数占母体单位数的比例分配各层应该抽取的样本数量,然后按照纯随机抽样方法或系统抽样方法抽取样本。(2)分层最佳抽样或非等比例分层抽样,不是按照各个层次样本单位数占母体单位数的比例分配各层应该抽取的样本数量,而是根据其它因素(各层平均数或成数标准差的大小、抽样费用大小、抽样工作量多少),调整各层的样本单位数。如按标准差大小调整各层样本单位数,则其计算公式为:第四章抽样设计技术其中:ni——各层应该抽取的样本单位数;n——样本单位总数;Ni——第i层单位总数;Si——第i层单位平均数或成数的标准差。仍以例2为例,假定估计的各层样本标准差见下表:收入层次各层单位总数(户)Ni各层样本标准差(元)SiNiSi高中低400012000400030020010012000002400000400000∑NiSi200004000000用样本标准差代替各层单位总数标准差按公式计算的各层应抽取样本数分别为:高收入层为200×1200000/4000000=60;中收入层为200×2400000/4000000=120;低收入层为200×400000/4000000=20如果考虑最佳成本,则公式为)/(/iiiiiiiCSNCSNnniiiiiSNSNnn(3)多次分层抽样第四章抽样设计技术3、分层抽样特点(1)优点:A、分层后,样本分布比较均匀,可提高估计准确度;B、各层可以根据具体情况采取不同的抽样方法;C、如果调查母体规模很大,则可在各层设立管理单位,以便调查。(2)限制性:A、分层特性的选择很关键;B、分层不能有重叠现象;C、相对简单随机抽样,资料整理与估计要复杂。(三)分群随机抽样或集群抽样(clustersampling):将母体区分为不同的群体,然后用纯随机抽样方法选定其中若干群,并对选中的群内每一个样本单位进行普查或再次分群或抽样。分层抽样分群抽样A、层数少,层间差异大,层内差异小B、各层至少有一个单位被选为样本C、只在每层中选部分样本D、目的在于减少误差,并提高样本估计可靠程度A、群数较多,群间差异小,群内差异大B、只有部分群体被选为样本C、在选中内进行普查或再次进行抽样D、目的在于降低抽样成本多段分群第四章抽样设计技术分层示意图aaaaaaaaabbbbbbbbbcccccccccabccbabaccbaabcbacbaccbaabc分群示意图优点:抽样工作简单,集中缺点:样本分布在特定群中,不能均匀分布在总体单位中,如果群与群之间差异较大,则误差较大。(四)等距抽样或系统抽样(systematicsampling):将母体的每一个单位按照一定标志编号排序,计算抽样间隔,[母体大小(N)/样本大小(n)],然后从1~N/n号码中随机选择一个号码作为起始号码,然后按照相等的间距抽选下去。系统抽样方法简单,适用于大规模抽样。局限性。如果第一个号码不是随机抽取,则系统抽样为非概率抽样无关标志与有关标志第四章抽样设计技术例3:某地有居民户880户,计划试用系统抽样法抽取80户作样本。第一步,对母体单位编号从1~880;第二步,确定抽样间隔为880/80=11;第三步,确定第一个号码,采用随机抽样(非随机抽样)确定第一个号码为10;第四步,确定所有样本号码,10、21、32、43、54、65、····879。(五)多阶段抽样:对于一些大规模调查,运用一次抽样可能达不到提高估计准确度或减低成本之目的,或效果不明显,还需要采取第二次或多次抽样。例如,要对某省农村家庭固定电话拥有量进行调查,第一阶段先抽取县市,第二阶段抽取乡镇,第三阶段再抽取村组或直接抽取家庭。多阶段抽样中,每一样本单位没抽中的概率是一样的。假定某省共有家庭20000户,包括县市10个,从中抽取1000户作为样本进行调查。各县市家庭户数见下表:若不能整除,四舍五入取整数第四章抽样设计技术县市母体数Ni累积母体数1*300030002150045003*250070004100080005120092006*36001280072000148008*33001810099001900010100020000第一阶段先从10县市中抽出4个,如抽取的县市为1、3、6、8(表*)第二阶段从抽取的4个县市中抽取同样数量的样本250户。对于每个县市,可以视情况采取不同的抽样方法直接抽取家庭户(前面已了解的方法)。或者,从每个县市中再抽取若干乡镇(第三阶段),再从抽取的乡镇中直接抽取家庭户。抽样方法除了上述介绍的随机和非随机抽样方法外,还有些由这些方法结合在一起的较为复杂的方法,第四章抽样设计技术四、抽样方法的选择:选择那种抽样方法主要考虑以下三个因素(一)对抽样误差大小的要求。在抽样单位数相等条件下,根据有关经验,一般来说抽样误差由小到大排列为:按有关标志排队的系统抽样;分层抽样;按无关标志排列的系统抽样;简单随机抽样;集群抽样。另外,重复抽样误差大于非重复抽样。(二)调查对象本身的特点。如对调查对象母体及其每一个个体是否有全面详细的资料。调查对象个体的差异化程度。(三)人力、物力、经费和时间约束。在具体实际调查中,往往不是运用单一方法,而是多种方法的结合,或者是运用多阶段抽样。第四章抽样设计技术五、推断调查母体(一)抽样误差1、误差有关概念调查误差登记误差代表性误差调查结果和客观实际情况的出入和差数由于抄写、记录、计算的过错而引起的误差由于选取调查个体对总体的代表性不足而产生的调查误差违背抽样随机原则,人为选择偏高或偏低个体进行调查而产生的误差系统性误差抽样误差不违背抽样随机原则下,因为个体与母体的差异必然要出现的误差平均抽样误差:在抽样调查中,从同一母体中可以抽取很多不同的样本组合,不同样本组合的样本容量可以相同或不同,而每一样本组合的平均数可能不同,从而其离差平方和不同(抽样误差差不同),所有样本组合的抽样误差的平均数就是平均抽样误差列如要从有20个样本单位的母体中抽取5个样本,随机抽样的结果可能是2、5、9、13、18,也可能是1、7、9、12、18,等等组合,不同的组合的标准差是不同的(二)影响抽样误差大小的因素:(1)个体标志值之间差异程度;(2)样本大小;(3)抽样技术与方法思考题(一)某市区居民家庭共12万户,于本年12
本文标题:市场调查006
链接地址:https://www.777doc.com/doc-1551969 .html