您好,欢迎访问三七文档
第一节抽样调查中的有关概念在进行抽样设计的过程中,常常要涉及以下一些基本概念:一、总体总体是指调查对象的全体,亦即通过调查要了解、研究的全部市场对象。例如,假设要调查衡阳市有多少家庭拥有电脑,拥有电脑的家庭与没有电脑的家庭有什么区别,那么调查总体就是衡阳市的所有家庭。第三章抽样调查样本是由总体中抽取的部分个体构成。每一个被抽到的个体或单位,就是一个样本。例如上面讲的衡阳市家庭电脑拥有率的调查中,被抽到的家庭就构成该项调查的样本,每一个被抽到的家庭就是一个样本。样本中包含个体的数量,就是所谓的样本量。在调查实施之前,样本量事先确定。二、样本和样本量为了便于实现概率抽样,常常将总体划分为若干个互不重叠的部分,每个部分都叫做一个抽样单元。例如,在衡阳市区进行概率抽样,可以把衡阳市区分成几个行政区(如蒸阳区、雁峰区等)作为一级抽样单元,再进一步按街道划分为二级抽样单元,二级抽样单元还可以进一步划分下去。抽样时,给每一个抽样单元赋予一个被抽中的概率,这个概率可以是相等的,也可以是不相等的。三、抽样单元在样本设计时,必须有一份全部抽样单元的资料,这份资料就叫做抽样框。如人员名单、地图、电话簿、户口档案、企业名录等都可以作为抽样框。在抽样框中,每个抽样单元都应该有自己对应的位置或序号,这常常通过编号来实现。四、抽样框样本是总体的一部分,虽然有代表性,但并不等于总体。因此从样本得出的结果估计总体总是会产生一定误差,这种由抽样引起的误差就叫做抽样误差。抽样误差越小,估计值的精度就越高。抽样误差是客观存在的但是抽样误差的大小与抽取的样本能否代表总体有密切的关系。为了使抽样误差减小,要尽可能的使样本的结构与总体的结构相一致。五、抽样误差和非抽样误差非抽样误差是指在抽样调查中由于人为因素造成的误差。这种误差是由研究者、访问员和受调查者造成的。例如由于调查方法不当引起的受调查者的反应不当;访问员工作不认真、不仔细所造成的记录错误;受调查者拒绝配合或不认真作答等等。这类误差是无法测量的,但它可以通过诸如加强对访问员的培训,提高调查人员的素质,采用合理的资料采集手段方法,设计高效的问卷等手段来克服。六、抽样调查抽样是一种选择样本的程序和方法。抽样调查,是指从市场母体中抽取一部分子体作为样本对样本进行调查,然后根据样本信息,推算市场总体情况的调查方法。抽样调查是广告营销调查中应用最多的方法,它具有以下明显的特点:(1)可以节省调查费用(2)在科学选取样本的前提下,可以比较准确地推断总体(3)应用范围广泛,特别适用于研究市场现象的数量表现;第二节抽样调查的基本程序抽样调查,特别是随机抽样,有比较严格的设计程序,只有按一定步骤,才能保证调查的顺利完成,取得应有的效果。抽样调查一般分为以下几个步骤:一、确定调查总体和抽样单元二、确定置信度和最大允许误差三、确定样本数量四、选择抽样方式进行抽样五、收集样本资料计算样本指标六、用样本指标推断调查总体指标置信度指由抽样调查结果来推断总体情况时,保证其抽样误差不超出允许范围的概率水平,抽样推断可靠程度有高低之分,通常用%表示。在抽样调查中,置信度通常为90%,95%和99%。对于置信度与抽样误差之间的关系,在数理统计中,常用正态分布来描述它,即在抽样误差前乘以t,并使置信度成为t的分布函数F(t),将两者关系对应起来建立正态分布概率表,以便使用时查找。这样任何一个置信度都可以查到对应的t值。如上面提到的90%、95%、99%,所对应的t值分别是:1.65,1.96,2.58。同样任何一个t值也可以查到对应的置信度。t=1时置信度为68.27%,t=2时置信度为95.45%。确定置信度和最大允许误差之间的关系第三节随机抽样调查随机抽样是按照随机原则在调查母体中进行抽样。这里的随机原则是指保证母体内每个样本被抽取机会都均等的原则。又称“均等原则”。随机抽样方法多种多样,其中最主要的有简单(单纯)随机抽样、分层随机抽样与分群随机抽样。(一)简单随机抽样简单随机抽样的指在抽样过程中,抽样人员完全排除了任何有目的选择,采用纯粹偶然的方法从调查母体中抽样。1、抽签法抽签法(又称丢骰子法)是简单随机抽样中一种常用方法。2、随机号码表法(随机数表示)随机数又称乱码表。它由摇码机逐个摇出或电子计算机自动生成的一组按二位数(或三位)从0—9十个自然数的组合表。随机号码表最早出现在英国,后来在其他国家得到广泛的应用。拟在900人中抽取20个样本,可以从下表中任何一个数字开始从左到右,从上到下,连续(或间隔相同位数)进行抽样。1622779439844217536163016378593321123429576086324418180792462662389775234240647462362819953785943512495443548257245506881695556719786456078209472796544417165809841607449982977777815092261197833950083017379323787704744767981050717562420744384017460962798386196283114632240745321408005676313842340796888735209643217633502512867358071551001342905284772706765003102014858845329894077280220253535442068798随机号码表(乱数表)简单随机抽样是随机抽样的最基本的方法,也是其他随机抽样法的基础。优点:方法简单,易于理解,直接从总体中抽取样本,抽取概率相同,计算抽样误差及总体指标比较方便。不足:总体很大的情况下使用,编号工作量繁重;当总体单位差异程度较大时,必须使样本数目足够大才能保证样本推断总体的可靠程度和准确程度;所抽取的样本在总体中的分布或过于集中而不具有代表性,或过于分散而给实际调查带来困难。分层随机抽样是先将总体按一定标准分层,然后在各层中采用简单随机抽样方式抽取样本的一种抽样方式。由于事先对调查母体进行分层,所以,这种抽样方法的实质是分层加简单随机抽样,它可以提高抽样结果的代表性。常用的分层随机抽样的形式有分层比例抽样和分层最佳抽样。1、分层比例抽样分层比例抽样是指分层以后,按各层占母体比例份额,用简单随机抽样方法进行抽样的一种方法。计算公式如下:二、分层随机抽样分层比例抽样计算公式:ni=(Ni/N)×nni:第i层应抽取的样本数Ni:第i层样本总数N:调查母体的样本总数n:设定的样本数分层比例抽样法适用于各层具有明显差异,各层内部具有较好一致性,各层在母体中所占比例不过分悬殊的市场母体的调查之中。N【例题1】某地区有百货商店10000户,其中大型、中型与小型百货商店分别为1000、2000、7000户,当抽样数为200户时,若用分层比例抽样法应从各层中各抽多少个样本?大型:n大=1000/10000×200=20(户)中型:n中=2000/10000×200=40(户)小型;n小=7000/10000×200=140(户)2、分层最佳抽样(非比例抽样法)分层最佳抽样是指在分层比例抽样的基础上,再根据各层样本标准差的大小,而调整各层样本数的一种抽样方式。计算公式:ni=(NiSi/∑NiSi)×n【例题2】某公司要预测某地区家用电器的潜在用户,这种商品的消费同居民收入水平有关,因而以家庭收入为分层基础。假定该地区居民户即整个母体数为1887户,已确定样本数为200户,家庭收入分高、中、低三层,其中收入高的家庭户为75户,中等收入的家庭为755户,低等收入的家庭为1057户。试用最佳比例抽样法确定各层的样本数。公式中:ni:各层应抽出的样本数目n:样本总数目Ni:第i层的调查单位数Si:第i层的调查单位的样本标准差提示:根据经验,估计高收入层的收入离差为5000元,中收入层的收入离差为3000元,低收入层的收入离差为1000元。(1)求高收入层样本的标准差根据标准差公式有:S高=√50002/200=353元S中=√30002/200=212元S低=√10002/200=71元(2)求各层最佳抽样的样本数根据计算公式有:n高=(N高S高/∑NS)×n=(75×353/26475+160060+75047)×200=20(户)其中,∑NS=N高S高+N中S中+N低S低=261582同理依次可得出中、低收入的样本数为122户和58户。某部门要调查城市居民家用电器潜在的需求数量,这种商品的消费量与居民收入水平相关,且总体中基本单位之间差异较大,因此应先按家庭收入作为分层标准分层。假定该市居民户即调查总体中含家庭总数100万户,已确定计划抽取样本1000个。家庭收入按高、中、低分层,其中高收入户为15万户,中等收入户为65万户,低收入户为20万户。试用最佳比例抽样法确定各层的样本数。(假定标准差估计值为,S高=300,S中=200,S低=50,)【练习】:层每层中调查单位总数(Ni):万各层中标准差估计值(Si)积(NiSi):万高153004500中652001300低20501000合计18500分层抽样的优点:1、由于总体中常有少数特殊单元,在简单随机抽样得到的样本里,这些特殊单元所占的比例容易过高或过低,从而影响估计量的精度。分层抽样可以将这些特殊单元作为一层,尽量避免上述情况,使样本更具有代表性;2、可以根据需要对各层的特性加以比较;3、从管理和实施上看,比简单随机抽样便利得多。二、分群随机抽样分群随机抽样是将市场调查母体划分为若干个群体,然后将若干群体作为抽样样本,采用单纯随机抽样方法确定并对选定群体内的全体样本进行普遍调查的一种方法。分群随机抽样与分层随机抽样的区别在于:分层随机抽样要求层间异质,层内同质;而分群随机抽样正好相反,它要求群间同质,群内异质。以居民收入为例,分层随机抽样与分群随机抽样见下图所示。高收入层低收入层中收入层高、高、高高、中、低A群中、中、中低、低、低高、中、低高、中、低B群C群分层随机抽样构成分群随机抽样构成非随机抽样是指抽样时不遵循总体中每个单位都有客观相等的被选中机会的原则,而是按照调查人员主观的判断或标准抽选样本的抽样方法。常用的非随机抽样法主要有:任意抽样法、判断抽样法、配额抽样法、系统抽样法。第四节、非随机抽样一、任意抽样法(ConvenientSampling)任意抽样法也称便利抽样法,是一种任意选取样本的方法。街头拦人法和方便选择法是任意抽样法的两种最常见的方式。优点:(1)无须精心选取样本(2)能及时获得所需的信息(3)省时、省力,节约调查支出二、判断抽样法(JudgementSampling)判断抽样法也称目的抽样法,是由调查人员根据主观经验判断而选择调查样本的一种非随机抽样方法。常用判断抽样法有典型抽样调查法和重点抽样调查法两种。优点:(1)抽样简便易行(2)调查回收率高调查人员根据调查母体某些属性特征进行分层,对分层后的各次副母本进行配额,配额内的样本抽取由调查人员主观判断抽样的方法。是非随机抽样中使用最广泛的一种抽样方法。按分配样本数量的不同的不同方法,配额抽样法可分为独立控制和相互控制两种类型。1、独立控制配额抽样2、相互控制配额抽样三、配额抽样法(Quotasampling)1、独立控制配额抽样独立控制配额是指只规定集中控制特性以及各控制特性的抽样配额,而不规定这几种控制特性之间的各抽样配额的相互关系,即控制特性的抽样配额是彼此独立的一种非随机抽样方法。【例题】用独立控制配额抽样法调查某品牌服饰的市场需求状况。计划抽取400人,按收入、年龄、性别特征分层,如下表所示。收入水平人数年龄段人数性别人数高收入8018-34岁80男20035-44岁120中收入12045-60岁140女200低收入20060岁以上60∑400∑400∑400表一:独立控制配额抽样表2、相互控制配额抽样相互控制配额抽样,又称交叉控制配额抽样。指在分层时,严格规定各控制特性的抽样比例,而且
本文标题:第三章抽样调查
链接地址:https://www.777doc.com/doc-419970 .html