您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 市场营销 > 山西通信市场抽样调查样本量配置方法
山西通信市场抽样调查样本量配置方法作者:***关键词:市场调查样本量配置方案摘要:本文从市场调查的实践出发,结合通信市场用户的消费特征和实施调研的数据统计过程,系统地整理并提出了样本量配置的分布表,并在两项有关电信市场的调研中进行了实践,取得了满意的效果。本文的主要结论对现实的市场研究具有较高的参考价值和简易的可操作性,同时可以很好地保证样本的精确程度,减小抽样误差。无论是全面调查还是抽样调查,样本产生的误差都是不可避免的。因此,为了获得较高精度和较高可靠性的数据,与误差作斗争就成为市场调研最大的课题之一。依照传统的理论习惯,人们在研究实践中通常采用调整样本量和改进抽样技术的方法来减小误差和提高调研的精确度。但问题是,虽然我们可以用较大的样本来弥补抽样技术的误差,用足够多的样本数来保证市场数据的真实可靠,但委托方对样本量增多而带来的调研成本的提高也非常敏感,调研的经济约束要求我们用最少的样本数来达到最大的抽样精确度。一、影响样本量的主要因素在市场调研实践中,样本量是关系到调研精确度和市场研究公司效益的一项重要指标。确定样本量是抽样方案的一个重要内容,也是实施抽样前必须解决的一个问题。样本量过大,会使调查费用显著增加,人力及管理费用加大,从而也难以体现抽样调查的优越性;样本量过小,又会使样本对总体的代表性降低,增大抽样误差。因此,解决抽样设计中的样本量问题至关重要。从统计学的角度来看,影响样本量的因素主要包括置信度和允许误差。简言之,置信度是对抽样估计可靠性的度量,允许误差是指事先要求与一定的置信概率相对应的抽样误差的最大范围,它是对抽样估计的精确度提出的要求。另一方面,就具体的调研项目而言,项目的总预算费用又构成了样本量的一个上限。容量过大就会突破预算约束,导致超支,这是受托方风险。设经费总额为c,费用函数可以表示为其中,为固定费用,与样本量无关;为平均每一样本单位需要的调查经费。由此解出的样本量,可以作为经费约束的一个基本条件。二、简单随机抽样样本量的测度方法1.基本公式在简单随机抽样的条件下,我们所使用的确定调查样本量的公式为:其中:n代表所需要样本量;Z表示置信水平下的Z统计量,如95%置信水平的Z统计量为1.96,99%的Z为2.68;S代表总体的标准差;d代表置信区间的1/2,在实际应用中就是容许误差,或者调查误差。对于比例型变量,确定样本量的公式为:其中:n表示样本量;z表示置信水平下的z统计量,如95%置信水平的Z统计量为1.96,99%的为2.68;p表示目标总体的比例期望值;d表示置信区间的半宽,即调查误差。2.公式的应用一些参数是我们可以事先确定的:Z值取决于置信水平,通常我们可以考虑α=95%的置信水平,那么Z=1.96;或者取α=99%,Z=2.68。然后可以确定容许误差d(或者说精度),即我们可以根据实际情况指定置信区间的半宽度d。因此,公式应用的关键是如何确定总体的标准差S。如果我们可以估计出总体的方差(标准差),那么我们可以根据公式计算出样本量。比如,要了解某城市的居民收入,假定我们知道该市居民收入的标准差为1000,要求的调查误差不超过100元,则在95%的置信水平下,所需的样本量为即需要调查的样本量为385个。3.最大样本量的讨论以上公式只是理论上的,在实际调查中确定合理的样本量,必须考虑多方面的因素。首先,由于人们通常缺乏对标准差的感性认识,因此对标准差的估计往往是比较困难的。总体的标准差是123,还是765?如果没有一点对样本的先验知识,那么对标准差的估计是不可能的。好在我们通常能对变量的平均值进行估计,如我们通过历史资料估计该地区目前的年人均收入大致为10,000元,那么根据统计学知识,我们引入变异系数的概念:变异系数V=标准差S/平均值X=1因此,我们知道人均收入的标准差应该小于平均值,就是说标准差应该在10000以下。当然,这对于我们确定样本量还不能起太大的作用。如果我们采用相对误差表述的精度,我们有其中P表示相对误差根据上述公式,我们可以计算在相对误差一定的情况下,所需的最大样本量。以下是在置信程度95%的水平下,在不同相对误差下的最高样本量:相对误差1%2%3%4%5%10%20%样本量384169604426824011537385104通常,变异系数为1的情况是很少见的,根据本人对市场研究中经常遇到的情况,变异系数多在50%以下,因此,实际所需要的样本量可以进一步缩小。对于比例型变量,在事先缺乏对比例的估计时,我们可以采用最保守的估计法,即p=0.5,以下是比例p在不同绝对误差程度下,所需的最大样本量(95%置信水平):p的绝对误差0.010.020.030.040.050.10所需最大样本量960424011067601385964.实际调查样本量的确定原则虽然我们根据公式可以从理论上确定样本量的上限,但是由于实际工作的经费和时间限制,使用最大样本量的可能性很小。而且,实际研究的情况通常要复杂得多,一项研究往往要考虑多个目标,即要求对多个指标的误差进行控制,而不是简单地考虑一个指标。因此我们在实际的市场研究中,必须综合考虑,采用多种方式来确定样本量。(1)调查的主要目标一个现实的市场调查往往有多个目标,对于一些目标单一的调查,调查的样本量往往可以很少,比如100个,甚至50个就足够了。而对于具有多个目标的研究,必须考虑这些目标中变异程度最大,要求精度最高的目标。(2)分类比较的程度分类是市场研究中一个最基本的方法,研究者往往是通过分类来发现细分市场,确定产品的市场定位等。假定对同一变量(研究目标),在一定精度与置信程度下,只要100个样本量就足够了,如果我们仅仅希望了解不同性别的消费者市场,则确定样本量时只需要考虑两类消费者的样本量,这样调查的总样本量可能需要200个以上,如果希望了解不同年龄层的消费者,则可能要将消费者分为多类,如分为:20岁以下,20-35,35-50,50岁以上等四类,这样的样本量需要400个以上。也就是说,确定样本量时必须考虑到每一类别的样本量。(3)调查区域的大小根据常识,调查区域越大,所需要的样本量可能越大,因为大区域内的样本变异程度通常较难掌握。此外,在实际研究中,我们还往往需要对大区域进行进一步分类,以寻求更加准确的市场细分。比如,对柯达胶卷进行的调研在北京的取样明显应高于太原。三、山西联通市场调研的抽样设计分配表山西联通是中国联合通信集团公司的全资子公司,负责经营山西省各地市的综合电信业务。该公司十分注重市场调查,对市场调研的精度和深度都有一定的要求。2003年6月实施的山西省联通用户综合业务调研中,样本的设计具有一定的科学性。本文给出了本次调查计划中全省范围市场调查的样本配置方案,以资参阅。设p为本次调查总体的任一比例值,为其估计值,要求则样本大小n可以计算如下:误差d置信度1-α样本大小n误差d置信度1-α样本大小n0.070.901380.030.950.960.970.980.99106711721308150918420.060.901880.050.950.960.970.980.993854224715436630.020.950.960.970.980.99240126372946339341450.040.950.960.970.980.9960166073684910360.010.950.960.970.980.99960410548117731357316577假设在95%的概率保证下,最大误差不超过2%,可取的一个样本方案是2401。我们考虑到山西省各地市人口数量的差异,采用比例配置法把全部样本依照比例分摊到各个地市。结果如下表:地区人口(万人)人口比例样本数n修正样本数m太原市29300000.09491416227227大同市26900000.08713962209209阳泉市12200000.0395205794138长治市30600000.09912536238238晋城市20600000.06673145160160朔州市13200000.04275996102138忻州市28200000.09135083219219离石市32800000.10625202255255晋中市29600000.09588597230230临汾市38400000.12439261298298运城市46900000.1519274436436430870000124012476我们注意到,阳泉市和朔州市的样本均在138以下,也就是说,这两个地市的抽样精度还达不到90%的置信度,而最大误差则超过了7%。因此,我们对这两个地市的样本数量进行修正,均提高到138,以满足各个地市调查数据可以独立的要求,此时,两个地市的抽样概率置信度都达到了90%,最大误差控制在7%以下。调整以后的样本列在表的最右边一列。这时,样本总数达到了2476个。注记:1.通过对方差的估计,采用公式计算所需样本量,主要采用两步抽样,即在调查前先抽取少量的样本,得到标准差S的估计,然后代入公式中,得到下一步抽样所需样本量n;如果有以前类似调查的数据,可以使用以前调查的方差作为总体方差的估计。2.根据经验,确定样本量的主要方法有:如果以前有人做过类似的研究,初学者可以参照前人的样本。如果是大型城市、省市一级的地区性研究,样本数在500-1000之间可能比较适合;而对于中小城市,样本量在200-300之间可能比较适合;如果是多省市或者全国性的研究,则样本量可能在1000-3000之间比较适合。3.作为一个常识(主要是为了显著性检验),要进行分组研究的每组样本量应该不少于30个。4.通过调研设计所作的研究,可以采用较小的样本量。如产品试用(留置)调查,在经费有限的情况下,可以将每组的样本量降低至15个左右,最好每组在30以上。此外,我们在多次的实际研究中发现,每组样本超过50个可能是一种资源浪费
本文标题:山西通信市场抽样调查样本量配置方法
链接地址:https://www.777doc.com/doc-1551745 .html