您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > 市场调查资料整理与分析
主讲雷思友副教授/硕导/工商管理系主任Bequiet!Shutyourmouth!!Marketsurvey&Forecast市场调查与预测主讲:雷思友系主任/副教授/硕导安徽理工大学经济与管理学院工商管理系2014年8月第一节市场调查资料的整理通过市场调查取得的资料反映的是调查对象各单位的具体情况,它们是分散的、表面的和零碎的,而且精粗并存,真伪混杂,不能说明事物的全貌。要说明调查对象的总体情况,揭示其总体特征、变化发展过程和本质联系,还需要对这些调查资料进行去粗取精、去伪存真、由表及里、由此及彼的加工整理和分析。一、调查资料的度量尺度市场调查资料按照下列度量尺度中的一种方式收集:定类尺度、定序尺度、定距尺度和定比尺度。度量尺度决定了资料中蕴含的信息量,表明非常适合于应用的资料整理和分析方法。1.定类尺度当资料是用来确认被调查者的品质特征或名称时,所采用的度量尺度叫做定类尺度,或称为名义尺度(nominalscale)。2.定序尺度定序尺度是指当资料既具有定性尺度的性能又需要按照先后顺序或赋予一定的顺序来排列。3.定距尺度定距尺度是指当资料具有定序性能,并以特定的计量单位表示的观测值之间的一段距离。4.定比尺度定比尺度是指资料具有定距尺度的所有性能,并且有必要用两个数值的比例来表示,这种资料的度量尺度就是定比尺度。市场调查资料的整理依据市场调查整理方案进行。市场调查资料整理内容如下:1、对调查资料进行审核、订正;2、剔除异常数据、缺漏数据;3、根据市场调查的目的、要求对获得的资料进行分类或分组并汇总;4、将汇总的资料用图表的形式简明扼要的表示出来。5、用表格或图形等形式,将整理过程的市场调查资料简明扼要、系统有序地表现出来。三、市场调查资料的审核(一)完整性主要审核被调查的单位是否全部被调查,调查问卷或调查表中的各项目是否都填写齐全。如果发现单位漏查或项目漏填的情况,必须查明原因,采取切实有效的措施补全应填而未填的空白表格或项目;如果问卷中出现“不知道”的答案所占比重过大,应采取适当的措施处理并加以说明,以免影响市场调查资料的完整性。(二)准确性主要审核调查资料的口径、计算方法和计量单位等方面是否符合调查设计的基本要求。准确性审核所使用的方法主要有:经验判断法、逻辑审核法和计算审核法。经验判断法就是根据审核人员已有的实践经验和理论素养,判断市场调查资料的真实性和准确性;逻辑审核法主要审核调查资料的内容是否符合逻辑,项目之间是否又有前后不一致或相互矛盾的地方;计算审核法主要通过数据的计算,审核定距资料或定比资料项目之间是否保持资料固有的数字联系和平衡关系。通过逻辑审核和计算审核相结合,对审核中发现的不准确的调查资料,应查明原因,进行反馈和订正。(三)及时性审核主要审核各个被调查对象是否都按规定的日期填写、送达调查问卷或调查表和填写的资料是否是最新的。由于市场变化越来越快,只有收集市场最新状态的信息才能最大限度地满足预测与决策的要求。在市场调查结束后,对所有的调查问卷或调查表都必须进行审核,通过审核将无效的或不能接受的调查问卷或调查表退回使之重新调查,或视为缺失数据或放弃不用。无效的问卷或调查表主要包括:回答不完全(相当多的问题没有填写答案、错答了问卷、或没有按照要求回答问题、缺页的问卷或调查表格)、在截止日期之后收回的问卷或调查表等。四、市场调查资料的清洁(一)判断是否有异常数据判断异常数据的方法可以凭借审核人员的工作经验与实践用逻辑分析进行,也可以用滤波方法进行。滤波方法是利用正态分布确定数据允许在合理范围,超出该范围的数据视为异常数据。数据合理允许范围可用下列式子表示:.,,)()(样本的标准差样本的序列数据均值数据允许的上限和下限下上下上SYYKSYYK值由下表查得,它由n、P1和P2三个参数决定:n为样本单位数;P1为置信度,通常采用0.95和0.99;P2为数据落在区间内的概率。),(KSYKSYP10.950.990.990.9990.990.999101520253035404550604.433.883.613.463.353.273.213.163.133.075.654.954.614.414.284.184.104.043.993.925.594.604.163.903.733.613.523.443.383.297.135.885.314.994.774.614.494.404.324.21P2Kn某地区连续30年降雨量资料分别为:(单位:mm)1243123612301240125112661273125213011274124512751264128213101304132313521845162813501347132813261333137113441320138313831360现要求按95%的可靠度,使99%的数据落在允许的范围内,试找出异常数据。解:n=30,=1330,S=123,P1=0.95,P2=0.99,查表得K=3.35,Y95.91712335.3133005.174212335.31330KSYYKSYY下上则正常数据的区间为(917.95-1742.05),可知1845为异常。(二)对有残缺数据序列进行加工对异常数据的处理,通常要在定性分析的基础上,结合序列数据的具体情况采用不同的方法加工处理。常用的方法有:1.剔除法当非时间序列数据较多,对不合理的异常数据可以剔除掉.2.插补法当时间序列数据较少时,剔除掉不合理的异常数据后可根据序列散点图所显示的数据变化趋势,用相应的方法补齐所缺数据,具体做法如下:(1)当散点图呈水平变化趋势时,异常数据可用算术平均代替。(2)当散点图呈线性变化趋势时,异常数据可用其前后的算术平均代替。(3)当散点图呈非线性变化趋势时,异常数据可用前后两数据的几何平均代替。3.口径调整法有些序列数据虽然异常,但经过分析后,这些数据能够反映调查对象的未来发展趋势,如行政区变更(指标计算口径、计算方法、计量单位变更、市场开放与保护等变更引起的近期数据跳跃性波动等)。显然,这种异常数据非但不能被剔除,还必须作为基础数据,并以此数据的口径来调整其他历史数据,形成新的序列数据。某地区各年度水泥销售量如下表单位:万元年份1998199920002001200220032004调整前某地销售量某县销售量调整后某地销售量11521136113221331172314012526151130281581922919219830198从上表可以算出,在调整前某地销售量自2003年后的销售量出现了跳跃性的增加,为异常数据.经过调查了解到,从2003年起,该地区行政划分发生了变化,增加了一个县.故2003、2004年的数据是正常的,应保留。4.残缺数据修补法在调查数据较少,残缺数据不止一个,或有连续若干个异常数据或数据空缺时,不能简单剔除残缺数据,可用均值替代法、回归估计法、随机抽取法、近距离确定法等修补残缺数据。均值替代法是使用变量的平均值替代其中某些异常值或缺失值。这种修补法的优点是能保持变量均值不变,变量的其他统计量(如标准差、相关系数)因此受到的影响也较小。回归插值法回归插值法是根据现有的数据,分析该变量与其他变量之间的联系,建立回归模型,然后根据被调查者对其他变量的回答,估计残缺资料的取值。(例如,估计居民家庭对某种消费品的购买量,可依据现有资料建立购买量与家庭人口数、家庭可支配收入之间的回归模型,然后把被调查者填报的家庭人口数、家庭可支配收入作为自变量代入回归模型估计出该家庭对该种消费品的购买量)。随机抽取法、近距离确定法都是依照某些规则指定其他被调查者的填报值替代异常值或缺失值的资料修补方法。资料分组,是根据市场研究的需要,按一定的标志,将研究资料划分为若干个组的整理方法。通过分组,使得同一组内的各数据在分组标志上具有同质性,不同组之间的单位具有差异性。因此,通过分组可以区分市场的类型、市场内部结构。(一)分组标志的选择对市场调查资料分组的关键在于正确地选择分组标志。分组标志就是进行分组的标准或依据。分组标准选择是否正确,是资料分组能否发挥其作用的基本前提。分组标志一旦确定,在整理中就会突出单位在该标志下的差异,而掩盖了单位在其他方面的不同。因此,同一调查总体由于选择的分组标志不同,由此得出的认识结论也会有所不同,甚至是相反的结论。为此,在进行分组是应遵循以下原则选择分组标志:1.依照调查研究的目的选择分组标志对同一研究对象的总体,由于研究目的不同,需要采用不同的分组标志。例如,研究某地区的消费品零售市场时:(1)研究的目的是分析某种商品的市场供应结构,分组时应采用消费品的生产厂商或品牌作为分组标志;(2)当研究目的在于分析该种商品的消费结构,分组标志应选择居民的户型或收入水平等。总之,根据不同的研究目的,选择合适的分组标志,才能使分组资料更好地满足进行研究的需要。2.选择分组标志应当反映现象本质特征反映事物的差异的标志很多,分组时应当抓住反映其最具本质区别的关键性标志作为分组标志。例如,在研究投资的规模效益时,对简单劳动密集型企业的规模分组标志应当选用职工人数;对资金密集型企业的规模分组标志应当选用固定资产原值等。例如,要获取某地区零售消费品市场规律时:(1)当研究目的是某种商品的市场供应情况,分组时应当选用某种消费品的生产厂商或品牌作为分组标志;(2)当研究目的是获取某种商品的消费结构,分组标志应当选择居民的户型或收入水平等。总之,不同的研究目的,选择不同的分组标志,才能使分组资料更好地认识市场变化规律。3.结合历史条件和经济状况,选择分组标志事物都处于不断地发展和变化之中,在不同阶段研究对象所表现出的性质和特征都会有所不同。因此,在进行分组时,必须用动态的观点选择分组标志。这一点在研究历史资料,进行时间序列分析和预测中需要特别注意。(二)资料分组的方法。常用的资料分组有:品质标志、数量标志分组方法。1.品质标志分组当资料的度量尺度是定类尺度或定序尺度,这些资料反映调查对象的性质或品质,在对各单位分组时可采用按品质标志分组。(1)按类别分组例如,按照企业进行产品宣传的媒体类别标志分组,可划分为:招贴、报刊杂志、广播、电视、互联网等;例如,居民按文化程度标志分组,可划分为:大学、大学以上、高中、初中、小学、文盲和半文盲等。(2)按品质分组例如,人口按照性别标志分为男、女两组;例如,企业按照组织形式标志分为个人业主企业、合伙制企业、股份制企业、合资企业等均属此类。2.数量标志分组当资料的度量尺度是定距尺度或定比尺度,则这些资料反映调查对象是数量特征。例如,居民的生活水平分组,按照居民家庭的恩格尔系数标志分为:在60%以上居民家庭归为贫困家庭;在50%~60%的家庭归为温饱家庭;在40%~50%的家庭归为小康家庭;在40%以下的家庭归为富裕家庭。由于,按数量标志分组时,有时组与组之间的界线不直观,因此在分组时应注意:第一,各组的数量界限能反映各组的差别。例如,对合同履约率不能把90%和100%合并为一组,这是因为这个数字对要约方具有十分不同的意义。第二,根据资料的分布情况,采用适当的分组方式,确定组距和组限。单项式分组是离散型变量,且其表现值只有有限的几个。例如,对城市家庭按照儿童数量分组,可分成0、1、2、3等组。组距式分组是将变量值按照数值大小依次划分为几个区间,每一个区间内的所有变量值归为一个组。组限上限和下限统称为组限。组距各组区间的距离称为组距。例如,上述温饱家庭组的恩格尔系数50%和60%分别是该组的下限和上限,组距为10%。间断组距分组在组距式分组中,相邻组的组限不重叠的分组称为间断组距分组。例如,儿童按年龄分组分为:不满1岁、1~2岁、3~4岁、5~9岁、10~14岁。对于离散型变量的取值是不连续的分组,也可采用间断组距分组。例如,对企业数、员工人数、设备台数等用实物单位计量的变量均可用间断组距分组。连续组距分组在组距式分组中,相邻组的组限重叠,即上一组的上限为下一组
本文标题:市场调查资料整理与分析
链接地址:https://www.777doc.com/doc-1556007 .html