您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > 第六讲 调查资料的整理与分析
1第六讲调查资料的整理与分析2案例:杜邦公司的“市场嘹望哨”杜邦公司创办于1802年,是世界上著名的大企业之一。经过近200年的发展,杜邦公司今天所经营的产品包括:化纤、医药、石油、汽车制造、煤矿开采、工业化学制品、油漆、炸药、印刷设备,近年来又涉足电子行业,其销售产品达1800种之多,多年的研究开发经费达10亿美元以上,研究出1000种以上的新奇化合物——等于每天有2件至3件新产品问世,而且每一个月至少从新开发的众多产品中选出一种产品使之商业化。杜邦公司兴盛200年的一个重要原因,就是围绕市场开发产品,并且在世界上最早设立了市场环境“嘹望哨”—经济研究室。成立于1935年的杜邦公司经济研究室,由受过专门培训的经济学家组成,以研究全国性和世界性的经济发展现状、结构特点及发展趋势为重点,注重调查、分析、预测与本公司产品有关的经济、政治科技、文化等市场动向。3案例:杜邦公司的“市场嘹望哨”除了向总公司领导及有关业务部门做专题报告及口头报告,解答问题外,经济研究室还每月整理出版两份刊物。一份发给公司的主要供应厂家和客户,报道有关信息和资料;另一份是内部发行,根据内部经营全貌分析存在的问题,提出解决措施,研究短期和长期的战略规划、市场需求量,以及同竞争对手之间的比较性资料。另外每季度还会整理出版一期《经济展望》供总公司领导机构和各部门经理在进行经营决策时参考。正是由于他们重视对调查资料的整理、分析和利用,才使得杜邦公司200年兴盛不衰。4调查资料的整理调查资料的整理(数据的预处理)是调查结果分析的基础。主要工作任务:预编码审核与编辑分类和汇总表格化和图示化5资料整理的步骤和内容①设计和编制资料整理方案。这是保证统计资料的整理有计划、有组织地进行的重要一步。资料的整理往往不是整理一个或两个指标,而是整理多个有联系的指标所组成的指标体系。②对原始资料进行审核。资料的审核是第一步,为了保证质量必须进行严格的审核。③综合汇总表的项目,对原始资料进行分组、汇总和计算是关键。④对整理好的资料在进行一次审核,然后编制成一个统计表,以表示社会经济现象在数量上的联系。6审查内容:(1)资料的审核必须遵守资料整理的一般要求,着重资料的真实性、准确性、完整性。1)资料的真实性调查资料来源的客观性问题,来源必须是客观的。调查资料本身的真实性问题,要辨别出资料的真伪,把那些违背常理的、前后矛盾的资料舍去。2)资料的准确性。准确的审核要着重检查那些含糊不清的、笼笼统统的以及互相矛盾的资料。3)资料的完整性。(2)审核应注意的问题在审核中,如发现问题可以分不同的情况予以处理:1)对于在调查中已发现并经过认真核实后确认的错误,可以由调查者代为更正。2)对于资料中可疑之处或有错误与出入的地方,应进行补充调查。3)无法进行补充调查的应坚决剔除那些有错误的资料,以保证资料的真实准确。7资料的复查审核复查审核的目的:确保每份要送去进行数据录入分析的调查资料都是有效的(完整性和准确性),其标准是看调查是否按规定的方式进行。复查一般按一定的比例抽选、通过电话进行。审核内容主要包括:查实此人是否真正接受了调查查实受访者是否符合过滤条件查实调查是否按规定的方式进行查实问卷回答内容是否完整核查其他方面的问题8资料的编辑整理编辑整理的目的:对调查人员和受访者的疏忽、遗漏、错误进行检查。编辑整理的方式调查人员的自行编辑整理质量监督部门的再次编辑整理编辑整理过程中查验的主要问题调查单位是否有遗漏调查的项目是否齐全调查数据是否符合逻辑9资料的编码与录入编码是指对一个问题的不同答案确定相应数字代码的过程,以便于数据的分组与后期分析。编码的具体方法问卷的预编码审核整理后的录入编码录入的方式直接录入程序录入光电扫描录入10资料的分类与汇总资料的分类(分组)是在对资料进行预处理的基础上,根据调查研究的需要,按照某种标志将研究总体划分为若干个组成部分。汇总计算是在对资料进行分组的基础上,将调查数据逐个分配到不同的组内,并计算出各组的单位数及各组单位数占总体单位数的比重,进而研究现象的分布特征。汇总的方法手工汇总电子计算机汇总11资料的表格化——统计图统计表的结构按统计表的形式分:总标题、横行标题、纵栏标题和数字资料四部分组成。此外,必要时在统计表的下方加上表外附加;按统计表的内容分:主词和宾词两部分组成。统计表的形式单向频数表交叉分组表12单向频数表品牌知名度的频率分布变量等级取值频数频率%有效频率%有效累计频率%不熟悉13613.313.313.3不太熟悉24115.215.228.5有点了解35219.219.347.8了解44315.815.963.7熟悉53613.313.370.0非常熟悉66222.923.0100.0910.4缺失总计271100.0100.013交叉分组表不同驾驶距离下的事故率类别男,%女,%驾驶距离1万公里1万公里1万公里1万公里无事故51735073至少有一次事故49275027样本总数,人717021502430605014资料的图示化统计图是在统计表的基础上,用几何图形或实物图形把数字资料形象地再现出来,以达到醒目、美观、突出线索或特点,易于接受和理解的效果。常用统计图的种类柱形图和条形图线性图饼状图散点图雷达图15柱形图16柱形图17柱形图18条形图19线性图20园形图21饼形图22散点图23市场调查资料分析的程序明确调研问题界定分析内容提取数据选择分析方法对比研究概括结论综合集成撰写调研报告24统计分析的内容集中趋势分析离散趋势分析相关分析回归分析区间估计假设检验描述统计推论统计用最简单的概括形式反映出大量数据资料所容纳的基本信息从样本调查中所得的数据资料来推断总体的情况基本方法基本内容25频数分布与频率分布所谓频数分布,就是指一组数据中取不同值的个案的次数分布情况,它一般以频数表的形式表达。某班有25名学生,其年龄情况如下:20,19,18,19,18,20,21,17,18,18,19,19,20,19,19,17,18,20,19,19,21,21,19,20,19。年龄(岁)学生人数171819202125105325合计该班学生的年龄分布表例如26所谓频率分布,则是指一组数据中不同取值的频数相对于总数的比率分布情况,这种比率通常以百分比的形式表达,而频率分布情况同样以频率表的形式出现。频率分布表除具备频数分布表的优点外,还能反映各类所占的比重,便于不同总体或不同类别之间的比较。这种分布的应用更为普遍。例如年龄(岁)百分比1718192021820402012100合计某班学生的年龄分布27集中趋势分析所谓集中趋势分析,指的是用一个典型值或代表值来反映一组数据的一般水平,或向这个典型值集中的情况。最常见的集中趋势统计量平均数众数中位数28平均数(算术平均数)用总体各单位数值之和除以总体单位总数的商。平均数又称为均值或均数。计算公式及应用举例由原始数据计算平均数。设总体单位总数为n,总体各单位的数值为xi(i=1,2,…,n),则计算公式为:nxXni129离散趋势分析离散趋势(又称离中趋势)分析指的是用一个特定的数值来反映一组数据相互之间的离散程度。作用:它与集中趋势一起,分别从两个不同的侧面描述和揭示一组数据的分布状况,共同反映出资料分布的全面特征;同时,它还对集中趋势的统计量(如平均数、众数、中位数)的代表性作出补充说明。30某校三个系各选5名同学,参加智力竞赛,他们的成绩分别如下:中文系:7879808182X=80数学系:6572808895X=80政治系:35788998100X=80如果仅以集中趋势统计量(平均数)来衡量,那么,三个系代表队的水平一样高,不存在什么差别。但从直观上我们不难发现,三个代表队中五名队员的成绩相互之间的差跟程度(离散程度)很不一样。中文系成绩十分接近;数学系成绩比较分散;而政治系队成绩则相差十分悬殊。不难理解,这个80分对中文系队同学的代表性最高,而对政治系队同学的代表性最低。31离散趋势的各种统计量,一方面揭示出数据相互分离的程度;另一方面又对相应的集中趋势统计量的代表性作出判断。结论集中趋势统计量的代表性与所对应的离散趋势统计量是反比关系,即离散趋势统计量越大,则所对应的集中趋势统计量的代表性就越小;反之,则越大。32标准差标准差的定义是:一组数据对其平均数的偏差平方的算术平均数的平方根。它是用得最多、也是最重要的离散趋势统计量。通常用符号S来表示,其计算公式根据资料的形式不同而稍有差别。公式nXxSni12)(33相关与回归交互分类主要处理的是定类(或定序)变量间的关系问题,对于定距及定比变量来说,则有另一些方法来探讨。这里主要简单介绍一下相关系数的计算方法及一元线性回归模型。34相关系数例子:调查10名工人的工龄与工资情况如下表:序号工龄(年)2358101215182022工资(元)808090100120120140160180200这10名工人的工龄与工资是否相关?可通过定量计算说明,称为相关系数。计算公式为:))().()()).((2222YYnXXnYXXYnr(35即相关系数r是表明两个定距或定比变量间关系程度的量数,其取值范围在-1到+1之间。当r为负值时,说明变量X与变量Y的变化方向相反。即当X增大时,Y减少;X减少时,Y增大。当r为正值时,说明两变量的变化方向相同。|r|=1时,称X与Y完全相关;r=0时,则称二者完全不相关。越接近|r|=1,说明关系强度越大,越接近0,则说明关系强度越小。上一例子中,r=0.986,有较强的正相关关系。36回归分析相关分析的目的在于了解两个变量之间的关系强度,即用相关系数r来描述X和Y两个变量之间的共变特征。它并不指出X和Y哪个是原因,哪个是结果.回归分析则是对有相关关系的现象,根据其关系的形态找出一个合适的数学模型,即建立回归方程,来近似地表达变量间的平均变化关系,以使依据回归方程对未知的情况进行估计。即回归分析增加了因果性,并具有了预测的功能,因此,它比相关分析作用更大。37回归分析的中心问题是建立回归方程,一元线性回归方程的建立使用最小二乘法。首先,依据理论分析或根据研究的需要确定两变量中何为自变量,何为因变量。在本例中,我们确定工龄为自变量(X),工资为因变量(Y)。其次,以自变量为X轴,因变量为Y轴作出表中资料的散点图,以判明是否为线性相关。给一组数据(X,Y),称为样本数据。计算公式:设y=a+bx22)(XXnYXXYnbxbya
本文标题:第六讲 调查资料的整理与分析
链接地址:https://www.777doc.com/doc-3279376 .html