您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > 第七章_调查资料的统计分析
第六章调查资料的统计分析调查资料整理的基本知识调查资料整理的基本方法调查资料初步统计分析的方法参考书目:马庆国,《管理统计》,北京,科学出版社,2002年第一版。6.1调查资料的整理所谓资料整理,是指运用科学的方法,将调查所得的原始资料按调查目的进行审核、汇总与初步加工,使之系统化和条理化,并以集中、简明的方式反映调查对象总体情况的过程。调查资料整理的基本步骤设计和编制资料整理方案。这是保证统计资料的整理有计划、有组织地进行的重要一步。资料的整理往往不是整理一个或两个指标,而是整理多个有联系的指标所组成的指标体系。对原始资料进行审核。资料的审核是第一步,为了保证质量必须进行严格的审核。综合汇总调查项目,对原始资料进行分组、编码、汇总和计算是关键。对整理好的资料再进行一次审核,然后编制成一个统计表,以表示社会经济现象在数量上的联系。6.1.1调查资料的审核审核的主要内容资料的真实性。调查资料来源的客观性问题,来源必须是客观的。调查资料本身的真实性问题,要辨别出资料的真伪,把那些违背常理的、前后矛盾的资料舍去。资料的准确性。准确的审核要着重检查那些含糊不清的、笼笼统统的以及互相矛盾的资料。资料的完整性。第一,调查资料总体的完整性。第二,每份调查资料的完整性。信度与效度信度是指对同一事物进行重复测量时,所得到的结果的一致性程度,一致性程度越高则信度越高。效度则是指一项测量能正确测出它所要测量的事物的程度。一份问卷如果无信度则一定无效度,有效度则一定有信度;然而有信度不能保证有效度。因此,在设计调查方案时要努力确保调查中的每一个问题就是调查者想要的变量,而且这种变量保持一定的一致性。6.1.2编码编码是指对一个问题的不同回答进行分组和确定数字代码的过程。1.事先编码大多数的问卷中大部分问题都是封闭式的,即已经预先编码。这意味着对调查中一组问题的不同数字编码已被确定,所有封闭式问题都是事先编码的。事先编码案例1.您每月生活费的主要来源是_____?A.父母B.家教、兼职C.奖学金/助学金D.其它2.您父母平均一个月给您的生活费是______?A.500元以下B.500-800元C.800-1000元D.1000-1500元E.1500以上3.您每月实际消费是_____?A.500元以下B.500-800元C.800-1000元D.1000-1500元E.1500以上4.你的消费习惯可以描述为_______?A.事先做好消费计划再花钱B.以勤俭为本C.想花就花D.其它(请注明)2.事后编码对于开放式问题而言,只能在资料收集好之后,再根据受访者的回答内容来决定不同答案的指定编码。编码的依据不应只是文字,更重要的是文字所反映出来的被调查者的潜在意识。所以对开放式问题的编码有一整套科学的方法与操作程序。事后编码程序列出答案。将所有被访者提供的答案一一列出将有意义的答案列成频数分布表,并确定可以接受的分组数对答案挑选归并。在符合调研目的的前提下,保留频数多的答案,把频数少的答案尽可能归并成含义相近的几个组,有时对那些含义相去甚远,频数又很低的,可以一并用“其它”来概括。对所确定的分组选择正式的描述制定编码规则事后编码案例问题:“您为什么选择海尔空调?”列出所有答案:1.节能环保2.外形美观3.价格公道4.噪音低5.空调效果好6.性价比高7.高科技8.体积小9.大品牌10.邻居都用这个牌子11.经常在广告中见到12.没想过13.不知道14.没什么特别原因根据回答分类来编码1、质量、科技1,4,5,72、外形2,83、价格实惠3,64、大名牌9,10,115、不清楚12,13,146.1.3调查资料的统计分类、分组统计分类、分组,是指根据社会调查的目的和要求,按照一定标志,将所研究的事物或现象区分为不同的类型或组的一种整理资料的方法。分类、分组的作用:可以找出总体内部各个部分之间的差异可以深入了解现象总体的内部结构可以显示社会现象之间的依存关系案例统计分组可以深入了解现象总体的内部结构:我国三次产业分类的从业人员构成情况单位(%)产业\年份19931994199519961997第一56.451.352.250.049.9第二22.422.723.023.523.7第三21.223.024.826.026.4合计100.0100.0100.0100.0100.0案例统计分组可以显示社会现象之间的依存关系某地区粮食单位面积产量和施肥量的关系每公顷化肥施用量粮食单位面积产量(千克)(千克/公顷)116.252827.5133.503124.5145.503396.0153.753608.3163.503484.0统计分组标志的选择标志指反映事物属性或特征的名称。根据分组标志的不同性质,分组有不同的类型:根据分组标志的数量的不同,可分为简单分组和复合分组两类。根据所使用分组标志的性质不同,可分为品质标志分组(比如按性别、职业等分组)和数量标志分组(比如按年龄、收入、人口、产量等分组)。案例我国各级各类型图书馆普遍使用的分类方法就是《中国图书馆图书分类法》,简称“中图法”。《中图法》是我国于1975年正式出版编制的一部大型综合性的图书分类法。它采用五分法的分类体系,把图书资料所包括的知识内容划分为马克思主义列宁主义毛泽东思想、哲学、社会科学、自然科学和综合性图书五大基本部类。社会科学A马列主义、毛泽东思想B哲学C社会科学总论D政治、法律E军事F经济G文化、科学、教育、体育H语言、文字I文学J艺术K历史、地理次数分布是将总体中的所有单位按某个数量标志分组后,所形成的总体单位数在组之间的分布。分布在各的总体单位数叫次数或频数。各组次数与总次数之比叫做比重、比率或频率。次数分布实质,是反映统计总体中所有单位在各组的分布状态和分布特征的一个数列,也可以称做次数分配数列,简称分布数列。案例单项变量分布数列按日产量分组工人人数比重(件)(人)(%)25106262010273017285028294022303017合计180100案例组距变量数列按计划完成程度分组企业数比重(%)100以下621.3100—1101657.4110以上621.3合计28100.00变量次数分配的编制按数量标志编制次数分配,所形成的结果称为变量次数分配。变量次数分配的编制程序如下:将原始资料顺序排列将各个数据按其数值大小归入相应的组内确定组数和组距(组中最大值与最小值差额)确定组限(组的两个端点)案例(变量次数分配的编制)假设某企业30个非熟练工人的周工资额(元)如下:106、99、85、121、84、94、106、105、110、119、101、95、91、87、105、106、109、118、96、128、91、97、105、111、111、107、103、101、107、106案例(变量次数分配的编制)第一步:按从小到大的顺序排列数据84、85、87、91、91、94、95、96、97、99、101、101、103、105、105、105、106、106、106、106、107、107、109、110、111、111、118、119、121、128第二步:将相同的数据归入同一组,并汇总各组数值的个数周工资额(元)人数(次数)848587919495969799101103105106107109110111118119121128合计11121111121342112111130案例(变量次数分配的编制)第三步:确定组数和组距第四步:确定组限周工资额(元)人数(个)各组人数占总人数百分比%80~9090~100100~110110~120120~130合计37135230102343177100分组方法的选择选择等距分组还是不等距分组,主要根据研究的目的和观察值的特点决定。如果研究目的是要从数量上区分不同性质的类别,就必须根据被研究现象各类别在数量上的特点确定各组组距,如果所收集的原始数据中有极端值存在,为避免组数太多,分布特征无法详实的情况,也可能采用不等距分组,在数据分布密集的地方用较短组距,在数据分布疏散的地方采用较长组距。案例(不等距分组的变量次数分配编制)某地区人口年龄分配情况按年龄分组人口数(万人)1岁以下21~7岁12.27~18岁24.018~25岁14.825~55岁34.255岁以上16.3合计103.5某地区个人年收入额分配按年收入额各组所占百分比分组(元)(%)0~5,00023.95,000~10,00034.810,000~15,00020.115,000~45,00017.2845,000~75,0001.7475,000~105,0000.88105,000~135,0000.81135,000以上0.48合计100.006.2描述性统计分析描述性统计分析(DescriptiveAnalysis)指对被调查总体所有单位的有关数据进行整理和计算综合指标等的加工处理,是用来描述总体特征的统计分析方法。市场调查分析中最常用的描述性统计分析,主要包括对调查数据的分组分析、集中趋势分析、离散程度分析和相对程度分析、指数分析。6.2描述性统计分析6.2.1列表列表,即把调查资料按照一定的目的,用表格形式展现出来表的结构:标题、横标目、纵标目、数字。表的种类:简单分组表(单因素列表)、复合分组表(交叉列表)。制作方法:制作应遵循科学、实用、简练、美观原则。简单列表(单因素列表)案例被调查者答案人数(人)频数(%)数量(个)频次(%)总数300100818100杭州百货大楼26588.326532.4银泰百货24080.024029.3杭州大厦11237.311213.7解百9230.79211.2元华购物中心6321.0637.7西湖时代广场4615.3465.6消费者购物地点选择调查表多因素列表(交叉列表)案例消费者购物地点选择简单交叉分析表总数年龄人数频数18~34岁35~54岁55以上总数300100%65100%83100%151杭州百货大楼14448.0%2132.3%4048.2%57银泰百货14648.7%4366.3%4048.2%40不知道/未回答103.3%11.5%33.6%36.2.2绘图统计绘图的种类:线图、条形图或称柱状图、圆饼图、曲线图、直方图。统计图的作用:形象地表明事物总体结构。表明统计指标不同条件下的对比关系。反映事物发展变化的过程和趋势。说明总体单位按某一标志的分布情况。显示现象之间的相互依存关系。6.2.3描述性统计分析的内容1、数据的集中趋势分析。对调查数据公布的数量规律性中集中特征进行分析,是对被调查总体的特征进行准确描述的重要前提。数据集中趋势分析的对象,包括数据的均值(各类平均数)、中位数和众数。均值是数据偶然性和随机性的一个特征值,反映了一些数据必然性的特点。中位数(Me)的确定可以以未分组资料为基础,也可由分组资料得到。它同样不受到资料中少数极端值大小的影响。在某些情况下,用中位数反映现象的一般水平比算术平均数更具有代表性,尤其对于两极分化严重的数据,更是如此。众数(Mo)是总体中出现次数最多单位的标志值,也是测定数据集中趋势的一种方法,克服了平均数指标会受数据中极端值影响的缺陷。案例比如,前面工人工资的例子84、85、87、91、91、94、95、96、97、99、101、101、103、105、105、105、106、106、106、106、107、107、109、110、111、111、118、119、121、128均值为:103.47元中位数(Me)为:105元众数(Mo)为:106元2、数据的离散程度分析反映数据差异程度的数值,有极差、平均差、方差和标准差离散系数等。极差(也称全距)是数据中两个极端值,不能反映数据变化的影响,受极端值的影响较大。一般说,极差越大,平均值的代表性越小。所以,极差可以一般性地检验平均
本文标题:第七章_调查资料的统计分析
链接地址:https://www.777doc.com/doc-2208699 .html