您好,欢迎访问三七文档
当前位置:首页 > 办公文档 > 工作范文 > chapter 8 资料分析的基础工作
资料分析的基础工作Chapter8经济与管理学院雷晶主要内容8.1资料的整理8.2资料的分析与解释概述8.3资料的表格化与图形化初步分析8.4资料的解释经济与管理学院雷晶学习目标1.掌握对资料的基本整理方法2.将资料表格化,并能进行初步的分析3.掌握资料解释的基本方法和思路经济与管理学院雷晶8.1资料的整理一、编辑二、编号三、表格化四、原始资料加工开发框架经济与管理学院雷晶一、编辑现场编辑Vs.办公室编辑个人访问和焦点小组访谈等——现场编辑邮寄问卷、电话访问等——办公室编辑经济与管理学院雷晶一、编辑资料编辑中常遇到的问题①假访问②不一致或矛盾的回答③无法读懂的回答④不正确或不完全的回答⑤“不知道”和没有答案——回访回访或深入分析经济与管理学院雷晶二、编号编号是给问题的答案配上数字或符号以便为表格化做准备。1.对量化资料进行分类编号分类间隔相互排斥分类间隔数不宜太少间隔区间设置应有利于数据分析经济与管理学院雷晶二、编号2.对定性资料进行分类编号分类编号应包括所有可能的答案分类简洁互斥生活方式的分类可以包括回答者的年龄、性别、家庭等经济与管理学院雷晶二、编号3.数字尺度(度量尺度)的类型类别尺度顺序尺度等量尺度比率尺度NominalOrdinalScale经济与管理学院雷晶三、表格化表格化是使答案以某种报告的形式出现,最常见的表格化形式是频率分布和百分比分布。您是否会买这种产品?数值(频率)百分比(%)绝对会买12411.1%很可能会买21118.9%不知道37633.7%很可能不买20418.3%绝对不买20017.9%总和1115100.0%Analyze——DescriptiveStatistics——Frequency经济与管理学院雷晶三、表格化开放式问题的分类归档①集中所有同一个开放式问题的全部文字性答案,通过阅读、思考和分析,把握被调查者的思路;②将被调查者的回答按照其思想认识的不同归纳为若干类,并计算各种类型的频数,制成全部答案分布表;③对全部答案分布表进行挑选归并,确定可以接受的分组数;④根据分类归纳的结果,制成正式的答案分布表。被调查者对XXX的看法分布看法分类答案人数比重(%)符合环保要求32516.25符合时代潮流28614.30符合消费需求31615.8希望尽快推出1989.90有可能实现31215.6不可能实现35017.50难以评价21310.65合计2000100.00经济与管理学院雷晶三、表格化开放式问题分类归档的应用阅读教材P164案例1对市长的评价,思考对开放式问题进行归档处理应注意的问题经济与管理学院雷晶主要内容8.1资料的整理8.2资料的分析与解释概述8.3资料的表格化与图形化初步分析8.4资料的解释经济与管理学院雷晶8.2资料的分析与解释概述一、分析与解释的定义分析是以某种有意义的形式或次序把收集的资料重新展现出来。解释是指在资料进行分析后找出信息块之间或与其他已知信息之间的联系。解释是把分析的资料、数据转变成信息的过程。前述案例,研究“性别”与“每周买报的个人花费”之间的关系。Analyze——CompareMeans——Means思考:性别不同,花费差异显著么?经济与管理学院雷晶8.2资料的分析与解释概述二、分析与解释之间的相互依赖性两种产品的销量比较季度月亮牌(袋)太阳牌(袋)1205,5001,3502193,5003,3003171,00015,9004154,00037,9501151,50060,0002145,50069,6003132,00079,5004121,50091,500分析:月亮牌销量下降同时太阳牌销量上升。解释:月亮牌产品的顾客转向了太阳牌,新产品的出现分流了老产品的顾客。结论:新产品可以替代老产品,老产品可以退市了。广告跟广告有关的销量(辆)A2,431B2,164C1,976案例8-1如何正确分析不同广告的效果?东风汽车公司要对3种广告设计进行测试,以判定哪一种设计方案对提高汽车销量最有效。研究人员在不同时间里分别选择在4个不同城市进行了市场试验,结果如表8-4。分析:A广告下的销量最大。解释:A广告最有效。结论:选择A广告。表8-4不同广告设计对销量的影响表8-5四城市的汽车销量比较(辆)城市1234总和广告A5089764894582,431B4816135284422,064C5165604644361,976分组随机实验,但分析不深入,得出了错误的结论。经济与管理学院雷晶补充:市场调查设计总结性调查总结性调查(描述性调查和因果性调查)普遍使用横截面市场调研设计。横截面调研设计,也就是在一个时间点抽取一个人口样本,通常称为“调研考察设计”。特点:准确性、可靠性要求高经济与管理学院雷晶补充:市场调查设计业绩监控调查业绩监控调查普遍使用纵向市场调研设计。纵向市场调研设计一般适用于连续的业绩监控需要,基本思路就是对固定人口样本(panelsample)进行反复衡量,所以经常被称为“典型对象调研设计”。特点:连续性、常规性,可比性高经济与管理学院雷晶补充:市场调查设计横截面调研设计Vs.纵向调研设计横截面调研设计因为是对不同应答者样本的衡量,可能会误导调研结果;纵向调研设计由于是对相同应答者样本的重复衡量,可以更准确地衡量变化和发展趋势。横截面数据时段1考察时段2考察品牌A购买100100不购买400400总计500500品牌B购买100100不购买400400总计500500纵向数据时段1典型对象报告品牌A时段2典型对象报告购买不购买总计品牌A购买1000100不购买0400400总计100400500品牌B时段2典型对象报告购买不购买总计品牌B购买0100100不购买100300400总计100400500经济与管理学院雷晶补充:市场调查设计纵向调研设计的特点优点:准确性高、低成本群体相对稳定,具有长期合作性数据收集技术相对专业、先进缺点:代表性差和应答偏差群体的流动性及替代者的代表性对象的厌倦与熟练性纵向调研设计应用:请参阅教材P263-266消费者固定样本连续调查经济与管理学院雷晶主要内容8.1资料的整理8.2资料的分析与解释概述8.3资料的表格化与图形化初步分析8.4资料的解释经济与管理学院雷晶8.3资料的表格化与图形化初步分析一、每个问题的表格化和图形化分析工作1.频率分布分析2.平均值分析——算术平均数、中位数和众数平均值分析与频率分布分析相比,往往会“吞”掉一些信息,故而不一定是很好的数据处理指标。如:公司员工平均收入Vs.各阶层收入及频率中位数的应用——区间型定序尺度的描述管理研究常把变量属性集结成组,然后给出每组的属性频率,如:花销范围学生人数累计人数1007575101~20097172201~30076248301~4006631440036350如何确定学生每月花销的具体数据呢?fcfNLMd2Md——中位数;L——中位数所在属性组的下限;N——样本总数;cf——中位数所在组以下的累计数;f——中位数所在组的样本数;ω——中位数所在组的属性间距。1.先找出中位数所在的属性组205997617223502012.计算中位数fcfNLMd251752/13503.结果:被抽查的350名学生的平均花销为205元经济与管理学院雷晶8.3资料的表格化与图形化初步分析二、多问题和多因素的综合分析——横列表法将单个问题针对不同的被调查者类型或其他不同因素进行分解分析。表8-8驾驶者的事故率项目百分比(%)开车无事故61开车时至少出过一次事故39样本数量(人)17800案例8-2保险公司如何判断事故的影响因素?某保险公司决定对影响保险户开车事故率的因素进行调查。方法是对各种因素进行横列表分析,初始表8-8如下。表8-9男女驾驶者的事故率男性(%)女性(%)开车无事故5666开车至少出过一次事故4434样本数量(人)93208480☻结论:男性开车比女性容易出事故?表8-10不同驾驶距离下的事故率男(%)女(%)>1万公里<1万公里>1万公里<1万公里开车无事故51735073至少出过一次事故49275027被调查总数7170215024306050☻结论:事故率是与驾驶里程数相关,而不是性别。经济与管理学院雷晶8.3资料的表格化与图形化初步分析1.横列表中使用因素的选择横列表使用的成功,取决于研究者选择的关键因素,以及根据这些因素组成横列表的能力。a)简单的事实收集b)描述性研究c)探索性研究经济与管理学院雷晶8.3资料的表格化与图形化初步分析2.从横列表里发现含义阅读教材P157案例8-3谁是常看电影的人?经济与管理学院雷晶8.3资料的表格化与图形化初步分析3.同步分析与顺序分析顺序分析简单,但是容易导致错误结论;同步分析善于解释事物之间的真实关系,但要注意同步分析中选取因素的相关性。经济与管理学院雷晶8.3资料的表格化与图形化初步分析4.横列表的局限性多因素分析困难;可能遗漏需要分析的因素;关键因素的选择比较困难。经济与管理学院雷晶8.3资料的表格化与图形化初步分析三、数据分析数据分析(dataanalysis)是从实际观测数据中发现变量的特征、变化规则以及变量之间关联的过程。数据分析包括:描述统计&推断统计经济与管理学院雷晶I.描述统计(descriptivestatistics)一、单变量描述统计(univariatedescriptivestatistics)1.频数和频率分布2.集中趋势(centraltendency)——众数(mode)、中位数(median)和平均数(mean)3.离散趋势(dispersiontendency)——极差(range)、四分互差(quartiledeviation)、标准差(standarddeviation)经济与管理学院雷晶I.描述统计(descriptivestatistics)二、双变量描述统计(bivariatedescriptivestatistics)1.定类和定序变量的关联分析——关联表、关联性分析2.定距和定比变量的关联分析——回归分析、相关分析经济与管理学院雷晶I.描述统计(descriptivestatistics)三、多变量描述统计(bivariatedescriptivestatistics)1.多变量关联表2.偏相关分析和多元回归分析3.因子分析经济与管理学院雷晶II.推断统计(inferentialstatistics)一、参数估计1.点估计2.区间估计经济与管理学院雷晶II.推断统计(inferentialstatistics)二、假设检验1.对立假设2.显著性实验3.参数和非参数检验经济与管理学院雷晶主要内容8.1资料的整理8.2资料的分析与解释概述8.3资料的表格化与图形化初步分析8.4资料的解释经济与管理学院雷晶8.4资料的解释一、归纳和演绎的推理方法归纳推理——把一系列分离事实或观察到的现象放在一起从而得出结论;演绎推理——从一般前提推到个别结论的方法。经济与管理学院雷晶8.4资料的解释①所有动物都难免一死(大前提);②人是动物(小前提);③人也不免一死(推理结论)。①存款利息上升时,居民存款额会增加(大前提);②1988年底利息上升了(观察到的事实,小前提);③因此那时的存款额会上升(结论)。经济与管理学院雷晶8.4资料的解释论证方法实证研究(empiricalstudy)理论研究(theoreticalverification)实验研究非实验研究经济与管理学院雷晶8.4资料的解释市场调查资料分析的本质——从数据导向结论、从结论导向对策、从定量认识过度到定性认识、从感性认识上升到理性认识。课后阅读教材P161案例8-4经济与管理学院雷晶8.4资料的解释二、结论的客观性客观与主观的悖论数据与信息的矛盾推
本文标题:chapter 8 资料分析的基础工作
链接地址:https://www.777doc.com/doc-871141 .html