您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > (02)(统计学贾俊平)第2章 数据的图表展示
2-1统计学基础2010年数据分析(方法与案例)统计学基础常用的统计图有哪些?如何绘制和解释其含义?2-2统计学基础2010年第2章数据的图表展示常用的统计图有哪些?如何绘制和解释其含义?2-3统计学基础2010年第2章数据的图表展示2.1数据的预处理2.2品质数据的整理与展示2.3数值型数据的整理与展示2.4合理使用图表2.4问卷设计及数据收集2-4统计学基础2010年学习目标数据预处理的内容和目的分类和顺序数据的整理与显示方法数值型数据的整理与显示方法用Excel作频数分布表和形图合理使用图表2-5统计学基础2010年统计应用把数据画图之后,要用用脑袋沃德(AbrahamWald)和许多统计学家一样,在第二次世界大战时也处理了战争与相关的问题。他发明的一些统计方法在战时被视为军事机密。以下是他提出的概念中较简单的一种。沃德教授(AbrahamWald)在被咨询飞机上什么部位的钢板需要加强时,他将联军飞机的弹着点资料描绘成图表,并且标出返航的战斗机上受敌军创伤的弹孔位置。资料积累一段时间后,机翼各部位几乎都被填满了。于是沃德建议,把剩下少数几个没有弹孔的位置(座舱与机尾发动机部位)装甲加强,因为这些部位被击中的飞机都没有返航。2-6统计学基础2010年2.1数据的预处理2.1.1数据审核-检查数据中的错误2.1.2数据排序-找出符合条件的数据2.1.3数据筛选-升序和降序,-寻找数据的基本特征2.1.4数据透视表-按需要汇总第2章数据的图表展示2-7统计学基础2010年2.1.1数据审核2.1数据的预处理2-8统计学基础2010年数据的审核原始数据二手数据完整性准确性逻辑检查计算检查适用时效数据审核2-9统计学基础2010年数据审核—原始数据(rawdata)1.完整性审核应调查的单位或个体是否有遗漏所有的调查项目或变量是否填写齐全2.准确性审核数据是否真实反映实际情况,内容是否符合实际数据是否有错误,计算是否正确等2-10统计学基础2010年数据的审核—二手数据(secondhanddata)1.适用性审核弄清楚数据的来源、数据的口径以及有关的背景材料确定数据是否符合自己分析研究的需要2.时效性审核尽可能使用最新的数据3.确认是否有必要做进一步的加工整理2-11统计学基础2010年2.1.2数据排序2.1数据的预处理2-12统计学基础2010年数据排序(datarank)1.按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索2.排序有助于对数据检查纠错,以及为重新归类或分组等提供依据3.在某些场合,排序本身就是分析的目的之一4.排序可借助于计算机完成2-13统计学基础2010年数据排序(方法)1.分类数据的排序字母型数据,排序有升序降序之分,但习惯上用升序汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分2.数值型数据的排序递增排序:设一组数据为x1,x2,…,xn,递增排序后可表示为:x(1)x(2)…x(n)递减排序:可表示为:x(1)x(2)…x(n)2-14统计学基础2010年某班级学生四门课成绩姓名统计学成绩数学成绩英语成绩经济学成绩张松69688486王翔91759594田宇54886778李华81608664赵颖75968183宋媛83726671袁方75587690陈风877692772-15统计学基础2010年按升序、降序排列用excel工具:数据排序,见表2-1.xls2-16统计学基础2010年2.1.3数据筛选2.1数据的预处理2-17统计学基础2010年数据筛选(datafilter)1.当数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选2.数据筛选的内容将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除2-18统计学基础2010年数据筛选的内容将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来表3-18名学生的考试成绩数据用Excel进行数据筛选1.筛选出统计学成绩为75分的数据;2.统计成绩为前三名的学生;3.4门课程成绩都大于70分的学生2-19统计学基础2010年2.1.4数据透视表2.1数据的预处理2-20统计学基础2010年数据透视表(pivottable)1.可以从复杂的数据中提取有用的信息2.可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图3.形成一个符合需要的交叉表(列联表)4.在利用数据透视表时,数据源表中的首行必须有列标题2-21统计学基础2010年数据透视表(pivottable)【例2.2】在某大学随机抽取30名学生,调查他们的性别、家庭所在地、平均月生活费支出、平均每月购买衣物支出和购买衣物时所考虑的首要因素等,得到的数据如表2—4所示。试建立一个数据透视表,在表的行变量中给出性别和购买衣物首选因素,在列变量中给出学生的家庭所在地,对平均月生活费支出和月平均购买衣物支出进行交叉汇总。2-22统计学基础2010年数据透视表(用Excel创建数据透视表)第1步:在Excel工作表中建立数据清单第2步:选中数据清单中的任意单元格,并选择【数据】菜单中的【数据透视表和数据透视图】第3步:确定数据源区域第4步:在【向导—3步骤之3】中选择数据透视表的输出位置。然后选择【布局】第5步:在【向导—布局】对话框中,依次将”分类变量“拖至左边的“行”区域,上边的“列”区域,将需要汇总的“变量”拖至“数据区域”第6步:然后单击【确定】,自动返回【向导—3步骤之3】对话框。然后单击【完成】,即可输出数据透视表用Excel创建数据透视表2-23统计学基础2010年家庭所在地性别买衣物首选因素数据大型城市乡镇地区中小城市总计男价格求和项:平均月生活费(元)110018004003300求和项:月平均衣物支出(元)23018040450款式求和项:平均月生活费(元)50030003500求和项:月平均衣物支出(元)150800950品牌求和项:平均月生活费(元)100080016003400求和项:月平均衣物支出(元)3002404801020男求和项:平均月生活费(元)26002600500010200男求和项:月平均衣物支出(元)68042013202420女价格求和项:平均月生活费(元)70040026003700求和项:月平均衣物支出(元)230120465815款式求和项:平均月生活费(元)26006003200求和项:月平均衣物支出(元)750180930品牌求和项:平均月生活费(元)5008001300求和项:月平均衣物支出(元)5080130女求和项:平均月生活费(元)3800120032008200女求和项:月平均衣物支出(元)10302006451875求和项:平均月生活费(元)汇总64003800820018400求和项:月平均衣物支出(元)汇总1710620196542952-24统计学基础2010年性别家庭所在地数据男女总计大型城市求和项:平均月生活费(元)260038006400求和项:月平均衣物支出(元)68010301710乡镇地区求和项:平均月生活费(元)260012003800求和项:月平均衣物支出(元)420200620中小城市求和项:平均月生活费(元)500032008200求和项:月平均衣物支出(元)13206451965求和项:平均月生活费(元)汇总10200820018400求和项:月平均衣物支出(元)汇总2420187542952-25统计学基础2010年性别与支出表性别数据汇总男求和项:月平均衣物支出(元)2420求和项:平均月生活费(元)10200女求和项:月平均衣物支出(元)1875求和项:平均月生活费(元)8200求和项:月平均衣物支出(元)汇总4295求和项:平均月生活费(元)汇总184002-26统计学基础2010年2.2品质数据的整理与展示2.2.1分类数据的整理与图示2.2.2数值型数据的整理与图示第2章数据的图表展示2-27统计学基础2010年数据的整理统计数据的分类分类的数据顺序的数据数值型数据分类整理分组整理2-28统计学基础2010年数据的整理与显示(基本问题)1.要弄清所面对的数据类型不同类型的数据,采取不同的处理方式和方法2.对分类数据和顺序数据主要是作分类整理3.对数值型数据则主要是作分组整理4.适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据2-29统计学基础2010年2.2.1分类数据的整理与图示2.2品质数据的整理与展示2-30统计学基础2010年一、分类数据的描述统计量1.频数(frequency):落在各类别中的数据个数。2.比例(proportion):某一类别数据个数占全部数据个数的比值。3.百分比(percentage):将对比的基数作为100而计算的比值。4.比率(ratio):不同类别数值个数的比值。2-31统计学基础2010年二、生成频数分布表(分类数据)1.列出各类别2.计算各类别的频数3.生成频数分布表分类频数比例百分比比率ABCDE2-32统计学基础2010年分类数据频数分布表2-33统计学基础2010年生成频数分布表(定性数据)【例2.3】为研究不同类型的软饮料的市场销售情况,一家市场调查公司对随机抽取的一家超市进行调查。下面的表2—1是调查员随机观察的50名顾客购买的饮料类型及购买者性别的记录。生成频数分布表,观察饮料类型和消费者性别的分布状况,并进行描述性分析制作频数分布表绿色健康饮品2-34统计学基础2010年三、使用Excel数据透视表计数(pivottable)第1步:选择【数据】菜单中的【数据透视表和数据透视图】第2步:确定数据源区域(在操作前将光标放在任意数据单元格内,系统会自动选定数据源区域)第3步:在【向导—3步骤之3】中选择数据透视表的输出位置,然后选择【布局】第4步:在【向导—布局】对话框中,依次将“饮料类型”拖至左边的“行”(或列)区域,将“顾客性别”拖至“列”(或行)区域,将“饮料类型”拖至“数据”区域。第5步:单击【确定】,自动返回【向导—3步骤之3】对话框。单击【完成】用数据透视表生成分类数据的频数分布2-35统计学基础2010年生成频数分布表(列联表—Excel)不同类型饮料和顾客性别的频数分布绿色健康饮品2-36统计学基础2010年四、分类数据的图示—条形图(barChart)1.用宽度相同的条形的高度或长短来表示各类别数据2.各类别可放在纵轴,称为条形图,可以放在横轴,称为柱形图(columnchart)2-37统计学基础2010年分类数据的图示—复式条形图(barChart)饮料类型和顾客性别的条形图(SPSS的输出)2-38统计学基础2010年012345678912345系列1系列22-39统计学基础2010年分类数据的图示---帕累托图帕累托图(Paretochart)是以意大利经济学家V.Pareto的名字而命名的。帕累托图又叫排列图、主次图,是按照发生频率大小顺序绘制的直方图。排列图用双直角坐标系表示,左边纵坐标表示频数,右边纵坐标表示频率.分析线表示累积频率,横坐标表示影响质量的各项因素,按影响程度的大小(即出现频数多少)从左到右排列,通过对排列图的观察分析可以抓住影响质量的主要因素。2-40统计学基础2010年标准帕累托图2-41统计学基础2010年分类数据的图示—帕累托图(paretochart)1.按各类别数据出现的频数多少排序后绘制的柱形图2.用于展示分类数据的分布2-42统计学基础2010年二八原理帕累托法则往往称为“二八原理”,即百分之八十的问题是百分之二十的原因所造成的。帕累托图在项目管理中主要用来找出产生大多数问题的关键原因,用来解决大多数问题。在帕累托图中,不同类别的数据根据
本文标题:(02)(统计学贾俊平)第2章 数据的图表展示
链接地址:https://www.777doc.com/doc-3372974 .html