您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 统计学-数据的图表展示分析
2020/2/16第三章数据的图表展示3.1数据的预处理3.2用图表展示定型数据3.3用图表展示定量数据3.4合理使用图表2020/2/16不同原因引起的寿命损失原因寿命减少天数原因寿命减少天数未结婚(男性)惯用左手吸香烟(男性)未结婚(女性)30%超重20%超重吸香烟(女性)抽雪茄35003285225016001300900800300危险工作,事故交通事故饮酒滥用药物一般工作,事故自然放射性喝咖啡医疗X——射线30020013090748862020/2/16柱形图01002003004005006007008009001000135791113原因寿命减少天数原因未结婚(男性)惯用左手吸香烟(男性)未结婚(女性)30%超重寿命减少的天数350032852250160013002020/2/16帕累托图原因医疗—X喝咖啡自然放射一般工作滥用药物饮酒交通事故危险工作抽雪茄吸香烟(20%超重30%超重未结婚(吸香烟(惯用左手未结婚(寿命减少天数40003500300025002000150010005000Percent0200300300800900130016002250328535002020/2/163.1数据的预处理DataPreparation3.1.1.数据的审核与筛选3.1.2数据的排序3.1.3数据透视表2020/2/16数据的审核、筛选与排序1.数据的审核DataCheck发现数据中的错误2.数据的筛选DataFilter找出符合条件的数据3.数据排序DataRank发现数据的基本特征升序和降序2020/2/163.1.1数据的审核(原始数据Check—RawData)审核的内容1.完整性审核–检查应调查的单位或个体是否有遗漏–所有的调查项目或指标是否填写齐全2.准确性审核–检查数据是否真实反映客观实际情况,内容是否符合实际–检查数据是否有错误,计算是否正确等2020/2/16数据的审核(原始数据)审核数据准确性的方法1.逻辑检查–从定性角度,审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象–主要用于对定类数据和定序数据的审核2.计算检查–检查调查表中的各项数据在计算结果和计算方法上有无错误–主要用于对定距和定比数据的审核2020/2/16数据的审核(第二手数据SecondHandData)1.适用性审核–弄清楚数据的来源、数据的口径以及有关的背景材料–确定这些数据是否符合自己分析研究的需要2.时效性审核–应尽可能使用最新的统计数据3.确认是否必要做进一步的加工整理2020/2/163.1.2数据的筛选1.对审核过程中发现的错误应尽可能予以纠正2.当发现数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选3.数据筛选的内容包括:将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔出2020/2/16【例3.1】学生四门课程的成绩数据筛选表3-18名学生考试成绩第一步:选择【工具】菜单,并选择【筛选】,如果要筛选出给定条件的数据,可使用【自动筛选】命令,如图3-1所示:这时会在第一行出现下拉键头,用鼠标点击箭头会出现如图3-2所示的结果第二步:在下拉键头方框内选择要筛选出的数据。比如,要筛选出统计成绩为75分的学生。选择75,得到结果如图2-3所示。要筛选出英语成绩最高的前四个学生,可选择【前4个】,并在对话框中输入数据4,结果如图3-4所示。单击确定后即可得到相应的结果。图3-3图3-4第三步:如果要选出四门课成绩都大于70分的学生,由于设定的条件比较多,需要使用【高级筛选】命令,使用高级筛选命令时,必须建立条件区域。这时需要在数据清单上方至少留出三行作为条件区域。然后在【列表区域】选出其中要筛选的数据清单,在【条件区域】中选择匹配的条件。比如要筛选出四门课程成绩均大于70分的学生,如图3-5所示。单击【确定】后出现的结果如图3-6所示。图3-5图3-62020/2/163.1.3数据的排序1.按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索2.排序有助于对数据检查纠错,以及为重新归类或分组等提供依据3.在某些场合,排序本身就是分析的目的之一4.排序可借助于计算机完成数据的排序1.定类数据的排序字母型数据,排序有升序降序之分,但习惯上用升序汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分2.定距和定比数据的排序–递增排序:设一组数据为X1,X2,…,XN,递增排序后可表示为:X(1)X(2)…X(N)–递减排序可表示为:X(1)X(2)…X(N)2020/2/163.1.4数据透视表利用数据透视表可以利用Excel提供的数据透视表工具,对数据重要信息按使用者习惯分析要求进行汇总和作图,形成一个符合需要的交叉表(列联表)。在利用数据透视表时,数据源表中的首行必须有列标题。第一步:建立Excel数据清单,如表3-22020/2/16表3-2第二步:选中数据清单中的任意单元格,并选择【数据】菜单中的【数据透视表和数据透视图】,弹出对话框如图3-7所示。然后根据需要选择“数据源类型”和“报表类型”。这里我们选用【MicrosoftOfficeExcel数据列表或数据库】和【数据透视表】,单击下一步,探出对框如图3-8所示图3-7图3-8第三步:确定数据源区。本利的数据源区为$A$1:$F$31,如果在启动想到之前单击了数据源单元格,Excel会自动选定数据源区域。单击下一步,探出的对话框如图3-9所示。图2-9第四步:在上面的对话框中,选择数据透视表的输出位置,为方便起见可选择【现有工作表】,并利用鼠标确定数据透视表的输出位置,本例为原工作表的G1单元格,然后选择【布局】,弹出的对话框如图3-10所示。图2-10第五步:在上面的【数据透视表和数据透视向导——布局】对话框中,依次将“性别”和“买衣物首选因素”拖至左边的“行”区域,将“家庭所在地”拖至上边的“列”区域,将“平均月生活费”和“月平均衣物支出”拖至“数据”区域。如图3-11所示。图3-11根据需要建立【数据透视表和数据透视图向导——布局】第六步:单击【确定】,自动返回【数据透视表和数据透视图向导—3步骤之3】对话框。然后单击【完成】,即可输出数据透视表。结果如图3-12所示。图3-12根据需要建立的数据透视表2020/2/163.2品质数据的整理与显示3.2.1生成频数分布图3.2.2定序数据的图示2020/2/16分类数据的整理与显示2020/2/16数据的整理与显示(基本问题)1.要弄清所面对的数据类型,因为不同类型的数据,所采取的处理方式和方法是不同的2.对定类数据和定序数据主要是做分类整理3.对定距数据和定比数据则主要是做分组整理4.适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据2020/2/161、基本过程(1).列出各类别(2).计算各类别的频数(3).制作频数分布表(4).用图形显示数据3.2.1分类数据的整理与显示2020/2/16CategoricalDataOrganization生成频数分布图1.Listallthecategories.列出所有分类。2.Calculatethefrequencyofeverycategory.计算各类别的频数。3.Makeafrequencydistributiontable.编制频数分布表。4.Graphicalpresentation.用图形表现出来。分类频数比例百分比比率ABCDEProcedure程序:2020/2/16定类数据的整理(可计算的指标)1.频数(frequency):落在各类别中的数据个数2.比例:某一类别数据占全部数据的比值3.百分比:将对比的基数作为100而计算的比值4.比率:不同类别数值的比值2020/2/16顾客性别及购买的饮料类型表3-32020/2/16不同类型的饮料和顾客性别的频数分布表表3-4也称为列联表或交叉表2020/2/16SPSS生成频数分布表第一步:选择【Analyze】【DescriptiveStatistics-Frequencies】进入主题对话框第二步:将“饮料类型”或“顾客性别”选入【Variable】;选中【DisplayFrequenciestables】。第三步:点击【Statistics】或【Charts】并选择相应的选项。点击【OK】2020/2/16表3-5不同类型饮料的频数分布表3-6不同性别顾客的频数分布2020/2/16SPSS生成列联表第一步:选择【Analyze】【DescriptiveStatistics-Crosstabs】进入主题对话框第二步:将“饮料类型”选入【Rows】;“顾客性别”选入【Columns】(行列可互换)。第三步:点击【Cells】,选择相关内容,或选其他相关选项。2020/2/16表3-7饮料类型和顾客性别的交叉列联表表3-8饮料类型和顾客性别的交叉列联表及其分析2020/2/16(2)比例(proportion)(3)百分比(percentage)(4)比率(ratio)2、分类数据的图示(1)条形图(barchart)用宽度相同的条形高度或长度表示数据多少的图形。纵置或横置,纵置时称为柱形图(columnchart)(1)频数(frequency)2020/2/16-113579111315果汁矿泉水绿茶其他碳酸饮料051015202530男女图3-132020/2/16【例】2562852475634683973286880100200300400500600700800联想IBM康柏戴尔一季度二季度2020/2/16SPSS输出效果电脑品牌戴尔康柏IBM联想Value800700600500400300200100一季度二季度2020/2/16(2)帕累托图(Paretochart):按各类数据频数多少排序后绘制的柱形图。频数15119960246810121416可口可乐旭日升冰茶百事可乐露露汇源果汁2020/2/16图3-142020/2/1645469012345678910果汁矿泉水绿茶其他碳酸饮料男女图3-142020/2/16(3)饼图:使用圆形或院内扇形的角度来表示数值大小的图形,主要用于表示一个样本(或总体)个组成部分的数据占全部数据的比例。果汁,6,12.00%矿泉水,10,20.00%绿茶,11,22.00%其他,8,16.00%碳酸饮料,15,30.00%图3-162020/2/16定类数据整理—频数分布表(实例)【例3.4】为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问题做了邮寄问卷调查,其中的一个问题是“您比较关心下列哪一类广告?”1.商品广告;2.服务广告;3.金融广告;4.房地产广告;5.招生招聘广告;6.其他广告。表3-8某城市居民关注广告类型的频数分布广告类型人数(人)比例频率(%)商品广告服务广告金融广告房地产广告招生招聘广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计20011002020/2/16定类数据的图示—条形图(条形图的制作)1.条形图是用宽度相同的条形的高度或长短来表示数据变动的图形2.条形图有单式、复式等形式3.在表示定类数据的分布时,是用条形图的高度来表示各类别数据的频数或频率4.绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图2020/2/16定类数据的图示—条形图(由Excel绘制的条形图)人数(人)5191610211204080120商品广告服务广告金融广告房地产广告招生招聘广告其他广告广告类型图3-1某城市居民关注不同类型广告的人数分布2020/2
本文标题:统计学-数据的图表展示分析
链接地址:https://www.777doc.com/doc-3798365 .html