您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 03第3章-数据的图表显示.
LOGO第3章数据的图表展示数据的预处理品质数据的图表展示数值型数据的图表展示统计图表的合理使用学习目标数据预处理。掌握数据审核、数据筛选、数据排序的方法。品质数据。掌握品质数据的图表表示方法,理解各种图表的含义,并能熟练绘制各种图表。数量数据。掌握品质数据的图表表示方法,理解各种图表的含义,并能熟练绘制各种图表。3.1数据的预处理3.1.1数据审核3.1.2数据筛选3.1.3数据排序3.1.1数据审核数据审核基本要求:数据的真实性数据的完整性数据的准确性数据的适用性数据的时效性3.1.2数据筛选1.当数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据进行筛选2.数据筛选的内容将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔除数据筛选(例题分析)【例3.1】下表是10名学生3门课程的考试成绩数据(单位:分)。试找出全体男同学的成绩单,英语成绩高于90分的学生,3门课程成绩都大于80分的学生。Excel数据筛选操作SPSS数据筛选操作3.1.3数据排序数据排序:1.按一定顺序将数据排列,有利于对数据的总体浏览,以发现一些明显的特征或趋势,找到解决问题的线索2.排序有助于对数据检查纠错,以及为重新归类或分组等提供依据3.在某些场合,排序本身就是分析的目的之一4.排序可借助于计算机完成排序方法1.分类数据的排序字母型数据,排序有升序降序之分,但习惯上用升序汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分2.数值型数据的排序递增排序:设一组数据为x1,x2,…,xn,递增排序后可表示为:x(1)x(2)…x(n)递减排序:可表示为:x(1)x(2)…x(n)数据排序(例题分析)【例3.1】下表是10名学生3门课程的考试成绩数据(单位:分)。试找出全体男同学的成绩单,英语成绩高于90分的学生,3门课程成绩都大于80分的学生。Excel数据排序操作SPSS数据排序操作3.2品质数据的图表展示3.2.1分类数据的图表展示3.2.2顺序数据的图表展示频数与频数分布1.频数(frequency):落在某一特定类别(或组))中的数据个数2.比例(proportion):称构成比,它是一个样本((或总体)中各个部分的数据与全部数据之比,通常反映样本(或总体)的构成或结构。3.百分比(percentage):比例的百分数形式。4.比率(ratio):是样本(或总体)中各不同类别数值之间的比值。【例3.2】一家市场调查公司为研究国产笔记本电脑的市场占有率,对拥有国产笔记本电脑的消费者随机选取了50人进行访问,并把这50人所拥有的国产笔记本电脑品牌结果进行记录,如下表所示。宏基联想神舟方正方正海尔联想华硕宏基神舟联想方正海尔联想华硕神舟华硕华硕方正海尔宏基联想联想华硕宏基方正海尔宏基联想华硕华硕宏基神舟方正联想华硕宏基神舟方正华硕华硕海尔华硕华硕宏基联想神舟华硕联想方正频数分布表(例题分析)频数分布表(例题分析)Excel数据排序操作SPSS数据排序操作产品频数百分比有效百分比累积百分比有效华硕1326.026.026.0联想1020.020.046.0宏基816.016.062.0神舟612.012.074.0方正816.016.090.0海尔510.010.0100.0合计50100.0100.0分类数据的图示(1)条形图(barchart)条形图是用宽度相同条形的高度或长短来表示频数多少或频率大小的图形,可用于显示分类变量和顺序变量取值的频数或频率分布。条形图横置,各类别放在纵轴,称为条形图;条形图纵置,各类别放在横轴,称为柱形图。条形图根据变量的个数还可以分为单式、复式等。Excel绘制的条形图SPSS绘制的条形图1.按各类别数据出现的频数多少排序后绘制的柱形图。2.用于展示分类数据的分布。SPSS绘制的帕累托图(2)Pareto图(Paretochart)分类变量在不同时间或不同空间上有多个取值时,为了对比分类变量的取值在不同时间或不同空间上的差异或变化趋势,可以绘制对比条形图。【例3.3】为考察我国通讯行业发展状况,收集到下列数据,见下表。试绘制对比条形图。20052006200720082009固定电话用户数移动电话用户数35045393413677946106365645473134036641253136974738(3)对比条形图2005年—2009年我国固定的电话和移动电话用户数(单位:万户)Excel绘制对比条形图操作SPSS绘制对比条形图操作(4)饼图(piechart)饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。3.2品质数据的图表展示3.2.1分类数据的图表展示3.2.2顺序数据的图表展示3.2.2顺序数据的图表展示3.2.2.1累积频数和累积频率累积频数是将各有序类别或组的频数逐步累加起来得到的频数。频数的累积方法有两种:向上累积和向下累积。累积频率或累积百分比是将各顺序变量各取值所对应频数的百分比累加起来得到的百分比。累积频率也有向上累积和向下累积两种方法。【例3.4】对某高校的教师进行一次学历调查,在被调查的2000名教师中,学历水平共分四种类别,学历水平从低到高依次是:1.大专;2.本科;3.硕士;4.博士。调查结果的频数分布表如下表所示。学历水平人数(人)百分比(%)向上累计向下累计频数(人)频率(%)频数(人)频率(%)大专及以下160816082000100本科2401240020184092硕士122061162081160080博士38019200010038019合计2000100累计频率(例题分析)(1)累积频数分布图向上累积分布图向下累积分布图3.2.2.2顺序数据的图示(2)环形图(doughnutchart)家庭收入很幸福比较幸福一般不太幸福很不幸福2万以下2~5万5~10万10万以上14.7917.5921.9731.7129.4036.4841.2740.0844.3638.3929.2419.366.524.734.063.804.932.813.465.05【例3.5】2010年1月,央视财经频道中国财经报道栏目主办了“CCTV2009经济生活大调查”,共收回近8万份有效问卷,下表是:“您对目前生活的感觉?A很幸福B比较幸福C一般D不幸福E很不幸福。”这一题目的统计结果。1.环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示;2.环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环;3.用于结构比较研究;4.用于展示分类和顺序数据。3.3数值型数据的图表展示3.3.1数据分组3.3.2数值型数据的图示数据分组(1)单变量值分组:把每一个变量的取值都作为分组标志形成一组;单变量值分组方法适合于离散变量;适用于变量值较少的情况。(2)组距分组将某一区间的变量值作为一组适用于连续变量适用于变量值较多的情况分为等距分组和不等距分组组距分组相关概念1.下限(lowlimit):一个组的最小值2.上限(upperlimit):一个组的最大值3.组距(classwidth):上限与下限之差4.组中值(classmidpoint):下限与上限之间的中点值下限值+上限值2组中值=上限值-下限值组距=组距分组的步骤第1步:排序。将变量按照一定的大小顺序进行排序,通常是由小至大的递增顺序。第2步:确定组数。一组数据所分的组数K不应少于5组且不多于15组,即5<K<15。在实际分组时,也可以借助经验公式来确定组数K,第3步:确定各组的组距。第4步:根据分组整理成频数分布表。2lglg1nK最大值-最小值组数组距=组距分组(例题分析)【例3.6】某高校国际贸易学专业共有130名学生,学校对该专业的所有学生进行了一次专业外语口语测试,其成绩如表3—17所示,试对下列数据进行分组分析。93698377759669635460975471887868769566868282726884707668957667735670816383827986578467795678938679678264908392788982737986827694867573647184688558857580526572679075907957808494727384645862707591737386838671759873778768638365598772856974757871818471868565749183Excel组距分组操作SPSS组距分组操作成绩分组频率(人数)累积%50—60107.69%60—702426.15%70—804359.23%80—903888.46%90—10015100.00%成绩分组频率(人数)累积%50—59107.69%60—692426.15%70—794359.23%80—893888.46%90—9915100.00%成绩分组频率(人数)累积%60以下107.69%60—692426.15%70—794359.23%80—893888.46%90以上15100.00%上下组限重叠:上下组限间断:开口组:数值型数据的图示3.3.2.1分组数据:直方图直方图(histogram)用矩形的宽度和高度(即面积)来表示频数分布的图形,通常用来表示分组数据的频数分布。直方图与条形图的区别条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的。1.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义。2.直方图的各矩形通常是连续排列,条形图则是分开排列。3.条形图主要用于展示分类数据,直方图则主要用于展示数值型数据。(1)茎叶图*用于显示未分组的原始数据的分布*由“茎”和“叶”两部分组*以该组数据的高位数值作树茎,低位数字作树叶*树叶上只保留最后一位数字*能够给数据排序的图形。未分组数据:茎叶图和箱线图成绩Stem-and-LeafPlotFrequencyStem&Leaf3.005.2447.005.66678898.006.0233344416.006.555677778888899921.007.00011111222233333334422.007.555555566667788889999922.008.001122222233333344444416.008.555566666666778910.009.00011233445.009.55678Stemwidth:10Eachleaf:1case(s)SPSS绘制茎叶图的操作根据【例3.6】绘制的茎叶图(2)箱线图箱线图(boxplot)是含有丰富信息的图,由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的、主要反应原始数据分布的图形。最大值最小值中位数上四分位数下四分位数用中位数/四分位数/极差箱形图来表示的【例3.6】。3.3.2.3两变量间关系的图示:散点图和线图(1)散点图散点图(scatterplot)是用二维平面直角坐标展示两个定量变量之间关系的一种图示,主要用来表达两变量间的相关关系。用横坐标轴代表变量x,用纵坐标轴代表变量y,两个变量的每组数据(xi,yi)用一个点表示,这样n组数据在坐标系中形成了n个散点,它们与坐标轴一起就构成了散点图。年份国内生产总值全社会固定资产投资1996199719981999200020012002200320042005200620072008200920107117778973844028967799215109655120332135878159878183085216314265810314045340903397983229142
本文标题:03第3章-数据的图表显示.
链接地址:https://www.777doc.com/doc-5820495 .html