您好,欢迎访问三七文档
当前位置:首页 > 办公文档 > 理论文章 > 第三讲 统计数据的整理与显示
第三讲统计整理广东食品药品职业学院1、关于excel统计功能的安装2、数据的预处理3、三类数据(分类、顺序、数值型)的整理与显示4、统计表重点内容学习目标1.了解excel统计功能的安装和使用2.了解数据预处理的内容和目的3.掌握分类和顺序数据的整理与显示方法4.掌握数值型数据的整理与显示方法5.用Excel作频数分布表和各种图形6.合理使用统计表Officexp及excel统计功能的安装和使用步骤:点setup.exe程序进行安装,输入sn.txt安装序列号,安装完成后运行crack文件夹中批处理软件进行注册。以下是整个安装过程演示输入安装序列号至此:完成安装与软件注册加载excel软件统计功能:点确定,计算机没反应,大功告成。打开excel软件界面,点工具数据的推断统计统计数据的获取数据的描述统计统计数据的预处理形成统计决策形成统计报告统计技术学习思路数据的预处理一.数据审核二.数据筛选三.数据排序调查数据输入版举例数据的预处理1.数据的审核检查数据中的错误2.数据的筛选找出符合条件的数据3.数据排序升序和降序寻找数据的基本特征数据审核审核的内容完整性审核检查应调查的单位或个体是否有遗漏所有的调查项目或指标是否填写齐全及时性审核检查数据是否及时报送准确性审核检查数据是否真实反映客观实际情况,内容是否符合实际检查数据是否有错误,计算是否正确等数据筛选用Excel进行数据筛选8名学生的考试成绩数据姓名年龄学历工龄面试成绩笔试成绩陈亮26研究生06.58.0高峻31本科87.87.6袁洁38大专187.76.0张华23中专05.08.2袁方42大专238.15.6田雨46大专267.94.2罗成35研究生108.28.2赵伟40本科186.95.8数据排序1.按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索2.排序有助于对数据检查纠错,以及为重新归类或分组等提供依据3.在某些场合,排序本身就是分析的目的之一4.排序可借助于计算机完成用Excel进行数据排序数据的整理与显示一.分类数据的整理与显示二.定序数据的整理与显示三.数值型数据的整理与显示数据的整理与显示(基本问题)1.要弄清所面对的数据类型,因为不同类型的数据,所采取的处理方式和方法是不同的2.对分类数据和顺序数据主要是做分类整理3.对数值型数据则主要是做分组整理1、分类数据的整理与图示分类数据的整理(基本过程)1.列出各类别2.计算各类别的频数3.制作频数分布表4.用图形显示数据分类频数比例百分比比率ABCDE分类数据的整理(可计算的统计量)1.频数(frequency):落在各类别中的数据个数2.比例(proportion):某一类别数据占全部数据的比值3.百分比(percentage):将对比的基数作为100而计算的比值4.比率(ratio):不同类别数值的比值分类数据整理—频数分布表(例题分析)【例】一家市场调查公司为研究不同品牌相机的市场占有率,对随机抽取的一家销售店铺进行了调查。调查员在对50名顾客购买相机的品牌进行了记录,如果一个顾客购买某一品牌的相机,就将这一相机的品牌名字记录一次。右边就是记录的原始数据用Excel制作频数分布表绿色健康饮品JVC松下松下索尼索尼索尼三星佳能松下松下佳能索尼松下索尼索尼索尼三星索尼三星JVC索尼索尼三星松下索尼JVC佳能JVC索尼松下索尼松下索尼佳能索尼佳能三星松下索尼三星索尼佳能三星三星索尼JVC索尼索尼JVC佳能分类数据的图示—条形图1.用宽度相同的条形的高度或长短来表示各类别数据的图形2.有单式条形图、复式条形图等形式3.主要用于反映分类数据的频数分布4.绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图分类数据的图示—条形图(例题分析)05101520JVC佳能索尼松下三星各品牌相销售条形图画法分类数据的图示—饼图1.也称圆形图,是用圆形及圆内扇形的角度来表示数值大小的图形2.主要用于表示总体或样本中各组成部分所占的比例,对于研究结构性问题十分有用3.绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形角度表示,这些扇形的中心角度,是按各部分数据百分比占3600的相应比例确定的分类数据的图示—饼图(例题分析)各品牌相机销售饼形图JVC12%佳能14%索尼40%松下18%三星16%下图是如何画出来的?教师学历结构以下58%博士及以上10%硕士32%请回顾分类型数据的处理方法转化为数学语言、列出各类别数据写出接收上限制作频数分布图用图形显示数据还有其他方法统计它们的频数吗?1、运用函数frequency2、运用函数countif3、运用数据透视表2、顺序数据的整理和图示顺序数据举例:产品按优良中排序,成绩按优秀、良好、合格、不合格排序相关概念:分类数据的处理方法、图表都适合于定序数据的处理!顺序数据还可以计算他们的累积频数或累积频率。1.累积频数:各类别频数的逐级累加2.累积频率:各类别频率(百分比)的逐级累加顺序数据的频数分布表(例题分析)【例】某企业对甲乙两班成员进行了相关培训,两班组培训成绩的累计频数、累计频率分别如右,用折线图、饼形图表示它们。甲班组成员培训成绩人数百分比(%)向上累积向下累积人数百分比(%)人数百分比(%)优良中及格不及格5128321740271065172528301757849410030251352100.08343166合计30100.0————乙班组成员培训成绩人数百分比(%)向上累积向下累积人数百分比(%)人数百分比(%)优良中及格不及格7136312344201037202629302367879710030231041100.07733133合计30100.0————甲班组员工培训成绩5172528303025135205101520253035优良中及格不及格培训成绩人数向上累积向下累积甲班组成员培训成绩人数百分比(%)向上累积向下累积人数百分比(%)人数百分比(%)优良中及格不及格5128321740271065172528301757849410030251352100.08343166合计30100.0————累计频数图环形图1.环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示2.环形图与圆形图类似,但又有区别圆形图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环3.环形图可用于结构比较研究4.环形图主要用于展示分类和顺序数据甲乙班组培训成绩饼形图17%39%27%10%7%23%44%20%10%3%优良中及格不及格甲乙优57良1213中86及格33不及格21数值型数据的整理与显示一.数据分组二.数值型数据的图示1201111271111141111201241201241251206810068103106103106106891061231251031038910610012012014912012010610698981201501206889103103891201161081501501061081101209811111198120106120120981001001101497012010310697999711411412012014912012012014097120150120701001401209710698891191198998891081141201251201231061101271201271231201139712010612312068134681231209712097100106120117126129145129145119113133125120100120120101581011201011201201008970871267089120110117701171401401171196899107104120150581011006814987139120110133511201231305112012012013310210414911011512013412010198891046911911370107112123981398712810711911311389691301201201121161021261261201341205814510469133107100107971151261201261211261216814010712012068145124681401207189123100140991201456999511365114969112991201205897120139104120124116120120635112512012012010410212013410712011112711163111120124120124136871351006810310669135131891061231251036389106100120136124120120871069898135981316889133103691201161081061081061081391209811113398139106120120985810071134981201031069799976363120120691391201201169712012069108100120120971069869119119899889108114120135120136106110127120711231391139763106123120689968123120971209769106120117126129135137110711131201251201001391371361201011351011201201008912011912612089120110117137137120117117119687110710412068891011396812012011512011011912012012313012712012012012010210410411011512012312013598891048911911313910711271981121281281071191131131361201301201201121161021261351371247197112104100120107100107971151261201261371261216811610713712068120124681101209989123100120991201251209911611099120137112991201201209712012071120124116120120120120125120120120104102120107107例:某重点中学物理高考成绩如右对于这样大型的数值型数据如何处理?组距分组(要点)1.将变量值的一个区间作为一组2.适合于连续变量3.适合于变量值较多的情况4.需要遵循“不重不漏”的原则5.可采用等距分组,也可采用不等距分组~~~~~组距分组(步骤)1.确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按Sturges提出的经验公式来确定组数K2.确定组距:组距(ClassWidth)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=(最大值-最小值)÷组数3.统计出各组的频数并整理成频数分布表)2lg()lg(1nK组距分组(几个概念)1.下限(lowlimit):一个组的最小值2.上限(upperlimit):一个组的最大值3.组距(classwidth):上限与下限之差4.组中值(classmidpoint):下限与上限之间的中点值下限值+上限值2组中值=频数分布表的编制(例题分析)【例】某班组50名成员日产量的数据如图,试对数据进行分组并编制变量数列。某班组50名成员日产量表14811612812512914010
本文标题:第三讲 统计数据的整理与显示
链接地址:https://www.777doc.com/doc-3337231 .html