您好,欢迎访问三七文档
第一章数据的收集、整理与显示-1-数据的收集、整理与显示统计数据的收集、整理与显示是统计分析的基础和初步,其中涉及到抽样方法的选择,数据的筛选、排序,数据的分类和分组以及频数分布的制作等。本章主要介绍如何使用Excel进行相应处理,其中第一节统计数据的收集,介绍“抽样”工具的使用;第二节数据的预处理,介绍“筛选”、“排位和百分比排位”工具的使用;第三节品质数据的整理与显示,介绍如何使用“直方图”工具制作品质型数据的频数分布;第四节数值型数据的整理与显示,介绍如何使用“直方图”工具制作数值型数据的频数分布以及多变量数据的雷达图制作。第一节统计数据的收集收集统计数据是统计研究的第一步。统计数据最初都来源于直接的调查或实验,其中抽样调查是实际中应用最广泛的一种调查方式,它是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查方式。在Excel的“数据分析”工具中有一个“抽样”工具,可以较简单迅速地完成一些常规的抽样任务。Excel菜单栏“工具”选项中“数据分析”工具是统计分析时经常需要用到的,在初次使用时会发现在Excel相应位置中找不到这一选项,其原因在于在安装Office办公集成软件或MicrosoftExcel时,一般使用的是“自动”或“典型”安装。为此,需要使用者自己加载这一功能。如图1.1和图1.2所示,在“工具”菜单中单击“加载宏”选项,从其弹出的对话框列表中,单击“分析工具库”前面的标志复选框,然后点击“确定”。此时,MicrosoftExcel会弹出对话框询问是否要安装,点击“是”选项后,系统会提示使用者放入光盘或指定资源位置。按提示操作后,点击“确定”即可。图1.1在“工具”菜单中单击“加载宏”选项在加载成功“数据分析”选项后,下面说明如何使用数据分析工具中“抽样”工具抽取样本。首先需要编制总体单位编号表。总体单位编号,可按随机原则也可按照与调查目的有关或无关的标志排队编号。例如:某年级有100名学生,要调查四级英语考试情况,按学生的姓名笔画排队编号,是无关标志编号;按学生的英语成绩排队编号,属有关标志编号。输入编号的方法很简单,这里不在详述。把100名学生的编号输入Excel表格中,如表1-1所示。第一章数据的收集、整理与显示-2-图1.2在“加载宏”列表中选择“分析工具库”表1-1总体单位编号表在Excel表中输入总体编号后,可按以下步骤操作完成抽样工作第一步:在“工具”菜单中单击“数据分析”选项,从其对话框“分析工具”列表中选择“抽样”,回车打开“抽样”对话框。(见图1.3~图1.5)图1.3在“工具”菜单中单击“数据分析”选项第一章数据的收集、整理与显示-3-图1.4从“分析工具”列表中选择“抽样”图1.5“抽样”工具对话框第二步:在“抽样”对话框中进行相应设置。本例在“输入区域(I)”(总体单位编号所在区域)输入A1:J10(在Excel执行过程中自动更换为绝对引用形式,即在字符和数字前加$号,使用者没有必要考虑这两种形式的不同)。Excel将从A列开始抽样,然后按顺序抽取B列至J列。如果“输入区域(I)”的第一行或第一列有标题,则需单击“标志(L)”前面的复选框(使其出现对钩,表示已被选定)。第三步:在“抽样方法”选择区域具体选择抽样模式:1、“周期(E)”模式,即等距抽样或机械抽样。采用此模式,需要将总体单位数除以所需样本数,求得取样的周期间隔。本例中如果在100名学生中抽取10名进行调查,100/10=10,可在“间隔框”中输入10(如果计算得到的周期间隔不是整数,取整即可)。2、“随机(R)”模式适用于纯随机抽样、分层抽样、整群抽样和多阶段抽样。如采用纯随机抽样,只需在“样本数”框中输入所需的样本单位数。本例,可在“样本数”框中输入10。对于分层抽样、整群抽样和多阶段抽样的具体含义,可参考有关教科书,这里不再详述,其具体做法与纯随机抽样的区别在于第二步“输入区域(I)”上的不同。如采用分层抽样,事先要计划好分几层,每层要抽取多少样本,每层的总体单位编号在何区域。在每一层中,分别采用纯随机抽样,步骤同上。第四步:指定“输出区域(O)”。“输出区域(O)”是指Excel结果输出的起始位置,输入单元格的行列号即可,本例输入“e6”。当然,也可以选择“新工作表组(P)”或“新工作薄(W)”作为放置抽样结果的位置。完成以上操作后,回车确认,即在指定的位置给出抽样结果。第一章数据的收集、整理与显示-4-第二节数据的预处理数据的预处理是数据整理的先前步骤,是在对数据分类或分组之前所做的必要处理,包括数据的审核、筛选、排序等。本节主要介绍Excel中筛选和排序功能的使用。一、数据筛选数据筛选包括两方面内容:一是将某些不符合要求的数据或有明显错误的数据予以剔除;二是将符合某种特定条件的数据筛选出来,对不符合特定条件的数据予以剔除。下面举例说明Excel进行数据筛选的过程。表1-28名学生的考试成绩数据单位:分表1-2是八名学生四门课程的考试成绩数据,使用Excel“筛选”命令分别找出统计成绩等于75分的学生;英语成绩前三名的学生;数学成绩大于80小于90的学生;统计成绩和数学成绩大于80分,或者英语成绩大于90分的学生。Excel提供了两种筛选命令:“自动筛选”(适用于简单的条件)和“高级筛选”(适用于复杂的条件)。接下先来介绍“自动筛选”的使用。首先,将表格中的数据区域选定或者只需确保活动单元格处于数据区域既可(如表1-2所示,活动单元格为B3)。选择“数据”菜单,并选择“自动筛选”命令。如图1.6所示。图1.6从“数据”菜单中选择“筛选自动”这时会在第一行(列标题)出现下拉箭头,用鼠标点击箭头会出现如下结果,如图1.7所示。第一章数据的收集、整理与显示-5-图1.7“自动筛选”命令图1.8统计成绩75分的学生图1.9英语成绩前三名的学生图1.10数学成绩大于80小于90的学生第一章数据的收集、整理与显示-6-要筛选出统计学成绩为75分的学生,可选择75,得到图1.8的结果;要筛选出英语成绩最高的前三名学生,可在英语成绩下拉箭头选项中选择“前10个”,并在对话框中输入“3”,得到如图1.9所示结果。要筛选出数学成绩大于80小于90的学生,可在数学成绩下拉箭头的选项中选择“自定义”。在弹出的对话框中,进行相应的设置,如图1.10所示。上面介绍的筛选方法条件比较单一,要求较少,一般情况下选择“自动筛选”命令就可以完成。对于设定条件比较多的筛选,则需要使用“高级筛选”命令。“高级筛选”与“自动筛选”命令不同,它要求在一个工作表区域内单独指定条件区域(也称筛选区域)与数据区域区分开来。通常的做法是把条件区域放在数据区域的上面,一个筛选区域至少要包含两行。如果第一行是列标题,则筛选将从第二行及其下面的行开始执行,需要注意的是条件区域的标题应和数据区域的标题一致。下面用“高级筛选”命令筛选出“统计成绩和数学成绩大于80分,或者英语成绩大于90分”的学生。第一步:建立条件区域,即在工作表的顶端插入若干新行来放置条件。具体到本例至少需要插入四行来放置条件(注意:数据区域与条件区域必须有一行间隔)。如图1.11所示。图1.11条件区域的建立图1.12“高级筛选”命令的使用Excel将根据以下规则解释这一区域:◆同一行中的条件之间的关系是“与”。第一章数据的收集、整理与显示-7-◆不同行中的条件之间的关系是“或”。第二步:选择“高级筛选”命令,在弹出的对话框中进行相应的设置。如图1.12所示。在本例在“数据区域(L)”输入A5:E13,在“条件区域(C)”输入A1:C3,回车确定即可。结果见表1-3。需要说明的是“自动筛选”和“高级筛选”命令显示筛选出的数据时,Excel仅仅把不符合要求的行隐藏起来,并且为了提醒用户此区域是经过筛选的数据区域,Excel会用对比颜色来显示筛选出的行数。如果要取消“筛选”,可以单击“筛选”菜单上的“全部显示”命令,也可以单击下拉列表框并选择“全部”(此时使用的是“自动筛选”命令)。所以,为了保证筛选结果的正确与“安全”,通常需要把每一次筛选的结果复制到其它工作表中。表1-3筛选结果二、数据的排序数据排序是按一定的顺序将数据排列,以便研究者通过排序后数据的特征或趋势,找出解决问题的线索。对于数值型数据的排序,即递增和递减排序,在Excel“数据”菜单中的“排序”命令可以很方便的实现这一功能,由于篇幅所限这里不再介绍。下面介绍如何利用Excel的“排位和百分比排位”分析工具来进行分析,此工具可以产生次序排位和百分比排位。以表1-2为例,步骤如下:第一步:在“工具”下拉菜单中单击“数据分析”选项,从其对话框“分析工具”列表中选择“排位和百分比排位”,回车打开其对话框(见图1.13,图1.14)。图1.13“排位和百分比排位”命令第一章数据的收集、整理与显示-8-图1.14“排位和百分比排位”命令对话框第二步:(以统计学成绩单列数据为例)对命令对话框进行相应设置。本例统计学成绩数据区域为“B1:B9”,“输入区域(I)”输入“B1:B9”。“分组方式”要求指出输入区域中的数据是按行还是按列排列,在本例中选择默认设置“列”。如果“输入区域(I)”的第一行包含了标志项,则需单击选中“标志位于第一行(L)”复选框,本例显然要选中此项。在输出选项中,按照需要相应选择,本例因输出结果比较多,所以选择“新工作表组(P)”。设置完毕,回车确定,结果见表1-4。表1-4排位和百分比排位结果显示结果包括四列:第一列“点”为数据原来的排列顺序;后三列依次为数据值、数据值排序和百分比排序。百分比排序的数值指的是“好于多少的”数据,如统计学成绩87分的百分比排序值为85.7%,指的是其成绩好于85.7%的其它数据。在本例中,使用“排位和百分比排位”分析工具分析了统计学单列数据。可以使用此工具分析全部四个成绩:统计学、数学、英语、经济学,在这种情况下应指定“B1:E9”为输入区域,工具将输出16列数据。第三节品质数据的整理与显示数据经过预处理后,可进一步做分类或分组整理。在对数据进行整理与显示时,首先要弄清是什么类型的数据,不同类型的数据适用的处理方法不同。一般情况下,对品质数据主要是分类整理,对数值型数据主要是分组整理。本节以及下一节(数值型数据的整理与显示)主要介绍这两大类数据频数分布的制作,而对于一般图形的制作,如:条形图、饼行图、直方图、圆环图等属于Excel的基本内容,由于篇幅所限不在这里讲述。下面通过一个具体的例子来说明如何使用Excel来制作定类数据的频数分布。第一章数据的收集、整理与显示-9-表1-5是一家市场调查公司为研究不同品牌饮料的市场占有率,调查员某天对50名顾客购买饮料品牌记录的原始数据。具体做法是:如果一个顾客购买某一品牌的饮料,就将这一饮料的品牌记录一次。表1-5顾客购买饮料品牌的记录因为Excel无法识别非数值型数据,所以为了用Excel建立饮料品牌的频数分布,首先需要将字符数字化。为此,通常的做法是将不同品牌的饮料用一个数字代码来表示。本例对各种品牌饮料指定的代码是:1.可口可乐2.旭日升冰茶3.百事可乐4.汇源果汁5.露露然后,将各品牌的代码输入到Excel工作表中。假定这里已将品牌代码输入到Excel工作表中的B2:B51,这样就将定类数据转化为数值型数据。为建立频数分布表和条形图,Excel还要求将每个品牌的代码作为分类标志单独输入到任何一列,这里将代码输入到工作表的C4:C8(见表1-6)。这样,Excel就可以对数值小于或等于每一品牌代码的数据进行计算,提供的合计数就是各品牌的频数分布。下面是用Excel产生频数分布表和图形的步骤:第一步:在“工具”下拉菜单中单击“数据分析”选项,从其对话框“分析工具”列表中选择“直方图”,回车打开其对话框(如图1.15,图1.16所示)。图1.15从对话框“分析工具”列表中选择“直方图”第一章数据的收集、整理与显示-10-图1.16对话框的设置第二步:对命令对话框进行相应设置。本例“输
本文标题:统计学上机实验指导
链接地址:https://www.777doc.com/doc-6498970 .html