您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 统计学基础(第三章)
第三章数据整理与显示statistics统计学——第三章数据整理与显示本章内容第一节数据的审核第二节统计分组及频数分布第三节统计表第四节统计图statistics统计学——第三章数据整理与显示第一节数据的审核statistics统计学——第三章数据整理与显示数据的审核数据的检查数据的完整性和准确性数据的校订对数据做进一步的补充和修正statistics统计学——第三章数据整理与显示数据检查的步骤事先制定出检查的规则,明确规定出哪些问卷可以接受、哪些问卷必须拒绝等,并对每一份问卷进行检查。根据检查规则,将所有的问卷分为三个部分:可以接受的、明显要作废的、对是否可以接受有疑问的。对可以接受的问卷和有疑问的问卷作进一步的校订。statistics统计学——第三章数据整理与显示数据校订的步骤一、对每一份问卷,检查出不满意的答案哦,这些都是不满意的答案啊!字迹模糊的;回答不完全的;不一致的;模棱两可的;跳答错误的;……statistics统计学——第三章数据整理与显示数据校订的步骤二、处理不满意答案有不满意答案的问卷数量很小1.按缺失值处理整份问卷中,不满意的答案所占比例很小有不满意答案的变量(问题)不是关键变量statistics统计学——第三章数据整理与显示2.整个问卷作废不满意的问卷比例很小(不超过10%)样本容量很大不满意的问卷和满意的问卷之间没有明显的差别每份不满意的问卷中,不满意答案的比例很大关键变量的答案缺失statistics统计学——第三章数据整理与显示对二手数据的整理要求完整性准确性适用性时效性Excelstatistics统计学——第三章数据整理与显示第二节统计分组及频数分布statistics统计学——第三章数据整理与显示统计分组统计分组:根据统计总体内在的特征和统计研究的任务需要,将统计总体按照一定的标志划分为若干组成部分的一种统计方法。统计分组的目的:把同质总体中的具有不同性质的单位分开,把性质相同的单位合并在一起,保持各组内统计资料的一致性和各组之间资料的差异性,以便进一步研究调查对象的数量表现与数量关系,进而正确认识调查对象的本质及其规律性。statistics统计学——第三章数据整理与显示频数分布在统计分组的基础上,把总体全部单位按组归类整理,汇总出各组的总体单位数,并将其按分组顺序加以排列而形成的统计数列——频数分布分布在各组中的总体单位数——频数(次数)频数与总频数的比值——比率(频率)频数分布是对统计分组结果的表达,是进一步统计分析的重要基础。statistics统计学——第三章数据整理与显示某单位职工文化程度分布表文化程度频数/人比例/%高中专科本科硕士研究生105648167.6943.0836.9212.31合计130100.00statistics统计学——第三章数据整理与显示区分总体类型统计分组的作用反映总体内部结构分析总体在数量现象之间的依存关系穷尽原则统计分组的原则互斥原则statistics统计学——第三章数据整理与显示定性数据的分组定类数据的分组定序数据的分组statistics统计学——第三章数据整理与显示定类数据的分组原则按照其各个类别的含义进行汇总,计算出相应的频数和频率定类数据的分布数列可借助于Excel进行编制statistics统计学——第三章数据整理与显示例1:某班40个同学分别来自湖北、湖南、安徽、山东。下表是这40个同学的原始数据,试借助于Excel将其整理成频数分布。山东湖南山东安徽安徽湖北湖北山东安徽湖北湖北湖北湖南山东安徽湖北湖北山东湖北湖北山东湖南湖北山东山东湖南安徽湖南湖北湖南安徽山东山东安徽湖南安徽安徽山东湖北山东statistics统计学——第三章数据整理与显示解:为方便整理,将学生籍贯合并为一列,表达在Excel工作表中的A2:A41,并用数字代码来表示学生籍贯:设1—湖北,2—湖南,3-安徽,4—山东,将各学生的籍贯代码填入Excel工作表中B2:B41。Excel把代码视为数值型数据。为建立频数分布和条形图,Excel要求将4个代码单独作为一列,以作为“接收区域”,设将4个代码输入到工作表的C2:C5。statistics统计学——第三章数据整理与显示具体步骤:(1)打开Excel工作表中“工具”下拉菜单中的“数据分析”选项。(2)在“数据分析”对话框中选择“直方图”命令,并点击“确定”按钮。(3)在该对话框中“输入区域”一栏填入数据区域B2:B41;在“接收区域”一栏填入代码区域C2:C5;在“输出区域”一栏填入结果输出的区域;其他选项根据需要选择。点击“确定”按钮,得结果。(4)对输出结果进行还原并适当改造,即可得频数分布。statistics统计学——第三章数据整理与显示定序数据的分组原则和定类数据相类似,只是进一步要求各分组按顺序排列~~~~~~~~~~statistics统计学——第三章数据整理与显示定序数据的累积频数和累积频率累积频数:依分组顺序将各组频数逐级累加起来。累积频率(累积百分比):将各分组的频率或百分比逐级累加起来。statistics统计学——第三章数据整理与显示例2:在一项有关住房间题的研究中,研究人员在甲、乙两个城市各抽样调查300户家庭,其中的一个问题是:“您对您家庭目前的住房状况是否满意?”(1)非常不满意;(2)不满意;(3)一般:(4)满意;(5)非常满意答:调查整理的结果为回答类别甲城市户数/户百分比/%向上累积向下累积户数/户百分比/%户数/户百分比/%非常不满意不满意一般满意非常满意24108934530836311510241322252703008.044.075.090.0100.0300276168753010092562510合计300100————statistics统计学——第三章数据整理与显示回答类别乙城市户数/户百分比/%向上累积向下累积户数/户百分比/%户数/户百分比/%非常不满意不满意一般满意非常满意21997864387.033.026.021.312.7211201982623007.040.066.087.3100.030027918010238100.093.060.034.012.7合计300100.0————statistics统计学——第三章数据整理与显示数值数据(定距数据)的分组单项分组:每一个组中只有一个变量值,适用于离散型变量的数据、并且数据的范围不太大情况下的分组。组距分组:每个分组是一个数值区间。它适用于连续型变量或变动范围较大的离散型变量的数据分组。statistics统计学——第三章数据整理与显示某班同学年龄分布年龄人数/人比例/%151617183234593.7528.7556.2511.25合计80100.00某班同学数学成绩分布成绩人数/人比例/%60以下60~6970~7980~8990以上215362072.5018.7545.0025.008.75合计80100.00单项数列组距数列statistics统计学——第三章数据整理与显示组距分组应注意的问题1.组数(classdata)与组距(classwidth)组数与组距(i)的关系是:i=R/m两者成反比变化。2.等距分组与异距分组当客观现象的变动比较均衡时,宜采用等距分组;当客观现象的变动不均衡时,则宜采用异距分组。3.组限(classlimit)和组中值(classmidpoint)组限即每个分组的区间端点(包括上限和下限)。组中值即上限与下限之间的中点数值称为组中值。statistics统计学——第三章数据整理与显示组中值的计算闭口组的组中值=(上限+下限)/2缺下限的开口组组中值=上限-邻组组距/2缺上限的开口组组中值=下限+邻组组距/2statistics统计学——第三章数据整理与显示简单分组与复合分组简单分组:按照一个分组标志对所研究的对象进行分组。复合分组:按照两个或两个以上的分组标志对所研究的对象进行分组。(按不同标志层叠分组)statistics统计学——第三章数据整理与显示第二节统计分组及频数分布statistics统计学——第三章数据整理与显示统计表定义:把经过整理的数据资料,通过表格的形式表达出来。分类:广义统计表和狭义统计表。作用:清楚有条理地显示统计资料;直观反映统计分析的特征。statistics统计学——第三章数据整理与显示统计表的结构statistics统计学——第三章数据整理与显示统计表的分类简单表(一览表):主词未经任何分组的统计表。简单分组表(分组表):主词只用一个标志分组形成的统计表。复合分组表(复合表):主词按两个或两个以上标志分组的统计表。statistics统计学——第三章数据整理与显示统计表设计规则(一)(1)统计表的各类标题应十分简明,并确切地反映与概括资料的主要内容以及所属的地区和时间。纵横各栏的排列特别要注意表述资料的逻辑性。(2)主词各行和宾词各栏,一般先列各个项目,后列总体。若无必要列出全部项目时,就应先列总体,后列其中一部分重要项目。内容不宜罗列太多和过于庞杂。(3)表中应有计量单位栏。当表中只有一种计量单位时,可在表的右上端注明。若有几个计量单位时,横行的计量单位可专设“计量单位”一栏,纵栏的计量单位可与纵栏标题写在一起,用小括号标明。statistics统计学——第三章数据整理与显示统计表设计规则(二)(4)表中数字填写要整齐,上下位数要对齐,同栏数字的单位,小数位要一致。如遇相同数字必须照填,不能用“同上”或“同左”代替。无数字的空格要用“—”表示。如遇缺乏资料的空格时,要用“……”表示,以免被误认为漏报。(5)当统计表栏数较多时,通常要加编号,并说明其相互关系,主词栏与计量单位栏可用甲、乙、丙等文字标明;宾词各栏可用(1)(2)(3)等数码标明。(6)统计表的表式为开口式,即表的左右两端不封闭(不画纵线),表的上下端线通常用粗线或双线,表内如有两个或两个以上不同的内容,也要用粗线或双线隔开。(7)借用他人数据资料时,统计表应加注解,说明资料出处,一般在统计表的下端注明“资料来源”。statistics统计学——第三章数据整理与显示第四节统计图statistics统计学——第三章数据整理与显示统计图的结构标题一般包括图表标题、数值轴(X,Y)标题坐标轴和网格线坐标轴和网格线构造了绘图区的骨架,借助坐标轴和网格线,可以更容易读懂统计图。图表区和绘图区统计表的所有内容都在图表区内,包括绘图区。统计图绘制在绘图区内。图例用来标明图表中的数据系列。statistics统计学——第三章数据整理与显示定类数据的统计图1.饼图饼图(piechart)也称圆形图,是用圆形及圆内扇形的面积来表示数值大小的图形,主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用。statistics统计学——第三章数据整理与显示2.条形图条形图(barchart)是用宽度相同的条形的高度或长短来表示频数分布的统计图形。020406080100120商品广告服务广告金融广告房地产广告招生招聘广告其他广告statistics统计学——第三章数据整理与显示定序数据的统计图1.环形图环形图(doughnutchart)中间有一个“空洞”,总体中的每一部分数据用环中的一段表示。圆形图只能显示一个总体各部分所占的比例,而环形图则可以同时绘制多个总体的数据系列。8%36%31%15%10%7%33%26%21%13%非常不满意不满意一般满意非常满意statistics统计学——第三章数据整理与显示定距数据的统计图离散型定距数据——条形图连续型定距数据——直方图、折线图statistics统计学——第三章数据整理与显示分组数据直方图(histogram)用矩形的宽度和高度来表示频数分布的图形,在平面直角坐标中,以横轴表示数据分组,纵轴表示频数或频率,各分组以组距为宽,以频数或频率为高。statistics统计学——第三章数据整理与显示直方图与条形图
本文标题:统计学基础(第三章)
链接地址:https://www.777doc.com/doc-4155908 .html