您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 初中教育 > 第一章数据整理和描述.
王飞13469837024zgwf-1987@163.com数量方法什么是数量分析方法:广义上讲,研究事物的数量特征、数量关系和数量界限需要一系列特有的和通用的方法,所有这些方法统称为数量分析方法。从狭义上讲,数量分析方法是在一定的理论指导下,遵照数学和统计学的有关原理,通过处理有关数据,建立数量模型,从而对经济现象的数量特征、数量关系和数量界限进行研究、分析和决策的一系列方法的总称。第一章数据的整理和描述第一节数据的类型第二节数据的整理与图表显示第三节数据集中趋势的度量第四节数据离散趋势的度量一、数据的类型分类型数据数量型数据1、按描述事物的特征不同,分为描述事物的属性或品质特性。姓名、性别、职业、学历、企业经济类型等主要特征:数据只能以文字形式来表述。表明事物数量方面的特性。身高、体重、年龄成绩、工资、产量等主要特征数据是以数值形式表示。2、按描述对象与时间关系不同,分为描述同一时间里现象的变化情况,静态数据也称为横向数据截面数据时间序列数据平行数据描述同一现象在不同时间里的发展变化,是动态数据也称为纵向数据。截面数据与时间序列数据的组合2.按照被描述的对象与时间的关系把对事物现象特征的描述称为变量。分类型数据----------分类型变量数量型数据----------数量型变量,简称变量二、变量(一)品质分组按品质标志的分组,分组标志一确定,组名组数便确定,分组即成。如学生按性别、按专业分组,教师按学历、按职称分组等。三、数据分组与频率分布直方图(二)变量分组按数量标志分组为变量分组。如学生按年龄、成绩分组,教师按教龄、月收入分组等。对于数据型变量分组分单变量值分组与组距分组两种方法。单变量值分组即把每一个变量值列为一组。适合离散型变量,且数值变动幅度较小。例家庭按成员数分组1个成员2个成员3个成员4个成员5个及以上成员例高校按学生数分组教师按月工资分组2000人以下1000—2000元2001—4000人2000—3000元4001—6000人3000—4000元6001—8000人4000—5000元8001—10000人5000元以上10001以上组距式分组整个变量区间依次划分成若干小区间,各变量值按大小归并在相应的区间。离散型变量数值变动范围大,项数较多时,不宜用单变量值分组;连续型变量不能一一例举,无法用单变量值分组,都要采用组距分组法。哪些数据适合于组距式分组?(1)组距与组数组距与组数确定是组距分组法的关键。整个区间的距离称为全距,即最大值与最小值之差。各组区间距离称为组距。当各组距相等时,组距=全距÷组数连续型变量相邻两组上下限要重叠,并把重叠在组限上的变量值归入下限组。离散型变量相邻两组上下限通常以整数断开,也可仿连续型变量。(2)组限与组中值组距两端的数值称为组限,每组起点值为下限,终点值为上限。222组距上限组距下限上限下限组中值22相邻组组距该组下限缺上限组组中值相邻组组距该组上限缺下限组组中值上下限之间中点的数值称为组中值,是各组变量值的代表值。数据落入各组的频数(个数)和频率频率=频数全体数据个数/组距分组步骤第一步,找出数据最大值和最小值;第二步,确定组距和组数;第三步,计算每组的上下限,组中值,频数,频率,制作频率分布表。根据频率分布表可绘制频率直方图以点、线、面、体等形式描述显示数据的一种方法。常见的图形有:饼形图,条形图,柱形图,折线图,曲线图,散点图,茎叶图(一)饼形图以圆形分割表示总体的分组与结构,扇形大小与该成分大小成正比。适合显示品质型数据的次数分布。四、数据的图形显示例5某大学487名教师的职称情况:助教92人、讲师230人、副教授73人、教授50人、其他42人,请用饼形图显示其结构。助教19%副教授15%教授10%其他9%讲师47%助教讲师副教授教授其他(二)条形图与柱形图用长短或高低显示数据的大小。形状分条形、立体柱形,分单式、复合式、叠加式。适合显示品质型数据及离散型变量的次数分布等。例6某年日、美、韩、港澳台来北京旅游的人数分别为43.0、18.5、18.0、38.6万人,用条形图显示数据结果。4318.51838.601020304050日本美国韩国港澳台0100020003000400050006000700020002001200220032004女生男生年份2000年2001年2002年2003年2004年男生(人)15612156252627033045女生(人)10711407222628833305合计(人)26323563475255866350例7某学院2001—2005年在校生人数如下,用柱形图显示数据结果。(三)折线图由坐标系中的数据点连线而成。主要是显示动态数据的变化趋势。(四)散点图用坐标系中每个点显示数据,主要是分析两个变量之间的相互关系。例8以例7数据绘制折线图。0100020003000400050006000700020002001200220032004男生女生合计例9某种产品产量与单位成本资料如下,绘制显示数据结果的散点图。050100150200020000400006000080000100000产量(件)单位成本(元/件)产量(件)2000030000400005000080000单位成本(元/件)168.3156.2150.5148142.2(五)曲线图采用光滑的曲线段连接各实心点,形成一条整体光滑的曲线。优点:能反映出数据变化的速度(六)茎叶图把每一个数据分成两部分作图-------茎和叶第三节、集中趋势的度量2、测定集中趋势的意义●能客观地反映现象总体的特征●能比较同类现象在不同单位的发展水平●能分析现象之间的依存关系1、集中趋势与平均数算术平均数调和平均数数值平均数几何平均数众数位置平均数中位数集中趋势的测定1、简单算术平均数(对未分组数据)为各单位标志值,n为总体单位数nxnxxxxn21ix例1(续前例)计算全班数量方法考试的平均成绩。(一)算术平均数各组权数相等时,加权算术平均就成为简单算术平均形式。2、加权算术平均(适合分组数据)为各组标志值,f为标志值出现的次数(权数)加权算术平均数的大小不仅取决于各组标志值大小,还取决于各标志值的次数。nnnffffxfxfxffxx212211ix例2某班组20名工人某日加工零件数如下,求平均日产量。日产量(件)12131518工人数(人)3584加权算术平均的权数除可用次数即频数外,还可用频率或比重形式:ffxxwxx某集团所属9个车间的劳动竞赛情况如下:计划完成程度(%)车间数计划任务数(吨)90—10029000100—1104150000110—1203118000求9个车间的平均计划完成程度。众数的确定未分组及单变量值分组资料根据定义,出现次数最多或最普遍的变量值即是众数。(二)众数变量数列中出现次数最普遍的变量值,用表示。0m例10确定某农贸市场某日大白菜价格的众数。例9某班组10名工人某日产量如下:35、30、35、40、35、42、30、35、35、32件,确定该班组日产量的众数。价格(元/千克)成交量(千克)0.300.350.400.45953766857合计596双众数:有两个数据出现次数最多多众数:有多个数据出现次数最多例10确定某农贸市场某日大白菜价格的众数。价格(元/千克)成交量(千克)0.300.350.400.459537637657合计(三)中位数数列按大小排序处于中点位置的数值称为中位数,用表示。em中位数的确定1、未分组数据资料的中位数1)数值按大小顺序排序;2)当变量值个数为奇数时,处于中点位置的数值为中位数;为偶数时,处于与两位置数值的简单算术平均数为中位数。21n2n12n例12两小组分别有7名与8名学生,其身高分别为:1.781.651.581.801.721.601.67(米)1.611.771.561.821.791.631.761.66(米)确定两组身高的中位数。(四)平均数、中位数和众数的关系1.频率直方图的类型单峰对称单峰非对称平均数、中位数、众数完全相同,位于直方图中间位置峰值偏左直方图:平均数最大,众数最小中位数位于平均数和众数之间峰值偏右直方图:平均数最小,众数最大中位数位于平均数和众数之间简单直观、计算简便,但易受极端数值影响,不能全面反映数据的变异情况。(一)极差:数据集里最大值与最小值之差,也称为全距。极差越大数据离散程度越大,反之越集中minmaxxxR第四节、离散趋势的度量特点(二)方差与标准差变量数列中各数值与其算术平均数离差平方的算术平均数称为方差,用表示;方差的平方根称为标准差,用表示。计算公式为:未分组数据分组数据2nxx)(2ffxx)(2例19计算全班考试成绩的标准差。标准差是测定离散程度最主要的指标。标准差愈大,数据离散程度、变动程度愈大;反之愈小。按成绩分组学生数(人)比重(%)60分以下60—7070—8080—9090—10039171156.6720.0037.7824.4411.11合计45100例18计算两组身高的标准差。(三)四分位点和四分位极差数据等分为四部分,中间的三点即为四分位点第三四分位点与第一四分位点的差称为四分位极差(四)变异系数变异指标与算术平均数之比。常用的是标准差系数即:xV变异系数越大,变量差异的相对程度越大,其平均数的代表性越低。例20某食品加工厂两个车间某月上旬产量为:一车间370、378、403、380、410、405、420、425、450、438(千克)二车间572、615、625、563、568、602、645、636、635、621(千克)计算两个车间产量的标准差系数,并比较哪个车间生产更均衡。例21某公司员工的月均工资1650元,标准差256元;员工平均工龄13年,标准差3年,员工月工资与工龄哪个差异大些?
本文标题:第一章数据整理和描述.
链接地址:https://www.777doc.com/doc-2115574 .html