您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 第04章_描述统计中的测度
北京理工大学管理与经济学院第4章描述统计中的测度北京理工大学管理与经济学院数据的特征和度量数据的特征和度量集中趋势算术平均数调和平均数几何平均数中位数众数百分位数四分位数集中趋势极差四分位距平均差方差与标准差标准分数离散系数分布形状偏态测度峰态测度北京理工大学管理与经济学院数据的特征和度量对于描述统计中的测度,主要可以分为三个方面来描述:一是数据的集中趋势,反映各数据向其中心值靠拢或聚焦的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是数据分布的形状,即数据分布的偏态和峰度。北京理工大学管理与经济学院4.1数据分布的集中趋势测度集中趋势(Generaltendency)是指分布的定位,它是指一组数据向某一中心值靠拢的倾向,或是表明一组统计数据所具有的一般水平。对集中趋势进行测度也就是寻找数据一般水平的代表值或中心值。对集中趋势的度量有数值平均数和位置平均数之分。北京理工大学管理与经济学院4.1数据分布的集中趋势测度数据的特征和度量集中趋势算术平均数调和平均数几何平均数中位数众数百分位数四分位数集中趋势极差四分位距平均差方差与标准差标准分数离散系数分布形状偏态测度峰态测度北京理工大学管理与经济学院一、数值平均数数值平均数又称均值(Mean),是根据统计资料的数值计算而得到,在统计学中具有重要的作用和地位,是度量集中趋势的最主要的指标之一。平均的对象可理解为变量,平均数可记为。xx北京理工大学管理与经济学院(一)算术平均数1.简单算术平均数简单算术平均数是根据原始数据直接计算均值。一般地,设一组数据为,其简单算术平均数计算的一般公式可表达为:nxnxxxxin21北京理工大学管理与经济学院(一)算术平均数例如:为了研究目前大学中班级学生人数的情况,从北京某大学抽样五个班级,其学生人数分别为:46,54,42,46,32。我们使用,…分别表示该五个数据,计算其均值,可以写成:1x2x5x4453246425446554321xxxxxnxxi北京理工大学管理与经济学院(一)算术平均数2.加权算术平均数加权算术平均数计算的所依靠的数据是经过一定整理的,即是根据一定规则分组的。可分为(1)由数列计算加权算术平均数(2)根据组距计算加权算术平均数北京理工大学管理与经济学院(一)算术平均数(1)由数列计算加权算术平均数由单项变量数列计算加权算术平均数的基础是要先将数据进行分组,即将n个数据按变量值(xi)进行分组,并统计在各个变量取值出现的次数,或称为频数(fi)。其加权算术平均数的计算公式如下:nfxffxffffxfxfxxiiiiinnn212211北京理工大学管理与经济学院(一)算术平均数设某班级10名同学的年龄分别为:18,19,17,18,17,18,19,18,18,19。则根据简单平均数的公式,我们可计算得到该班10名同学的平均年龄:181019181819181718171918nxxi北京理工大学管理与经济学院(一)算术平均数xfff年龄(岁)人数人数比重1722/10(0.2)1866/10(0.6)1922/10(0.2)合计10118262/219618217ffxxii北京理工大学管理与经济学院(一)算术平均数(2)根据组距计算加权算术平均数选择适当的组距来对数据进行分组,再求加权平均数往往就简单、容易许多。根据组距计算加权平均数的方法与上面所述的数列加权平均数方法基本相同,只需以各组的组中值来代替相应的x值即可北京理工大学管理与经济学院(一)算术平均数①简单算术平均数适用于数据量较少的未分组数据;加权算术平均数则只适用于分组数据,且在进行数据分组时,可以根据每个变量的取值来分组,亦或根据一定的区间来分组,这应该根据所针对问题的具体数据来来选取。②简单算术平均数其数值的大小只与变量值的大小有关;对最终加权平均数大小的影响因素有两个:一是各组变量值的影响;另一个是各组变量值的频数的影响。北京理工大学管理与经济学院(一)算术平均数③加权算术平均数计算公式中频数的大小起着重要作用,当变量值比较大的次数多时,平均数就接近于变量值大的一方;当变量值比较小的次数多时,平均数就接近于变量值小的一方。可见,次数对变量值在平均数中的影响起着某种权衡轻重的作用,因此被称为权数。④在加权算术平均数计算中当各组变量的权重相等时,则权重的权衡轻重的作用也就消失了,此时加权算术平均数转化为简单算术平均数的计算形式。北京理工大学管理与经济学院(二)调和平均数调和平均数(Harmonicmean)是均值的另一种重要表示形式,由于它是根据变量值倒数计算的,也叫倒数平均数,一般用字母表示Hm。根据所给资料情况的不同,调和平均数可分为:简单调和平均数和加权调和平均数两种。北京理工大学管理与经济学院(二)调和平均数1.简单调和平均数inmxnxxxnH111121事实上简单调和平均数是权数均相等条件下的加权调和平均数的特例。当权数相等时,就产生了通常所说的加权调和平均数。北京理工大学管理与经济学院(二)调和平均数2.加权调和平均数用公式表示为:iiinnnmxmmxmxmxmmmmH221121im由此可以看出,当权重mi相等时,则加权调和平均数则转换为简单调和平均数。北京理工大学管理与经济学院(二)调和平均数3.调和平均数是算术平均数的变形在一定的条件下,加权调和平均数和加权算术平均数只是计算形式不同,在经济内容上没有实质性的区别,调和平均数是算术平均数的变形,是在缺少总体单位的资料时才被迫使用的计算平均数的一种方法。即:xffxxfxfxxmmxmxmxmmmmHiiiiiiiiiiinnnm221121北京理工大学管理与经济学院(三)几何平均数几何平均数(Geometricmean)是个变量值连乘积的次方根,常用字母表示。它是平均指标的另一种计算形式。几何平均数是计算平均比率和平均速度最适用的一种方法。根据掌握的数据资料不同,几何平均数可分为简单几何平均数和加权几何平均数两种。北京理工大学管理与经济学院(三)几何平均数1.简单几何平均数假定有n个变量值x1,x2,……xn,则简单几何平均数的基本计算公式为:nniinnxxxxG121北京理工大学管理与经济学院(三)几何平均数2.加权几何平均数当掌握的数据资料为分组资料,且各个变量值出现的次数不相同时,应用加权方法计算几何平均数。加权几何平均数的公式为:ninnfffnififfffnffxxxxG212121121北京理工大学管理与经济学院二、位置平均数数值平均数是根据所提供资料的具体数值计算而得到,和我们通常观念中的平均含义比较接近,但结果受极端值的影响而不能真是地反应改组资料的整体集中趋势,在这种情况下,一般可以考虑用位置中位数取代算术中位数来对数据的集中趋势进行描述。常用的位置平均数有:平均数、众数、分位数。北京理工大学管理与经济学院(一)中位数中位数(Median)是度量数据集中趋势的另一重要测度,它是一组数据按数值的大小从小到大排序后,处于中点位置上的变量值。通常用表示Me。定义表明,中位数就是将某变量的全部数据均等地分为两半的那个变量值。其中,一半数值小于中位数,另一半数值大于中位数。中位数是一个位置代表值,因此它不受极端变量值影响。北京理工大学管理与经济学院(一)中位数1.根据未分组数据确定中位数对于未分组的数据,确定其中位数的具体步骤为:(1)将变量按变量值大小从小到大进行排列。(2)确定中位数的位置,即中点位置。一般的,设一组数据的个数为,则中点的位置为(n+1)/2。(3)确定中位数。北京理工大学管理与经济学院(一)中位数如果观测值的数目n为奇数,则(n+1)/2为整数,该位置上所对应的变量即为所求的中位数如果观测值的数目n为偶数,则(n+1)/2为非整数,则取位于中间位置的两个变量值的算术平均数作为中位数。北京理工大学管理与经济学院(一)中位数2.根据单项数列确定中位数根据单项数列资料确定中位数与根据未分组资料确定中位数方法基本一致。具体步骤为:(1)计算各组的累计次数(或频数)(2)确定中位数的位置,。(3)确定中位数。中位数所在组的变量值即为中位数。21iefM北京理工大学管理与经济学院(一)中位数3.根据组距数列确定中位数如果我们掌握的资料是分组后得到的组距数列,则确定中位数的步骤为:(1)确定中位数的位置。(2)计算累计次数,据以找出中位数所在的组。(3)利用以下公式,确定中位数的近似值21ifi北京理工大学管理与经济学院(一)中位数下限公式:ifsfLMmmie12上限公式:ifsfUMmmie12式中:L——中位数所在组的下限;U——中位数所在组的上限;1mS——从低到高累计至中位数所在组前一组止的次数;1mS——从高到低累计至中位数所在组后一组止的次数;mf——中位数所在组的次数;i——中位数所在组的组距。北京理工大学管理与经济学院(二)众数众数(Mode)是一组数据中出现次数最多的那个变量值,通常用MO表示。如果在一个总体当中,各变量值皆不相同,或各个变量值出现的次数皆相同,则没有众数。如果在一个总体中,有两个标志值出现的次数都最多,称为双众数。只有在总体单位比较多、变量值又有明显集中趋势的条件下确定的众数,才能代表总体的一般水平;在总体单位较少,或虽多但无明显集中趋势的条件下,众数的确定是没有意义的。众数的确定方法要根据给定资料的具体情况而定。北京理工大学管理与经济学院(二)众数1.未分组资料或单项数列资料众数观察给定的数据,某个变量出现次数最多,则该变量即为所求众数。这样的方法确定比较容易,不需要计算。北京理工大学管理与经济学院(二)众数2.根据组距变量数量确定众数具体步骤为:(1)确定众数的位置。将次数最多的组确定为众数组,因为众数一定在次数最多的组里面。(2)利用以下公式,确定众数的近似值:下限公式:iffffffLMmmmmmmo111上限公式:iffffffUMmmmmmme111式中:L——众数所在组的下限;U——众数所在组的上限;mf——众数所在组的次数;1mf——从低到高累计至众数所在组前一组的次数;1mf——从高到低累计至众数所在组后一组的次数;i——众数所在组的组距。北京理工大学管理与经济学院(三)分位数中位数是从中间点将全部数据等分为两部分。与中位数类似的还有四分位数、八分位数、十分位数和百分位数等。它们分别是用3个点、7个点、9个点和99个点将数据四等分、八等分、十等分和100等分后各分位点上的值。这里只介绍四分位数的计算,其他分位数与之类似。北京理工大学管理与经济学院(三)分位数1.百分位数百分位数(Percentile)是用99个点将排列好的数据100等分后各能给出从最小值到最大值区间内数据的信息分位点上的值。其中每个部分包含了1%的数据。百分位数的计算方法与中位数的类似北京理工大学管理与经济学院(三)分位数升序或降序)进行排列。(2)确定所求百分位数的位置。假设求第p百分位数,则该第p百分位数位置为:i=pn/100(3)确定百分位数。如果计算i的为整数,则直接在排列的数据列中找到第个变量即为所求。若i不为整数,则取位于两侧的变量的平均数作为所要求的百分位数。北京理工大学管理与经济学院(三)分位数2.四分位数一组数据排序后处于25%和75%位置上的值,称为四分位数(quartile),也称四分位点。四分位数是通过三个点即将全部数据等分为四部分,其中每部分包含25%的数据。中间的分位数就是中位数。因
本文标题:第04章_描述统计中的测度
链接地址:https://www.777doc.com/doc-3351545 .html