您好,欢迎访问三七文档
引例“平均”这个词往往是“算术平均值”的简称。这是一个很有用的统计学的度量指标。然而,如果有少数几个很大的数,“平均值”就会给人错误的印象。例如,有一个人在一条平均只有1.2米的河中淹死了,而成人的身高一般都会超过1.5米。那么,为什么一条平均深度只有1.2米的河却会淹死人?原因是这条河深浅不同,这个人是在一个2米多深的陷坑处沉下去的。第六章变异度指标一、基本内容第一节变异度指标的意义变异度指标的概念、变异度指标的作用、变异度指标的种类第二节变异度指标的计算全距、四分位差、平均差、标准差和方差、离散系数第三节偏度与峰度偏度、峰度;偏度和峰度的简捷计算及应用二、学习目的与要求通过对本章的学习,使同学们明确变异度指标的概念、种类和作用,变异度指标和平均指标的区别,掌握各种变异度指标的计算方法。三、学习重点和难点本章的重点是标准差、离散系数的计算;难点是偏度与峰度的计算,以及如何正确的运用标准差和离散系数来判别社会经济现象的代表性。四、授课课时:4-6学时变量数列2___X变量数列1一则笑话如果你一只脚放在摄氏1度的水里,另一只脚放在摄氏79度的水里,平均水温40度,你一定感觉很舒服?显然,只了解变量的集中趋势是不够的!第一节变异度指标一、变异度指标的概念变异度指标又称标志变动度指标,是综合反映总体各单位标志值及其分布的差异程度的指标。如:七个人的工资分别为:320元,320元,400元,400元,500元,500元,2000元。平均工资为634.29元(平均指标,集中趋势)最高和最低之差为1680元(变异度指标,内部差异,离中趋势)。二、变异度指标的作用1、衡量平均数的代表性。变异度指标值与平均数的代表性大小成反比。变异度指标值(离散程度)越大,平均数的代表性就越小。如有三个生产小组,有5人每日产量如下:甲组:2424242424乙组:2022252627丙组:10202530352、衡量现象变动的离散程度、稳定性和均衡程度。变异度指标越小,现象变动的稳定性和均衡程度越高。3、计算抽样误差和确定样本容量的依据。三、变异度指标的种类1、全距2、四分位差3、平均差4、标准差5、方差6、离散系数7、偏度8、峰度第二节变异度指标的计算一、全距(极差)1、全距是总体各单位标志值中最大值与最小值之差,又称极差。全距R=最大值-最小值对于总体数据而言,极差也就是变量变化的范围或幅度大小。组距数列中,极差≈最高组的上限-最低组的下限。在总体中任何两个单位的标志值之差都不可能超过极差,即2、优缺点:计算简便、含义直观、容易理解。反映现象的差异程度较粗略,未考虑数据的中间分布情况,不能充分说明全部数据的差异程度。minmaxxxRjiRxxji其中,(一)全距计算例6.1日产量X工人数f203214225236245254263∑30件62026minmaxXXR例6.2X分组f30-40140-50350-60860-70470-802∑503080minmaxXXR二、四分位差1、四分位差是四分位数中间两个分位之差。四位差Q=第三个四分位数Q3—第一个四分位数Q1实质上是两端各去掉四分之一的数据以后的极差,表示占全部数据一半的中间数据的离散程度。四分位差越大,表示数据离散程度越大。2、适用条件:四分位差是一种顺序统计量,适用于定序数据和定量数据。尤其是当用中位数来测度数据集中趋势时。3、优缺点:计算简单,意义清楚,在一定程度上对极差的一种改进,避免了极端值的干扰。但反映现象的差异程度较粗略和不全面,实用价值甚小。全距和四分位差均只使用部分数据进行计算。例题:某车间12个工人,其日产量按数量大小依次排列如下:10,20,22,24,25,26,27,28,30,32,34,35,求其四分位差。解:第一步:求出第一个四分位数和第三个四分位数的位次:第二步:求出第一个四分位数和第三个四分位数,得到四分位数23224221Q7594133.)(的位次nQ2534112411.的位次nQ31232303Q8233113QQQ三、平均差1、平均差是总体各单位标志值对其算术平数的离差绝对值的算术平均数。反映各个数据与其均值的平均差距,通常以A.D表示。计算公式为:已分组数据未分组数据nxxDAnii1||.niiiniiffxxDA11||.平均差含义清晰,能全面地反映数据的离散程度。但取离差绝对值进行平均,数学处理上不够方便,在数学性质上也不是最优的。计算月工资水平的平均差月工资X员工数f8005100010120020150072000525003合计50计算月工资水平的平均差月工资X员工数f8005-5205202600100010-3203203200120020-120120240015007180180126020005680680340025003118011803540合计50----16400fXXXXXX元||.328501640011niiiniiffxxDA四、方差和标准差1.方差(Variance)方差是各个数据与其均值的离差平方的算术平均数.总体方差(σ2)的计算公式为:已分组数据未分组数据212122)(xnxnxxniinii)(21121122)(xffxffxxniiiniiniiinii)(注意:样本方差(通常用S2表示)分母应为(n-1)2标准差标准差是总体所有单位标志值与其平均数的离差平方的平均数的均方根。标准差——方差的算术平方根。总体标准差一般用σ表示。其计算公式为:未分组数据分组数据nxxnii12)(niiiniiffxx112)(注意:样本标准差(S)分母应为(n-1)标准差比方差更容易理解。在社会经济现象的统计分析中,标准差比方差的应用更为普遍,经常被用作测度数据与均值差距的标准尺度。【例题】计算方差、标准差使用寿命(小时)组中值(x)试验数量(只)f频率(f/Σf)(x-1542)|x-1542|f(X-1542)2*f1000以下90020.020-64212848243281000-1200110080.080-442353615629121200-14001300160.160-24238729370241400-16001500350.350-421470617401600-18001700230.23015836345741721800-20001900120.120358429615379682000以上210040.04055822321245456合计——1001.000——2032467436006743610067436001122niiiniiffxx)(68425967436.3交替标志的标准差交替标志x次数比重(Ni/N)1N1PP1-P(1-P)2P0N2Q00-P(0-P)2Q合计N1P--(1-P)2P+P2QxxNNxxi2)(NNxiPQPQPNNxxi01)()()((PPQPPQQPQPPPffxx10122222)例题:某车间生产300件产品,其中合格品270件,不合格品为30件,试计算产品的平均合格率及标准差。方差数学性质(一)2_______22XX变量值的方差等于变量值平方的算术平均数减变量值算术平均数的平方2______22___2______22______22______22______22___22222XXXXXXNXXNXNXNXXXNXXXXNXX方差数学性质(二)NXXNAXAX2___2___各变量值同加一个常数,原变量值的方差不变.的方差XNXXNAXAX2___2___方差数学性质(三)22___2___ANXXNXAAX各变量值同乘以一个常数A,原变量值的方差扩大A2倍.22___2___22___2___ANXXNXXANXXANXAAX方差数学性质(四)分组条件下,总方差可以分解成组内方差的平均数和组间方差两部分.2i2222i也就是说,在分组条件下,全部数据的差异包括两个方面:一是组与组之间水平的差异(由于分组标志的影响所引起的差异);二是各组内部数据之间的差异(除分组标志之外其他因素的影响所引起的变异)。前者用组间方差来测度,后者用各组方差(即组内方差)的平均数来衡量。iiiiiffxx22)(组内方差ffxxii22)(iiiiff22组内方差平均数组间方差组内方差平均数数平均数、方差和数据个组的分别为第、、为总体平均数,其中,ifxxiii2例题:某车间9个工人,日产量分别为:2、4、4、6、7、8、9、11、12件,根据资料计算总平均数7963nxix109/90)(2nxxi日产量(件)工人数(人)f组平均数2~533.3340.416~947.5110~12211.540.5合计9—81.91ixfxxi2)(199918122..)(所以:ffxxiiix第一组日产量(件)21.7740.4540.45合计2.67ix21)(xxi8903672112121..nxxnii)(第二组日产量(件)62.2570.2580.2562.25合计5ix22)(xxi25145212222.nxxnii)(第三组日产量(件)110.25120.25合计0.5ix23)(xxi250250212223..nxxnii)(90922504251389022....nniii方差数学性质(五)对于同一变量分布,其标准差永远不会小于平均差。即有:xxDA.方差数学性质(六)如果两个变量x和y相互独立,它们的代数和的方差等于原来两个变量的方差之和,它们的代数和的标准差则等于原来两个变量的方差之和的正平方根,即有:222yxyx22yxyx一群牛的平均体重是180公斤,标准差是18公斤;一群羊的平均体重是15公斤,标准差是3公斤。能不能说羊的平均体重的代表性高些?为什么?五、离散系数前面的各变异指标都是有计量单位的,它们的数值大小不仅取决于数据的离散程度,还要受数据本身水平高低和计量单位的影响。对不同变量(或不同数据组)的离散程度进行比较时,只有当它们的平均水平和计量单位都相同时,才能利用上述变异指标来分析;否则,须利用离散系数来比较它们的离散程度。离散系数用于对比分析不同数列变异度大小的指标。例如,哪个变量的差异较大:体重,还是身高?例如,体重的差异哪个较大:父亲,还是婴儿?父亲:平均体重=70kg,标准差=5kg婴儿:5kg,1kg(一)概念离散系数又称标志变动度指标或变异系数,它是各变异度指标与其算术平均数对比得到的相对数。以相对数的形式表示变异程度。将极差与算术平均数对比得到极差系数将平均差与算术平均数对比得到平均差系数将四分位差与算术平均数对比得到四分位差系数最常用的离散系数是就标准差来计算的,称之为标准差系数离散系数大,说明数据的离散程度大,其平均数的代表性就差;反之亦然。例题:现有两个城市居民人均年收入资料如下表:人均收入(元)收入标准差(元)收入四分位差(元)离散系数(%)标准差系数四分位差系数甲城市60
本文标题:第六章 变异度指标
链接地址:https://www.777doc.com/doc-3352313 .html