平均数、标准差与变异系数

22第三章平均数、标准差与变异系数本章重点介绍平均数（mean）、标准差（standarddeviation）与变异系数（variationcoefficient）三个常用统计量，前者用于反映资料的集中性，即观测值以某一数值为中心而分布的性质；后两者用于反映资料的离散性，即观测值离中分散变异的性质。第一节平均数平均数是统计学中最常用的统计量，用来表明资料中各观测值相对集中较多的中心位置。在畜牧业、水产业生产实践和科学研究中，平均数被广泛用来描述或比较各种技术措施的效果、畜禽某些数量性状的指标等等。平均数主要包括有算术平均数（arithmeticmean）、中位数（median）、众数（mode）、几何平均数（geometricmean）及调和平均数（harmonicmean），现分别介绍如下。一、算术平均数算术平均数是指资料中各观测值的总和除以观测值个数所得的商，简称平均数或均数，记为x。算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。（一）直接法主要用于样本含量n≤30以下、未经分组资料平均数的计算。设某一资料包含n个观测值：x1、x2、…、xn，则样本平均数x可通过下式计算：nxnxxxxniin121（3-1）其中，Σ为总和符号；niix1表示从第一个观测值x1累加到第n个观测值xn。当niix1在意义上已明确时，可简写为Σx，（3-1）式即可改写为：nxx∑=【例3.1】某种公牛站测得10头成年公牛的体重分别为500、520、535、560、585、600、480、510、505、490（kg），求其平均体重。由于Σx=500+520+535+560+585+600+480+510+505+490=5285，n=10代入（3—1）式得：.5(kg)528105285∑nxx即10头种公牛平均体重为528.5kg。（二）加权法对于样本含量n≥30以上且已分组的资料，可以在次数分布表的基础上采用加权法计算平均数，计算公式为：23ffxfxffffxfxfxfxkiikiiikkk11212211（3-2）式中：ix—第i组的组中值；if—第i组的次数；k—分组数第i组的次数fi是权衡第i组组中值xi在资料中所占比重大小的数量，因此fi称为是xi的“权”，加权法也由此而得名。【例3.2】将100头长白母猪的仔猪一月窝重（单位：kg）资料整理成次数分布表如下，求其加权数平均数。表3—1100头长白母猪仔猪一月窝重次数分布表组别组中值（x）次数（f）fx10—1534520—25615030—352691040—4530135050—5524132060—65852070—753225合计1004520利用（3—2）式得：)(2.451004520kgffxx即这100头长白母猪仔猪一月龄平均窝重为45.2kg。计算若干个来自同一总体的样本平均数的平均数时，如果样本含量不等，也应采用加权法计算。【例3.3】某牛群有黑白花奶牛1500头，其平均体重为750kg，而另一牛群有黑白花奶牛1200头，平均体重为725kg，如果将这两个牛群混合在一起，其混合后平均体重为多少？此例两个牛群所包含的牛的头数不等，要计算两个牛群混合后的平均体重，应以两个牛群牛的头数为权，求两个牛群平均体重的加权平均数，即)(89.738270012007251500750kgffxx即两个牛群混合后平均体重为738.89kg。（三）平均数的基本性质1、样本各观测值与平均数之差的和为零，即离均差之和等于零。240)(1xxnii或简写成0)(xx2、样本各观测值与平均数之差的平方和为最小，即离均差平方和为最小。ni1(xi-x)2ni1(xi-a)2（常数a≠x）或简写为：2)(xx2)(x以上两个性质可用代数方法予以证明，这里从略。对于总体而言，通常用μ表示总体平均数，有限总体的平均数为：Nxnii1（3-3）式中，N表示总体所包含的个体数。当一个统计量的数学期望等于所估计的总体参数时，则称此统计量为该总体参数的无偏估计量。统计学中常用样本平均数（x）作为总体平均数（μ）的估计量，并已证明样本平均数x是总体平均数μ的无偏估计量。二、中位数将资料内所有观测值从小到大依次排列，位于中间的那个观测值，称为中位数，记为Md。当观测值的个数是偶数时，则以中间两个观测值的平均数作为中位数。中位数简称中数。当所获得的数据资料呈偏态分布时，中位数的代表性优于算术平均数。中位数的计算方法因资料是否分组而有所不同。（一）未分组资料中位数的计算方法对于未分组资料，先将各观测值由小到大依次排列。1、当观测值个数n为奇数时，(n+1)/2位置的观测值，即x(n+1)/2为中位数；Md=2/)1(nx2、当观测值个数为偶数时，n/2和（n/2+1）位置的两个观测值之和的1/2为中位数，即：2)12/(2/nndxxM（3-4）【例3.4】观察得9只西农莎能奶山羊的妊娠天数为144、145、147、149、150、151、153、156、157，求其中位数。此例n=9，为奇数，则：Md=52/)19(2/)1(xxxn=150（天）即西农莎能奶山羊妊娠天数的中位数为150天。【例3.5】某犬场发生犬瘟热，观察得10只仔犬发现症状到死亡分别为7、8、8、9、11、12、12、13、14、14天，求其中位数。此例n=10，为偶数，则：255.11212112265)12/(2/xxxxMnnd（天）即10只仔犬从发现症状到死亡天数的中位数为11.5天。（二）已分组资料中位数的计算方法若资料已分组，编制成次数分布表，则可利用次数分布表来计算中位数，其计算公式为：)2(cnfiLMd（3—5）式中：L—中位数所在组的下限；i—组距；f—中位数所在组的次数；n—总次数；c—小于中数所在组的累加次数。【例3.6】某奶牛场68头健康母牛从分娩到第一次发情间隔时间整理成次数分布表如表3—2所示，求中位数。表3—268头母牛从分娩到第一次发情间隔时间次数分布表间隔时间（d）头数（f）累加头数12—261127—412342—56131657—71203672—86165287—1011264102—116266≥117268由表3—2可见：i=15，n=68，因而中位数只能在累加头数为36所对应的“57—71”这一组，于是可确定L=57，f=20，C=16，代入公式（3—5）得：5.70)16268(201557)2(cnfiLMd（天）即奶牛头胎分娩到第一次发情间隔时间的中位数为70.5天。三、几何平均数n个观测值相乘之积开n次方所得的方根，称为几何平均数，记为G。它主要应用于畜牧业、水产业的生产动态分析，畜禽疾病及药物效价的统计分析。如畜禽、水产养殖的增长率，抗体的滴度，药物的效价，畜禽疾病的潜伏期等，用几何平均数比用算术平均数更能代表其平均水平。其计算公式如下：nnnnxxxxxxxxG1)(321321（3—6）为了计算方便，可将各观测值取对数后相加除以n，得lgG，再求lgG的反对数，即得26G值，即)]lglg(lg1[lg211nxxxnG（3—7）【例3.7】某波尔山羊群1997—2000年各年度的存栏数见表3—3，试求其年平均增长率。表3—3某波尔山羊群各年度存栏数与增长率年度存栏数（只）增长率（x）Lgx1997140——19982000.429-0.36819992800.400-0.39820003500.250-0.602Σlgx=-1.368利用公式（3—7）求年平均增长率G=)]lglg(lg1[lg211nxxxn=lg-1[31（-0.368-0.398–0.602）]=lg-1（-0.456）=0.3501即年平均增长率为0.3501或35.01%。四、众数资料中出现次数最多的那个观测值或次数最多一组的组中值，称为众数，记为M0。如表2-3所列的50枚受精种蛋出雏天数次数分布中，以22出现的次数最多，则该资料的众数为22天。又如【例3.6】所列出的次数分布表中，57—71这一组次数最多，其组中值为64天，则该资料的众数为64天。五、调和平均数资料中各观测值倒数的算术平均数的倒数，称为调和平均数，记为H，即xnxxxnnH1111111)(121（3—8）调和平均数主要用于反映畜群不同阶段的平均增长率或畜群不同规模的平均规模。【例3.8】某保种牛群不同世代牛群保种的规模分别为：0世代200头，1世代220头，2世代210头；3世代190头，4世代210头，试求其平均规模。利用公式（3—9）求平均规模：33.2080048.01)024.0(1)(1512101190121012201200151H（头）27即保种群平均规模为208.33头。对于同一资料，算术平均数几何平均数调和平均数。上述五种平均数，最常用的是算术平均数。第二节标准差一、标准差的意义用平均数作为样本的代表，其代表性的强弱受样本资料中各观测值变异程度的影响。如果各观测值变异小，则平均数对样本的代表性强；如果各观测值变异大，则平均数代表性弱。因而仅用平均数对一个资料的特征作统计描述是不全面的，还需引入一个表示资料中观测值变异程度大小的统计量。全距（极差）是表示资料中各观测值变异程度大小最简便的统计量。全距大，则资料中各观测值变异程度大，全距小，则资料中各观测值变异程度小。但是全距只利用了资料中的最大值和最小值，并不能准确表达资料中各观测值的变异程度，比较粗略。当资料很多而又要迅速对资料的变异程度作出判断时，可以利用全距这个统计量。为了准确地表示样本内各个观测值的变异程度，人们首先会考虑到以平均数为标准，求出各个观测值与平均数的离差，即（xx），称为离均差。虽然离均差能表达一个观测值偏离平均数的性质和程度，但因为离均差有正、有负，离均差之和为零，即Σ（xx）=0，因而不能用离均差之和Σ（xx）来表示资料中所有观测值的总偏离程度。为了解决离均差有正、有负，离均差之和为零的问题，可先求离均差的绝对值并将各离均差绝对值之和除以观测值n求得平均绝对离差，即Σ|xx|/n。虽然平均绝对离差可以表示资料中各观测值的变异程度，但由于平均绝对离差包含绝对值符号，使用很不方便，在统计学中未被采用。我们还可以采用将离均差平方的办法来解决离均差有正、有负，离均差之和为零的问题。先将各个离均差平方，即(xx)2，再求离均差平方和，即Σ2)(xx，简称平方和，记为SS；由于离差平方和常随样本大小而改变，为了消除样本大小的影响，用平方和除以样本大小，即Σnxx/)(2，求出离均差平方和的平均数；为了使所得的统计量是相应总体参数的无偏估计量，统计学证明，在求离均差平方和的平均数时，分母不用样本含量n，而用自由度n-1，于是，我们采用统计量Σ1/)(2nxx表示资料的变异程度。统计量Σ1/)(2nxx称为均方（meansquare缩写为MS）,又称样本方差，记为S2，即S2=1/)(2nxx（3—9）相应的总体参数叫总体方差，记为σ2。对于有限总体而言，σ2的计算公式为：σ2x(μ）2/N（3—10）由于样本方差带有原观测单位的平方单位，在仅表示一个资料中各观测值的变异程度而不作其它分析时，常需要与平均数配合使用，这时应将平方单位还原，即应求出样本方差的平方根。统计学上把样本方差S2的平方根叫做样本标准差，记为S，即：281)(2nxxS（3-11）由于)2()(222xxxxxx222xnxxx222)()(2nxnnxxnxx22)(所以（3-11）式可改写为：12)(2nxSnx（3-12）相应的总体参数叫总体标准差，记为σ。对于有限总体而言，σ的计算公式为：σ=

平均数、标准差与变异系数

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

专项质量保证措施

关注市场短期调整风险

蒙牛集团企业文化

改善提案培训资料(ppt39)(1)

上海华联罗森有限公司人才流失原因和对策的探讨

如鱼得水的五种职场人

火车票遗失情况说明

施工电梯安装方案

照明公司岗位职责

城市与社区的网格化管理--信息化管理典型应用

相关文档

相关搜索