您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第3章平均数标准差与变异系数
第三章资料的特征数——平均数、标准差与变异系数本章内容第一节平均数第二节标准差第三节变异系数平均数是统计学中最常用的统计量,用来表明资料中各观测值相对集中的中心位置。平均数包括:算术平均数(arithmeticmean)中位数(median)众数(mode)几何平均数(geometricmean)调和平均数(harmonicmean)第一节平均数算术平均数指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数。x设某一资料包含n个观测值:x1、x2、…、xn,则样本平均数可通过下式计算:nxx其中,Σ为总和符号;表示从第一个观测值x1累加到第n个观测值xn。当在意义上已明确时,可简写为Σx,上式可改写为:niix1nxnxxxxniin121342.1340.7348.4346.0343.4342.7346.0341.1344.0348.0344.2342.5350.0343.5346.3346.0340.3344.2342.2344.1345.0340.5344.2344.0341.1345.6345.0348.6343.5344.2342.6343.7345.5339.3350.2337.3345.3358.2341.0346.8344.3347.2344.2345.8331.2342.1342.4340.5350.0343.2347.0340.2343.3350.2346.2339.8344.0353.3340.2336.3348.9340.2356.1346.0345.6346.2342.3339.9338.0344.4346.6339.7342.3352.8342.6350.3348.5344.0350.0335.1339.5346.6341.1347.2340.3338.2345.5345.6349.0336.7342.0338.4343.9343.7343.0339.9347.3341.0341.1347.1100头牛胴体净重(kg)【例】已知100头牛胴体净重,求其平均数。342.1340.7348.4347.1344.0(g)100xxn关于平均数的统计分析平行同一个处理测定多次,且测试对象来自于同一个个体,称之为平行(一瓶矿泉水中矿物质含量测定三次的结果)重复同一个处理测定多次,但测试对象来自不同个体,称之为重复(五瓶矿泉水中矿物质含量测定的结果)统计意义上的平均数只能来自重复,而不是平行。平均数的基本性质1、样本各观测值与平均数之差的和为零,即离均差之和等于零。0)(1xxnii0)(xx或简写成2、样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小。(xi-)2(xi-a)2(常数a≠)或简写为:对于总体而言,通常用μ表示总体平均数,有限总体的平均数为:ni1xni12)(xx2)(xNxNii1x式中,N表示总体所包含的个体数。当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的无偏估计量。统计学中常用样本平均数()作为总体平均数(μ)的估计量,并已证明样本平均数是总体平均数μ的无偏估计量。x第二节标准差一、标准差的意义StandardDeviation(SD)用平均数作为样本的代表,其代表性的强弱受样本资料中各观测值变异程度的影响。仅用平均数对一个资料的特征作统计描述是不全面的,还需引入一个表示资料中观测值变异程度大小的统计量。全距(极差)是表示资料中各观测值变异程度大小最简便的统计量。但是全距只利用了资料中的最大值和最小值,并不能准确表达资料中各观测值的变异程度,比较粗略。离均差:各个观测值与平均数的离差()。离均差能表示一个观测值偏离平均数的性质和程度,但因为离均差有正、有负,离均差之和为零,即Σ()=0,因而不能用离均差之和Σ()来表示资料中所有观测值的总偏离程度。xxxxxx我们还可以采用将离均差平方的办法来解决离均差有正、有负,离均差之和为零的问题。先将各个离均差平方,即()2,再求离均差平方和,即,简称平方和,记为SS;由于离差平方和常随样本大小而改变,为了消除样本大小的影响,用平方和除以样本大小,即,求出离均差平方和的平均数。xx2)(xxnxx/)(2用观测值的个数除离均差平方和得到的平均平方和,简称为均方(meansquare,MS)或方差。相应的总体参数叫总体方差,记为σ2。对于有限总体而言,σ2的计算公式为:22()/xN为了使所得的统计量是相应总体参数的无偏估计量,统计学证明,在求离均差平方和的平均数时,分母不用样本含量n,而用自由度n-1,于是,我们采用统计量表示资料的变异程度。统计量称为均方(meansquare缩写为MS),又称样本方差,记为S2,即S2=1/)(2nxx1/)(2nxx1/)(2nxx由于样本方差带有原观测单位的平方单位,在仅表示一个资料中各观测值的变异程度而不作其它分析时,常需要与平均数配合使用,这时应将平方单位还原,即应求出样本方差的平方根。统计学上把样本方差S2的平方根叫做样本标准差,记为S,即:1)(2nxxS相应的总体参数叫总体标准差,记为σ。对于有限总体而言,σ的计算公式为:在统计学中,常用样本标准差S估计总体标准差σ。Nx/)(2二、标准差的特性标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差也大,反之则小。在计算标准差时,在各观测值加上或减去一个常数,其数值不变。当每个观测值乘以或除以一个常数a,则所得的标准差是原来标准差的a倍或1/a倍。在资料服从正态分布的条件下,资料中约有68.26%的观测值在平均数左右一倍标准差(±S)范围内;约有95.43%的观测值在平均数左右两倍标准差(±2S)范围内;约有99.73%的观测值在平均数左右三倍标准差(±3S)范围内。也就是说全距近似地等于6倍标准差,可用(全距/6)来粗略估计标准差xxx总体(µ,σ)样本1(1)样本2(2)样本3(3)xxx1,2,34,…..xxxx新总体误差如何去估计??三、标准误(standarderror,SE,SEM)标准误(平均数抽样总体的标准差)的大小反映样本平均数的抽样误差的大小,即精确性的高低。标准误大,说明各样本平均数间差异程度大,样本平均数的精确性低。反之,小,说明间的差异程度小,样本平均数的精确性高。的大小与原总体的标准差σ成正比,与样本含量n的平方根成反比。从某特定总体抽样,因为σ是一常数,所以只有增大样本含量才能降低样本平均数的抽样误差。nx/xxxxxx在实际工作中,总体标准差σ往往是未知的,因而无法求得。此时,可用样本标准差S估计σ。于是,以估计。记为,称作样本标准误或均数标准误。样本标准误是平均数抽样误差的估计值。若样本中各观测值为,,…,,则xnSxxSxS1x2xnx)1(/)()1()(222nnnxxnnxxnSSxxS样本标准差与样本标准误是既有联系又有区别的两个统计量,二者的区别在于:样本标准差S是反映样本中各观测值,,…,变异程度大小的一个指标,它的大小说明了对该样本代表性的强弱。样本标准误是样本平均数的标准差,它是抽样误差的估计值,其大小说明了样本间变异程度的大小及精确性的高低。kxxx,...,,211x2xnxx对于大样本资料,常将样本标准差S与样本平均数配合使用,记为±S,用以说明所考察性状或指标的优良性与稳定性。对于小样本资料,常将样本标准误与样本平均数配合使用,记为±,用以表示所考察性状或指标的优良性与抽样误差的大小。xxxSxxxS论文写作过程中SD和SE(M)的用法ABCDV1a1±SD11b1±SD21c1±SD31d1±SD41V2a2±SD12b2±SD22c2±SD32d2±SD42V3a3±SD13b3±SD23c3±SD33d3±SD43….ABCDSEV1a1b1c1d1se1V2a2b2c2d2se2V3a3b3c3d3se3….3.5,3.6,3.4,4.2,3.0,3.8,3.7,3.0,3.3,4.14.5,5.3,4.4,4.2,5.0,5.8,4.7,4.0,5.3,5.15.4,5.7,4.8,4.7,5.3,5.6,5.7,6.0,6.3,6.1标准差和标准误平均数:3.55标准差:0.41平均数:4.83标准差:0.57平均数:5.56标准差:0.53标准误:0.18剪切力(kg)3.55±0.414.83±0.575.56±0.53….SE剪切力(kg)3.554.835.560.18….第三节变异系数变异系数是衡量资料中各观测值变异程度的另一个统计量。标准差与平均数的比值称为变异系数,记为C·V。变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。变异系数的计算公式为:(3—15)%100xSVC变异系数的大小,同时受平均数和标准差两个统计量的影响,因而在利用变异系数表示资料的变异程度时,最好将平均数和标准差也列出。统计学:比较不同样本资料的相对变异程度食品科学:在空白试验时,可作为基础试验条件差异的指标,并可作为确定区组、重复次数等的依据用途【例】已知某良种猪场长白成年母猪平均体重为190kg,标准差为10.5kg,而大约克成年母猪平均体重为196kg,标准差为8.5kg,试问两个品种的成年母猪,哪个体重变异程度大?此例观测值虽然都是体重,单位也相同,但他们平均数不同,只能用变异系数来比较其变异程度的大小。即:长白成年母猪体重的变异系数:C.V=10.5/190*100%=5.53%大约克成年母猪体重的变异系数:C.V=8.5/196*100%=4.34%所以,长白成年母猪体重的变异程度大于约克成年母猪。【例】已知赞皇大枣果皮厚及角质层厚的平均数、标准差和变异系数,但两者的均数不同,标准差不能直接比较。
本文标题:第3章平均数标准差与变异系数
链接地址:https://www.777doc.com/doc-2155744 .html