您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 咨询培训 > 生物统计附试验设计第九章协方差分析(2017)
第九章协方差分析第一节协方差分析的意义生物试验目的是验证处理效应是否真实存在,所以应对试验误差进行控制,并对变异来源进行刨析。其中试验条件的影响是最大因素。协方差分析有二个意义,一是对试验进行统计控制,二是对协方差组分进行估计。一、对试验进行统计控制为了提高试验的精确性和准确性,对处理以外的一切条件都需要采取有效措施严加控制,使它们在各处理间尽量一致,这叫试验控制。但在有些情况下,即使作出很大努力也难以使试验控制达到预期目的。例如:研究几种配合饲料对猪的增重效果,希望试验仔猪的初始重相同,因为仔猪的初始重不同,将影响到猪的增重。研究发现:增重与初始重之间存在线性回归关系。但是,在实际试验中很难满足试验仔猪初始重相同这一要求。这时可利用仔猪的初始重(记为x)与其增重(记为y)的回归关系,将仔猪增重都矫正为初始重相同时的增重,于是初始重不同对仔猪增重的影响就消除了。由于矫正后的增重是应用统计方法将初始重控制一致而得到的,故叫统计控制。统计控制是试验控制的一种辅助手段。经过这种矫正,试验误差将减小,对试验处理效应估计更为准确。若y的变异主要由x的不同造成(处理没有显著效应),则各矫正后的间将没有显著差异。若y的变异除掉x不同的影响外,尚存在不同处理的显著效应,则可期望各间将有显著。此外,矫正后的和原y的大小次序也常不一致。所以,处理平均数的回归矫正和矫正平均数的显著性检验,能够提高试验的准确性和精确性,从而更真实地反映试验实际。这种将回归分析与方差分析结合在一起,对试验数据进行分析的方法,叫做协方差分析(analysisofcovariance)。yyyy二、估计协方差组分前章曾介绍过表示两个相关变量线性相关性质与程度的相关系数的计算公式:若将公式右端的分子分母同除以自由度(n-1),得(10-1)22)()())((yyxxyyxxr)1()()1()()1/())((22nyynxxnyyxxr右端除以(n-1)后其中是x的均方MSx,它是x的方差的无偏估计量;是y的均方MSy,它是y的方差的无偏估计量;1)(2nxx2x1)(2nyy2x)1()()1()()1/())((22nyynxxnyyxxr1))((nyyxx称为x与y的平均的离均差的乘积和,简称均积,记为MPxy,即1))((nyyxxMPxy1))((nnyxxy(10-2)与均积相应的总体参数叫协方差(covariance),记为COV(x,y)或。统计学证明了,均积MPxy是总体协方差COV(x,y)的无偏估计量,即EMPxy=COV(x,y)。于是,样本相关系数r可用均方MSx、MSy,均积MPxy表示为:(10-3)xyyxxyMSMSMPr相应的总体相关系数ρ可用x与y的总体标准差、,总体协方差COV(x,y)或表示如下:(10-4)xyxyyxxyyxyxCOV),(均积与均方具有相似的形式,也有相似的性质。在方差分析中,一个变量的总平方和与自由度可按变异来源进行剖分,从而求得相应的均方。统计学已证明:两个变量的总乘积和与自由度也可按变异来源进行剖分而获得相应的均积。这种把两个变量的总乘积和与自由度按变异来源进行剖分并获得获得相应均积的方法亦称为协方差分析。在随机模型的方差分析中,根据均方MS和期望均方EMS的关系,可以得到不同变异来源的方差组分的估计值。同样,在随机模型的协方差分析中,根据均积MP和期望均积EMP的关系,可得到不同变异来源的协方差组分的估计值。有了这些估计值,就可进行相应的总体相关分析。这些分析在遗传、育种和生态、环保的研究上是很有用处的。第二节单因素试验资料的协方差分析设有k个处理、n次重复的双变量试验资料,每处理组内皆有n对观测值x、y,则该资料为具kn对x、y观测值的单向分组资料,其数据一般模式如表10-1所示。表10-1kn对观测值x、y的单向分组资料的一般形式表10-1中的x和y变量的自由度和平方和的剖分参见单因素试验资料的方差分析方法一节。其乘积和的剖分则为:总变异的乘积和SPT是xji与和yji与的离均差乘积之和,即:(10-5)=kn-1..x..yknyxyxyyxxSPkinjijijkinjijijT......)..)((1111Tdfknyyknxxyyxxkiikii....,....,...,...11其中,处理间的乘积和SPt是与和与的离均差乘积之和乘以n,即:处理内的乘积和SPe是与和与的离均差乘积之和,即:(10-7).ix..x.iy..ykiiikiiiiitknyxyxnyyxxnSP11....1..)...)(.(1kdftijx.ixijy.iykinjkitTkiiinjijijiijiijeSPSPyxnyxyyxxSP11111..1.).)(((10-6)=k(n-1)edf以上是各处理重复数n相等时的计算公式,若各处理重复数n不相等,分别为n1、n2、…、nk,其和为,则各项乘积和与自由度的计算公式为:(10-8)kiin1kinjkiiiiijijTinyxyxSP111..11kiiTndf=SPT-SPt=-k=dfT-dft(10-9)kiikkktnyxnyxnyxnyxSP1222111.............1kdftkinjijijeiyxSP11kkknyxnyxnyx.........222111kiin1edf有了上述SP和df,再加上x和y的相应SS,就可进行协方差分析。【例10.1】为了寻找一种较好的哺乳仔猪食欲增进剂,以增进食欲,提高断奶重,对哺乳仔猪做了以下试验:试验设对照、配方1、配方2、配方3共四个处理,重复12次,选择初始条件尽量相近的长白种母猪的哺乳仔猪48头,完全随机分为4组进行试验,结果见表10-2,试作分析。表10-2不同食欲增进剂仔猪生长情况表(单位:kg)此例,=18.25+15.40+15.65+13.85=63.15=141.80+130.10+144.80+133.80=550.50k=4,n=12,kn=4×12=48......4321xxxxx......4321yyyyy协方差分析的计算步骤如下:(一)求x变量的各项平方和与自由度1、总平方和与自由度dfT(x)=kn-1=4×12-1=4775.14815.638325.844815.63)10.185.150.1(2222222)(knxxSSijxT2、处理间平方和与自由度83.04815.63)85.1365.1540.1525.18(121...122222212)(knxxnSSkiixt)(xtdf=k-1=4-1=33、处理内平方和与自由度92.083.075.1)()()(xtxTxeSSSSSS44347)()()(xdftxdfTdfxe(二)求y变量各项平方和与自由度1、总平方和与自由度76.96485.55031.6410485.550)00.11...00.1240.12(222222..2)(knyySSijyT4711241)(kndfyT2、处理间平方和与自由度3、处理内平方和与自由度68.114850.550)80.13380.14410.13080.141(121.1222222..2)(knyynSSiyt3141)(kdfyt08.8568.1176.96)()()(ytyTyeSSSSSS44347)()()(ytyTyedfdfdf(三)求x和y两变量的各项离均差乘积和与自由度1、总乘积和与自由度knyxyxSPkinjijijT....1125.812450.55015.6350.73212450.55015.6300.1110.1...00.1285.140.1250.1),(yxTdf=kn-1=4×12-1=472、处理间乘积和与自由度=1.64knyxyxnSPkiiit......1112450.55015.63)80.13385.1380.14465.1510.13040.1580.14125.18(121=k-1=4-1=3),(yxtdf3、处理内乘积和与自由度61.664.125.8tTeSPSPSP44347)()(),(vxtvxTyxedfdfdf平方和、乘积和与自由度的计算结果列于表10-3。表10-3x与y的平方和与乘积和表(四)对x和y各作方差分析(表10-4)表10-4初生重与50日龄重的方差分析表分析结果表明,4种处理的供试仔猪平均初生重间存在着极显著的差异,其50日龄平均重差异不显著。须进行协方差分析,以消除初生重不同对试验结果的影响,减小试验误差,揭示出可能被掩盖的处理间差异的显著性。1、误差项回归关系的分析误差项回归关系分析的意义是要从剔除处理间差异的影响的误差变异中找出50日龄重(y)与初生重(x)之间是否存在线性回归关系。计算出误差项的回归系数并对线性回归关系进行显著性检验,若显著则说明两者间存在回归关系。这时就可应用线性回归关系来校正y值(50日龄重)以消去仔猪初生重(x)不同对它的影响。然后根据校正后的y值(校正50日龄重)来进行方差分析。如线性回归关系不显著,则无需继续进行分析。(五)协方差分析回归分析的步骤如下:(1)计算误差项回归系数,回归平方和,离回归平方和与相应的自由度从误差项的平方和与乘积和求误差项回归系数:(10-10)误差项回归平方和与自由度(10-11)dfR(e)=11848.792.061.6)()(xeeeyxSSSPb49.4792.061.62)(2)(xeeeRSSSPSS误差项离回归平方和与自由度=85.08-47.49=37.59(10-12))()()(eRveerSSSSSS43144)()()(eRveerdfdfdf(2)检验回归关系的显著性(表10-5)表10-5哺乳仔猪50日龄重与初生重的回归关系显著性检验表F检验表明,误差项回归关系极显著,表明哺乳仔猪50日龄重与初生重间存在极显著的线性回归关系。因此,可以利用线性回归关系来校正y,并对校正后的y进行方差分析。2、对校正后的50日龄重作方差分析(1)求校正后的50日龄重的各项平方和及自由度利用线性回归关系对50日龄重作校正,并由校正后的50日龄重计算各项平方和是相当麻烦的,统计学已证明,校正后的总平方和、误差平方和及自由度等于其相应变异项的离回归平方和及自由度,因此,其各项平方和及自由度可直接由下述公式计算。①校正50日龄重的总平方和与自由度,即总离回归平方和与自由度(10-13)=-=47-1=46②校正50日龄重的误差项平方和与自由度,即误差离回归平方和与自由度(10-14)=-=44-1=43上述回归自由度均为1,因仅有一个自变量x。87.5775.125.876.962)(2)()()('xTTyTyRyTTSSSPSSSSSSSS'Tdf)(yTdf)(yRdf59.3792.061.608.852)(2)()()('xeeyeeRyeeSSSPSSSSSSSS'edf)(yedf)(Redf③校正50日龄重的处理间平方和与自由度=57.87-37.59=20.28(10-15)=k-1=4-1=3(2)列出协方差分析表,对校正后的50日龄重进行方差分析(表10-6)eTt
本文标题:生物统计附试验设计第九章协方差分析(2017)
链接地址:https://www.777doc.com/doc-5668207 .html