您好,欢迎访问三七文档
第七章协方差分析第一节协方差分析的意义下一张主页退出上一张在科研中,实验效应除了受到处理因素的作用外,尚受到许多非处理因素的影响。如在研究临床疗效时,疗效的好坏不仅与治疗措施有关,还受病人的年龄、性别、病情、心理、环境、社会等因素的影响。药物临床疗效研究疗效药物病情心理因素患者的状况(性别、年龄其他因素混杂因素举例各组间的效应进行比较,必须保持组间的影响因素(混杂因素的比例)相同,组间才具有可比性。T+S1e+s1(实验组)-S2s2(对照组)Te处理因素混杂因素(在设计阶段控制混杂因素的方法)在混杂因素中,有些是难以完全控制的,如,天气变化,饲料的进食量;有些是可以控制的,如年龄,动物的初始体重。可以控制的混杂因素:最好在设计阶段(也可在分析阶段)进行控制。难以控制的混杂因素:在分析阶段进行控制。常见的实例(1)比较不同施肥量对果树单株产量的影响,果树起始干周是混杂因素。(2)比较两种药物治疗高血压的疗效,年龄是一个混杂因素。(3)研究不同饲料对动物增加体重的作用时,动物的初始体重、进食量等因素。(4)……在分析阶段控制混杂因素的方法:1、采用分层分析:如把年龄分组,再比较同一年龄组的正常体重与超重组有无差别。(适用:计量、计数资料)2、协方差分析(适用:计量资料)3、多因素分析(适用:计量、计数资料)协方差分析(analysisofcovariance,ANCOVA)将线性回归与方差分析结合起来,检验两组或多组修正均数间有无差异的一种统计方法,用于消除混杂因素对分析指标的影响。协变量:在进行协方差分析时,混杂因素统称为协变量。协方差分析的基本思想:在作两组或多组均数,…,的假设检验前,用线性回归分析方法找出协变量X与各组Y之间的数量关系,求得在假定X相等时修定均数,,,然后用方差分析比较修正均数间的差别,这就是协方差分析的基本思想。1'y2'ykyky'2y1y协方差分析的应用条件⑴要求各组资料都来自正态总体,且各组的方差相等;(t检验或方差分析的条件)⑵各组的总体回归系数βi相等,且都不等于0(回归方程检验)。因此,应用协方差分析前,要对资料进行方差齐性检验和回归系数的假设检验(斜率同质性检验),只有满足上述两个条件之后才能应用,否则不宜使用。协方差分析的应用条件⑴各比较组协变量X与分析指标Y存在线性关系(按直线回归分析方法进行判断)。⑵各比较组的总体回归系数βi相等,即各直线平行(绘出回归直线,看是否平行)。两条回归直线不平行结论:本资料不宜做协方差分析三条回归直线基本平行结论:本资料可以做协方差分析各回归系数不为零不满足条件时的处理方法X与Y不满足线性关系时,通常情况下是对X或Y或两者作适当的变量变换,使之符合线性关系。协方差分析适用的资料协方差分析可用于:完全随机设计、随机区组设计、拉丁方设计、析因设计等资料;协变量X可以仅有一个,称一元协方差分析;协变量也可以有多个,称多元协方差分析。协方差分析有二个意义,一是对试验进行统计控制,二是对协方差组分进行估计,现分述如下。一、对试验进行统计控制为了提高试验的精确性和准确性,对处理以外的一切条件都需要采取有效措施严加控制,使它们在各处理间尽量一致,这叫试验控制。下一张主页退出上一张但在有些情况下,即使作出很大努力也难以使试验控制达到预期目的。例如:研究几种配合饲料对猪的增重效果,希望试验仔猪的初始重相同,因为仔猪的初始重不同,将影响到猪的增重。经研究发现:增重与初始重之间存在线性回归关系。但是,在实际试验中很难满足试验仔猪初始重相同这一要求。下一张主页退出上一张这时可利用仔猪的初始重(记为x)与其增重(记为y)的回归关系,将仔猪增重都矫正为初始重相同时的增重,于是初始重不同对仔猪增重的影响就消除了。由于矫正后的增重是应用统计方法将初始重控制一致而得到的,故叫统计控制。统计控制是试验控制的一种辅助手段。经过这种矫正,试验误差将减小,对试验处理效应估计更为准确。若y的变异主要由x的不同造成(处理没有显著效应),则各矫正后的间将没有显著差异(但原y间的差异可能是显著的)。若y的变异除掉x不同的影响外,尚存在不同处理的显著效应,则可期望各间将有显著差异(但原y间差异可能是不显著的)。此外,矫正后的和原y的大小次序也常不一致。yyyy所以,处理平均数的回归矫正和矫正平均数的显著性检验,能够提高试验的准确性和精确性,从而更真实地反映试验实际。这种将回归分析与方差分析结合在一起,对试验数据进行分析的方法,叫做协方差分析(analysisofcovariance)。二、估计协方差组分在第六章曾介绍过表示两个相关变量线性相关性质与程度的相关系数的计算公式:若将公式右端的分子分母同除以自由度(n-1),得(10-1)22)()())((yyxxyyxxr)1()()1()()1/())((22nyynxxnyyxxr下一张主页退出上一张其中是x的均方MSx,它是x的方差的无偏估计量;是y的均方MSy,它是y的方差的无偏估计量;1)(2nxx2x1)(2nyy2x1))((nyyxx称为x与y的平均的离均差的乘积和,简称均积,记为MPxy,即1))((nyyxxMPxy1))((nnyxxy(10-2)与均积相应的总体参数叫协方差(covariance),记为COV(x,y)或。统计学证明了,均积MPxy是总体协方差COV(x,y)的无偏估计量,即EMPxy=COV(x,y)。于是,样本相关系数r可用均方MSx、MSy,均积MPxy表示为:(10-3)xyyxxyMSMSMPr下一张主页退出上一张相应的总体相关系数ρ可用x与y的总体标准差、,总体协方差COV(x,y)或表示如下:(10-4)xyxyyxxyyxyxCOV),(均积与均方具有相似的形式,也有相似的性质。在方差分析中,一个变量的总平方和与自由度可按变异来源进行剖分,从而求得相应的均方。统计学已证明:两个变量的总乘积和与自由度也可按变异来源进行剖分而获得相应的均积。这种把两个变量的总乘积和与自由度按变异来源进行剖分并获得获得相应均积的方法亦称为协方差分析。下一张主页退出上一张协方差分析是将线性回归与方差分析相结合的一种分析方法。把对反应变量Y有影响的因素X看作协变量,建立Y对X的线性回归,利用回归关系把X值化为相等,再进行各组Y的修正均数间比较。修正均数是假设各协变量取值固定在其总均数时的反应变量Y的均数。2)YY(2)YY(2)YY(其实质是从Y的总离均差平方和中扣除协变量X对Y的回归平方和,对离回归平方和作进一步分解后再进行方差分析。ijiijetuY第i组第j个观测值随机误差第i组的组效应一般均值方差分析的前提是除随机误差外,水平变量是影响观测值的唯一变量首先,我们看看方差分析数据结构:观测值=一般均值+水平影响+协变量影响+随机误差ijxijyijuXuY)(ijxijeiyijuXtuY)(回归系数协变量效应ijiijetuY可见,协方差分析将方差分析与回归分析结合了起来.方差分析回归分析下面我们再看协方差分析数据结构(单因素完全随机设计试验资料的协方差分析):第二节单因素试验资料的协方差分析设有k个处理、n次重复的双变量试验资料,每处理组内皆有n对观测值x、y,则该资料为具kn对x、y观测值的单向分组资料,其数据一般模式如表10—1所示。下一张主页退出上一张表10—1kn对观测值x、y的单向分组资料的一般形式表10—1的x和y变量的自由度和平方和的剖分参见单因素试验资料的方差分析方法一节。其乘积和的剖分则为:总变异的乘积和SPT是xji与和yji与的离均差乘积之和,即:(10-5)=kn-1..x..yknyxyxyyxxSPkinjijijkinjijijT......)..)((1111Tdf下一张主页退出上一张knyyknxxyyxxkiikii....,....,...,...11其中,处理间的乘积和SPt是与和与的离均差乘积之和乘以n,即:(10-6)处理内的乘积和SPe是与和与的离均差乘积之和,即:(10-7).ix..x.iy..ykikiiiiitknyxyxnyyxxnSP11......1..)...)(.(1kdftijx.ixijy.iykinjkitTkiiinjijijiijiijeSPSPyxnyxyyxxSP11111..1.).)((=k(n-1)以上是各处理重复数n相等时的计算公式,若各处理重复数n不相等,分别为n1、n2、…、nk,其和为,则各项乘积和与自由度的计算公式为:(10-8)edfkiin1kinjkiiiiijijTinyxyxSP111..11kiiTndf下一张主页退出上一张=SPT-SPt=-k=dfT-dft(10-9)kiikkktnyxnyxnyxnyxSP1222111.............1kdftkinjijijeiyxSP11kkknyxnyxnyx.........222111kiin1edf有了上述SP和df,再加上x和y的相应SS,就可进行协方差分析。【例10.1】为了寻找一种较好的哺乳仔猪食欲增进剂,以增进食欲,提高断奶重,对哺乳仔猪做了以下试验:试验设对照、配方1、配方2、配方3共四个处理,重复12次,选择初始条件尽量相近的长白种母猪的哺乳仔猪48头,完全随机分为4组进行试验,结果见表10—2,试作分析。下一张主页退出上一张表10—2不同食欲增进剂仔猪生长情况表(单位:kg)下一张主页退出上一张此例,=18.25+15.40+15.65+13.85=63.15=141.80+130.10+144.80+133.80=550.50k=4,n=12,kn=4×12=48......4321xxxxx......4321yyyyy协方差分析的计算步骤如下:(一)求x变量的各项平方和与自由度1、总平方和与自由度dfT(x)=kn-1=4×12-1=4775.14815.638325.844815.63)10.185.150.1(2222222)(knxxSSijxT2、处理间平方和与自由度83.04815.63)85.1365.1540.1525.18(121...122222212)(knxxnSSkiixt)(xtdf=k-1=4-1=33、处理内平方和与自由度(二)求y变量各项平方和与自由度1、总平方和与自由度92.083.075.1)()()(xtxTxeSSSSSS44347)()()(xdftxdfTdfxe76.96485.55031.6410485.550)00.11...00.1240.12(222222..2)(knyySSijyT4711241)(kndfyT下一张主页退出上一张2、处理间平方和与自由度3、处理内平方和与自由度(三)求x和y两变量的各项离均差乘积和与自由度1、总乘积和与自由度68.114850.550)80.13380.14410.13080.141(121.1222222..2)(knyynSSiyt3141)(kdfyt08.8568.1176.96)()()(ytyTyeSSSSSS44347)()()(ytyTyedfdfdf=kn-1=4×12-1=472、处理间乘积和与自由度=1.64knyxyxSPkinjijijT....1125.812450.55015.6350.73212450.55015.6300.111
本文标题:第七章 协方差分析
链接地址:https://www.777doc.com/doc-3287667 .html