您好,欢迎访问三七文档
方差分析(ANOVA)多个均数比较不能用t检验!!!若用t检验进行多个均数的比较,将会加大犯Ⅰ类错误(把本无差别的两个总体均数判为有差别)的概率。例如,有4个样本均数,两两组合数为,若用t检验做6次比较,且每次比较的检验水准选为,则每次比较不犯Ⅰ类错误的概率为(1-0.05),6次均不犯Ⅰ类错误的概率为:此时,总的检验水准变为26.0)05.01(16246C0.056)05.01(将所研究的对象分为多个处理组,施加不同的干预,施加的干预称为处理因素(factor),处理因素至少有两个水平(level)。用这类资料的样本信息来推断各处理组间多个总体均数是否存在差别,常采用方差分析(analysisofvariance,ANOVA)。该方法由RA.Fisher首先提出,并由GW.Snedecor完善,为纪念Fisher,检验统计量以F命名,故方差分析又称F检验(Ftest)。第一节方差分析的基本思想实例说明(P73)例4-2某医生为研究一种降血脂新药的临床疗效,按统一纳入标准选择了120名高血脂患者,采用完全随机设计方法将患者分为4组,进行双盲试验。6周后测得低密度脂蛋白(见表4-3)。问4个处理组患者的低密度脂蛋白含量总体均数有无差别?i=1,2…gj=1,2…niin(1)i2i3i4iijXij表示第组第个观察值试验数据有三种不同的变异•总变异(Totalvariation)全部测量值Xij与总均数间的差别;•组间变异(variationamonggroups)各组的均数与总均数间的差异;•组内变异(variationwithingroups)每组的30个观察值与该组均数的差异。(一)变异的分割iXXXiX下面用离均差平方和(sumofsquares,SS)表示变异的大小1.总变异(totalvariation)2ggg221111112222();1iiinnnijijijijijijSSXXXXnXXnXCCXn总总其中=n反映了所有测量值之间总的变异程度.SS总=各测量值Xij与总均数差值的平方和XSS组间反映了各组均数间的变异程度.组间变异是由于①随机误差+②处理因素效应?产生。2.组间变异(variationamonggroups)22ggg1211112g2212()nnn;g1iinijnjiiijiiijiiiiiiXSSnXXXnTXTnCnCX组间组间其中=iXmimj在同一处理组内,虽然每个受试对象接受的处理相同,但测量值仍各不相同,这种变异称为组内变异。SS组内仅仅反映了随机误差的影响。(也称SS误差)3.组内变异(variationwithingroup)gg22111()(1)nginijiiiijiSSXXnS组内组内=mi可以证明:三种“变异”间的关系组内组间总SSSSSS+=,且ν总=ν组间+ν组内组内变异SS组内:随机误差组间变异SS组间:处理因素+随机误差One-FactorANOVAPartitionsofTotalVariationVariationDuetoTreatmentSSBVariationDuetoRandomSamplingSSWTotalVariationSSTCommonlyreferredtoas:SumofSquaresWithin,orSumofSquaresError,orWithinGroupsVariationCommonlyreferredtoas:SumofSquaresAmong,orSumofSquaresBetween,orSumofSquaresModel,orAmongGroupsVariation=+均方(meansquare,MS)离均差平方和还受其自由度的影响,由于各部分自由度不相等,因此各部分离均差平方和不能直接比较,须将各部分离均差平方和除以相应自由度,其比值就是方差,简称均方(meansquare,MS)。组间均方和组内均方的计算公式为:SSMS组间组间组间SSMS组内组内组内(二)构建检验统计量F如果各组样本的总体均数相等(H0:12mm…gm),即各处理组的样本来自相同总体,无处理因素的作用,则组间变异同组内变异一样,只反映随机误差作用的大小。组间均方与组内均方的比值称为F统计量MSFMS组间组内1组间,2组内F值接近于l,就没有理由拒绝H0;反之,F值越大,拒绝H0的理由越充分。数理统计的理论证明,当H0成立时,F统计量服从F分布。(三)F分布F分布概率密度函数:22121122/22/12121121)(222)(FFFf式中)(为伽玛函数;21MSMS组内均方=组间均方F,是两个均方的比值;1、2分别为F值的分子与分母的自由度,这是F分布的两个参数,由这两个自由度可决定F分布的图形形状,因此F分布可用),(21F表示。以F为横轴,)(Ff为纵轴可绘制F分布的图形。F分布曲线(一)0123450.00.20.40.60.81.01=1,2=101=5,2=10F分布曲线(二)0123450.00.20.40.60.81.01=10,2=1=10,2=10方差分析的基本思想首先将总变异分解为组间变异和组内(误差)变异,然后比较两者的均方,即计算F值。F值越大越有理由说处理起作用(处理组间的效应不同),反之,表示处理组间效应相同(组间差异仅仅由随机误差所致)。组间变异总变异组内变异方差分析的基本思想(单向)方差分析的基本思想对于不同设计的方差分析,其基本思想都是一样的,即将处理间平均变异与误差的平均变异进行比较。不同之处在于变异分解的项目因设计不同而异。第二节完全随机设计的方差分析完全随机设计(completelyrandomdesign)的方差分析也称单向方差分析(one-wayANOVA)。前已述及,完全随机设计是将受试对象仅仅靠随机化的办法分配到各个处理组或对照组的一种设计,未考虑干扰因素的影响。完全随机设计各组例数可以相等或不等处理1(n1)处理2(n2)处理k(nk)试验对象(n)随机化分组随机分组方法:1.编号,确定分组方案(如较小的10个随机数为A,中间10个数为B,较大10个随机数为C)2.产生随机数字(附表15,或电脑),排序3.按方案分组(此处规定序号1-30为第一组,。。。)例4-1(P72)二、ANOVA的步骤H0:12g...mmmH1:g组的总体均数不全相等(至少两个不等)0.05MSMSF组间组内若F>F0.05(v1,v2),P0.05,拒绝H0,接受H1;反之,接受H0。计算F值(方差分析表)211()C=ningijijXnn结果与结论注意:当拒绝H0,接受H1,不能说明各组总体均数两两间都有差别(注意H1的含义),要进行多个均数间多重比较(后述)。第三节随机区组设计的方差分析随机区组设计(randomizedblockdesign):又称配伍组设计,其方差分析也叫双向方差分析(two--wayANOVA)。该设计是配对设计的扩展(介绍农田的例子)。具体做法:将受试对象按性质(如性别、年龄、病情等)(这些性质是非处理因素,可能影响试验结果)相同或相近者组成b个区组(配伍组),每个区组中有g个受试对象,分别随机地分配到g个处理组。这样,各个处理组不仅样本含量相同,生物学特点也较均衡。比完全随机设计更容易察觉处理间的差别。一、随机区组设计P56:例4-3随机分组方法(每个单位组内随机):1.将同种类同窝大白鼠为一个区组,并编号;2.给同窝中3只大白鼠编号;规定随机数小者分到甲组,中等分到乙组,大者分到丙组;3.给每个大白鼠一个随机数;4.按规定分组(事先规定每个区组中随机数小者分到甲组…)表4窝大白鼠按随机区组设计分组单位组号1234小白鼠123456789101112随机数683526009953936128527005序号321132321231分配结果丙乙甲甲丙乙丙乙甲乙丙甲二、方差分析的步骤与完全随机设计的方差分析基本相同,主要区别在于:F值计算的方差分析表(ANOVAtable)不同。变异来源从组内变异中分解出区组变异与误差变异。(二)计算F值(方差分析表)2(X)C=n计算F值(方差分析表)(三)下结论随机区组设计利用区组(block)控制了非实验因素,并在进行方差分析时将区组间的变异从组内变异中分解出来。因此,当区组间差别有统计学意义时,这种设计由于减少了误差,较完全随机设计的试验效率提高了。如果区组间差别无统计学意义,有两种可能:一是区组本身没有差别,这样设计多此一举,此时应退回到完全随机设计进行ANOVA;二是可能有重要的干扰因素未考虑到。对于处理组间的结论容易下。然而对于区组间的结论有几点应该考虑:t检验与F检验的关系当处理组数为2时,对于相同的资料,如果同时采用t检验与F检验:随机区组设计ANOVA的处理组F值与配对设计的t值;完全随机设计ANOVA的F值与两样本均数比较的t值间均有:tF完全随机设计与随机区组设计的ANOVA随机区组设计ANOVA将完全随机设计ANOVA的组内变异再分解为区组间变异与误差变异,即:SSSSSS组内区组误差组内区组误差=;=完全随机设计与随机区组设计的ANOVA随机区组设计ANOVA是将完全随机设计ANOVA的组内变异再分解为区组间变异与误差变异,即:SSSSSS组内区组误差组内区组误差=;=方差分析的应用条件资料无偏性,样本是相互独立的随机样本(独立性);样本来自正态总体(正态性,normality);各对比组的总体方差相等(方差齐性,homogeneityofvariance)—对于完全随机设计。上述条件相互制约,实际工作中,以方差齐性考虑最多!ANOVA的流程,xs列出原始数据,计算等统计量;方差齐性检验(实际工作中,一般在最大方差与最小方差相差3倍以上时才进行);①若方差齐(正态性也就满足了)ANOVA,如果NS,结束;如果P0.05,则Post-hoc检验。②若方差不齐,则变量变换方差齐性检验ANOVA(同上)F’检验(两组比较-t’检验:Satterthwaite法、Welch法、Cochran&Cox法)非参数统计(如秩和检验)第六节多个均数间的多重比较当方差分析的结果拒绝H0,接受H1时,只说明g个总体均数不全相等。若想进一步了解哪两个总体均数不等,需进行多个样本均数间的两两比较或称多重比较(multiplecomparison)。也称Post-hoc检验。一、一对或几对在专业上有特殊意义样本均数比较:建议用LSD-t二、多个实验组与一个对照组的比较:建议用Dunnett检验三、多个均数间全面比较(探索性研究):SNK法(q检验)用得最多。“多重比较”的三类方法SNK(Student-Newman-Keuls)检验,亦称q检验。一、SNK(q检验)ijijXXXXqS,ν=ν误差,112ijXXijMSSnn误差iX,in和jX,jn为两对比组的样本均数和样本例数。适用于探索性研究,各组间都要比较。SNK-q检验与t检验区别SNK-q检验Student’st检验122nn211()ijxxCijSSnn误差q界值表(附表4)t界值表(附表2)11()2ijxxijMSSnn误差最小显著差异(Leastsignificantdifference,LSD)t检验,目的主要是控制二型错误。二、LSD法(LSD-t检验)LSD-t=ijijXXXXS,ν=ν误差,11ijXXijSMSnn误差iX,in和jX
本文标题:第4章ANOVA
链接地址:https://www.777doc.com/doc-2156361 .html