您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 药学 > 田间试验与统计分析31
第三章方差分析Chapter3ANOVA(AnalysisofVariance)方差分析是判断多组数据(K≥3)之间平均数差异是否显著的一种假设测验方法。2个样本平均数可用t或U测验的方法来评定其差数的显著性。如果有K个平均数,且K≥3,若仍然用两两比较的方法来测验,则需要作K(K-1)/2次测验,如果K=10,则需要45次测验,不但测验程序繁琐,而且在理论上,其显著水平已经扩大了。因此,对于多样本平均数的假设测验,需采用一种更为合适的统计方法,即方差分析法(Fisher,1923)。第三章方差分析方差是平方和除以自由度的商。Nxi22)(nx/22方差分析是将总变异分裂为各个因素的相应变异,作出其数量估计,从而发现各个因素在变异中所占的重要程度,而且除了可控制因素所引起的变异后,其剩余变异又可提供试验误差的准确而无偏的估计,作为统计假设测验的依据。第三章方差分析例如,若有5组数据要比较,则共需要比较(5×4)/2=10次。若H0正确,每次接受的概率为1-α=0.95,10次都接受的概率为0.9510≈0.60,因此,α’=1-0.60=0.40,即犯第一类错误的概率为0.40,这显然是不能接受的。本章主要内容:第一节方差分析的基本原理和方法。第二节单向分组资料的方差分析。第三节两向分组资料的方差分析。第三章方差分析第一节方差分析的基本原理和方法1.自由度和平方和的分解2.F分布(FDistribution)3.多重比较(multiplecomparisons)4.方差分析的基本假定5.数据转换第三章方差分析1、自由度和平方和的分解设有K组样本,每样本均具有n个观察值,则该资料共有nk个观察值,数据如下表。组别12……i……n总和平均均方1..J..kX11X12…X1j…X1nX21X22…X2j…X2nXi1Xi2…Xij…XinX1nX2n…Xjn…XknT1T2TiTk表每组具n个观察值的k组样本的符号表1x2xixkxxxTijx21S22S2iS2kS第一节方差分析的基本原理和方法Xij,i=1,2,……k,j=1,2,……n。总变异是nk个观察值的变异,故其自由度为nk-1,平方和SST为:nkTxnkxxxxSST22222)()()(式中,C称为矫正数。总平方和(SST)第一节方差分析的基本原理和方法CnkT2)(CxnkTxSST222)(njiiijnjijxxxxxx1212)()(njinjiiijnjiijxxxxxxxx12112)())((2)(212)()(xxnxxinjiijkiikinjiijkinjijTxxnxxxxSS12112112)()()(总平方和SST=组内平方和SSe+处理平方和SSt总平方和SST的计算:组内的变异为各组内观察值与组平均数的相差,故每组具有n-1个自由度,平方和为,而总共有k组资料,故组内自由度为k(n-1),而组内平方和SSe为:2)(iijxxtkiTnjiijSSSSxxSSe112)(第一节方差分析的基本原理和方法上述总变异的自由度和平方和可分解为组间和组内两个部分。组间变异即k个平均数的变异,故其自由度为k-1,平方和SSt为:2)(xxnSSit因此,上述资料的自由度和平方和的分解式为:总自由度=组间自由度+组内自由度(nk-1)=(k-1)+k(n-1)总平方和=组间平方和+组内平方和kinjiijkiinkijxxxxnxx1121212])([)()(第一节方差分析的基本原理和方法均方的计算:)1(11222nkSSSkSSSnkSSSeettTT第一节方差分析的基本原理和方法方差分析表变异来源平方和SS自由度DF均方MSF值处理间SStK-1St2St2/Se2处理内/误差SSeK(n-1)Se2总变异SSTnk-1第一节方差分析的基本原理和方法例1:测定东小麦品种东方红3号的蛋白质含量(%)10次,得其平均数为14.3,方差为1.621;测定农大139号的蛋白质含量5次,得其平均数为11.7,方差为0.135。试测验东方红3号小麦蛋白质含量的变异是否比农大139为大。假设:H0:δ12=δ22;HA:δ12δ22。显著水平:α=0.05,DF1=9,DF2=4时,F0.05,(9,4)=6.00。00.601.12135.0621.1)4,9(,05.02221FSSF推断:此F>F0.05,所以,P<0.05接受HA,即东方红3号小麦蛋白质含量的变异大于农大139。第一节方差分析的基本原理和方法分析:两样本分别来自于两个不同的总体,总体方差均为未知,不能假设σ12=σ22。可采用近似t分布两尾测验的方法。假设:H0:μ1=μ2;HA:μ1≠μ2。显著水平:α=0.05。回顾t测验法:东方红3:均数:14.3,方差:1.621,n1=10农大139:均数:11.7,方差:0.135,n2=5计算;两个样本的样本容量不同,需转换自由度。86.00270.01621.01621.05/135.010/621.110/621.1k1148.115)86.01(110)86.0(1'22v推断:接受HA,否定H0,即两品种蛋白质含量有极显著差异。在σ1≠σ2时的t测验,如果两个样本的样本容量相同n1=n2=n,则在t测验时,可不必进行自由度的转换,可直接取自由度为n-1。查表,t0.05,11=2.301。计算值|t|=5.98t0.05,11,故P0.0598.5435.07.113.14435.05135.010621.1'21vxxtS计算t值;例2:以A、B、C、D4种药剂处理水稻种子,其中A为对照,每处理得4个苗高观察值,结果如下表,试进行自由度和平方和的分解,并测验药剂间变异是否显著大于药剂内变异?表水稻不同药剂处理的苗高假设:H0:δ12=δ22;HA:δ12δ22。显著水平:α=0.05,DF1=3,DF2=12时,F0.05,(3,12)=3.49。药剂ABCD19232113212427202018191522252722总和76927296T=336平均数1923182421第一节方差分析的基本原理和方法自由度分解:总变异自由度=4×4-1=15药剂间自由度=4-1=3药剂内自由度=4(4-1)=12平方和分解:SST=222SSt=104SSe=SST-SSt=222-104=118均方:ST2=222/15=14.80St2=104/3=34.67Se2=118/12=9.83其中,Se2为4种药剂内变异的合并均方,是试验误差的估计值;药剂均方St2则为试验误差加上不同药剂对苗高的效应。第一节方差分析的基本原理和方法53.383.967.34F推断:接受HA,即测验药剂间变异显著地大于药剂内变异,不同药剂对水稻苗高具有不同效应。查表5(F值表):自由度(3;12)第一节方差分析的基本原理和方法F.05=3.49;F.01=5.95变异平方和自由度均方处理间104334.67误差118129.83总变异2221514.849.353.3)12,3(,05.0F方差分析表平方和自由度均方FF0.05SSt=1043St2=104/3=34.67St2/Se2=3.53*3.49SSe=SST-SSt=11812Se2=118/12=9.83SST=22215ST2=222/15=14.80变异来源自由度DF平方和SS均方MSF值处理间K-1SStSt2=SSt/df1F=St2/Se2误差K(n-1)SSeSe2=Sse/df2总变异nk-1SST第一节方差分析的基本原理和方法2.F分布FDistribution第一节方差分析的基本原理和方法2221SSF此F值具有S12的自由度ν1和S22的自由度ν2。如果我们在给定的ν1和ν2下进行一系列抽样,就可得到一系列的F值,这一系列的F值呈F分布。理论统计研究证明,F分布具有平均数μF=1和取值区间为【0,+∞】的一组曲线,而某一特定的曲线的形状则仅决定于参数ν1和ν2。ν1=1或ν1=2时,F分布曲线呈反向“J”型;当ν1≥3时,曲线呈偏态。定义:在一个平均数为μ,方差为σ的正态总体中,随机抽取两个独立样本,并求得其均方S12和S22,我们将这两个均方的比值定义为F。FDistributionν1=5,ν2=4ν1=1,ν2=5ν1=2,ν2=5012345670.20.40.60.81.0因自由度不同的F分布曲线FDistribution当ν1=1或ν1=2时,F分布曲线呈反向“J”型;当ν1≥3时,曲线呈偏态。f(F)F•F分布下一定区间的概率可从已制成的统计表查出。附表5系各种v1和v2下右尾概率α=0.05和α=0.01时的临界F值(一尾概率表)。如查附表5,v1=3,v2=12时,F0.05=3.49,F0.01=5.95,即表示如以v1=3(n1=4)、v2=12(n2=13)在一正态总体中进行连续抽样,则所得F值大于3.49的仅有5%,而大于5.95的仅有1%。•所以附表5的数值实际是专供测验S12的总体方差σ12是否显著大于S22的总体方差σ22而用的。•(H0:σ12≤σ22;HA:σ12>σ22)。•在作F则验时,应以取大值的均方(S12)作分子、取小值的均方(S22)作分母计算F值。若所得F>F0.05或>F0.01。则该F值即为在α=0.05或α=0.01水平上显著,应否定H0,接受HA;若所得F<F0.05,则接受H0。FDistribution•在方差分析的体系中,F测验某项变异因素的效应或方差是否真实存在。所以在计算F值时,总是将要测验的那一项变异因素的均方作分子,而以另一项变异因素(如试验误差项)的均方作分母。这个问题与方差分析的模型和各项变异来源的期望均方有关。在此测验中,如果作分子的均方小于作分母的均方,则F<1;此时不必查F表即可确定P>0.05,应接受H0。•F测验需具备:(1)变数x遵循正态分布N(μ,σ2)(2)S12和S22彼此独立两个条件。当资料不符合这些条件时,需作适合转换。FDistribution3.多重比较(multiplecomparisons)在上例中,接受了HA,仅是指出了东方红3号小麦蛋白质含量的变异大于农大139的。但是,是否各个平均数彼此间都有显著差异呢?还是仅有一部分平均数间有显著差异而另一部分平均数间没有显著差异?仅根据上述分析结果是无法确定的。要明确各个平均数彼此间的差异显著性,还必须对各平均数进行多重比较。3.1、最小显著差数测验法3.2、最小显著极差测验法(1)Duncan’s新复极差测验法(Duncan,1955)(2)q测验3.3、比较方法的选择3.1最小显著差数测验法leastsignificantdifference,简称LSD法。用此法测验多个平均数时,首先算得平均数差数的标准误:nSSexx2221式中,Se2为方差分析时的误差均方值,n为样本容量。然后查t表得Se2所具有自由度下两尾概率值为α的临界t值tα,计算得最小显著差数:tSLSDxx21若两个平均数的差数LSDα,即为在α水平上显著。multiplecomparisons例3:以A、B、C、D4种药剂处理水稻种子,各药剂处理后的苗高平均数依次为19、23、18、24cm,作多重比较。假设:H0:μB=μA,μC=μA,μD=μA;HA:μB≠μA,μC≠μA,μD≠μA。显著水平:α=0.05multiplecomparisons药剂ABCD19232113212427202018191522252722总和76927296T=336平均1923182421已经算得Se2=9.83,A为对照。22.2483.9
本文标题:田间试验与统计分析31
链接地址:https://www.777doc.com/doc-4324536 .html