您好,欢迎访问三七文档
第五章方差分析第一节方差分析的基本原理1.1概念方差分析(AnalysisofVariance,简称ANOVA),又称“变异数分析”或“F检验”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。例如:医学界研究几种药物对某种疾病的疗效;农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响;不同饲料对牲畜体重增长的效果等,都可以使用方差分析方法去解决。方差或叫均方,是标准差的平方,是表示变异的量。在一个多处理试验中,可以得到一系列不同的观测值。造成观测值不同的原因是多方面的,有的是处理不同引起的,叫处理效应或条件变异,有的是试验过程中偶然性因素的干扰和测量误差所致,称为实验误差。方差分析的基本思想是将测量数据的总变异按照变异原因不同分解为处理效应和实验误差,并作出其数量估计。(方差分析方法就是从总离差平方和分解出可追溯到指定来源的部分离差平方和)。1.2方差分析的适用条件•各处理组样本来自正态总体;•各样本是相互独立的随机样本;•各处理组的总体方差相等,即方差齐性。1.3数学模型假定有k组观测数据,每组有n个观测值,则用线性可加模型来描述每一观测值,有:是在第i次处理下的第j次观测值,为总体平均数,为处理效应,是试验误差,要求是相互独立的,且服从正态分布ijiijxijxiij2(0,)N对于由样本估计的线性模型为:为样本平均数,为样本的处理效应,为试验误差。ijiijxxtexitije1.4平方和和自由度的分解因此,要把一个试验的总变异依据变异来源分为相应的变异,首先要将总平方和和总自由度分解为各个变异来源的相应部分。2222()()1xNxxsn总体方差:样本方差:1.4.1平方和的分解总平方和=处理间平方和+处理内平方和SSTteSSSS2222211()()knTxTSSxxxxknkn2CTkn令,2CTSSx2TSS=itCnSSeTtSSSS1.4.2自由度的分解总自由度也可分解为处理间自由度和处理内自由度,即:总自由度=处理间自由度+处理内自由度Ttdfdfdf11(1)(1)(1)TteTtdfnkdfkdfdfdfnkkkn根据各变异部分的平方和和自由度,可得处理间方差和处理内方差2ts2es2tttSSsdf2eeeSSsdf例1.对四个污水处理厂污水中的氨氮含量进行测定,测定结果列于下表,试进行方差分析。表1.氨氮含量(ppm)本例中,品种数k=4,重复数n=4,观测数据总数nk=4*4=16.(1)平方和计算:矫正数C22222222222434.4C11793.9616C=31.924...24.6213.3T123.6103.296.2111.4SS=103.944SS213.30103.94109.36TiteTtTknSSxCCCnSSSS(2)自由度的计算:总自由度处理间自由度处理内自由度116115Tdfnk1413tdfk(1)4*(41)12eTtdfdfdfkn(3)方差计算:处理间方差处理内方差2103.9434.653tttSSsdf2109.369.1112eeeSSsdf1.5统计假设的显著性检验——F检验处理内方差可以作为误差方差的估计量,处理间方差作为不同处理工艺差异的估计量。已知从一个总体随机抽取两个样本,其样本方差的比值为F,即2212ss和2122Fss一般将大方差作分子,小方差作分母,使F值大于1,进行不同处理差异显著性的F检验时,一般是把处理间方差作为分子,称为大方差,误差方差作分母,称为小方差。F处理间方差误差方差无效假设把各个处理的变量假设来自同一总体,即处理间方差不存在处理效应,只有误差的影响,因而处理间的样本方差与误差的样本方差相等,即H0:无效假设是否成立,决定了计算的F值在F分布中出现的概率,例1中的F值为:2t2e2234.65F3.89.11tess22te根据确定的显著标准从F值表中查出在和下的值。如果所计算的F<,P>0.05,则接受H0,说明处理间差异不显著,若F≥P≤0.05,应否定H0,接受,说明处理间差异是显著的,并在计算的F值的右上角标上“*”号。tdfFedf0.05F0.05F22te表2.F值、P值与统计结论例1中查F值表,F>,应否定H0,说明不同处理间污水氨氮含量差异是显著的。将方差分析结果列成方差分析表。0.053.49F0.05F1.6多重比较用F检验如果否定了H0.接受HA,仅说明k个平均数间有显著差异,但不能说明哪些平均数间有显著差异。例如4个不同污水处理工艺对污水氨氮含量有显著差异,但不是所有处理下氨氮平均数间的差异都显著,有些处理间可能差异极显著,有些处理间可能差异不显著。例如,如果确定了不同施肥量对农作物的产量有显著影响,那么还需要了解10公斤、20公斤、30公斤肥料对农作物产量的影响幅度是否有差异,其中哪种施肥量水平对提高农作物产量的作用不明显,哪种施肥量水平最有利于提高产量等。因此,要明确不同处理平均数两两间差异的显著性,每个处理的平均数都要与其他的处理进行比较,这种差异显著性的检验就叫多重比较。多重比较检验问题也是假设检验问题,因此也遵循假设检验的基本步骤。多重比较的方法很多,常用最小显著差异法(LSD)和最小显著极差法(LSR).1.6.1最小显著性差异法LSD——LeastSignificantDifference实质是两个平均数相比较的t检验法。检验的方法是首先计算出达到差异显著的最小差数,记为LSD,然后用两个处理平均数的差与LSD比较,若>LSD,即在给定的水平上差异显著,反之,差异不显著。12xx由,得若>或>就可以在0.05或0.01水平上拒绝H0,接受HA。1212xxxxts1212xxxxts12120.050.050.010.01xxxxLSDtsLSDts12xx120.05xxts120.01xxts12xx其中平均数差数标准误计算公式:为处理内误差方差,n为每一处理观察次数。1222212121211()exxssssnnnn1222exxssn12当n=n时,2es例1.表1.氨氮含量(ppm)根据例1,将氨氮含量平均数差数列于表中,并和LSD值比较。12222*9.112.134exxssn0.050.0112,2.179,3.056edftt12120.050.050.010.012.1792.134.653.0562.136.52xxxxLSDtsLSDts1.6.2多重比较结果的表示•列梯形表法(表3)•标记字母法(表4)A与D差异达到极显著标准,A与C之间的差异达到显著标准,其他处理间差异不显著。表3.不同处理间氨氮含量差异显著表(列梯形表法)表4.不同处理间氨氮含量差异显著表(标记字母法)*进行LSD检验时,必须注意这一对平均数的比较是检验之前已经指定的,而且经F检验证实平均数间差异已达显著之后,可以进行LSD检验。练习1.6.3最小显著极差法(LSR法)LSR法采用不同平均数间用不同的显著差数标准进行比较,可用于平均数间的所有相互比较。LSR法的常用方法有新复极差检验和q检验。(1)按相比较的样本容量计算平均数标准误:(2)查所具有自由度和比较所含平均数个数k时的SSR值,然后算出值:21221212,11,()exexsnnnsnsnnsnnn*xLSRSSRs2esedfLSR(3)将各平均数按大小顺序排列,用各个k值的值即可检验各平均数间极差的显著性。LSR第二节单因素方差分析2.1概念是用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。这里,由于仅研究单个因素对观测变量的影响,因此称为单因素方差分析。因素与处理:因素是影响因变量变化的客观条件;处理是影响因变量变化的人为条件。也可通称为因素。常用大写字母(A,B,…)来表示。水平:因素的不同等级称作水平。水平值取有限的离散值。如:性别中的0,1(男、女)等常用代表该因素的字母添加下标来表示。(A1,A2,…B1,B2…)例如,分析不同施肥量是否给农作物产量带来显著影响,考察地区差异是否影响妇女的生育率,研究学历对工资收入的影响等。这些问题都可以通过单因素方差分析得到答案。•单因素方差分析的第一步是明确观测变量和控制变量。例如,上述问题中的观测变量分别是农作物产量、妇女生育率、工资收入;控制变量分别为施肥量、地区、学历。•单因素方差分析的第二步是剖析观测变量的方差。方差分析认为:观测变量值的变动会受控制变量和随机变量两方面的影响。据此,单因素方差分析将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两部分,用数学形式表述为:SST=SSA+SSE。•单因素方差分析的第三步是通过比较观测变量总离差平方和各部分所占的比例,推断控制变量是否给观测变量带来了显著影响。在观测变量总离差平方和中,如果组间离差平方和所占比例较大,则说明观测变量的变动主要是由控制变量引起的,可以由控制变量来解释,控制变量给观测变量带来了显著影响;反之,如果组间离差平方和所占比例小,则说明观测变量的变动不是主要由控制变量引起的,不可以主要由控制变量来解释,控制变量的不同水平没有给观测变量带来显著影响,观测变量值的变动是由随机变量因素引起的。2.2组内观测次数相等的方差分析K组处理中,每一处理皆有n个观测值,其方差分析方法同前。表5.组内观测次数相等的单因素方差分析例2.测定东北、内蒙古、河北、安徽、贵州五个地区冬季针矛的长度,每个地区随机抽取4个样本,测定结果如表示,试比较各地区针毛长度差异显著性。表5.不同地区冬季针毛长度(mm)表6.数据统计表本例中,k=5,n=4。计算离均差平方和与自由度:222222222530.5C14071.515*4C=14258.21186.7T126.4109.6...91.4SS=173.714SS186.7173.7112.9912011915145(41)15103.9434.653TiteTtTtettteeTknSSxCCCnSSSSdfnkdfkdfSSsdfSSsd109.369.1112ef进行F检验:说明五个地区冬季针矛的长度差异非常显著。220.05(4,15)0.01(4,15)0.0134.6550.159.113.06,4.89,,0.01tesFsFFFFP表7.不同地区冬季针矛长度方差分析表为了确定各个地区之间的差异是否显著,需要进行多重比较,用LSD法进行检验。12121220.050.010.050.050.010.0122*0.8660.658415,2.131,2.9472.1310.6581.4022.9470.6581.939exxexxxxssndfttLSDtsLSDts表8.不同地区冬季针矛长度比较2.3组内观测次数不相等的方差分析k个处理的观测次数依次是n1,n2,…nk的单因素分组资料仍可使用前述的分析方法,但总观测次数不是nk,而是次。表9.组内观测次数不相等的方差分析1kiin在作多重比较时,首先计算平均数的标准误,需先计算各ni的平均数n0:220()()(1)iiinnnnk1222002eexxxssssnn或第三节二因素方差分析3.1概念在实际工作中经常会遇到两种因素共同影响试验结果的情况。例如,为了研究某种昆虫滞育的情况,同时选用几种温度(因素A)和光照时间(因素B)进行室内培养,每一观测值都是某一特定温度与光照条件共同作用的结果。在二因素试验中,固定模型——二因素都是固定
本文标题:方差分析
链接地址:https://www.777doc.com/doc-5191711 .html