您好,欢迎访问三七文档
2020/5/201第六章方差分析2020/5/202主要内容第一节方差分析简介第二节单因素方差分析第三节多因素方差分析第四节协方差分析2020/5/203第一节方差分析简介方差分析是英国统计学家R.A.Fisher(1890-1962)在进行试验设计时为解释试验数据而首先引入的。方差分析是一种通过分析样本资料各项差异的来源以检验三个以上总体平均数是否相等的统计方法。目前,方差分析方法在各个领域都得到了广泛应用。方差分析的核心就是方差可分解。即将总变异分解为由随机误差造成的变异(组内SS)与由均数差异造成的变异(组间SS)两个部分。如果后者大于前者,且具有统计学意义,我们将拒绝零假设,即认为总体中均数间存在差异。42020/5/20一、方差分析的作用在诸多领域的数量分析研究中,找到众多影响因素中重要的影响因素是非常重要的。比如:在农业生产中,我们总是希望在尽量少的投入成本下得到较高的农作物产量。这就需要首先分析农作物的产量究竟受到哪些因素的影响。有许多因素会影响农作物的产量,如种子的品种、施肥量、气候、地域等,他们都会给农作物的产量带来或多或少的影响。如果我们能够掌握在众多的影响因素中,哪些因素对农作物的产量起到了主要的、关键性的作用,我们就可以根据实际情况对这些关键因素加以控制。进一步,在掌握关键影响因素,如品种、施肥量因素等之后,我们还要对不同的品种、不同的施肥量条件下的产量进行对比分析,研究究竟哪个品种的产量高,施肥量究竟多少最合适,哪种品种与哪种施肥量搭配最优,等等。在这些分析研究的基础上,我们就可以计算出各个组合方案的成本和收益,并选择最合理的种植方案,主动地在农作物种植过程中对各种影响因素加以准确控制,进而获得最理想的效果。52020/5/20二、相关概念1、影响因素的分类:在所有的影响因素中根据是否可以人为控制可以分为两类,一类是人为可以控制的因素,称为控制因素或控制变量,如种子品种的选定,施肥量的多少;另一类是认为很难控制的因素,称为随机因素或随机变量,如气候和地域等影响因素。在很多情况下随机因素指的是实验过程中的抽样误差。2、控制变量的不同水平:控制变量的不同取值或水平,称为控制变量的不同水平。如甲品种、乙品种;10公斤化肥、20公斤化肥、30公斤化肥等。3、观测变量:受控制变量和随机变量影响的变量称为观测变量,如农作物的产量等。方差分析就是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量,并分析对观测变量有显著影响的各个控制变量的不同水平以及各水平的交互搭配是如何影响观测变量的一种分析方法。62020/5/20三、方差分析的原理方差分析认为,如果控制变量的不同水平对观测变量产生了显著影响,那么它和随机变量共同作用必然使得观测变量值显著变动;反之,如果控制变量的不同水平没有对观测变量产生显著影响,那么观测变量值的变动就不明显,其变动可以归结为随机变量影响造成的。方差分析建立在观测变量各总体服从正态分布和同方差的假设之上,这样方差分析的问题就转化为在控制变量不同水平上的观测变量均值是否存在显著差异的推断问题了。综上所述,方差分析从对观测变量的方差分解入手,通过推断控制变量各水平下各观测变量的均值是否存在显著差异,分析控制变量是否给观测变量带来了显著影响,进而再对控制变量各个水平对观测变量影响的程度进行剖析。根据控制变量的个数可将方差分析分为单因素方差分析、多因素方差分析;根据观测变量的个数可将方差分析分为一元方差分析(单因变量方差分析)和多元方差分析(多因变量方差分析)。2020/5/207四、方差分析过程1、One-Way过程:单因素简单方差分析过程。在CompareMeans菜单项中,可以进行单因素方差分析、均值多重比较和相对比较。2、GeneralLinearModel(简称GLM)过程:GLM过程由Analyze菜单直接调用。这些过程可以完成简单的多因素方差分析和协方差分析,不但可以分析各因素的主效应,还可以分析各因素间的交互效应。2020/5/208在GeneralLinearModel菜单项下有四个选项:Univariate:提供一个因变量与一个或多个因素变量的方差分析;Multivariate:多因变量的方差分析;RepeatedMeasures:重复测量方差分析;VarianceComponents:方差成分分析,通过计算方差估计值,可以帮助我们分析如何减小方差。2020/5/209第二节单因素方差分析一、简介单因素方差分析是检验由单一因素影响的多组样本某因变量的均值是否有显著差异的问题。如果各组之间有显著差异,说明这个因素(分类变量)对因变量是有显著影响的,因素的不同水平会影响到因变量的取值。二、完全窗口分析按AnalyzeCompareMeansOne-WayANOVA顺序单击,打开One-WayANOVA主对话框,如图6-1。2020/5/2010选入因变量,可有多个变量选入分组变量,必须满足只取有限个水平的条件。图6-1One-WayAnova主对话框见图6--2见图6--3见图6--4112020/5/20(1)Contrasts选项Contrasts选项用来实现先验对比检验和趋势检验。如果进行趋势检验,则应选择Polynomial选项,然后在后面的下拉框中选择趋势检验的方法。其中Linear表示线性趋势检验;Quadratic表示进行二次多项式检验;Cubic表示进行三次多项式检验,4th和5th表示进行四次和五次多项式检验。如果进行先验对比检验,则应在Coefficients后依次输入系数ci,并确保∑ci=0。应注意系数输入的顺序,它将分别与控制变量的水平值相对应。2020/5/2012图6—2Contrasts对话框对组间平方和进行多项式分解,并在其后的参数框中选定阶数。如一阶:Linear,二阶:Quadratic,三阶:Cubic…….最高可达五阶输入多项式各组均值的系数,输入一个系数单击Add按钮,系数进入下面方框,依次输入各组均值的系数。如果多项式中只包括第一与第四组的均值的系数,必须把第二、第三个系数输入为0。如果只包括第一与第二组的均值,则第三、第四个可不输入。可同时建多个多项式,输入一组后按Next按钮;如果要修改则按Previous按钮,修改后按Change按钮,删除按Remove按钮。显示每组系数的总和。132020/5/20(2)PostHoc选项PostHoc选项用来实现多重比较检验。提供了18种多重比较检验的方法。其中EqualVariancesAssumed框中的方法适用于各水平方差齐性的情况。在方差分析中,由于其前提所限,应用中多采用EqualVariancesAssumed框中的方法。多重比较检验中,SPSS默认的显著性水平为0.05,可以根据实际情况修改Significancelevel后面的数值以进行调整。2020/5/2014图6—3PostHoc对话框在此对话框中选择进行多重比较的方法1.用t检验完成组间成对均值的比较,对多重比较错误率不进行调整2.同上,但通过设置每个检验的误差率来控制整个误差率3.用t检验完成多重配对比较,为多重比较调整显著值,但比2的界限要小4.对所有可能的组合进行同步进入的均值配对比较5.用F检验进行多重比较6.在StudentizedRange分布下进行多重比较7.用StudentizedRange分布进行所有各组均值间的配对比较8.用StudentizedRange统计量进行所有组间均值的配对比较,用所有配对比较集合的误差率作为试验误差率9.同8,但其临界值是TUKEY和S-N-K的相应值的平均值10.进行配对比较时,使用的逐步顺序与Student-Newman-Keuls检验的顺序一样,但并不是给每个检验设定一个误差率,而是给所有检验的误差率设定一个临界值11.用Studentized最大系数进行比较检验和范围检验12.用Studentized最大系数进行配对比较检验13.用Studentized最大系数进行比较检验,使用贝叶斯逼近14.用t检验进行配对比较1.用t检验进行配对比较2.用Studentized最大系数进行配对比较检验3.同上,这种方法有时比较自由4.用StudentizedRange统计量进行配对比较检验规定显著性水平,默认为0.05152020/5/20(3)Option选项Option选项用来对方差分析的前提条件进行检验,并可输出其他相关统计量和对缺失数据进行处理。Homogeneityofvariancetest选项实现方差齐性检验;Descriptive选项输出观测变量的基本描述统计量;Brown-Forsythe、Welch选项可计算其统计量以检验各组均值的相等性,当方差齐性不成立时应选择使用这两个统计量而不是F统计量。MeansPlot选项输出各水平下观测变量均值的折线图;MissingValues框中提供了两种缺失数据的处理方式。2020/5/2016图6—4Options对话框选择缺失值的处置方式:在检验变量中含有缺失值的观测将不被计算在任何一个变量中含有缺失值的观测都将不被计算规定输出的统计量:输出描述统计量,包括观测量数目,均值,最小值,最大值,标准差,标准误差,各组中每个因变量均值的95%的置信区间用Levene检验对方差齐性进行检验输出均数分布图三、例题分析例1[06-1]某灯泡厂用四种不同配料方案制成的灯丝,生产了四批灯泡。每批灯泡中随机抽取若干个灯泡测其使用寿命(单位:小时),数据如表6-1,求四种灯丝的灯泡的使用寿命有无显著差异。2020/5/2017表6-1灯泡使用寿命在该例中,设灯泡的使用寿命为因变量,灯丝的配料为因素,四种配料方案为四水平,为单因素四水平的实验。(数据文件:06-1灯泡寿命.sav)灯泡灯丝12345678甲1600161016501680170017001780乙15001640140017001750丙16401550160016201640160017401800丁1510152015301570164016802020/5/20181、不使用选择项的操作步骤1)定义两个变量:Filament变量,取值1、2、3、4分别代表甲、乙、丙、丁,标签为“灯丝”Hours变量其值为灯泡的使用寿命,标签为“灯泡使用寿命”2)按AnalyzeCompareMeansOne-WayANOVA顺序打开“单因素分析”主对话框3)从源变量框中选取hours进入DependentList框中;选取filament变量进入Factor框中,单击“OK”运行4)输出结果及分析2020/5/2019ANOVAHOURS39776.456313258.8191.638.209178088.93228094.951217865.3825BetweenGroupsWithinGroupsTotalSumofSquaresdfMeanSquareFSig.表6-2灯泡使用寿命的单因素方差分析结果表6-2说明:第一列:方差来源;第二列:离差平方和;第三列:自由度;第四列:均方;第五列:F值;第六列:F统计量的P值。2、使用选择项的操作步骤1)定义变量和选取变量同1(第1-3步)的操作步骤2020/5/20202)在主对话框中单击“Contrast”,在Contrast对话框中选择多项式比较,选择一次多项式比较各组均值,共指定两组多项式系数:系数依次为1、-1、-1、1,这是检验灯丝对灯泡使用寿命的影响及甲、丁效应和与乙、丙效应和是否有显著差异系数依次为1、-1、1、-1,这是检验灯丝对灯泡使用寿命的影响及甲、丙效应和与乙、丁效应和是否有显著差异3)打开PostHocMultipleComparisons对话框,选择多重比较:在EqualVarianceAssumed栏中选择LSD和Duncan在EqualVarianceNotAssumed栏中选择Tamhane’sT22020/5/20214)打开Options
本文标题:第六章-方差分析
链接地址:https://www.777doc.com/doc-5482687 .html