您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 咨询培训 > i第八章 单因素方差分析
幻灯片1【例】调查了5个不同小麦品系的株高,结果如下。试判断这5个品系的株高是否存在显著性差异。5个小麦品系株高(cm)调查结果株号品系ⅠⅡⅢⅣⅤ12345和平均数64.665.364.866.065.8326.565.364.565.364.663.763.9322.064.467.866.367.166.868.5336.567.371.872.170.069.171.0354.070.869.268.269.868.367.5343.068.6幻灯片2第八章单因素方差分析One-factoranalysisofvariance幻灯片3本章内容第一节方差分析简述第二节固定效应模型第三节随机效应模型第四节多重比较第五节方差分析应具备的条件幻灯片4第一节方差分析简述一、方差分析的一般概念1、概念方差分析(analysisofvariance,ANOVA):是同时判断多组数据平均数之间差异显著性的统计假设检验,是两组数据平均数差异显著性t检验的延伸。幻灯片5单因素方差分析(一种方式分组的方差分析):研究对象只包含一个因素(factor)的方差分析。单因素实验:实验只涉及一个因素,该因素有a个水平(处理),每个水平有n次实验重复,这样的实验称为单因素实验。水平(level):每个因素不同的处理(treatment)。幻灯片6方差分析AnalysisofVariance(ANOVA)ANOVA由英国统计学家R.A.Fisher首创,用于推断多个总体均数有无差异。幻灯片7【例】随机选取4窝动物,每窝中均有4只幼仔,称量每只幼仔的出生重,结果如下。判断不同窝的动物出生重是否存在显著性差异。4窝动物的出生重单位:g幻灯片82、单因素方差分析的数据格式:因素也称为处理因素(factor)(名义分类变量),每一处理因素至少有两个水平(level)(也称“处理组”)。一个因素(水平间独立)——单向方差分析(第八章)两个因素(水平间独立或相关)——双向方差分析(第九章)一个个体多个测量值——重复测量资料的方差分析ANOVA与回归分析相结合——协方差分析目的:用这类资料的样本信息来推断各处理组间多个总体均数的差别有无统计学意义。32.931.425.728.0118.029.50027.123.327.826.7104.926.22533.226.028.632.3120.130.02534.733.326.231.6125.831.4501234和平均数ⅣⅢⅡⅠ窝别动物号ainjijnjiiijiyanyyyaiynyyy1111,,,2,11,幻灯片9二、不同处理效应与不同模型1、方差分析中每一观测值的描述——线性统计模型njaiyijiij,,2,1,,2,1yij:在第i水平下的第j次观测值;μ:总平均数,是对所有观测值的一个参数;αi:处理效应,是仅限于对第i次处理的一个参数;εij:随机误差成分。幻灯片102、①固定效应:由固定因素所引起的效应。②固定因素:所研究因素各个水平是经过特意选择的,这样的因素称为固定因素。固定因素的水平可以严格地人为控制,在水平固定之后,它的效应值也是固定的。③固定模型:处理固定因素所用的模型。…yi1yi2yi3…yij…yinYi…ya1ya2ya3…yaj…yany31y32y33…y3j…y3ny21y22y23…y2j…y2ny11y12y13…y1j…y1n123…j…n平均数YaY3Y2Y11y2y3yiyay幻灯片113、①随机效应:由随机因素所引起的效应。②随机因素:所研究因素各个水平是从该因素水平总体中随机抽出的,这样的因素称为随机因素。随机因素的水平是不能严格人为控制的,在水平确定之后,它的效应值并不固定。③随机模型:处理随机因素所用的模型。幻灯片12第二节固定效应模型一、线性统计模型ijiijy要检验a个处理效应的相等性,就要判断各αi是否为0。H0:α1=α2=……=αa=0HA:αi≠0(至少有1个i)若接受H0,则不存在处理效应,每个观测值是由总平均数加上随机误差构成;若拒绝H0,则存在处理效应,每个观测值是由总平均数、处理效应及误差三部分构成。幻灯片13在固定模型中,方差分析所得到的结论只适合于选定的那几个水平,不能将结论扩展到未加考虑的其它水平上。在随机模型中,方差分析所得到的结论,可以推广到这个因素的所有水平上,是对水平总体的推断。总变异是测量值yij与总的均数间的差异。处理间变异是由处理效应引起的变异。处理内变异是由随机误差引起的变异。用离均差平方和的平均(均方、方差)反映变异的大小幻灯片14二、平方和与自由度的分解1.总平方和(totalsumofsquares,SST):每个测量值与总平均数离差的平方和的总和,反应了一组数据总的变异程度。计算公式为:nayyyySSainjijainjijT2112112dfT=N-1=an-1nayC2校正项(校正系数,correction):幻灯片152.处理间平方和(sumofsquaresamongtreatments,SSA):各个处理组的平均数与总平均数离差的平方和,SSA反映了各处理组均数的变异程度。计算公式为:nayynyynSSaiiaiiA212211处理间(组间)变异总变异误差或处理内(组内)变异dfA=a-1(含有误差成分)处理均方(treatmentmeansquare,MSA):处理间平方和除以自由度。1aSSMSAA幻灯片163.在同一处理组内虽然每个受试对象接受的处理相同,但观测值仍各不相同,这是由随机因素(误差)引起的。误差平方和(errorsumofsquares,SSe)或称处理内平方和(sumofsquareswithintreatment):各处理内部观测值与相应处理平均数离差的平方和,SSe反映了各处理组内观测值的变异程度。计算公式为:dfe=dfT-dfA=an-aATeSSSSSS误差均方(errormeansquare,MSe):误差平方和除以误差自由度。MSe反映了随机因素所造成的方差的大小。aanSSMSee幻灯片17三种变异之间的关系SST=SSA+SSedfT=dfA+dfe处理内变异:随机误差处理间变异:处理因素+随机误差幻灯片18One-FactorANOVAPartitionsofTotalVariation=+Commonlyreferredtoas:SumofSquaresWithin,orSumofSquaresError,orWithinGroupsVariationCommonlyreferredtoas:SumofSquaresAmong,orSumofSquaresBetween,orSumofSquaresModel,orAmongGroupsVariation幻灯片19均方差,均方(meansquare,MS)TotalVariationSSTVariationDuetoTreatmentSSBVariationDuetoRandomSamplingSSW变异程度除与离均差平方和的大小有关外,还与其自由度有关,由于各部分自由度不相等,因此各部分离均差平方和不能直接比较,须将各部分离均差平方和除以相应自由度,其比值称为均方差,简称均方(meansquare,MS)。组间均方和组内均方的计算公式为:SSMS组间组间组间SSMS组内组内组内幻灯片20三、检验统计量F自由度具,eAeAdfdfMSMSF,,做F单侧上尾检验当FFα时,接受零假设H0:α1=α2=……=αa=0,各处理平均数之间差异不显著,认为MSA与MSe差异不大,产生的变异是由随机误差造成的;当FFα时,拒绝零假设,处理平均数间差异显著,MSA显著高于MSe,产生的变异是由处理因素造成的。幻灯片21F值与F分布如果各组样本的总体均数相等(H0:12…k),即各处理组的样本来自相同总体,无处理因素的作用,则组间变异同组内变异一样,只反映随机误差作用的大小。组间均方与组内均方的比值称为F统计量MSFMS组间组内1组间,2组内F值接近于l,就没有理由拒绝H0;反之,F值越大,拒绝H0的理由越充分。数理统计的理论证明,当H0成立时,F统计量服从F分布。,幻灯片22四、方差分析表单因素固定效应模型方差分析表F均方自由度平方和变差来源处理间MSA/MSeMSAa-1SSAa(n-1)MSe误差或处理内SSena-1SST总和幻灯片23五、方差分析的指导思想与基本原理方差分析的指导思想:是将所有测量值间的总变异按照其变异的来源分解为多个部分,然后进行比较,评价由某种因素所引起的变异是否具有统计学意义。幻灯片24方差分析的基本原理:将总平方和分解为处理平方和和误差平方和,根据相应的自由度,得到相应的均方;处理均方反映处理因素所造成的方差的大小,误差均方反映随机因素(误差)所造成的方差的大小;处理均方除以误差均方反映处理效应的显著性。幻灯片25六、单因素方差分析与成组数据t检验的异同单因素方差分析成组数据t检验相同平均数差异显著性检验平均数差异显著性检验两个平均数差异的检验多个平均数差异的分析不同利用平均数的差利用平均数的方差计算统计量t计算统计量F幻灯片26七、实例【例8.1】调查了5个不同小麦品系的株高,结果如下。试判断这5个品系的株高是否存在显著性差异。5个小麦品系株高(cm)调查结果株号品系ⅠⅡⅢⅣⅤ12364.665.364.864.565.364.667.866.367.171.872.170.069.268.269.845和平均数66.065.8326.565.363.763.9322.064.466.868.5336.567.369.171.0354.070.868.367.5343.068.6幻灯片27解:①列出方差分析计算表:(编码法-65)序号品系ⅠⅡⅢⅣⅤ12345-0.40.3-0.21.00.81.52.251.93-0.50.3-0.4-1.3-1.1-3.09.003.42.81.32.11.83.511.5132.2529.436.87.15.04.16.029.0841.00174.464.23.24.83.32.518.0324.0068.06总和57.01308.50277.28iy2iynjijy12②利用公式计算各项平方和:96.129550.5722nayC32.14796.12928.2772112nayySSainjijT74.13196.129550.13081212nayynSSaiiA58.1574.13132.147ATeSSSSSS幻灯片28③列出方差分析表:不同小麦品系株高方差分析表F均方自由度平方和变差来源42.2332.940.78420131.7415.58品系间误差﹡﹡24147.32总和﹡α=0.05﹡﹡α=0.01F4,20,0.05=2.866F4,20,0.01=4.431FF0.01④结论:选定的5个不同小麦品系的株高差异极显著。幻灯片29下结论查附表5F界值表,得F0.05(3,20)=3.10。由于F>F0.05(3,20),故有概率P<0.05,根据式(8.5)的推断规则拒绝无效假设,接受备择假设。处理因素的4个水平中至少有一个组的总体平均值不同于其他各组。从表8.1所示的各iY值可见,不同解毒药物的效果是不同的。解毒药物A和C与空白对照组D相近。B组血中胆硷脂酶含量较其他组为高。注意:当组数为2时,完全随机设计的方差分析结果与两样本均数比较的t检验结果等价,对同一资料,有:tF幻灯片30第三节随机效应模型一、随机效应模型的方差分析1、方差分析的程序与固定效应模型方差分析的程序一样。2、随机效应
本文标题:i第八章 单因素方差分析
链接地址:https://www.777doc.com/doc-4045287 .html