您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 综合/其它 > 卫生统计学_方差分析
AnalysisofVariance,ANOVAChapter9方差分析【例9-1】为研究煤矿粉尘作业环境对尘肺的影响,将24只Wistar大鼠随机分到甲、乙、丙三个组,每组8只,分别在地面办公楼、煤炭仓库和矿井下染尘,12周后测量大鼠全肺湿重(g)。案例分析甲组4.23.33.74.34.13.33.54.1乙组4.54.43.54.24.64.24.44.1丙组5.63.64.55.14.94.74.84.4表9-1三组大鼠的全肺湿重(g)请思考以下问题①该实验属何种设计方案?处理因素是什么?有几个水平?观察指标是什么?②能否采用t检验比较不同作业环境中的大鼠全肺湿重是否有差异?对于小样本多组均数的比较不能采用t检验进行两两比较原因:•割裂整体设计,只见树木,不见森林•增大一型错误的概率可以采用方差分析的方法进行分析第一节ANOVA基本思想和应用条件基本概念的复习方差:离均差平方和(sumofsquare,SS):自由度:均方(meansquare,MS):即方差1-2222nXXSNX,2XXSS1nANOVA的概念ANOVA,变异数分析,最早由英国著名统计学家R.A.Fisher提出,又称F检验,是推断两个或多个总体均数是否相同的统计分析方法。ijxinixx2iS2S表9-2三组大鼠的全肺湿重(g)甲组乙组丙组合计观察值4.24.55.63.34.43.63.73.54.54.34.25.14.14.64.93.34.24.73.54.14.84.14.44.388824(N)3.81254.23754.68754.24580.16980.11700.34690.326024个观测值彼此不同总变异同一组内的观测值不同组内变异不同组间的各个观测值不同组间变异各组样本均数差异可能原因:随机误差:包括抽样误差、测量误差等即各样本来自同一总体,但由于随机误差使得样本均数各不相等。处理因素即不同的处理(本例为不同的作业环境)引起不同的作用或效果,导致各处理组均数不同。1.根据实验设计类型将总变异分解;如完全随机设计:2.计算各部分的和;3.计算F值;4.作出统计推断。SSνeTRMSMSF/间变异总变异=组内变异+组方差分析的基本思路变异分解构造检验统计量eBATνννν+++=eBATSSSSSSSS+++=误差因素MSMSF=ANOVA变异的分解总变异(totalvariation)1-N总以完全随机设计为例]/)([-/)(-)-(2211222∑∑∑∑∑∑NxCCxNxxxxSSijij总组间变异(variationbetweengroups)引起原因:1.处理因素2.随机误差(个体差异和测量误差)2()1(9-2)iiiSSnxxk组间组间组内变异(variationbetweengroups))-(∑∑112ijiijxxSS组内引起原因:随机误差(个体差异和测量误差)k-N组内三种变异及相应自由度的关系为(9-4)SSSSSS总总组间组内组间组内(9-4)SSSSSS总总组间组内组间组内构造检验统计量F随机误差随机误差处理组间差异组内组间组内组内组间组间//MSMSSSSSF1.组间无差异,理论上F=12.若处理组间有差异,则F>1。是否统计学意义查方差分析界值表050PFF050PFFeTReTRνναννα.,.≤,≥),),则若则若((统计量F服从F分布aF分布Fa(k-1,n-k)0拒绝H0不能拒绝H0F如果H0成立,F=MSTR/MSe1各观察值相互独立(独立性)各样本来自正态分布总体(正态性)各个样本的总体方差齐(方差齐性)ANOVA应用条件第二节完全随机设计的ANOVA完全随机设计(completelyrandomdesign)又称成组设计,按随机化原则将受试对象随机分配到某一研究因素的多个水平中去,然后观察实验效应。其目的都是推断不同水平下各组均数之间的差别是否有统计学意义。2()iiinxx1kSS组间组内组间MSMS2)1(iiiSnSSSS或组间总kNSS组内Nxx22)(表9-3完全随机设计方差分析计算公式变异来源SSνMSF组间(处理)k-1组内(误差)N-k总变异N-1【检验步骤】1.建立检验假设,确定检验水准05.0,,::32113210=aHH不等或不全相等2.计算检验统计量F值23124498.71)-(2400.3261)-(2总总NSSS2222()8(3.8125-4.2458)8(4.23754.2458)8(4.68754.2458)3.063312iiiSSnxx组间组间7.4983.0634.435SSSSSS总组内组间24321组内表9-4方差分析结果变异来源SSMSFP组间3.06321.5327.2500.01组内4.435210.211总7.498233.确定P值,做出统计推断查附表7(F界值表),P0.01。按水准,拒绝H0,接受H1,差异有统计学意义,可认为不同粉尘环境影响大鼠的全肺湿重。05.0a第三节随机区组设计的ANOVAjxinixx2iS2S表9-63种营养素喂养小白鼠所增体重(g)方差分析计算表区组A营养素B营养素C营养素nj162.163.573.2366.267253.254.158.1355.133371.267.878.7372.567441.346.638.9342.267550.456.964.5357.267642.543.146.6344.067752.658.775.1362.133849.856.165.3357.067962.651.054.6356.0671048.354.847.2350.10010101030N53.40055.26060.22056.29387.89353.660180.131108.406变异分解SS总=SS处理+SS区组+SSe检验统计量F值e区组处理总eeMSMSFMSMSF/=/=区组区组处理处理表9-7随机区组设计方差分析的计算公式变异来源SSMSF处理组2()iiinxxk-11kSS处理误差处理MSMS区组2()jjjnxxb-11bSS区组误差区组MSMS误差区组处理总SSSSSSN-k-b+1或(k-1)(b-1)1误差N-k-bSS总变异Nxx22)(N-11NSS总【检验步骤】1.建立检验假设,确定检验水准05.0,,::32113210=aHH3种营养素对小白鼠体重增加作用相同不等或不全相等对于处理组:【检验步骤】1.建立检验假设,确定检验水准05.0::10=aHH十个区组的总体均数相等十个区组的总体均数不等或不全相等对于区组:【检验步骤】2.计算检验统计量F值(1)计算各项离均差平方和与自由度29130774.31431)-(30406.1081)-(2总总NSSS2222()10(53.400-56.293)10(55.26056.293)10(60.22056.293)248.579312iiiSSnxx处理处理2jj222()3(66.2767-56.293)3(55.13356.293),,3(50.10056.293)2357.7991019jSSnxx区组区组186.537799.2357759.248744.3143区组处理总误差SSSSSSSS299218误差【检验步骤】2.计算检验统计量F值(2)计算均方与F值248.579/2124.290MS处理2357.799/9261.978MS区组537.186/1829.844MS误差124.2904.165MS29.844MSF处理误差261.9788.778MS29.844MSF区组误差【检验步骤】2.计算检验统计量F值(3)列方差分析表表9-8例9-2的方差分析表变异来源SSMSFP处理组248.5792124.2904.1650.05区组2357.7999261.9788.7780.01误差537.18618总变异3143.77429【检验步骤】3.确定P值,做出统计推断查附表7(F界值表),P0.05。按水准,拒绝H0,接受H1,差异有统计学意义,可认为3种营养素对小白鼠体重增加作用不同或不全相同。05.0a(1)对处理组:【检验步骤】3.确定P值,做出统计推断查附表7(F界值表),P0.01。按水准,拒绝H0,接受H1,差异有统计学意义,可认为不同窝别对小白鼠体重增加有影响。05.0a(2)对区组:第四节多个样本均数的两两比较【例9-3】例9-1中,研究者对甲、乙、丙三组均数采用了两样本均数t检验进行两两比较,得出结论:除乙组和丙组差异无统计学意义以外(P0.05),其余各两组间差异均有统计学意义(P0.05)。当方差分析的结果为拒绝H0,接受H1,差异有统计学意义时,可以认为三组总体均数不等或不全相等,即至少有两组总体均数不同。如果要进一步判断三组中究竟哪两组总体均数有差别,不能直接用t检验进行比较,需进行多个样本均数的两两比较。本节介绍常用的两种:SNK-q检验和LSD-t检验SNK(Student-Newman-Keuls)检验,也称q检验,适用于探索性研究,对任意两个样本均数都进行检验。检验统计量qSNK-q检验(9-10)11()2ABABABxxABxxxxqSMSnn误差误差【检验步骤】1.建立检验假设,确定检验水准H0:AB,即任两对比组的总体均数相等H1:AB,即任两对比组的总体均数不等0.05a【检验步骤】2.计算检验统计量(1)将三个样本均数按由小到大的顺序依次排列,并编上组次。组别甲组乙组丙组均数3.81254.23754.6875组次123(2)计算差值的标准误:本例各组例数相等,故任意两组均数差值的标准误相等。0.211MS误差0.21111()0.1624288ABxxS(3)列表计算q统计量表9-9例9-1的SNK检验计算表对比组组数q界值A与BABxxq值(2)(3)0.1624a0.050.01P(1)(2)(3)(4)(5)(6)(7)1与20.4252.61722.954.020.051与30.8755.38833.384.640.012与30.4502.77122.954.020.05【检验步骤】3.确定P值,做出统计推断q界值不但考虑自由度,而且考虑组数a,即任意两对比组包含的组数。05.0a按水准,甲组和丙组的总体均数差异有统计学意义,而甲组和乙组、乙组和丙组的总体均数之间差异均无统计学意义。最小显著性差异(leastsignificantdifference)t检验,用于某一对或某几对在专业上有特殊意义的均数间的比较,如多个处理组与对照组的比较,一般在设计阶段确定哪些均数需进行多重比较。统计量t值。LSD-t检验(9-11)11()ABABABxxABxxxxtSMSnn误差误差【检验步骤】1.建立检验假设,确定检验水准H0:AB,即任两对比组的总体均数相等H1:AB,即任两对比组的总体均数不等0.05a【检验步骤】2.计算检验统计量F值8BAnn0.211MS误差(1)计算差值的标准误:本例各组例数相等,故任意两组均数差值的标准误相等。(2)计算统计量LSD-t值表9-10例9-1的LSD-t检验计算表对比组t界值A与BABxxt值(2)(3)0.22970.050.01P(1)(2)(3)(4)(5)(6)甲组与乙组0.4251.85022.0802.8310.05甲组与
本文标题:卫生统计学_方差分析
链接地址:https://www.777doc.com/doc-5954610 .html