您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 8完全随机设计方差分析
1完全随机设计资料的方差分析邓伟2008.102引言•例8.1为研究茶多酚保健饮料对急性缺氧的影响,某研究者将60只小白鼠随机分为低、中、高三个剂量组和一个对照组,每组15只小白鼠。对照组给予蒸馏水0.25ml灌胃,低、中、高剂量组分别给予2.0g∕kg、4.0g∕kg、8.0g∕kg的饮料溶于0.2~0.3ml蒸馏水后灌胃。每天一次,40天后,对小白鼠进行耐缺氧存活时间试验,结果如表8-1。试比较不同剂量的茶多酚保健饮料对延长小白鼠的平均耐缺氧存活时间有无差别。3组别耐缺氧时间niiYSi20.7922.9127.2119.3417.8523.7922.6018.531521.323.40对照组23.2320.1426.7119.3617.2224.1315.8522.2224.7421.5319.6625.8929.1018.9318.641523.233.52低剂量组26.3925.4920.4322.6929.6720.3622.7428.5628.6725.2830.3823.1323.4728.8829.621528.144.00中剂量组24.8234.6422.2929.2225.6335.1232.3231.9337.9439.7627.9429.6534.2332.6329.131532.844.66高剂量组39.6236.1528.8524.0729.2935.2436.13合计6026.385.92•一个变量(因素、处理),四个水平4•例8.2某研究者为了了解男性高校教师的血脂水平,随机抽取了不同年龄组男性各10名,检测他们的总胆固醇(TC)含量(mmol/L)。问:各年龄组的人群总胆固醇平均含量是否不同?•---观察性研究,按照暴露因素(年龄)的不同水平分别进行随机抽样得到5•设计类型:完全随机设计•处理因素(变量):单变量•处理水平–两水平---两样本/组–多水平---多样本/组引言6能否使用两两t检验?•统计学的结论都是概率性的,存在犯错误的可能–假设实际情况是H0成立,根据a=0.05水准,平均每100次检验中有5次会得出拒绝H0的错误结论,即一类错误。–4组均数比较,如果采用两两t检验,则共需作次比较,每次比较不犯第一类错误的概率均为(1-0.05)=0.95,当这些检验独立进行时,则每次比较均不犯第一类错误的概率为0.956=0.7351,总的犯第一类错误的概率为1-0.7351=0.2649,远远大于设定的0.0524C67完全随机设计资料的方差分析•方差分析AnalysisofVariance,缩写简称为ANOVA,又称F检验•方差分析可以是单因素方差分析(One-wayANOVA),也可以两因素方差分析(Two-wayANOVA)或多因素方差分析8完全随机设计的实验结果处理因素i水平1水平2…水平k观察值jX11x21…xk1x12x22…xk2....nx11nx22…kknx例数n1n2nk均数x1x2kx表中任意一个观察值可以用xij表示,i表示第i个水平/组,其取值范围为i=1,2,…,k,j表示第i个水平组中的第j个观察对象,其取值范围为j=1,2,…,ni,ni为第i个水平组中观察对象的例数,该水平组观察值的样本均数ix9基本思想•H0:各组资料对应的总体均数相同•H1:各组资料对应的总体均数不全相同•方差分析是基于变异分解的原理进行的,将资料中的变异分解为组间变异和组内变异10•变异:离均差平方和(sumofsquaresofdeviationsfrommean,记称SS)•其中表示第i组第j个对象的效应指标观察值,表示所有资料的平均数•SS的大小与资料的离散程度有关,另外还与样本的自由度(degreeoffreedom)有关,自由度增大,SS增大基本思想()ijSSxx2ijxx11•总的SS:ν总=N-1基本思想222/ijijijijijijSSxxxxN总12总变异的分解22222ijijiiijijijiiijiiijijijSSxxxxxxxxxxxxxx总0ijiiijxxxx22ijiiijijSSxxxx总组内变异组间变异1314•完全随机设计资料(单因素)的方差分析中,变异分解为总变异=随机变异+处理因素导致的变异–其中随机变异是客观存在的–处理因素导致的变异是否存在就是研究的目标。即只要能证明它不等于0,就等同于证明了处理因素的确存在影响基本思想15•组内变异–即使在同一组内,各观察对象的测量值也不尽相同,这种同组内的变异称为组内变异。属于随机变异–可用各组的离均差平方和的表示–组内变异=–组内变异=,是第i组的样本方差基本思想2(1)iiins2ijiijxx2is16•组内变异–组内变异与无效假设H0是否成立无关,仅与资料的随机误差和样本量大小有关–ν组内=N-k222(1)ijiiijijixnsxn基本思想17•组间变异–各组的样本均数间彼此也不相同,这种变异称为组间变异–组间变异=22iiiijixxnxx基本思想18•组间变异–当H0成立时,各组对应的总体均数相同,各组样本均数和所有资料的平均数都是同一总体均数的估计值–与之间的差异仅为样本均数的抽样误差,故组间变异比较小ixxxix基本思想19•组间变异–若H0不成立,各组的总体均数不全相同–与之间的差异不仅反映了样本均数的抽样误差,而且反映不同处理可能造成总体均数之间差别所引起的变异–组间变异增大,是两种变异的总和–组间=k-1ixx22iiiijiSSxxnxx组间基本思想20•方差分析的可加性:SS总=SS组间+SS组内,总=组间+组总变异=随机变异+处理因素导致的变异总变异=组内变异+组间变异基本思想21•方差分析:比较组内变异和组间变异的大小,如果后者远远大于前者,则说明处理因素的影响的确存在,如果两者相差无几,则说明该影响不存在基本思想22•由于组间变异和组内变异与自由度有关,所以不能直接比较;将各部分的离均差平方和除以各自的自由度,得到相应的平均变异指标:均方(meansquare,记为MS)SSMS组间组间组间SSMS组内组内组内基本思想23•当组数k=2时,为成组t检验中的合并方差,故可以视为多组的合并方差,为共同方差的估计MS组内2cS222222112233441234(1)(1)(1)(1)(1)(1)(1)(1)(1)(1)(1)iiiiiiinsnsMSNkknnsnsnsnsnnnn组内基本思想224•MS组间反映了不同水平下,样本均数与总均数的差异(标准误)•当H0成立时,MS组间反映的仅为抽样的随机误差,理论上等于MS组内221iiiijixxnxxMSk组间=k-1基本思想25•理论上可证明:–MS组内是的无偏估计–当H0为真时,MS组间是的无偏估计–当H1为真时,基本思想222211iMSnAk组间226•方差分析的检验统计量•当H0成立时,则统计量F值一般不太大,可以证明,F服从自由度为k-1和N-k的F分布;若H0不成立,则F不服从F分布,且大多数情况下,因MS组间较大,以致F也远大于1MSFMS组间组内基本思想27•推断:H0成立时,统计量F界值是一个小概率事件(概率为0.05),可以认为一次抽样是不会发生的,因此,可通过F是否大于界值推断H0的成立与否0.05,1,kNkF基本思想28•例8.1•H0:四个总体均数相等•H1:四个总体均数相等不全相同0.05a123429完全随机设计资料方差分析的计算公式变异来源离均差平方和(SS)自由度(υ)均方(MS)F值组间变异.()jjjnxx21k/SS组间组间/MSMS组间组内组内变异.()ijjjixx2Nk/SS组内组内总变异()ijijxx21NSTATA命令:onewayxgroupF=26.087,p=0.0000,FF0.05,3,5630方差分析的基本假设•各处理样本是相互独立的随机样本;•各处理样本的观察值xij分别服从总体均数为μi的正态分布;•各处理样本的总体方差相等,即具有方差齐性(homogeneityofvariance)•如这些条件不满足,则应进行变量变换,或多组比较的秩和检验31方差齐性检验•H0:各总体方差相等•H1:各总体方差不全相等•Bartlett检验•Levene检验ijijiZXXijijiZXX3233正态性检验•图示法•正态性检验:W法–每组样本量太小无法进行正态性检验–可以证明方差分析仅要求所有残差服从总体均数为0的正态分布并且方差齐性–对全体的残差数据进行正态性检验即可ijixx34方差分析的多重比较35•探索性研究:涉及任意两个均数的比较,如SNK,Bonfferoni,LSD;完全无效假设•证实性研究:在研究开始前计划好的特定的均数间的比较Dunnett-t(q’检验);部分无效假设,如几个实验组和一个标准对照组比较两两比较方法36LSD-t检验•LSD是leastsignificantdifference的缩写,即最小显著差异•适用于探索性研究中两两均数的比较•H0:,即:第i组与第j组的(存活肿瘤细胞数)总体均数相同(ij);•H1:,即:第i组与第j组的(存活肿瘤细胞数)总体均数不同。ijij37•LSD•自由度vLSD与方差分析中的MS误差自由度相同。当H0成立时,LSD-t服从自由度为vLSD的t分布---查t界值表....ijijxxxxtS..11ijxxijSMSnn误差(+)LSD-t检验3839SNK法•又称Q检验,属于多重极差检验,比较保守•例:对治疗四周餐后2小时血糖下降值的三组总体均数进行两两比较•H0:任两对比组的总体均数相等•H1:任两对比组的总体均数不相等•先按均数由大到小排列高剂量低剂量对照组别9.19525.80005.43000组次12340•对比组内包含组数a:组间跨度,为之间涵盖的均数个数(包括他们自身)•q的临界值:两组均数的差别有统计意义时,其差数需为标准误的倍数.与a和误差自由度有关ABxx和对比各组A与B两组均数差差的标准误q=对比组内包含组数aq的临界值(自由度,组间跨度)P1与33.76520.88274.26633.404.280.01-0.051与23.39520.89453.79622.833.760.012与30.37000.90510.40922.833.760.05ABxxABxxS/ABABxxxxSSNK法..112ABxxABMSSnn误差(+)41Dunnett法•适用于k-1个实验组和对照组均数的比较•H0:,即实验组与对照组的总体均数相同;•H1:,即实验组与对照组的总体均数不相同。TCTCTCxxxxxxqSMS误差TC11(+)nnTCTC42对比组T与C两均数之差=均数差/0.2049PA与C-1.5900-7.7600.01B与C-1.1940-5.8270.01TCxxDunnett法q0.05(q误差自由度,处理组数)界值43•Bonferroni校正–可以解决两两比较的问题–它需将各次比较分别进行,使用上比较麻烦–其次,它保证的是总的一类错误不会大于a,这显然意味着多数比较的检验水准实际上是小于a的,从而结论相对保守Bonfferoni法44Bonfferoni法•调整检验水准大小aij=a/k,k为需要进行的比较次数45•LSD:leastsignificantdifference的缩写,即最小显著差异,实际上就是t检验的变形,敏感度最高,在比较时
本文标题:8完全随机设计方差分析
链接地址:https://www.777doc.com/doc-1959477 .html