您好,欢迎访问三七文档
Nov,10,2009先来看一个具体的例题例8-1某大学营养与食品卫生研究所将800只条件一致的雌性果蝇随机分配到4种不同浓度的某受试物培养基组,各组200只。经2至3月的培养试验,得各组寿命最高的10只果蝇的生存天数如下:浓度0%组:616364646565666668680.022%组:626364646566676970700.067%组:636464656768686970700.600%组:65666667686870727476试比较各最高寿命组的平均生存天数。Nov,10,2009从本例引伸的问题属于什么样的研究?设计类型是什么?该试验的三要素具体是什么?处理因素有几个水平?所获得的是什么类型的资料?研究目的是什么?应该用什么统计方法证实假设?Nov,10,2009第一节完全随机设计多组均数比较的方差分析方差分析的基本思想和应用条件方差分析(analysisofvariance,ANOVA)是由英国统计学家R.A.Fisher在20世纪初提出是用于多个样本均数检验的一种假设检验方法Nov,10,2009表8-1某受试物不同浓度组高寿命果蝇生存天数ijXij0.000%0.022%0.067%0.600%合计61626365636364666464646664646567656567686566686866676870666969726870707468707076xi656666.869.266.75(x)ni1010101040(N)nijijx16506606686922670(gijijnix11)nijijx1242292436364468448010178622(gijijnix112)Nov,10,2009H0:多个样本总体均数相等H1:多个样本总体均数不相等或不全等α=0.05如何计算统计量F?Nov,10,2009表8-1某受试物不同浓度组高寿命果蝇生存天数ijXij0.000%0.022%0.067%0.600%合计61626365636364666464646664646567656567686566686866676870666969726870707468707076xi656666.869.266.75(x)ni1010101040(N)nijijx16506606686922670(gijijnix11)nijijx1242292436364468448010178622(gijijnix112)Nov,10,2009=N-1=g-1=N-g三种变异来源:1、总变异:全部测量值大小不同。原因是:随机测量误差、个体差异;可能的话处理水平的不同所导致的差异。2、组间变异:各处理组由于接受处理水平不同,各组样本均数也大小不等。原因是随机测量误差、个体差异;可能的话处理水平的不同所导致的差异。3、组内变异:随机测量误差、个体差异Nov,10,2009三种变异的关系:SS总=SS组间+SS组内v总=v组间+v组内Nov,10,2009成组设计方差分析的计算公式变异来源SSυMSF组间g-1SS组间/υ组间MS组间/MS组组内SS总-SS组间N-gSS组内/υ组内总N-1211inijkjiixcncxkinjiji112ggNxC)(2Nov,10,2009(1)建立检验假设H0:多个样本总体均数相等。H1:多个样本总体均数不相等或不全等。检验水准为0.05。(2)计算检验统计量F值(3)确定P值并作出推断结果整个方差分析的基本步骤如下:Nov,10,2009表8-1某受试物不同浓度组高寿命果蝇生存天数ijXij0.000%0.022%0.067%0.600%合计61626365636364666464646664646567656567686566686866676870666969726870707468707076xi656666.869.266.75(x)ni1010101040(N)nijijx16506606686922670(gijijnix11)nijijx1242292436364468448010178622(gijijnix112)Nov,10,2009//(1)96.30/33.81//()303.20/36gMSFNgMS组间组间组间组间组内组内组内组内SSSSSSSS查附表(方差分析用)F界值表,F3.81,P0.05,可认为4个处理组总体平均生存天数不全等或全不等50.399402670178662总ss30.9640267010692106681066010650102.69105.678.66105.6766105.676510222222222)()()()(组间ss20.30330.9650.3990组内ss178622Nov,10,2009表8-2例8-1的方差分析表总体来源自由度离均差平方和均方F值P值总变异39399.50组间396.3032.103.810.05组内36303.208.42Nov,10,2009成组设计方差分析数据满足的条件独立性正态性方差齐性one-wayanovaNov,10,2009基本原理1组内组间MSMSF如果H0成立,组间变异来自随机测量误差、个体差异;无处理水平的不同所导致的差异;本身组内变异来自随机测量误差、个体差异;f0.00.10.20.30.40.50.60.7F012345F分布图形v1=3,v2=36Nov,10,20094.多个均数间的两两比较当检验结果P≤0.05后,可进一步对多个均数作两两比较。当进行多个均数间的两两全面比较时,采用SNK(Student-Newman-Keuls)检验;当g-1个处理组分别与一个共同的对照组比较,而各处理组间不作两两比较时,采用dunnett-t检验。Nov,10,2009如采用t检验进行两两比较,将增加I类错误2649.011)05.01()1(242CCkNov,10,2009SAS程序Li8_1Nov,10,2009SAS分析结果的标准表达方式表1某受试物不同浓度组高寿命果蝇生存天数比较*浓度)(nsx0.000%65.0±2.2(10)a0.022%66.0±2.9(10)a0.067%66.8±2.6(10)a,b0.600%69.2±3.7(10)b*单因素方差分析F=3.81,P=0.0180;SNK两两比较,字母不同(a,b)差别有统计学意义(P0.05),字母相同(a,b)差别无统计学意义(P0.05)Nov,10,2009某一组或多组不服从正态分布或分布类型未知,或各组总体方差不齐,可采用完全随机设计多组分布比较的秩和检验(Kruskal-WallisH)检验。此种非参数检验方法适用面广,但增加了第Ⅱ类错误的概率β,降低了统计检验的功效1-β。第二节完全随机设计多个分布比较的秩和检验Nov,10,2009一、多组连续变量资料的秩和检验1.实例及计算分析步骤例8-2在例8-1的研究中,如果增加了0.200%浓度组,该组寿命最高的10只果蝇的生存天数为:62、63、66、66、68、69、69、70、76、76,其余4组数据不变,试比较5组的平均生存天数。Nov,10,20095组资料经方差齐性Levene检验,F=2.3505,P=0.06840.10,可认为方差不齐。宜采用秩和检验,计算分析步骤如下:Nov,10,2009⑴建立检验假设H0:5总体分布位置相同H1:5总体分布位置全不相同或不全相同α=0.05⑵编秩求秩和将全部数据由小到大按自然数1,2,3,…的顺序及大小统一编秩。当某若干个数相同且位于同一组时按顺序编秩;当某若干个数相同但位于2个及以上组时,将该若干个数按顺序编秩后对秩取均数,此均数即为该若干个数的共同秩次。计算得i(i=1,2,..,5)组的秩和Ri分别为:167.5,216.5,256.0,299.5,335.5,见表8-2。Nov,10,2009表8-2不同浓度(%)受试物组高寿命果蝇生存天数的比较对照浓度0.022浓度0.067浓度0.200浓度0.600天数秩次天数秩次天数秩次天数秩次天数秩次616364646565666668681.05.510.510.516.016.022.022.032.032.0626364646566676970702.55.510.510.516.022.027.037.542.542.5636464656768686970705.510.510.516.027.032.032.037.542.542.5626366666869697076762.55.522.022.032.037.537.542.549.049.06566666768687072747616.022.022.027.032.032.042.546.047.049.0Ri167.5216.5256.0299.5335.5Nov,10,2009⑶计算检验统计量2123(1)(1)iiHNNNRn22222167.5216.5256.0299.5335.512()3(501)8.2850(501)1010101010Nov,10,2009⑷确定P值下结论当组数等于3且每组例数≤5时,可查有关统计书籍附H界值表确定P值。当组数大于3或虽组数等于3但最小样本例数大于5时,H近似服从自由度为组数-1的卡方分布。本例H=8.289.49=,P0.05,可认为5总体分布位置相同,即5组的平均生存天数相同。Nov,10,2009⑸两两比较当结论为“各组总体分布位置全不相同或不全相同”时,需要进一步作两两比较。可采用完全随机设计多组数据秩转换后作方差分析并两两比较的方法,参见本段“2.SAS程序及结果”中的“⑶完全随机设计多组数据秩转换后作方差分析并两两比较的SAS程序”。Nov,10,2009也可采用两样本秩和检验的方法,借助SAS或SPSS软件得到相应的P值(参见第七章),按公式α’=α/k计算各次两两比较的检验水平α’,这里α为总检验水平,k为两两比较的次数。Nov,10,2009相关SAS程序Li8_22Nov,10,2009二、多组有序变量资料的秩和检验1.实例及计算分析步骤例8-3某大学社会医学与全科医学研究所采用匿名自填式问卷调查了2908名进城农民工对性自慰/手淫的认识,认识程度分为同意、无所谓、反对三个等级,资料如表8-3Nov,10,2009表8-3不同文化程度组民工对性自慰/手淫的认识程度等级比较认识等级例数小学初中高中或中专大专及以上秩次范围平均秩次同意114327268691-778389.5无所谓13352225844779-17351257.0反对185587340611736-29082322.0合计4321436866174试比较小学、初中、高中或中专、大专及以上不同文化程度组的平均等级Nov,10,2009⑴建立检验假设H0:4总体分布位置相同H1:4总体分布位置全不相同或不全相同α=0.05⑵编秩求秩和先计算各等级的合计,再确定各等级的秩次范围及平均秩次,如等级“同意”的合计为778,则其秩次范围为1-778,其平均秩次为(1+778)/2=389.5;计算分析步骤如下:Nov,10,2009又如等级“无所谓”的合计为957,则其秩次范围为779-(778+957),即779-1735,其平均秩次为1257。以各等级的平均秩次近似代替该等级各调查对象的秩次,计算各组的秩和,如小学组秩和=389.5×114+1257×133+2322×185=641154。Nov,10,2009⑶计算检验统计量按公式(8-6)计算检验统计量H值,当各样本相同秩较多时,用H除以C的商对H作校正。这里,其中为第j个相同秩次的个数,N为各组例数之
本文标题:卫生统计学方差分析
链接地址:https://www.777doc.com/doc-3168752 .html