您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 医学统计学ch04-王一任
第四章多个样本均数比较的方差分析analysisofvariance,ANOVA讲述内容第一节方差分析的基本思想及其应用条件第二节完全随机设计资料的方差分析第三节随机区组设计资料的方差分析第四节拉丁方设计资料的方差分析第五节两阶段交叉设计资料的方差分析第六节多个样本均数间的多重比较第七节多样本方差比较的Bartlett检验和Levene检验第一节方差分析的基本思想及其应用条件目的:推断多个总体均数是否有差别。也可用于两个方法:方差分析,即多个样本均数比较的F检验。基本思想:根据试验设计的类型,将全部测量值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。应用条件:总体——正态且方差相等样本——独立、随机设计类型:完全随机设计资料的方差分析随机区组设计资料的方差分析拉丁方设计资料的方差分析两阶段交叉设计资料的方差分析2221122(,),(,),,(,)ggNNN表4-1g个处理组的试验结果处理分组测量值统计量1水平X11X12…X1j…1nX1n11XS12水平X21X22…X2j…2nX2n22XS2…………………………g水平Xg1Xg2…Xgj…ggnXnggXSg完全随机设计资料的方差分析的基本思想合计NS第i个处理组第j个观察结果XijX变异(离均差平方和)分解:离均差平方和(sumofsquaresofdeviationsfrommean,SS):2211,2(1)ingNijijijSSXXXXNS1.总变异:所有测量值之间总的变异程度,计算公式为2212111,,iinnggijijijNijijijXCSSXXXC总2211,()()ingNijijijijXXCNN校正系数:1N总2.组间变异:各组均数与总均数的离均差平方和,表示处理因素的作用和随机误差的影响,计算公式为:如果有——g个总体均数有差别如果无——g个总体均数无差别21211()()inijjggiiiiiXSSnXXCn组间1g组间211()ingijiijSSXX组内Ng组内3.组内变异:各组内各测量值Xij与其所在组的均数的差值的平方和,表示随机误差的影响。计算公式为:SSSSSS总组间组内总组间组内三种变异的关系:SSMSSSMS组间组间组间组内组内组内均方差,均方(meansquare,MS)。检验统计量:如果,则都为随机误差的估计,F值应接近于1。如果不全相等,F值将明显大于1。用F界值(单侧界值)确定P值。12,,MSFMS组间组间组内组内12g,MSMS组间组内212,,,g第二节完全随机设计资料的方差分析将全部试验对象分配到g个处理组(水平组),各组分别接受不同的处理,试验结束后比较各组均数之间的差别有无统计学意义,推论处理因素的效应。一、完全随机设计例4-1某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名患者,采用完全随机设计方法将患者等分为4组进行双盲试验。问如何进行分组?(1)完全随机分组方法:1.编号:120名高血脂患者从1开始到120,见表4-2第1行;2.取随机数字:从附表15中的任一行任一列开始,如第5行第7列开始,依次读取三位数作为一个随机数录于编号下,见表4-2第2行;表4-2完全随机设计分组结果编号12345678910…119120随机数260873373204056930160905886958…220634序号241063915311413109108117…1675分组结果甲丁乙甲甲丁甲丁丁丁…甲丙3.编序号:按数字从小到大(数据相同则按先后顺序)编序号,见表4-2第3行。4.事先规定:序号1-30为甲组,序号31-60为乙组,序号61-90为丙组,序号91-120为丁组,见表4-2第四行。(2)统计分析方法选择:1.对于正态分布且方差齐同的资料,常采用单因素方差分析的单向分类的方差分析或成组资料的t检验(g=2);2.对于非正态分布或方差不齐的资料,可进行数据变换或采用Wilcoxon秩和检验。二、变异分解表4-4完全随机设计资料的方差分析表变异来源自由度SSMSF总变异N-1211ingijijXC组间g-1211()inijgjiiXCnSS组间组间MSMS组间组内组内N-gSSSS总组间SS组内组内例4-2某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名高血脂患者,采用完全随机设计方法将患者等分为4组(具体分组方法见例4-1),进行双盲试验。6周后测得低密度脂蛋白作为试验结果,见表4-3。问4个处理组患者的低密度脂蛋白含量总体均数有无差别?统计量分组测量值niXX2X3.534.594.342.663.593.132.642.563.503.253.304.043.533.563.854.073.523.934.192.96安慰剂组1.373.932.332.984.003.552.964.34.162.59303.43102.91367.85降血脂新药2.423.364.322.342.682.951.563.111.811.771.982.632.862.932.172.722.652.222.902.972.4g组2.362.562.522.272.983.722.803.574.022.31302.7281.46233.002.862.282.392.282.482.283.212.232.322.682.662.322.613.642.583.652.663.682.653.024.8g组3.482.422.412.663.292.703.042.811.971.68302.7080.94225.540.891.061.081.271.631.891.192.172.281.721.981.742.163.372.971.690.942.112.812.527.2g组1.312.511.881.413.191.922.471.022.103.71301.9758.99132.13表4-34个处理组低密度脂蛋白测量值(mmol/L)三、分析步骤H0:1234,即4个试验组的总体均数相等H1:4个试验组的总体均数不全相等0.05按表4-4中的公式计算各离均差平方和SS、自由度、均方MS和F值。H0:即4个试验组总体均数相等H1:4个试验组总体均数不全相等12340.052.计算检验统计量:1.建立检验假设,确定检验水准:102.9181.4680.9458.99324.30ijX2367.85233.00225.54132.13958.52ijX2(324.30)/120876.42C958.52876.42=82.10SS总,总=120-1=1192222(102.91)(81.46)(80.94)(58.99)876.4232.1630303030SS组间413组间82.1032.1649.94SS组内,1204116组内32.1610.723MS组间,49.940.43116MS组内,10.7224.930.43F变异来源自由度SSMSFP总变异11982.10组间332.1610.7224.930.01组内11649.940.43表4-5完全随机设计方差分析表列方差分析表0.053.确定P值,作出推断结论:按水准,拒绝H0,接受H1,认为4个试验组ldl-c总体均数不相等,即不同剂量药物对血脂中ldl-c降低影响有差别。注意:方差分析的结果拒绝H0,接受H1,不能说明各组总体均数间两两都有差别。如果要分析哪些两组间有差别,可进行多个均数间的多重比较(见本章第六节)。当g=2时,完全随机设计方差分析与成组设计资料的t检验等价,有。tF第三节随机区组设计资料的方差分析一、随机区组设计——配伍组设计(randomizedblockdesign)先按影响试验结果的非处理因素(如性别、体重、年龄、职业、病情、病程等)将受试对象配成区组,再分别将各区组内的受试对象随机分配到各处理或对照组。(1)随机分组方法:(2)随机区组设计的特点随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个处理组受试对象数量相同,区组内均衡。在进行统计分析时,将区组变异离均差平方和从完全随机设计的组内离均差平和中分离出来,从而减小组内离均差平方和(误差平方和),提高了统计检验效率。例4-3如何按随机区组设计,分配5个区组的15只小白鼠接受甲、乙、丙三种抗癌药物?分组方法:先将小白鼠按体重编号,体重相近的3只小白鼠配成一个区组,见表4-6。在随机数字表中任选一行一列开始的2位数作为1个随机数,如从第8行第3列开始纪录,见表4-6;在每个区组内将随机数按大小排序;各区组中内序号为1的接受甲药、序号为2的接受乙药、序号为3的接受丙药,分配结果见表4-6。表4-65个区组小白鼠按随机区组设计分配结果区组号12345小白鼠123456789101112131415随机数683526009953936128527005483456序号321132321231213分配结果丙乙甲甲丙乙丙乙甲乙丙甲乙甲丙(3)统计方法选择:1.正态分布且方差齐同的资料,应采用单因素方差分析的双向分类方差分析或配对t检验(g=2);2.当不满足方差分析和t检验条件时,可对数据变换或采用随机区组设计资料的FriedmanM检验。处理因素(g个水平)区组编号123…g1X11X21X31…Xg12X12X22X32…Xg2………………jX1jX2jX3j…Xgj………………n1nX2nX3nX…gnX表4-7随机区组设计的试验结果二、变异分解(1)总变异:反映所有观察值之间的变异,记为SS总。(2)处理间变异:由处理因素的不同水平作用和随机误差产生的变异,记为SS处理。(3)区组间变异:由不同区组作用和随机误差产生的变异,记为SS区组.(4)误差变异:完全由随机误差产生的变异,记为SS误差。对总离均差平方和及其自由度的分解,有:SSSSSSSS处理区组总误差处理区组总误差变异来源自由度SSMSF总变异N-1211gnijijXC处理间g-12111()gnijijnXCSS处理处理MSMS处理误差区组间n-12111()gnijjigXCSS区组区组MSMS区组误差误差(n-1)(g-1)SS总-SS处理--SS区组SS误差误差表4-8随机区组设计资料的方差分析表三、分析步骤例4-4某研究者采用随机区组设计进行实验,比较三种抗癌药物对小白鼠肉瘤抑瘤效果,先将15只染有肉瘤小白鼠按体重大小配成5个区组,每个区组内3只小白鼠随机接受三种抗癌药物(具体分配方法见例4-3),以肉瘤的重量为指标,试验结果见表4-9。问三种不同的药物的抑瘤效果有无差别?区组A药B药C药1gijiX10.820.650.511.9820.730.540.231.5030.430.340.281.0540.410.210.310.9350.680.430.241.351nijjX3.072.171.576.81()ijXiX0.6140.4340.3140.454()X21nijjX2.02071.05870.54513.62452()ijX表4-9不同药物作用后小白鼠肉瘤重量(g)H0:,即三种不同药物作用后小白鼠肉瘤重量的总体均数相等H1:三种不同药物作用后小白鼠肉瘤重量的总体均数不全相等1230.052113.62453.0917=0.5328gnijijSSXC
本文标题:医学统计学ch04-王一任
链接地址:https://www.777doc.com/doc-6995122 .html