您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 综合/其它 > 卫生统计学 - 方差分析
AnalysisofVariance,ANOVAChapter92020/6/17ANOVA2outline方差分析的基本思想和应用条件完全随机设计的方差分析随机区组设计的方差分析多个样本均数的两两比较主要内容2020/6/17ANOVA3•【例9-1】为研究煤矿粉尘作业环境对尘肺的影响,将24只Wistar大鼠随机分到甲、乙、丙三个组,每组8只,分别在地面办公楼、煤炭仓库和矿井下染尘,12周后测量大鼠全肺湿重(g)2020/6/17ANOVA4表9-1三组大鼠的全肺湿重(g)甲组4.23.33.74.34.13.33.54.1乙组4.54.43.54.24.64.24.44.1丙组5.63.64.55.14.94.74.84.4•研究者对上述资料采用两样本t检验两两比较得出结论:①乙组和丙组差异无统计学意义②其余各两组间差异均有统计学意义2020/6/17ANOVA5【问题9-1】(1)该实验属何种设计方案?(2)统计分析方法是否正确?为什么?【分析】(1)完全随机设计(2)不正确:①将多个样本均数的同时比较转化为多次的两两比较;②多次的两两比较会增大Ⅰ型错误的概率2020/6/17ANOVA6模拟试验(simulationtrial)•从标准正态分布总体N(0,1)中随机抽样,样本含量为10,共抽取10次,得数据如下:2020/6/17ANOVA7d#c1c2c3c4c5c6c7c8c9c1011.803-0.0481.4080.4190.466-1.3571.2110.0770.4640.56220.839-0.990-2.014-0.663-1.0320.151-1.1381.3270.7700.8283-1.2120.607-2.014-0.663-1.0320.151-1.1381.327-1.6321.4464-1.123-1.086-0.366-0.196-0.4650.535-1.0521.042-0.0830.4875-0.545-0.136-0.6450.7401.7520.850-0.1710.122-0.3190.2086-0.012-1.2860.1341.5910.029-1.8060.460-0.836-1.1730.6037-1.2872.0500.8900.942-0.6940.9420.1680.5540.4520.5498-0.238-1.5110.2250.810-0.790-1.6340.5320.686-1.1010.4169-0.6250.3450.623-1.2791.067-0.7451.2031.4350.629-0.47210-0.293-0.3150.3190.4100.0160.856-1.5382.327-0.1841.080-0.272-0.237-0.0680.262-0.017-0.1400.0510.710-0.2120.571S0.9701.0721.0260.8440.8871.1280.9950.8760.8390.510x2020/6/17ANOVA8两两比较的次数:(1)22kkkm13(31)32m3,k例:10,k210(101)452m2020/6/17ANOVA910个样本来自同一标准正态分布N(0,1)总体则实际上犯I型错误的大小:c1-c8c1-c10c2-c8c2-c10c8-c9c9-c10t-2.38-2.43-2.16-2.152.42-2.54P0.0290.0260.0440.0450.0260.0211231060.1333452020/6/17ANOVA10第一节方差分析的基本思想和应用条件2020/6/17ANOVA11•方差分析又称变异数分析,是由英国著名统计学家Fisher于1928年首先提出的一种统计方法,故也称F检验,用于多个样本均数的比较RonaldFisher2020/6/17ANOVA12•常用术语:–因素:所要检验的对象称为因素(如研究某种药物的不同剂量疗效,药物即因素)–水平:因素的具体表现称为水平(药物的每个剂量为一个水平)–观察值:在每个因素水平下得到的样本值2020/6/17ANOVA13•变异的测量:2222()()11xxxxnsnn方差:2020/6/17ANOVA14一、方差分析的基本思想表9-2三组大鼠的全肺湿重(g)甲组乙组丙组4.24.55.63.34.43.63.73.54.54.34.25.14.14.64.93.34.24.73.54.14.84.14.44.33.81254.23754.6875ix2020/6/17ANOVA15•变异的来源:样本均数间存在的差异可能由两种原因所致:①随机因素引起的差异:抽样误差、测量误差②处理因素引起的差异:不同的处理引起不同的作用和效果,导致各处理组之间均数不同2020/6/17ANOVA16•变异的分解:总变异组间变异组内变异2020/6/17ANOVA17•总变异:所有观察值之间的变异(不分组)-1N总222111111()iiinnnkkkijijijijijijSSxxxxN总2020/6/17ANOVA18•组间变异:各处理组均数之间不尽相同1vk组间22121111()iinijnkkkjiiijiiijixSSnxxxNn组间2020/6/17ANOVA19•组内变异:各处理组内观察值之间不尽相同Nk组内21221111()iiinijnnkkjijiijijijixSSxxxn组内2020/6/17ANOVA20SSSSSS总组间组内组间变异总变异组内变异总组间组内•三种变异的关系:线性可加性2020/6/17ANOVA21•均方MS(meansquare):–组间均方:–组内均方:MSSS组间组间组间MSSS组内组内组内2020/6/17ANOVA22N-k组内变异随机误差Ek-1组间变异处理效应T自由度分解变异分解变异来源2020/6/17ANOVA23•如果各样本来自同一总体,即各组之间无差别(即无处理效应),则组间变异与组内变异均只反映随机误差,这时若计算组间均方与组内均方的比值:F值应接近于1;反之,若各样本均数不是来自同一总体,组间变异应较大,F值将明显大于1FMSMS组间组内2020/6/17ANOVA24•若组间变异与组内变异相差不大,F值比较接近于1,此时我们尚不能认为总体均数之间有差别,若处理组间的变异明显大于组内变异,则不能认为组间的变异仅反映随机误差,也就是认为处理因素有作用(即存在处理效应),接下来,我们通过查F界值表,即可得P值,按P值大小作出推断结论2020/6/17ANOVA25•方差分析的基本思想:根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和(即方差)和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用加以解释。通过比较不同变异来源的均方,借助F分布作出统计推断,从而了解该因素对观测指标有无影响2020/6/17ANOVA26f(F)F0123450.00.20.40.60.81.01=1,2=101=5,2=101=10,2=101=∞,2=102020/6/17ANOVA272020/6/17ANOVA28从图中看出:1,2固定,,F1212(,)(,)FFPFFP2020/6/17ANOVA29二、方差分析的应用条件:①独立性②正态性③方差齐性概括地表达为:任何观察值xij都是独立地来自具有等方差的正态总体2020/6/17ANOVA30第二节完全随机设计的方差分析2020/6/17ANOVA31•完全随机设计(completelyrandomdesign)又称成组设计,按随机化原则将受试对象随机分配到某一研究因素的多个水平中去,然后观察实验效应。其目的都是推断不同水平下各组均数之间的差别是否有统计学意义2020/6/17ANOVA322()iiinxx1kSS组间组内组间MSMS2)1(iiiSnSSSS或组间总kNSS组内Nxx22)(表9-3完全随机设计方差分析计算公式变异来源SSνMSF组间(处理)k-1组内(误差)N-k总变异N-12020/6/17ANOVA33【检验步骤】1.建立检验假设,确定检验水准H0:1=2=3,三组大鼠全肺湿重总体均数相等H1:1,2,3不等或不全相等=0.05(客观实际只可能是其中一种情况)1231231321232020/6/17ANOVA342.计算检验统计量23124498.71)-(2400.3261)-(2总总NSSS2222()8(3.8125-4.2458)8(4.23754.2458)8(4.68754.2458)3.063312iiiSSnxx组间组间7.4983.0634.435SSSSSS总组内组间24321组内2020/6/17ANOVA35表9-4方差分析结果变异来源SSMSFP组间3.06321.5327.2500.01组内4.435210.211总7.498232020/6/17ANOVA363.确定P值,作出统计推断以1=2、2=21查F界值表,得F0.05,(2,21)=3.47,F0.05,(2,21)=5.78,P<0.01。按=0.05水准,拒绝H0,接受H1,差异有统计学意义,可认为不同粉尘环境影响大鼠的全肺湿重2020/6/17ANOVA37•当随机对照只有两组(即),,t检验与F检验等价如:2(1,)2,Ft220.05(1,10)0.052,104.962.228Ft121k,2020/6/17ANOVA38第三节随机区组设计的方差分析2020/6/17ANOVA39•随机区组设计(randomizedblockdesign)又称配伍组设计,是配对设计的扩展。是将全部受试对象按某种或某些特征分为若干个区组,使每个区组内研究对象的特征尽可能接近,每个区组内的观察对象与研究因素的水平数相等,然后分别使每个区组内的观察对象随机地接受研究因素某一水平的处理2020/6/17ANOVA4030只小鼠按随机区组设计的分配结果123451234567891011121314154411894859631747794436387103CBABACABCCABCBA67891016171819202122232425262728293076554625563705522564832257860CABBACCBACBAACB区组编号随机数分组2020/6/17ANOVA41表9-63种营养素喂养小白鼠所增体重(g)区组A营养素B营养素C营养素162.163.573.2253.254.158.1371.267.878.7441.346.638.9550.456.964.5642.543.146.6752.658.775.1849.856.165.3962.651.054.61048.354.847.22020/6/17ANOVA42•特点:一个处理因素:若干个水平一个非处理因素:区组因素•目的:排除影响因素的干扰,减少个体差异,提高研究效率,使处理因素的效果更清楚2020/6/17ANOVA43•变异的分解–区组变异2()1jjjSSnxxb区组区组1MSSSb区组区组SSSSSSSS处理总区组误差处理总区组误差2020/6/17ANOVA44表9-7随机区组设计方差分析的计算公式变异来源SSMSF处理
本文标题:卫生统计学 - 方差分析
链接地址:https://www.777doc.com/doc-5954606 .html