您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 综合/其它 > 研究生医学统计学 方差分析
第四章多个样本均数比较的方差分析2020/1/233主要内容第一节方差分析的基本概念第二节完全随机设计的方差分析第三节随机区组设计的方差分析第四节拉丁方设计资料的方差分析第五节两阶段交叉设计资料的方差分析第六节多个样本均数间的多重比较第七节多样本方差齐性检验第一节方差分析的基本概念什么是方差?离均差离均差平方和SS方差(2S2)均方(MS)标准差:S自由度:关系:MS=SS/一、方差分析的几个名词原始数据对于总均数的离差平方和可分解成几个部分,每一部分代表一种变异的来源,自由度也可得到相应的分解。通过对不同来源变差的均方的比较,以判断某种变异原因的存在与否。二、方差分析的基本思想三、统计量F的计算及其意义F=MS组间/MS组内自由度:组间=组数-1组内=N-组数通过这个公式计算出统计量F,查表求出对应的P值,与进行比较,以确定是否为小概率事件。第二节完全随机设计的方差分析(单因素方差分析)何谓完全随机设计是一种将研究对象随机地分配到处理因素各水平组的单因素设计方法,其研究目的是推断处理因素不同水平下的试验结果的差异是否有统计学意义,即该处理因素是否对试验结果有本质影响.例4-1某医师为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名患者,采用完全随机设计方法将患者等分为4组进行双盲试验。问如何进行分组?分组方法:先将120名高血脂患者从1开始到120编号,见表4-2第一行;从随机数字表中的任一行任一列开始,如第5行第7列开始,依次读取三位数作为一个随机数录于编号下见表4-2第二行;然后将全部随机数从小到大编序号(数据相同的按先后顺序编序号),将每个随机数对应的序号记在表4-2第三行;规定序号1-30为甲组,序号31-60为乙组,序号61-90为丙组,序号91-120为丁组,见表4-2第四行。表4-2120名患者等分为4组的完全随机设计分组结果编号12345678910...119120随机数260873373204056930160905886958...220634序号241063915311413109108117...1675分组结果甲丁乙甲甲丁甲丁丁丁...甲丙例4-2某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名高血脂患者,采用完全随机设计方法将患者等分为4组(具体分组方法见例4-1),进行双盲试验。6周后测得低密度脂蛋白作为试验结果,见表4-3。问4个处理组患者的低密度脂蛋白含量总体均数有无差别?表4-34个处理组低密度脂蛋白测量值(mmol/L)分组测量值统计量n安3.534.594.342.663.593.132.642.563.503.25慰剂3.304.043.533.563.854.073.523.934.192.96303.43102.91367.85组1.373.932.332.984.003.552.964.34.162.59降血脂新药2.42.423.364.322.342.682.951.563.111.811.77g1.982.632.862.932.172.722.652.222.902.97302.7281.46233.00组2.362.562.522.272.983.722.803.574.022.314.82.862.282.392.282.482.283.212.232.322.68g2.662.322.613.642.583.652.663.682.653.02302.7080.94225.54组3.482.422.412.663.292.703.042.811.971.687.20.891.061.081.271.631.891.192.172.281.72g1.981.742.163.372.971.690.942.112.812.52301.9758.99132.13组1.312.511.881.413.191.922.471.022.103.71iXX2XXij第i个组的第j个观察值I=1,2,…gJ=1,2,…nini第i个处理组的例数∑ni=N各种符号的意义处理因素的分组水平水平1水平1…水平k合计X11X21…Xk1X12X22…Xk2…………X1n1X2n2…Xknknin1n2…nkk1iinniX1X2X…kXk1in1jijiXn1X2iS21S22S…2kSk1in1j2ij2iXX1n1S数据结构SS组内组内MS组内SS组间组间MS组间三者之间的关系•SS总=SS组内+SS组间•总=组内+组间各种变异(SS)的表示方法SS总总MS总,即4个试验组的整体均数相等H1:4个试验组的整体均数不全相等按表4-4中的公式计算各离均差平方和SS、自由度、均方MS和F值。=102.91+81.46+80.94+58.99=324.30=367.85+233.00+225.54+132.13=958.52C=(324.30)2/120=876.42SS总=958.52-876.42=82.10,=120-1=11943210:H05.016.3242.87630)99.58(30)94.80(30)46.81(30)91.102(2222组间SS总ijX2ijX314组间1164120,94.4916.3210.82组内组内SS93.2443.072.10,43.011694.49,72.10316.32FMSMS组内组间方差分析表见表4-5。按水准,=3,=116查附表3的F界值表,得结论:按水准,拒绝H0,接受H1,认为4个处理组患者的低密度脂蛋白总体均数不全相等,即不同剂量药物对血脂中低密度脂蛋白降低有影响.05.001.0,93.2498.3)116,3(,01.0)116,3(,01.0PFF,1205.0表4-5例4-2的方差分析表表4-4完全随机设计资料的方差分析表变异来源自由度SSMSFP总变异11982.10组间332.1610.7224.930.01组内11649.940.43变异来源自由度SSMSFP总变异N-1组间g-1组内N-gSS总-SS组间MSMS组间组内SS组内组内211()inijgjiiXCn211ingijijXCSS组间组间在满足下列条件下:1)各处理组所代表的总体服从正态分布;2)各处理组所代表的总体相互独立;3)各处理组所代表的总体方差齐性;4)各处理组所代表的总体均数相等。均方(MS)之比的意义v1=vA,v2=veF(v1,v2)f(F)F分布及其上侧F界值第三节随机区组设计资料的方差分析也叫配伍组设计的多个样本均数的比较(双因素方差分析)应用分层的思想,事先将全部受试对象按某种或某些特性分为若干个区组,区组内的试验对象均衡,区组之间试验对象具有较大的差异,这样利用区组控制非处理因素的影响,并在方差分析时将区组间的变异从组内变异中分解出来。当区组间差别有统计学意义时,这种设计的误差比完全随机设计小,试验效率得以提高。是配对(两个组)资料的扩充(两个以上组)。例4-3如何按随机区组设计,分配5个区组的15只小白鼠接受甲、乙、丙三种抗癌药物?方法为先将小白鼠的体重从轻到重编号,体重相近的3只小白鼠配成一个区组,见表4-6。然后在随机数字表(附表15)中任选一行一列开始的2位数作为1个随机数,如从第8行第3列开始纪录,见表4-6;在每个区组内将随机数按大小排序,各区组中内序号为1的接受甲药,序号为2的接受乙药,序号为3的接受丙药,分配结果见表4-6。表4-615只小白鼠分5个区组的随机区组设计分配结果乙甲丙乙丙甲丙乙甲甲丙乙丙乙甲分配结果213231321132321序号483456527005936128009953683526随机数123123123123123小白鼠54321区组号例4-4某研究者采用随机区组设计进行实验,比较三种抗癌药物对小白鼠肉瘤的抑瘤效果,先将15只染有肉瘤小白鼠按体重大小配成5个区组,每个区组内3只小白鼠随机接受三种抗癌药物(具体分配方法见例4-3),以肉瘤的重量为指标,试验结果见表4-9。问三种不同药物的抑瘤效果有无差别?表4-9三种不同药物作用后小白鼠肉瘤重量(g)1gijiX1nijjXiX21nijjX()X2()ijX()ijX区组A药B药C药10.820.650.511.9820.730.540.231.5030.430.340.281.0540.410.210.310.9350.680.430.241.353.072.171.576.810.6140.4340.3140.4542.02071.05870.54513.6245分析变异总变异:组间变异(因素一的变异):误差(组内)变异(随机误差):配伍间变异(因素二的变异):统计量F的计算F1=MS组间/MS组内F2=MS区间/MS组内自由度:组间=组数-1=3-1=2区间=区数-1=8-1=7组内=(组数-1)(区数-1)=14都是和随机误差进行比较。H0:即三种不同药物作用后小白鼠肉瘤重量的总体均数相等H1:三种不同药物作用后小白鼠肉瘤重量的总体均数不全相等按表4-8中的公式计算各离均差平方和SS、自由度、均方MS和F值。C=6.812/15=3.0917SS总=3.6245-3.0917=0.5328,=15-1=1432105.02280.00917.3)57.117.207.3(51222处理SS213处理2284.00917.3)35.193.005.150.198.1(3122222区组SS415区组0764.02284.02280.05328.0误差SS8)13)(15(误差总410方差分析表见表。表4-8随机区组设计资料的方差分析表211gnijijXC2111()gnijijXCn2111()gnijjiXCgSS处理处理SS区组区组SS误差误差MSMS处理误差MSMS区组误差变异来源自由度SSMSFP总变异N-1处理间g-1区组间n-1误差(n-1)(g-1)SS总-SS处理-SS区组按水准,查附表3的F界值表,得按水准,拒绝H0,接受H1,认为三种不同药物作用后小白鼠肉瘤重量的总体均数不全相等,即不同药物的抑瘤效果有差别.05.08221、01.0,88.11,65.8,46.4)8,2(,01.0)8,2(,01.0)8,2(,05.0PFFF05.0410表44例的方差分析表变异来源自由度SSMSFP总变异140.5328处理间20.22800.114011.880.01区组间40.22840.05715.950.05误差80.07640.0096SS误差误差MS误差SS处理处理MS处理四者之间的关系•SS总=SS误差+SS处理+SS区组•总=误差+处理+区组各种变异(SS)和自由度的表示方法SS总总MS总SS区组区组MS区组v1,v2F(v1,v2)f(F)F分布及其上侧F界值方差分析结果提供了各组均数间差别的总的信息,但尚未提供各组间差别的具体信息,即尚未指出哪几个组均数间的差别具有或不具有统计学意义。为了得到这方面的信息,可进行多个样本间的两两比较。注意第四节拉丁方设计资料的方差分析完全随机设计只涉及到一个处理因素。随机区组设计涉及一个处理因素、一个区组因素(配伍因素)。倘若实验研究涉及一个处理因素和两个控制因素,且每个因素的水平数相等时,此时可采用拉丁方设计来安排试验。例4-5某研究者为了比较甲、乙、丙、丁、戊、己6种药物给家兔注射后产生的皮肤疱疹大小(mm2),采用拉丁方设计,选用6只家兔,并在每只家兔的6个不同部位进行注射。试验结果见表4-11
本文标题:研究生医学统计学 方差分析
链接地址:https://www.777doc.com/doc-3266914 .html