您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 咨询培训 > SPSS多因素方差分析
1多因素方差分析2一、析因设计资料的方差分析两因素两水平三因素多水平析因设计的特点必须是:两个以上(处理)因素(factor)(分类变量)。两个以上水平(level)。两个以上重复(repeat)。每次试验涉及全部因素,即因素同时施加观察指标(观测值)为计量资料(独立、正态、等方差)。析因设计的有关术语单独效应(simpleeffects):其它因素的水平固定为某一值时,某一因素不同水平间的效应差异。主效应(maineffects):某因素各单独效应的平均效应。交互作用(Interaction):某一因素效应随着另一因素变化而变化的情况。(如一级交互作用AB、二级交互作用ABC…)。析因设计的优缺点用相对较小样本量,获取更多的信息。可用来分析全部主效应,单独效应以及因素间各级的交互作用。优点缺点所需试验的次数很多,如2因素,各3水平5次重复需要试验为45次。例1:某研究人员采用某法测定人血清C3(mg/L)值,问①不同保存温度下该法对C3的测定值有无差异?不同保存时间下该法对C3的测定值有无差异?②保存时间与温度对测定值无交互作用?保存温度20℃保存时间保存温度平均b2-b120℃(b1)37℃(b2)1天(a1)132013201317213201330133013101310133013001300131613183天(a2)134014201376801340142013501430133014101320140013361416平均13261367134641a2-a12098597步骤①选择Analyze→GeneralLinearModel→Univariate,激活Univariate对话框。②在Univariate对话框中,把变量“c3值”放入DependentVariable,变量“保存时间”和“保存温度”放入FixedFactor(s)栏。单击Plots…按钮,激活ProfilePlots对话框。③在ProfilePlots对话框中,把Factors栏中的变量“保存时间”放入HorizontalAxis栏,变量“保存温度”放入SeparateLines栏,再单击Add按钮,会使变量“a*b”自动进入Plots栏,单击Continue按钮返回。④在Univariate对话框中,单击Options…按钮。在Options对话框中,把Factor(s)andFactorInterations栏中的变量“保存时间”、“保存温度”、和“保存时间*保存温度”放入DisplayMeansfor栏;并在Display多选项中,选择Descriptivestatistics,Estimatesofeffectsize,Homogeneitytests。单击Model…,选择默认项,即Fullfactorial项(全析因模型),单击Continue按钮返回。⑤在Univariate对话框,单击OK按钮得到Univariate过程的运行结果。8结果9均数分布图10例2,用5×2×2析因设计研究5种类型的军装在两种环境、两种活动状态下的散热效果,将100名受试者随机等分20组,观察指标是受试者的主观热感觉(从“冷”到“热”按等级评分),结果见下表。试进行方差分析。11战士主观感觉冷热等级评分完全随机的三因素析因设计方差分析表13结果14二、协方差分析完全随机设计的协方差分析完全随机区组设计的协方差分析15一般地,均数间的比较可用t检验或方差分析。要求比较组除了处理因素不同外,其它对结果有影响的因素要齐同或均衡。当影响结果的某个因素没有得到控制时,即对两组来说不齐同,这两个均数就不能直接比较,需进行校正,得到的修正均数,再比较。16基本概念协变量(covariate):对反应变量有影响的非处理因素。必须是数值变量。例如,在研究降压药物的疗效时,病人的初始血压水平对服药后血压下降值是有影响的。如果不考虑病人初始血压水平的差异,直接比较不同处理组病人的平均血压下降值,是不恰当的。这里,处理因素?协变量因素是?17观察协变量X对反应变量Y的影响是否存在线性关系。可建立应变量Y随协变量X变化的线性回归关系,利用这种回归关系,固定X值,得到Y的修正均数,然后再比较修正均数间差异。其实质就是从Y的总平方和中扣除协变量X对Y的回归平方和,对残差平方和作进一步分解后再进行方差分析,以更好地评价各种处理的效应。基本思想:是将线性回归分析与方差分析结合起来的一种统计分析方法。18实例分析:为研究A、B、C三种饲料对猪的催肥效果。用每种饲料喂养8头猪一段时间,测得每头猪的初始重量(X)和增重(Y)数据如下表。试分析三种饲料对猪的催肥效果是否相同?表三种饲料喂养猪的初始重量与增重(单位:kg)X:初始重量;Y:增重19如果不考虑初始重量对增重的影响,那么本例就是一个典型的完全随机设计类型的方差分析。三组的初始重量(X)均数不同,经采用两两比较,P值均小于0.05。在没有扣除X对Y的影响的情况下,提示猪的初始重量与饲料的效应混杂。采用协方差分析,将三组的初始体重化为相等,以扣除其影响,再比较三种饲料的增重是否相同,即检验三组修正均数间的差别有无统计学意义。20数据输入格式及步骤21结果X(初始重量)的组间差异有统计学意义。F=88.813,P0.01;Group(饲料间)的差异(在扣除了初始体重后)有统计学意义,F=31.071,P0.01.22在扣除了初始体重后得到的修正均数23三、两阶段交叉设计方差分析设计特点•同一批受试对象,随机等分为两组,一组先接受A处理,后再接受B处理;另外一批受试对象先接受B处理而后再接受A处理。如此可使A处理和B处理有同等的机会处于两个实验阶段。•这种设计可分析三种变异,即两种处理间的差异,两个阶段之间的差异受试对象之间的差异。24例:为比较血液透析过程中,低分子肝素钙(A)与速避凝(B)对凝血酶原时间(TT)的影响,选择20例接受血液透析的病人为研究对象,采取二阶段交叉设计,实验数据如表下表,试分析之。2526结果27多变量的统计分析方法兰州大学流行病与卫生统计研究所申希平E-mail:shenxp@lzu.edu.cn2007.1228Logistic回归分析29用途•通过一组自变量(X1…Xn),采用Logistic回归,可以预测一个因(分类)变量每一个分类所发生的概率。它是研究二(多)分类观察结果与一些影响因素之间关系的一种多变量分析方法。自变量可以是分类变量,也可以是连续变量,或者兼而有之。30•在流行病学研究中,经常需要分析疾病与各危险因素之间的定量关系,如食道癌的发生与吸烟、饮酒、不良饮食习惯等危险因素的关系,为了正确说明这种关系,需要排除一些混杂因素的影响。由于因变量Y是二(多)分类的,不满足线性回归的条件,故应该用Logistic回归!31二项分类Logistic回归条件1:m配对Logistic回归32•例:前列腺癌细胞是否扩散到邻近的淋巴结,是选择治疗方案的重要依据。为了了解淋巴组织中有无癌转移,通常的做法是对病人实施剖腹术探查,并在显微镜下检查淋巴组织。为了不手术而又能弄清淋巴结的转移情况,Brown(1980)在术前检查了53例前列腺癌患者,分别记录了年龄(AGE)、酸性磷酸酯酶(ACID)两个连续型的变量,X射线(X_RAY)、术前探针活检病理分级(GRADE)、直肠指检肿瘤的大小与位置(STAGE)三个分类变量。•后三个变量均按0、1赋值,其值1表示阳性或较严重情况,0表示阴性或较轻情况。还有手术探查结果变量NODES,1表示有淋巴结转移,0表示无淋巴结转移。33分析目的:1.影响前列腺癌细胞淋巴结转移的因素;2.建立淋巴结转移的预报模型。53例接受手术的前列腺癌患者情况NoX_RAYGRADESTAGEAGEACIDNODES1011644002001634003100654604010674705000664806011654807000604908000514909000665001000058500…341.数据格式:见Logistic1.sav•因变量(结果变量):NODES为二分类变量。1为‘有淋巴结转移’,0为‘无淋巴结转移’。•自变量(危险因素):自变量可以是定量、二分类和等级的。本例年龄(AGE)、酸性磷酸酯酶(ACID)两个连续型的变量,X射线(X_RAY)、术前探针活检病理分级(GRADE)、直肠指检肿瘤的大小与位置(STAGE)三个分类变量。352.SPSS的分析过程:Analyze→Regression→BinaryLogistic进入二分类Logistic回归分析对话窗。Dependent窗:只能选入一个变量,将NODES选入。Covariates窗:将AGE、ACID、X_RAY、GRADE、STAGE选入。36•Method:默认Enter。也可用变量筛选方法的选择。•Categorical对话框:用于分类变量的资料,选入X_RAY、GRADE、STAGE。•Save对话框:存入新变量。•Options对话框:选StatisticsandPlots:Hosmer-Lemeshowgoodness-of-fitCIforexp95%373.主要结果:★全回归模型:•①模型的检验:–OmnibusTestsofModelCoefficientsChi-squaredfSig.Step1Step22.1265.000Block22.1265.000Model22.1265.000χ2=22.126,P0.001,模型有统计学意义。38②模型的拟和优度检验:HosmerandLemeshowTestStepChi-squaredfSig.15.9548.652χ2=5.954,P=0.652,模型吻合性好。39③参数估计及检验:VariablesintheEquation2.045.8076.4211.0117.7321.58937.614.761.771.9761.3232.141.4739.7001.564.7744.0831.0434.7781.04821.783-.069.0581.4321.231.933.8331.045.024.0133.4231.0641.025.9991.051.0623.460.0001.9861.064XRAYGRADESTAGEAGEACIDConstantStep1aBS.E.WalddfSig.Exp(B)LowerUpper95.0%C.I.forEXP(B)Variable(s)enteredonstep1:XRAY,GRADE,STAGE,AGE,ACID.a.40XRAY,GRADE,STAGE,AGE,ACID对影响淋巴结转移的相对危险度分别为7.732、2.141、4.778、0.933、1.025。对XRAY和STAGE,P0.05,XRAY和STAGE的95%的可信区间未包含1,有统计学意义。对GRADE,AGE,ACID,P0.05。得到Logistic预测概率模型为:ACIDAGESGXP024.0690.0564.1761.0045.2062.0exp11^41★逐步回归模型:VariablesintheEquation2.182.6979.7831.0028.8612.25834.769-1.170.3829.4031.002.3102.119.7478.0541.0058.3261.92635.9891.588.7005.1481.0234.8951.24119.304-2.045.61011.2361.001.129XRAYConstantStep1aXRAYSTAGEConstantStep2bBS.E.WalddfSig.Exp(B)LowerUpper95.0%C.I.forEXP(B)Variable(s)enteredonstep1:XRAY.a.Variable(s)enteredonstep2:STAGE.b.42•得到线性预测方程
本文标题:SPSS多因素方差分析
链接地址:https://www.777doc.com/doc-4692578 .html