您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 咨询培训 > 第9讲--协方差分析与混合线性模型
第9讲协方差分析与混合线性模型理学院汪晓银教授华中农业大学数学建模创新实践基地课件如果在单因素、双因素或多因素试验中有无法控制的因素x影响试验的结果Y,且x可以测量、x与Y之间又有显著的线性回归时,常常利用线性回归来矫正Y的观测值、消去x的差异对Y的影响。例如,研究施肥对苹果树产量的影响,由于苹果树的长势不齐,必须消去长势对产量的影响。又如,研究饲料对动物增重的影响,由于动物的初重不同,必须消去初重对增重的影响。协方差分析这种不是在试验中控制某个因素,而是在试验后对该因素的影响进行估计,并对试验指标的值作出调整的方法称为统计控制,可以作为试验控制的辅助手段。以统计控制为目的,综合线性回归分析与方差分析所得到的统计分析方法,称为协方差分析,所需要统计控制的一个或多个因素,例如苹果树的长势,又如动物的初重等等称为协变量。1协方差分析思想原理2单因素协方差分析-理论2单因素协方差分析-理论2单因素协方差分析-理论2单因素协方差分析-理论2单因素协方差分析-计算dataex;doa=1to3;doi=1to8;inputxy@@;output;end;end;cards;475458665363465149565666546144505254535364675862596261636364666944524858465450615970576458695366;procglm;classa;modely=xa/solution;lsmeansa/stderrpdiff;run;2单因素协方差分析-计算2单因素协方差分析-计算施用三种肥料的产量矫正后有极显著的差异2单因素协方差分析-计算3双因素协方差分析-不考虑交互作用方差来源平方和自由度均方和F值显著性AQAr-1MQAFABQBs-1MQBFB误差QErs-r-sMQE总和QTrs-23双因素协方差分析-不考虑交互作用dataex;doa=1to3;dob=1to5;inputxy@@;output;end;end;cards;82.85104.24123.00114.94102.88103.14124.5072.75125.84104.06123.88103.8692.82104.9492.89;procglm;classab;modely=xab/solution;lsmeansab/stderrpdiff;run;3双因素协方差分析-不考虑交互作用3双因素协方差分析-不考虑交互作用方差来源平方和自由度均方和F值显著性A0.604620.30232.49NB7.124541.781114.66**误差0.850270.1215总和8.57931各小区的产量矫正后没有显著的差异,各品种的产量矫正后有极显著的差异。3双因素协方差分析-不考虑交互作用方差来源平方和自由度均方和F值显著性AQAr-1MQAFABQBs-1MQBFBABQAB(r-1)(s-1)MQABFAB误差QErs(m-1)-1MQE总和QTrsm-24双因素协方差分析-考虑交互作用4双因素协方差分析-考虑交互作用dataex;doa=1to4;dob=1to2;doi=1to2;inputxy@@;output;end;end;end;cards;14.697.812.194.219.511.218.8110.11.6100.312.998.518.5119.412.2114.712.899.210.789.612.2122.216.9105.312.0102.112.4103.816.4117.217.2117.9procglm;classab;modely=xaba*b/solution;lsmeansab/stderrpdiff;run;4双因素协方差分析-考虑交互作用4双因素协方差分析-考虑交互作用方差来源平方和自由度均方和F值显著性A277.43485392.4782866.51**B2.84525932.8452590.20NAB12.84810014.2827000.30N误差99.441171714.205882A与B的交互作用矫正后不显著,促生长剂之间的差异极显著,试验批次间的差异不显著4双因素协方差分析-考虑交互作用3.混合线性模型通过一个例子讲述混合线性模型的使用艾滋病疗法的评价艾滋病是当前人类社会最严重的瘟疫之一,从1981年发现以来的20多年间,它已经吞噬了近3000万人的生命。艾滋病的医学全名为“获得性免疫缺损综合症”,英文简称AIDS,它是由艾滋病毒(医学全名为“人体免疫缺损病毒”,英文简称HIV)引起的。这种病毒破坏人的免疫系统,使人体丧失抵抗各种疾病的能力,从而严重危害人的生命。人类免疫系统的CD4细胞在抵御HIV的入侵中起着重要作用,当CD4被HIV感染而裂解时,其数量会急剧减少,HIV将迅速增加,导致AIDS发作。3.混合线性模型艾滋病治疗的目的,是尽量减少人体内HIV的数量,同时产生更多的CD4,至少要有效地降低CD4减少的速度,以提高人体免疫能力。迄今为止人类还没有找到能根治AIDS的疗法,目前的一些AIDS疗法不仅对人体有副作用,而且成本也很高。许多国家和医疗组织都在积极试验、寻找更好的AIDS疗法。3.混合线性模型请你完成以下问题:(1)利用附件1的数据,预测继续治疗的效果,或者确定最佳治疗终止时间(继续治疗指在测试终止后继续服药,如果认为继续服药效果不好,则可选择提前终止治疗)。(2)利用附件2的数据,评价4种疗法的优劣(仅以CD4为标准),并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间。(3)艾滋病药品的主要供给商对不发达国家提供的药品价格如下:600mgzidovudine1.60美元,400mgdidanosine0.85美元,2.25mgzalcitabine1.85美元,400mgnevirapine1.20美元。如果病人需要考虑4种疗法的费用,对(2)中的评价和预测(或者提前终止)有什么改变。3.混合线性模型ID疗法年龄时间Log(CD4count+1)1236.427103.13551236.42717.57143.04451236.427115.57142.77261236.427123.57142.83321236.427132.57143.21891236.4271403.04452447.846703.06812447.846783.89182447.8467163.97032447.8467233.61092447.846730.71433.33222447.8467393.09103160.287503.73774336.596904.11904336.59697.14294.11094336.596916.14294.70953.混合线性模型1对4种疗法的疗效评价的分析对题目所给的附件2的数据进行分析可知,决定病人的CD4的浓度的因素有年龄,检查的时刻,治疗方案这三个因素。因此我们将年龄分成5类,检查的时刻分为4个时间段,治疗方案有4种。而问题是以CD4的浓度为标准来评价疗效的优劣,即CD4的浓度越大,那么疗效越好。由于考虑题中所给的样本有6000多个(病人的个数*各个病人检查的次数),因此我们考虑用MIXED(混合线性模型)。下面我们就混合线性模型的原理进行说明。3.混合线性模型混合线性模型过程是拟合许多不同数据的混合线性模型,并利用所拟合的模型对数据进行统计推断。首先混合线性模型的主要假设是数据服从正态分布,由于本题所给的数据的样本容量有6000多个,因此,我们可认为它服从正态分布。又由于正态分布的数据可完全有均值和方差确定,因此一个混合线性模型是由两个模型决定的。分别是均值模型和方差模型。MIXED使用约束最大似然的方法来拟合数据的。一旦数据的模型已经建立,我们可以使用该模型通过固定效应参数和协方差参数进行统计推断。用这些统计量可以对模型进行评价。3.混合线性模型再者,该分析的重要假设是数据是正态分布的,由于我们将附录2的数据进行了分类。由于数据出现在类(如可能是同一年龄段中),那可能的情况是来自同一年龄段的这些CD4的值是相关的,不是独立的。鉴于此,由于附录2所给的数据是高度数据(即样本容量很大),那么考虑这种因素是相关。因此我们对这些因素进行相关性建模,我们使用随机效用。在本题中,我们规定年龄、检查时刻为随机效应,即使得具有相同年龄水平或相同检查时刻的水平之间存在共同的相关性,那么,此模型才较为合理。3.混合线性模型2对4种疗法的疗效模型的建立1)数据的处理a、所有病人的年龄是在[14.9021,74.193]的区间内,以(74.193-14.9021)/5=11.85818为区间长度。我们将患者按照年龄阶段分为5级,分别记作1至5(如表4所示);b、我们将患者所接受的治疗方法分为4种,分别记作1至4;c、我们将病人的检查的时刻[0,40]以10为区间长度,分为4级,分别记作1至43.混合线性模型3.混合线性模型2)确定固定效应和随机效应固定效用是设计者所研究的因素,在此题中为4种疗法。因为病人的年龄是随机的,并且病人接受检验的时刻是也是随机进行的,故病人的年龄和病人接受检验的治疗时刻应该为随机效应。3.混合线性模型3)协方差结构的选择模型中具体选用哪种结构矩阵:在相同模型结构下,选择几个不同结构的协方差矩阵,从中选取似然比统计量(-2LogLikeli-hood)、Akaike’sInformationSchwartzBayesian三个指标均较小的一个,通常以AIC为主要判断指标。依据专业知识和既往文献,在此模型中选用符合对称结构[CS]、不规则结构[UN]、一阶自回归结构[AR(1)]、空间幂相关结构[SP(POW)]。3.混合线性模型4)建立混合线性模型的线性模型,如下:curecuretimetimeageageaveBXBXBXBY***3.混合线性模型dataex;inputnameax1x2y@@;ifx126.76thenx1=1;if26.76=x141.662thenx1=2;if41.662=x156.56thenx1=3;if56.56=x171.467thenx1=4;if71.467=x1thenx1=5;ifx210thenx2=1;if10=x220thenx2=2;if20=x230thenx2=3;if30=x2thenx2=4;cards;1236.427103.13551236.42717.57143.04451236.427115.57142.77261236.427123.57142.83323.混合线性模型1313115.8412204.40671313115.8412273.55531313115.8412353.4657;procglm;classax1x2;modely=ax1x2;meansa/duncan;procmixed;classax1x2;modely=a;randomx1x2;lsmeansa;run;3.混合线性模型3.混合线性模型3.混合线性模型
本文标题:第9讲--协方差分析与混合线性模型
链接地址:https://www.777doc.com/doc-5648689 .html