您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 宣传企划 > 2010暑期数学建模培训-2006B艾滋病疗法的评价及疗效的预测
艾滋病疗法的评价及疗效的预测严继高yanjigao@suda.edu.cn全国大学生数学建模竞赛2006年B题艾滋病是当前人类社会最严重的瘟疫之一,从1981年发现以来的20多年间,它已经吞噬了近3000万人的生命。艾滋病的医学全名为“获得性免疫缺损综合症”,英文简称AIDS,它是由艾滋病毒(医学全名为“人体免疫缺损病毒”,英文简称HIV)引起的。这种病毒破坏人的免疫系统,使人体丧失抵抗各种疾病的能力,从而严重危害人的生命。人类免疫系统的CD4细胞在抵御HIV的入侵中起着重要作用,当CD4被HIV感染而裂解时,其数量会急剧减少,HIV将迅速增加,导致AIDS发作。艾滋病治疗的目的,是尽量减少人体内HIV的数量,同时产生更多的CD4,至少要有效地降低CD4减少的速度,以提高人体免疫能力。迄今为止人类还没有找到能根治AIDS的疗法,目前的一些AIDS疗法不仅对人体有副作用,而且成本也很高。许多国家和医疗组织都在积极试验、寻找更好的AIDS疗法。现在得到了美国艾滋病医疗试验机构ACTG公布的两组数据。ACTG320(见附件1)是同时服用zid.,lam.,ind.3种药物的300多名病人每隔几周测试的CD4和HIV的浓度(每毫升血液里的数量)。193A(见附件2)是将1300多名病人随机地分为4组,每组按下述4种疗法中的一种服药,大约每隔8周测试的CD4浓度(这组数据缺HIV浓度,它的测试成本很高)。4种疗法的日用药分别为:600mgzid.或400mgdid.,这两种药按月轮换使用;600mgzid.加2.25mgzal.;600mgzid.加400mgdid.;600mgzid.加400mgdid.,再加400mgnev.。请你完成以下问题:(1)利用附件1的数据,预测继续治疗的效果,或者确定最佳治疗终止时间(继续治疗指在测试终止后继续服药,如果认为继续服药效果不好,则可选择提前终止治疗)。(2)利用附件2的数据,评价4种疗法的优劣(仅以CD4为标准),并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间。(3)艾滋病药品的主要供给商对不发达国家提供的药品价格如下:600mgzid.1.60美元,400mgdid.0.85美元,2.25mgzal.1.85美元,400mgnev.1.20美元。如果病人需要考虑4种疗法的费用,对(2)中的评价和预测(或者提前终止)有什么改变。附件1ACTG320数据同时服用3种药物的300多名病人每隔几周测试的CD4和HIV的浓度。第1列是病人编号,第2列是测试CD4的时刻(周),第3列是测得的CD4(乘以0.2个/ml),第4列是测试HIV的时刻(周),第5列是测得的HIV(单位不详)。PtIDCD4DateCD4CountRNADateVLoad23424017805.523424422843.923424812684.723424251712542342440994052342501405.32342546242.423425911093.72342523122232.62342540320附件2193A数据1300多名病人按照4种疗法服药大约每隔8周测试的CD4浓度。第1列是病人编号,第2列是4种疗法的代码:第3列是病人年龄,第4列是测试CD4的时刻(周),第5列是测得的CD4,取值log(CD4+1).ID疗法年龄时间Log(CD4count+1)1236.427103.13551236.42717.57143.04451236.427115.57142.77261236.427123.57142.83321236.427132.57143.21891236.4271403.04452447.846703.06812447.846783.89182447.8467163.97032447.8467233.61092447.846730.71433.33222447.8467393.0910CD4大致有先增后减的趋势,HIV有先减后增的趋势,启示应建立时间的二次函数模型问题(1)利用附件1的数据,预测继续治疗的效果,或者确定最佳治疗终止时间。分析数据如随机取20个病人,画出他们CD4和HIV浓度随时间变化的图形(折线),若先用一次模型,应与二次模型做统计分析比较01020304050600100200300400500600700CD4010203040501.522.533.544.555.566.5HIV1)总体回归模型用全部数据拟合一个模型,如yij=b0+b1tij+b2tij2,tij,yij分别为第i病人第j次测量的时间和测量值(CD4或HIV)或者测量值与初始值之比,用数据估计b0,b1,b2建立模型有以下形式的回归模型(一次与二次模型比较,二次较优):对HIV,b20,b10,t=-b1/2b2达到最小对CD4,b20,b10,t=-b1/2b2达到最大平均地应在25~30(周)CD4达到最大,HIV达到最小,可以合理确定结束治疗时间。可对CD4统计b2i0,b1i0(存在正最大点)及b2i0(不存在最大点)的频率,对HIV统计b2i0,b1i0(存在正最小点)及b2i0(不存在最小点)的频率,分别作为及时结束治疗与继续治疗的概率(一般分别为0.6~0.8以及0.2~0.3);也可用它们的均值和均方差在确定分布下计算这些概率。2)个人回归模型用每个病人的数据拟合一个模型,如yij=b0i+b1itij+b2itij2,计算b0i,b1i,b2i的均值和均方差,用均值可得CD4的最大点和HIV的最小点,一般为20-30周。3)分段时序模型对yij用j以前的资料如y(i,j-1),t(ij)-t(i,j-1),j-1段的斜率等为变量建立模型(j=3,4,5,6),由数据估计系数,预测yij,然后对CD4统计预测的yij大于实际的y(i,j-1)的频率,对HIV统计预测的yij小于实际的y(i,j-1)的频率,由此得到应终止治疗的时段。将模型2)yij=b0i+b1itij+b2itij2的系数分解:bki=固定效应参数bk+随机效应参数ik(k=0,1,2),设ik服从零均值正态分布,利用极大似然估计可以得到bk的估计值及ik的方差。4)纵向数据回归模型(处理这类问题的专门方法)bk的估计值用于计算CD4的最大点和HIV的最小点,它与ik的方差一起可以在正态分布假定下计算及时结束治疗与继续治疗的概率。如果考虑病人初始状态(t=0时的CD4和HIV)的不同对模型的影响,可以将模型中的yij定义为第i病人第j次测量的CD4(或HIV)与初始值之差或之比。或者先按照病人初始状态分类(如轻度、中度、重度),然后对于每一类建立回归模型。建立模型几点注意:(1)建立几种模型相互比较、验证者较优。(2)不能只有模型,不做统计分析;对模型结果进行统计分析,考虑与数据拟合程度、注意去除异常数据者较优。(3)注意到有一些数据是当出现CD4下降、HIV上升就及时结束的,并做出适当考虑者较优。(4)注意到题目中“艾滋病治疗的目的,是尽量减少人体内HIV的数量,同时产生更多的CD4,至少要有效地降低CD4减少的速度”,并对结果做出适当考虑者较优。问题(2):利用附件2的数据,评价4种疗法的优劣,并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间。对于每种疗法随机取20个病人,画出他们CD4随时间变化的图形(折线),可以看出疗法1~3的CD4基本上水平,略有下降,而疗法4有先增后减的趋势。启示应建立时间的一次与二次函数模型,经统计分析比较,确定哪种较优。分析数据1)可以引入4(或3)个0-1变量表示4种疗法建立统一模型,或者对每种疗法各建立一个模型(一般来说前者较优)。1.回归模型方法以总体回归模型为例,只需增加年龄变量,分别用一次与二次时间函数模型进行比较,可知疗法1~3用一次模型较优,且一次项系数为负,即CD4在减少,从数值看疗法3优于疗法2和1;疗法4用二次模型较优,即CD4先增后减,在t=20左右达到最大.建立模型做疗法有无显著性差异的两两比较:用1个0-1变量构造两种疗法的统一模型,可以用t检验作回归系数是否为零的假设检验。结果是疗法1与2无显著性差异,而疗法1与3,2与3,3与4均有显著性差异。2)假设检验疗法是必选的因素,如果还考虑年龄和初始状态,用双因素分析则比较复杂,可以先按这些因素分类,再做疗法的单因素分析。3)方差分析1)数据分析考虑到治疗的效果与患者的年龄有关,将患者按年龄分组,如14~25岁,25~35岁,35~45岁及45岁以上4组。每组中按照4种疗法和4个治疗阶段(如0~10周,10~20周,20~30周,30~40周),构造16个决策单元。取4种药品量为输入,治疗各个阶段末患者的CD4值与开始治疗时CD4值的比值为输出。2.线性规划模型方法2)建立模型利用相对有效性评价方法,建立分式规划模型并经过变换,转化为线性规划模型求解,对各年龄组患者在各阶段的治疗效率进行评价。计算结果:对第1年龄组疗法2和4在整个治疗中效率较高,在第4阶段仍然有效;对第2年龄组疗法1在第1,2阶段有效;对第3年龄组疗法1,2,3在第1阶段有效;对第4年龄组疗法1,2在第1,2阶段有效。表明只有14~25岁的年4种轻患者,才能在治疗的最后阶段仍然有有效的疗法。注:由线性规划模型的对偶形式建立预测模型,对各年龄组各种疗法下一阶段的疗效进行预测。若由某决策单元得到的实际输出大于预测输出,则该决策单元相对有效;反之,说明该种疗法对该组患者在治疗的未来阶段不再有效,应该转换疗法。问题(3):如果病人需要考虑4种疗法的成本,对(2)中的评价和预测(或者提前终止)有什么改变。根据提供的价格疗法1~4每天的费用分别为:1.60(取最大),3.45,2.45,3.65,显然若经济允许应采用疗法4,否则可设定包含疗效和费用的决策函数,进行决策。考虑费用的线性规划模型将问题(2)中的输入改为4种疗法的费用,计算结果是疗法2的效率大大降低,而疗法4对第1年龄组仍然是最有效的;疗法1对其它年龄组有效且费用低。可以类似地建立预测模型,并进行预测。论文中出现问题的评析1.只做数据拟合,不做统计检验。用回归分析方法做统计检验:得到的模型有无显著意义,它的置信度多大,用它作预测时准确程度如何。最小二乘拟合:已知一组数据(xk,yk),k=1,2,…,n和一个形式已定、参数待定的模型(曲线)y=f(x,),确定参数使数据与模型在误差平方和最小的意义下拟合得最好。有现成的计算公式和软件确定参数x0123456789y1.041.221.381.591.801.992.212.392.652.83z0.280.612.192.562.491.173.171.292.113.27y=a1x+b1=0.2013x+1.0040z=a2x+b2=0.2025x+1.0025两个模型的结果一样,但是可靠性和准确性一样吗?需要做统计检验!简例最小二乘拟合yxzx决定系数R2F值p值剩余方差2a的置信区间b的置信区间y=a1x+b10.998552940.00010.0006[0.1950,0.2077][0.9699,1.0381]z=a2x+b20.35284.3610.07020.7761[-0.0211,0.4262][-0.1915,2.1966]•R2=0.3528~在z的变化中只有35%是由x决定的•p值大于0.05~在常用的置信度=5%下该模型没有显著意义•a2的置信区间包含零点~a=0落在置信水平为95%的区间内若x=5.5预测区间y:[2.0621,2.1606],z:[0.3899,3.8432],预测值y=2.1113,z=2.1165z的预测没有什么价值!2.对原始数据先取平均,再用平均值做拟合数据中大多数病人的测试时间是0,4,8,…(周),个别病人是5,7,…(周),为了得到CD4(或HIV)的变化趋势,先在每个时间点上对CD4取平均,再用平均值做
本文标题:2010暑期数学建模培训-2006B艾滋病疗法的评价及疗效的预测
链接地址:https://www.777doc.com/doc-3043737 .html