您好,欢迎访问三七文档
一.摘要艾滋病是当前人类社会最严重的瘟疫之一,虽然有一些针对艾滋病的疗法,但迄今为止还没有关于这些疗法疗效的评价和预测方法,因此合理评价艾滋病疗法及预测其疗效有着重要的意义。本文就艾滋病治疗问题经过合理的假设,严密的理论推导,科学的建模求解及实际验证,理论联系实际,得到较为理想的结论:在处理问题(1)时:我们通过做出散点图和前十个患者的CD4含量指标判断大概走势,接着利用曲线拟合方法,建立了模型一,给出了CD4含量的变化趋势曲线。得到了25周左右停药的结果。在处理问题(2)时:考虑利用哑变量法,以疗法四为基本,用带参数的假设检验,列出Log(CD4count+1)关于周期的函数2301122334455678yxxxxxttt运用哑变量法(也称虚拟变量)结合最小二乘法对参数进行求解。再通过做出函数图像,求出均值比较和作显著性判断,侧面验证了疗法四的疗效是最好的。在考虑疗法与花费两个维度的问题(3)时,我们决定用层次分析,通过层析分析法进行模型的建立:1.设立里三个层次分别为:疗法选择,疗效和价格,四种疗法;2.然后从第二层开始,用互反成对比较矩阵法和1-9比较尺度构造互反成对比较矩阵;3.进而利用一致性指标,计算权向量并做一致性检验;最后得出疗法一为最优。在得出方法一为最优后模仿问题(2)中的哑变量法,仍然以疗法四位标准,以单位时间内下降的CD4浓度为指标,求得123,比较后得到相同的结果,增强了疗法一的可信度。关键词:曲线拟合显著性判断散点图哑变量法互反对称比较矩阵二.问题重述艾滋病病毒通过破坏人的免疫系统,使人体丧失各种疾病的抵抗能力,吞噬了近3000万人的生命,令人遗憾的是,迄今为止人类还没有找到能够根治AIDS病毒的疗法或者特效药,现如今的医疗手段只能是尽量减少病人体内的HIV病毒的数量,同时产生更多的CD4,至少降低CD4减少的速度,以提高人体的免疫力。现得到了美国医疗试验机构公布的两组数据,附件一是300多名同时服用zidovudine(齐多夫定),lamivudine和indinavir三种药物的病人每隔几周测得CD4和HIV的浓度。附件二是1300多名病人分成四组按不同疗法治疗后测得CD4的浓度。四种疗法分别是600mgzidovudine或400mgdidanosine(去羟基苷),这两种药按月轮换使用;600mgzidovudine加2.25mgzalcitabine(扎西他滨);600mgzidovudine加400mgdidanosine;600mgzidovudine加400mgdidanosine,再加400mgnevirapine(奈韦拉平)。需要解决的问题:(1)利用附件1的数据,预测继续治疗的效果,或者确定最佳治疗终止时间(继续治疗指在测试终止后继续服药,如果认为继续服药效果不好,则可选择提前终止治疗)。(2)利用附件2的数据,评价4种疗法的优劣(仅以CD4为标准),并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间。(3)艾滋病药品的主要供给商对不发达国家提供的药品价格如下:600mgzidovudine1.60美元,400mgdidanosine0.85美元,2.25mgzalcitabine1.85美元,400mgnevirapine1.20美元。如果病人需要考虑4种疗法的费用,对(2)中的评价和预测(或者提前终止)有什么改变。三.实验假设1、一种疗法测试的病人每天服药的时间和药量都严格一致。2、排除特殊体质对HIV病毒不治而愈的可能性3、病人在测试期内被体外HIV病毒感染的概率为0。4、患者体内除HIV病毒外,没有其他入侵CD4细胞的病毒。5、HIV病毒只入侵CD4细胞,而不再入侵其它细胞。6、药物进入体内后只与HIV病毒和CD4细胞相作用。7、疗法的费用在测试时间内保持不变。8、药物的供应量充足,即不会出现供不应求的情况。9、病人均积极配合治疗。10、假定题目要求研究的测试期为40周。四.主要变量符号说明:均值2:方差y:Log(CD4count+1)ix:哑变量参数i:哑变量系数t:测量时间(周)A:选择疗法1B:疗效2B:花费1~4C:疗法一,二,三,四:特征向量max:最大特征值CI:一致性指标RI:随机一致性指标CR:一致性比率五.模型建立1.关于问题一模型的建立:我们首先将附件一中的数据利用EXCEL进行处理,将数据汇总之后,将同一周进行测试的病人的CD4和HIV的含量指标取平均值(数据见附录1)。根据得出来的数据,以测试时间为横坐标,得出来的指标平均值为纵坐标,我们绘制出了散点图如图1.1:图1.1显而易见的是有一些离群点,我们通过假设样本服从正太分布,计算整个样本的均值和方差2,筛除3,3以外的奇异点后求均值拟合曲线得到图形二,再任取前面10名病人的每隔几周测得的CD4浓度与CD4测试时间的函数图像如下:图1.2经过分析后我们决定分别用一,二,三次曲线进行拟合,由此也顺理成章地得到了模型一1.1模型一图1.31.11检验模型一:模型一的优点是保存了大部分的原始数据,比较全面。然而我们在检验中发现拟合度偏低,而且更为不尽如人意的是显著性系数太高,明显偏离实际。模型汇总和参数估计值因变量:VAR00002方程模型汇总参数估计值R方Fdf1df2Sig.常数b1b2b3线性.0191.066154.306116.736.538二次.029.797253.456104.6391.931-.025三次.031.554352.648110.051.582.036-.001自变量为VAR00001。表1.11经过分析后得,原因可能是部分个案测试CD4的时刻(周)太少,比如原数据中测试CD4的周数为17的个案只有一个,而且测得的CD4浓度为零,偏离实际较大,由此我们又考虑通过筛选找到测试CD4某一个案足够多,足够稳定的时刻进行曲线拟合,再考虑整个样本服从正太分布删除了期望加减三倍标准差以外的值,进而得到模型二:1.2模型二图1.21由此得到的模型二拟合度得到了较大的提高。1.21检验模型二模型汇总和参数估计值因变量:均值方程模型汇总参数估计值R方Fdf1df2Sig.常数b1b2b3线性.2596.287118.022126.1791.322二次.55210.488217.00194.7707.172-.138三次.5707.074316.00383.96410.929-.368.004自变量为CD4Date。表1.211测得的显著性系数也明显小于0.05,显著性较为明显。由模型汇总求得二次曲线拟合方程为:20.1387.17294.770xx,其最大值的横坐标为25.9855。最佳治疗终止时间为25.9855周。而三次曲线拟合方程为320.0040.36810.92983.964xxx,其最大值的横坐标为25.2174。最佳治疗终止时间为25.2174周。2.关于问题2的模型建立:为了便于判断疗法一,二,三,四的优劣,我们考虑以其中一种疗法为基准,计算出其他的疗法相对于第一种疗法的区别,进行优劣比较。2.1模型三关于问题2我们考虑以方法第四种疗法为基本,采用带参数的假设检验,列出Log(CD4count+1)关于周期的函数2301122334455678yxxxxxttt运用哑变量法(也称虚拟变量)即:在采用第四种疗法的时候123xxx都取零,在采用第三种疗法的时候12xx取零,3x取一;以此类推。之后再结合最小二乘法进行参数估计,得到0到8。由此我们的模型三便横空出世了:Matlab代码见附件一:运行之后求得0到8的值为:0=3.1901326060588961=-0.2606153260749242=-0.2190320508740703=-0.1001569144841704=-0.4403342424050995=-0.1461562247714566=0.0238440488884127=-0.0018302342973348=0.000026912747867又由上面的数据可知:123均小于0,易知第四种疗法最佳。2.11对模型三的检验:通过对上面的模型三,导出一,二,三,四疗法的函数图像如下:图2.221不同疗法在相同年龄段下只有疗法四中Log(CD4count+1)的值最大,而且对每个年龄段的影响相当,故而疗法四最有效。鉴定完毕。随后再对疗法一到四利用SPSS计算均值之后进行一对一比较得到如下数据:疗法因变量:LogCD4count1疗法均值标准误差95%置信区间下限上限12.751.0312.6912.81122.800.0302.7402.85932.911.0302.8512.97043.020.0302.9613.078再对其进行一一比较:多个比较因变量:LogCD4count1(I)疗法(J)疗法均值差值(I-J)标准误差Sig.95%置信区间下限上限LSD12-.049046.0430305.254-.133404.0353133-.159813*.0430049.000-.244121-.0755054-.268784*.0426894.000-.352474-.18509421.049046.0430305.254-.035313.1334043-.110767*.0429010.010-.194872-.0266634-.219739*.0425848.000-.303223-.13625431.159813*.0430049.000.075505.2441212.110767*.0429010.010.026663.1948724-.108971*.0425589.010-.192405-.02553741.268784*.0426894.000.185094.3524742.219739*.0425848.000.136254.3032233.108971*.0425589.010.025537.192405Bonferroni12-.049046.04303051.000-.162616.0645253-.159813*.0430049.001-.273316-.0463104-.268784*.0426894.000-.381455-.15611421.049046.04303051.000-.064525.1626163-.110767.0429010.059-.223996.0024614-.219739*.0425848.000-.332133-.10734431.159813*.0430049.001.046310.2733162.110767.0429010.059-.002461.2239964-.108971.0425589.063-.221297.00335541.268784*.0426894.000.156114.3814552.219739*.0425848.000.107344.3321333.108971.0425589.063-.003355.221297基于观测到的均值。误差项为均值方(错误)=1.153。*.均值差值在.05级别上较显著。也从侧面印证了疗法四疗效最好。3.关于问题3的模型建立:对于相对富裕的患者,疗效当然是最重要的,谁都知道生命的宝贵;然而对于一些相对比较贫困的患者而言,与其为了延长自己已是日薄西山的生命,让亲戚朋友承担过重的医疗费用,到不如选择保守,经济的疗法,既能最大程度上延长自己的生命,又不会给留在世上的家人留下太大的经济负担。所以,在问题3中将药品价格纳入考察范围,当考虑的因素为多个时,我们自然而然地想到了层次分析,通过层析分析法进行模型的建立:4.设立里三个层次分别为:疗法选择,疗效和价格,四种疗法;5.然后从第二层开始,用成对比较法和1-9比较尺度构造互反成对比较矩阵;6.进而利用一致性指标,计算权向
本文标题:数学建模论文一
链接地址:https://www.777doc.com/doc-3221419 .html