您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 论文-多重PCR引物设计的软件开发
i多重PCR引物设计的软件开发目录第一章引言.....................................................11.1背景知识简介...............................................11.1.1多重PCR引物设计简介...................................11.1.2遗传算法简介...........................................21.2相关文献综述................................................31.3研究目的与成果..............................................41.4本章小结....................................................4第二章问题分析...................................................62.1多重PCR引物设计问题的数学模型..............................62.2载体算法的选择..............................................62.3本章小结....................................................7第三章相关生物学参数简介及其数学模型.............................83.1单个引物的约束参数..........................................83.2引物间的约束参数...........................................113.3本章小结...................................................12第四章引物集评价体系............................................134.1评价体系的数学模型.........................................134.2权值及其约束对象...........................................144.3本章小结...................................................15ii第五章引物设计的遗传算法实现....................................165.1算法结构总览...............................................165.2引物设计问题在遗传算法中的数学表示.........................165.3初始化随机解集.............................................175.4解的评估策略与双亲的选择...................................175.5交叉策略及交叉率的选择.....................................185.6变异策略及变异率的选择.....................................195.7收敛条件...................................................205.8本章小结...................................................20第六章GAPrimer简介.............................................216.1软件功能与特点概述.........................................216.2软件操作结构图.............................................216.3软件默认参表...............................................226.4本章小结...................................................23第七章实验结果及数据分析........................................247.1实验结果:三重PCR引物设计.................................247.2数据分析...................................................247.3本章小结...................................................25第八章总结与展望................................................26参考文献.......................................................27附录...........................................................291第一章引言1.1背景知识简介聚合酶链式反应(PolymeraseChainReaction,PCR)是体外扩增DNA的一种技术;其能够在短时间内根据极微量的模板序列扩增出大量特异性DNA片断,扩增过程类似于核裂变。Mullis博士在1983年发明了该技术,并因此于1993年获得诺贝尔化学奖。PCR技术是现代分子生物学中最有价值的技术之一[1];例如:人类基因组计划,亲子鉴定,对罪犯DNA的鉴别,都依赖于这一技术。在聚合酶链式反应中,原始的DNA片段称为模板序列;待复制的DNA片段称为目标序列,它是模板序列的一部分;引导目标序列合成的寡核苷酸片段称为引物,其长度一般在16-27之间。每个反应一般含20至40个循环,每次循环目标序列含量翻一倍;每个循环由三个主要步骤构成:1.变性(90℃-96℃):双链DNA模板在热作用下,氢键断裂,形成单链DNA;2.退火(25℃-65℃):系统温度降低,引物与DNA模板结合,形成局部双链;3.延伸(70℃-75℃):在Taq酶的作用下,以dNTP为原料,从引物的5′端→3′端延伸,合成与模板互补的DNA链。扩增一段目标序列需要两条引物,分别和目标序列的两端相匹配。引物的作用类似于电路里的开关,引物设计不好会导致产物杂乱无章(即扩增失败),因此引物设计是PCR成功的关键之一。引物设计需要综合考虑引物的退火温度,GC含量,引物长度,特异性等。现有的PCR引物设计软件已经非常成熟,可以达到较好的效果,常用软件有PRIMER3,PRIMER5,OLIGO6.0等。1.1.1多重PCR引物设计简介多重聚合酶链式反应(多重PCR)是指在同一试管中同时进行多个PCR,从而一次性扩增多个目标片段,因此节省了大量的时间和金钱,具有巨大的经济和时间效应。由于引物之间以及引物与模板序列之间的相互干扰,一方面导致了多重PCR引物设计考虑因素增加,另一方面极大地增加了计算的空间和时间复杂度。同时多重PCR引物设计问题需要被当作一个整体考虑,不能被分割为多个PCR引物设计问题的简单组合[2]。现尚2无完善的理论解决这一问题。综上所述,要实现多重PCR引物设计的自动化,在实践中需要解决两个问题:一、多重PCR引物设计的约束条件与评价标准;二、载体算法的选择。1.1.2遗传算法简介遗传算法是一种随机优化算法,用于求解问题的全局最优解,尤其是对非线性问题的全局搜索和最优化。该算法由美国密歇根大学的JohnHolland教授于80年代提出,其借鉴了达尔文优胜劣汰的思想,以及遗传过程中的染色体交叉与变异的概念。虽然遗传算法尚未被完全从理论上证明,但遗传算法已得到比较成熟的发展,并广泛地被成功应用于各类实际问题;Schema定理部分证明了该算法的有效性[3]。遗传算法主要步骤包括初始化,可行解的评估,交叉,变异,和收敛。每个步骤根据问题的性质与规模不同,均有多种策略可以选择。在实践中,要将遗传算法和问题结合需要解决如下几个问题:一、建立问题的数学模型并表示为数据结构;二、初始化策略的选择;三、挑选双亲与交叉策略的选择;四、变异策略的选择;五、收敛条件的选择;六、交叉率,变异率,初始解数目的选择。参见图1.1遗传算法流程图.定义cost函数,定义变量表达式,选择GA参数YesNo初始化可行解集计算cost(即评估可行解)选择双亲交叉变异检查是否收敛结束3图1.1遗传算法流程图1.2相关文献综述由于多重PCR引物设计问题尚未在算法理论上得到完善解决,根据对文献的总结,一方面、国内对引物设计的自动化问题关注较少,鲜有文献记载;国外近几年已提出一些启发性的算法和相应的软件,例如MultiPLX[4][5],但尚无宣称成熟的算法与软件。另一方面、为了满足现实需要国外也有比较成熟的大型系统采用常规的算法,使用大量并行计算机以及较长的时间来为大规模多重PCR设计引物,虽然较好地解决了问题,但这需要以大量的时间和金钱为代价,同时也将应用限制在大规模PCR引物设计问题上。例如日本的PrimerStation,使用了100个CPU(SunFire15K)来为人类全基因扩增问题设计引物,耗时为3个月[6]。在调查总结文献的基础上,本研究选择了遗传算法作为解决问题的载体,具体思路将在第二章中进行阐述。台湾国立中央大学与国立中山大学共有两篇论文运用了遗传算法进行了多重PCR引物设计的研究[7][8];随后由李宗南教授总结后几位作者共同在05年国际遗传算法年会上公开提出用遗传算法来解决多重PCR引物设计这一观点[9]。以上两项工作基本类似,因此共同存在三个较大的问题:首先、虽然作者从计算机专家的角度出发强调了遗传算法的应用,但对生物方面的约束条件未进行详细的调查研究而考虑不周全,甚至存在一些生物概念的误解。例如:退火温度TM是设计引物时关键的约束条件之一,而计算TM时作者使用了60年代提出的理论估算公式:TM=(A+T)+4(G+C),该公式忽略了影响退火温度的许多重要因素,已被实践证明无法准确估算退火温度,甚至无法适应单个PCR引物的设计[2];又例如:作者将引物自互补和发夹结构两个概念误解为同一个,前者是指完全相同的两条引物互补从而产生二聚物,而后者是指一条引物折叠后和自身产生互补从而形成发夹二级结构;其次、作者对多重PCR生物参数部分未做较好的建模从而导致了生物定义上的错误;例如:作者因未定义合理的引物评价制度,从而特异性条件无法满足,所以作者自行提出了二次特异性的概念来使条件得到满足,但这是不合理的;又例如:作者只区分了引物的合不合适,却未分出合适的引物之间的好坏。最后,作者虽然提供了三个范围的输入给用户,但未给用户提供反馈接口,实验者只能被动接受计算结果,而无法将信息反馈到机器中来设计合适的产物;此外、作者未4对遗传算法各参数和各部分未做较好的选择与调整。以上三个问题,前两个问题导致了程序不能成功地设计可以在实际实验中使用的多重PCR引物;最后一个问题导致了用户缺乏自主权,无法按照实际情况主导程序来选择合适的引物。综上所述,以上两项工作将遗传算法与引物设计问题结合从而给出了解决问题的新方法,但由于忽略了问题的实用方面从而导致问题未能实际解决。1.3研究目的与成果工作目的归纳为:开发适用于中、小规模生物实验室的多重PCR引物设计软件;并将研究目的推广为:归纳总结开发多重PCR引物设计软件的一般性思路,提出启发性的方法,并将以上两项付诸实践检验;最后将研究思路概括为:针对性、实用性和一般性。为了开发能够在实际生物实验中使用的应用软件,经调查研究后借鉴了应用遗传算法设
本文标题:论文-多重PCR引物设计的软件开发
链接地址:https://www.777doc.com/doc-4997965 .html