您好,欢迎访问三七文档
BiophysicsandComputationalBiology生物物理與計算生物NationalCentralUniversity國立中央大學物理系李弘謙ComputationalBiologyLaboratory計算生物實驗室CBL@NCU2002January24TheHumanGenomeProject人類基因工程•1988美國(國家衛生院與能源部)開始•目標–給人類及其他重要生物基因體排序–發展其他相關科技–注意相關倫理、法律、社會問題•預計2005年完成人類基因體排序CBL@NCU排序完成的基因序列近年以爆炸性成長(Asof2002January13)MillionsofbasepairsofDNAMillionsofsequences排序完成的基因序列近年以爆炸性成長CBL@NCU人類基因工程的公眾智慧財產原則•智慧財產屬於公眾•工程中所取得的數據以及相關資訊快速上載於互聯網的資料庫中•無約束供任何人下載有電腦、能上網就可以作研究CBL@NCU已完成排序的大基因體1995-2005–About~100bacterialgenomes;細菌0.5-9Mb;hundredsto2000genes1996April–Yeast(Saccharomycescerevisiae)12Mb,5,500genes酵母1998Dec.-Worm(Caenorhabditiselegans)97Mb,19,000genes線蟲2000March-Fly(Drosophilamelanogaster)137Mb,13,500genes果蠅2000Dec.-Mustard(Arabidopsisthaliana)125Mb,25,498genes芥末2000June–Human(Homosapiens)1stroughdraft2001Feb15/16–Human,“workingdraft”人類3000Mb,35,000~40,000genes老鼠、稻米、虐原蟲、還有許多已完成排序的大基因體CBL@NCU人類基因序列在2001年2月完成排序初稿CBL@NCU基因組(Genome)–四種“字母”編成的生命書DNA-兩條大分子串形成的雙螺旋四種大分子-A,C,G,T大分子串-四種“字母”編成的文章基因組–染色體所有的DNACBL@NCU研究現代生命科學的三種方法•invivo在活體裡•invitro在試管中•insilico在電腦中CBL@NCU在電腦中研究生命科學“Itismucheasiertoteachbiologytopeoplefromamath,physicsorcomputer-sciencebackgroundthantoteachabiologisthowtocodewell.”-Nature,February15,2001,p963LifeScienceinsilico用電腦研究生命科學[biology]生物+[computer-science]電腦+[math&physics]數理CBL@NCU•資訊–大量生命序列數據存在網路資料庫中–DNA序列、蛋白質序列–資料庫軟體、資料採礦、演算法•物理–生命體就是一部巨大又非常複雜的機器–運作法則、系統模型•計算–序列分析(基因認識、分子演化等)–系統模擬計算(蛋白質折疊、藥物設計等)Bioinformatics生物資訊Biophysics生物物理ComputationalBiology計算生物CBL@NCU•生物演化–分子演化、親緣樹、生物共同祖先•基因與疾病–基因晶片、數理分析•蛋白質結構–物理實驗、理論模型、計算模擬•蛋白質(群)組織與功能•疾病預防及治療–基因改良、農作物•藥物設計–蛋白質與大分子的結合人類基因工程給我們什麼?CBL@NCU•只有極極少數的DNA序列能有生命表現•DNA是演化的執行地•演化是機會主義無頭雞的行走–DNA隨機突變、複製–無孔不入–多數走進死巷•演化的結果常常很奇怪–例:眼睛•生命是基因載體,是演化的試驗場–適者生存、物種淘汰生命的目的是保護基因?CBL@NCUMolecularevolutionandGenomeevolution分子演化與基因組演化生命網路上有取之不盡的生物資訊資料庫1tgctgagaaaacatcaagctgtgtttctccttccccaaagacacttcgcagcccctcttg61ggatccagcgcagcgcaaggtaagccagatgcctctgctgttgccctccctgtgggcctg121ctctcctcacgccggcccccacctgggccacctgtggcacctgccaggaggctgagctgc181aaaccccaatgaggggcaggtgctcccggagacctgcttcccacacgcccatcgttctgc241ccccggctttgagttctcccaggcccctctgtgcacccctccctagcaggaacatgccgt301ctgcccccttgagctttgcaaggtctcggtgataataggaaggtctttgccttgcaggga361gaatgagtcatccgtgctccctccgagggggattctggagtccacagtaattgcagggct421gacactctgccctgcaccgggcgccccagctcctccccacctccctcctccatccctgtc481tccggctattaagacggggcgctcaggggcctgtaactggggaaggtatacccgccctgc541agaggtggaccctgtctgttttgatttctgttccatgtccaaggcaggacatgaccctgt601tttggaatgctgatttatggattttccaggccactgtgccccagatacaattttctctga661cattaagaatacgtagagaactaaatgcattttcttcttaaaaaaaaaaaaaaccaaaaa721aaaaaaaaaaaaaccaaaaaactgtacttaataagatccatgcctataagacaaaggaac781acctcttgtcatatatgtgggacctcgggcagcgtgtgaaagtttacttgcagtttgcag841taaaatgacaaagctaacacctggcgtggacaatcttacctagctatgctctccaaaatg901tattttttctaatctgggcaacaatggtgccatctcggttcactgcaacctccgcttccc961aggttcaagcgattctccggcctcagcctcccaagtagctgggaggacaggcacccgcca1021tgatgcccggttaatttttgtatttttagcagagatgggttttcgccatgttggccaggc1081tggtctcgaactcctgacctcaggtgatccgcctgccttggcctcccaaagtgctgggat1141gacaggcgtgagccaccgcgcccagccaggaatctatgcatttgcctttgaatattagcc1201tccactgccccatcagcaaaaggcaaaacaggttaccagcctcccgccacccctgaagaa1261taattgtgaaaaaatgtggaattagcaacatgttggcaggatttttgctgaggttataag1321ccacttccttcatctgggtctgagcttttttgtattcggtcttaccattcgttggttctg1381tagttcatgtttcaaaaatgcagcctcagagactgcaagccgctgagtcaaatacaaata1441gatttttaaagtgtatttattttaaacaaaaaataaaatcacacataagataaaacaaaa1501cgaaactgactttatacagtaaaataaacgatgcctgggcacagtggctcacgcctgtcaAstretchofgenomefromtheXchromo-someofHomosapien=2276452&db=Nucleotide&dopt=GenBankThecompletegenomehas2,000,000suchPages基因組非常巨大視網膜眼球的視神經在視網膜前拉向眼後時造成盲點奇怪的演化結果:CBL@NCU視網膜受光管光源視網膜:電線向光光管背光CBL@NCUWearehere生命高度多樣性且複雜真細菌真核生物古細菌10億年前20億年前30億年前40億年前WFDoolittle,Proc.Natl.Acad.Sci.USA,Vol.94,pp.12751–12753(1997)最早期的細胞演化CBL@NCU比較蛋白質/DNA序列可找出基因/物種的親緣關係簡化生命樹人類酵母大腸桿菌人類/線蟲/果蠅核受體蛋白質親緣樹CBL@NCU真細菌真核生物古細菌細菌全基因體的“碎形”表示CBL@NCU+北京理論物理所以算核甘出現次數的方法將基因體圖像畫每個基因體的“像”都不一樣有很多方法比較生命序列的異同有很多方法比較生命序列的異同簡化生命樹紅:序列比對法黑:寡核甘酸頻率法真細菌真核生物古細菌CBL@NCU+內蒙古大學我們發現基因組生長的原動力是隨機片段複製Lroot=L/MsisauniversalconstantUniversalityclass(redline)logLroot=ak+B;a=0.398,B=1.61(30%)Redsymbols:Universalgenomegrowthmodelbasedonmaximallystochasticsegmentalduplication.Hasmanyimplicationsinearlyhistoryofgenomesandevolution.Black:genomedata;green:randomsequence;red:modelsequencedata電腦模擬蛋白質結構與功能MoleculardynamicssimulationofProteinStructure&Function蛋白質是最微妙微小的機器•生命的執行者–催化、繁衍、新陳代謝、結構、運動–蛋白質本身的製造–演化競技場的競技者•直徑約五奈米(5x10-9m)–約為頭髮直徑的萬分之一•完全自動–組裝、尋找受體、執行繁雜的任務–完成任務後機器的拆散•每人每天製造及拆散成千上萬個不同的蛋白質•蛋白質不正常導致疾病CBL@NCU蛋白質是一條項鍊折成的機器•項珠是(20種)氨基酸•有特定的形狀–做什麼事、長什麼樣•蛋白質折疊錯誤會導致疾病–狂牛症、艾茲海墨症、帕肯森症•研究蛋白質折疊成形是物理與計算生物的大題目–在10億flop/秒的PC上要算一百萬天HIV逆轉錄脢(562個氨基酸)CBL@NCU以大型分佈計算模擬蛋白質結構與功能MassivelyDistributedComputingandAnNRPGMProjectonProteinStructureandFunctionComputationBiologyLabPhysicsDept&LifeScienceDeptNationalCentralUniversityMulti-temperatureAnnealing(II)clientclientclientclientclientclientclientServerOldtemperaturesSwaptempsbyMultiple“peptide”paralleltemper
本文标题:生物物理与计算生物
链接地址:https://www.777doc.com/doc-294819 .html