您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 生物资讯及网路资源简介
NCKUBINFO©2004生物資訊及網路資源簡介蔡少正國立成功大學醫學院生理所國立成功大學生物資訊中心NCKUBINFO©2004定義:利用電腦輔助資料管理系統從基因體(Genomic)、蛋白質體(proteomics)或藥物篩選資料庫中蒐集、整合、及分析大量的生物序列或資訊。基因資料庫(Genbank)序列資訊快速增加生物資訊學的發展#bpinbillions1231982-2000生物資訊學(Bioinformatics)與人類基因組解讀計劃(HumanGenomeProject)NCKUBINFO©2004•序列資料貯存-(6*106序列檔案/onegenome)*6*200KB/序列檔案•序列資訊整理-BLAST,FASTA….•序列資訊分析-Assembly,repetitivesequence…..•序列功能註解-Genomeannotation,molecularmodeling…生物資訊學的發展NCKUBINFO©2004涵蓋分子生物、資訊工程、統計等學門的新科學計算生物學(computationalbiology):處理生物(序列)資料的科學蘊涵無限寶藏的科學---序列取得、結構分析、功能預測、模擬驗證。生物資訊學的發展NCKUBINFO©2004後基因體分析紀元(Post-genomeEra)功能性基因體(FunctionalGenomics)世代來臨當基因被完全解讀出來後下一階段的目標:組合一個沒有“間隙”(Gap)的染色體圖譜,並且提高序列正確率至99.99%NCKUBINFO©2004---基因註解---基因預測---蛋白質功能研究(proteomics)---單核甘酸多樣性(singlenucleotidepolymorphismsorSNPs)功能性基因體(FunctionalGenomics)辨認所有的基因並瞭解他們的功能:NCKUBINFO©2004DifferenttechnologiesandresourcesintoaproteomicprocessNCKUBINFO©2004LITERATURE(文獻)DATABASESNUCLEOTIDE(核酸)DATABASESPROTEIN(蛋白質)DATABASESENZYME(酵素)DATABASESOTHERTYPE(其他)DATABASES資料庫的類型:依性質區分NCKUBINFO©2004資料庫的類型:依功能區分原始資料庫Genebank,ESTdatabase加值型資料庫初步或未加整理的序列資訊比對、計算、整理只擷取部分有用的資訊加以歸類儲存重複序列資料庫、訊息傳遞因子資料庫(Smartdatabase)實用價值較低具高附加價值NCKUBINFO©2004©2004NCKUBINFO©2004NCKUBINFO©2004SMART-SimpleModularArchitectureResearchToolNCKUBINFO©2004NCKUBINFO©2004NCBINCKUBINFO©2004網路資源vs.套裝軟體網路資源的優缺點優點:-資料庫更新頻繁-介面較易學習,操作容易缺點:-通常功能專一化-資料格式轉換不易-參數預設值無法調整-解讀輸出結果困難NCKUBINFO©2004網路資源vs.套裝軟體套裝軟體的優缺點優點:-容易調整參數預設值-分析功能完整且具多樣化-資料格式統一,不同程式間不需轉換-可提供圖形檔輸出結果缺點:-資料庫更新較不頻繁-指令繁多不易學習NCKUBINFO©2004網際網路上的生物資源SearchEngineBioHunt://infomine.ucr.edu/Pedro'sBiomolecularResearchTools~pedro/research_tools.htmlNCKUBINFO©2004網際網路上的生物資源Databases•Literature-PubMed,Hint,SeqAnalRef,SRS•Sequence-DNA:GenBank/EMBL/DDBJ,UniGene,GDB-Protein:PDB,PIR,PROSITE,SWISS-PORT•Structure-BioMagResBank,SCOP,MMDBNCKUBINFO©2004網際網路上的生物資源Software(DNAannotation)•NucleicAcidConformation-DNA,RNAsecondarystructure•Translation-startandstopcoden,codenusagetable•ORFFinder-promoter,5’and3’UTR,intronandexon•GeneFunctionPrediction-motifandpatternsearchNCKUBINFO©2004網際網路上的生物資源Software(Proteinannotation)•Identificationandcharacterization•DNA-Protein•Similaritysearches•Patternandprofilesearches•Post-translationalmodificationprediction•Primarystructureanalysis•Secondarystructureprediction•Tertiarystructure•Transmembraneregionsdetection•AlignmentNCKUBINFO©2004網際網路上的生物資源Courses陽明大學生化所清華大學生科系中研院生圖國家衛生研究院生物資訊課程國立成功大學醫學院……NCKUBINFO©2004BioinformaticsPackageToolsGCG-TheWisconsinPackage–AccelrysBiocomputationalResearchGenoMaxv3.3–InforMaxLSITM–LionBioscienceNCKUBINFO©2004BioinformaticsPackageToolsLaserGene-DNAStar,Inc.MacVector-OxfordMolecularGroup,Inc.DiscoveryStudioGene-OxfordMolecularGroup,Inc.VectorNTI-Informax,Inc.NCKUBINFO©2004Literature,BibliographyandReferenceDatabasesMedlineMIM(MendelianInheritanceinMan)TaxonomyGeneticodeNCKUBINFO©2004MIM(MendelianInheritanceinMan)NCKUBINFO©2004BrowsingOMIMNCKUBINFO©2004NCKUBINFO©2004NucleotidesequencedatabasesEMBL/Genebank/DDBJContainingeveryindividuallysubmittedprimarysequenceREFSEQProvidenon-redundantcurateddatarepresentingknowledgeofKnowngenesENSEMBLannotatedgenomiccontigsequenceNCKUBINFO©2004TheInternationalNucleotideSequenceDatabaseCollaboration(INSD)TheINSDconsistsofDDBJ(Japan),GenBank(USA)andtheEMBL(UK)NucleotideSequenceDatabase.ThethreedatabasesexhangenewandupdateddataonadailybasistoachieveoptimalsynchronisationNCKUBINFO©2004GenebankNCKUBINFO©2004ProteinsequencedatabasesSwiss-Protacuratedproteinsequencedatabasewhichstrivestoprovideahighlevelofannotation.SpTrEMBLadatabasesupplementingtheSwiss-ProtProteinSequenceDataBank.TrEMBLcontainsthetranslationsofallcodingsequences(CDS)EMBLPIRidentificationandanalysisofproteinsequencesandtheircorrespondingcodingsequencesREFSEQPProteininformationfromREFSEQNCKUBINFO©2004SPTrEMBLNCKUBINFO©2003Primarysequencecouldbefurtheranalysis………Sequencedatabasewithanalyzedannotation(specialpatternfound)AnalysistoolsNCKUBINFO©2004NucleotiderelateddatabasesSpecialpatternofNucleotidesequenceREBASEGenomestructureCPGISLAND,ENSEMBLCPG,LOCUSLINK,MOUSE2HUMANTranscriptionfactorbindingsiteTESS:TFCLASS,TFCELL,TFFACTOR,TFMATRIX,TFSITEGenestructureEPD,TFGENE,UTR,UTRSITE,EMBLALIGNintegrationofgeneexpressionpatternUNIGENEUNILIBNCKUBINFO©2004LocuslinkNCKUBINFO©2004PDBNCKUBINFO©2004二維電泳資料庫NCKUBINFO©20042DGelNCKUBINFO©2004預測人類的基因利用其他物種的基因利用某一染色體上的基因數利用EST資料庫中的序列傳統的方法NCKUBINFO©2004Pfam©2004©2004CGAP©2004NCKUBINFO©2004目前完成之生物資訊平台:1.人類基因體序列搜尋系統(Humangenomeblastserver)2.34種微生物基因體序列搜尋系統3.變異基因資料庫(HGVDatabase)4.單核甘酸多型性(SNP)加值型資料庫以及網頁介面資料輸入及搜尋系統5.表現序列分析系統(ESTanalysissystem)6.南區生物資訊教育選課系統成功大學生物資訊中心
本文标题:生物资讯及网路资源简介
链接地址:https://www.777doc.com/doc-295331 .html