您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 生物信息学蛋白质数据库
2013.10重庆医科大学药理教研室:万敬员Email:jywancqmu.edu.cnTel:13629714392蛋白质数据库与蛋白质分析INTRODUCTION生命物质过程核酸蛋白质TheCentralDogma生物信息学(Bioinformatics)是由生物学和信息科学交叉融合形成的。包含生物信息的获取、处理、存储、发布、分析和解释等各个方面,它综合运用数学、生物学、计算机、信息科学等诸多学科的理论方法及国际互联网,阐明和解释大量数据所包含的生物学意义。数据库(DataBase)1.检索工具(RetrieveTool)1.分析软件(AnalysisSoftware)《NucleicAcidsResearch》杂志每年的第一期中详细介绍最新版本的各种数据库。到2013年共有1512个数据库。生物信息学的重要组成:利用在线工具和离线工具分析功能和结构,NCBI和Pubmed等公共数据库美国国家医学图书馆(NLM)的一部分(该图书馆是美国国家卫生研究所NIH的一部分).(美洲)工具:EntrezBLAST2.欧洲生物信息学研究所EuropeanBioinformaticsInstitute,EBI(EMBL)数据库等。1992年由欧盟资助建立在英国的一个非盈利性学术机构,也是生物信息学研究与服务的欧洲中心。(欧洲)工具:SRSFASTA3.日本国立遗传学研究所NationalInstituteofGenetics,NIGDNADataBankofJapan(DDBJ),日本DNA数据库是日本遗传学各方面研究的中心研究机构及生命科学所有领域的研究基地。(亚洲)工具:DBGETSEARCHKEGGNIG建立的日本DNA数据库(DDBJ)、欧洲EBI维护的EMBL核酸序列数据库,以及美国NCBI的GenBank数据库,并列为国际上最著名的三大核酸数据库。三大核酸数据库4.瑞士生物信息研究所(SwissInstituteofBioinformatics,SIB)数据库:SWISS-PROT5.美国国家生物医学基金会(NationalBiomedicalResearchFoundation,NBRF)数据库:PIR6.布鲁克黑文国家实验室(Brookhavennationallaboratory)数据库:PDB7.桑格研究所(WellcomeTrustSangerInstitute)数据库:PFAMBIOINFORMATICSOFPROTEIN一、重要的蛋白质数据库蛋白质序列数据库蛋白质三维结构数据库蛋白质组数据库(二维凝胶电泳数据库)信号传导及蛋白质-蛋白质相互作用相关数据库蛋白质和DNA相互作用数据库ProteinSequenceDatabases(HistoricalOrder)•NationalBiomedicalResearchFoundation(NBRF)=ProteinIdentificationResource(PIR)–MargaretDayhoff–AtlasofProteinSequences–Phylogenies,evolution,aminoacidsubstitutionmatrices(PAM)anddiscoveringactivesitesinenzymes–PIRSFEvolutionaryFamily,iProClassFunctionalsiteanalysisandontologies,iProLinktoliterature–UniProt-UniversalProteinResource•SwissProt(EXPASYsite)–AmosBairoch–Manualcurationandannotation–Highlycross-referenced–Manyusefulanalyticaltools(EXPASYTools)–2D-PAGEandMassSpectrometrydatabases–Prositefunctionalmotifdatabase–UniProt-UniversalProteinResource•TREMBL–TranslationofmRNAs(RefSeq),UniGene,openreadingframes(ORFs)andpredictedgenesfromgenomes–Automaticannotations•EMBL=EBIProteindatabases–Clusters–Interprolinkedtodomainandmotifdatabases(CATH,PANTHER,PRINTs,PROSITE,pFAM,PIRSF,PRODOM,SCOP,SMART,SUPERFAMILY)–Intron-exonstructureandlinkstoORFs,codingregions–UniProt-UniversalProteinResource•NCBIProteinDatabase–ProteinandnrPROdatabaseSwissProt,PIRandtranslatedgenes/genomes–ProteinClustersDatabase(prokaryotic)andCOGSandKOGS–Linkedtocodingregionsandintron/exonstructure–LinkedtocodingSNPsandvariationsdatabases–LinkedtoMMDSBstructuredatabase–Linkedto3Ddomains–LinkedtoCDDConservedDomainDatabase•UCSCProteomeBrowserSWISS-PROT(瑞士日内瓦大学)蛋白质序列数据库(Expasy)包括序列及功能信息、蛋白识别、蛋白质结构预测及其他功能NCBI蛋白质数据库包括所有蛋白质序列,及其翻译产物序列PIR(ProteinInformationResource)蛋白质序列信息资源库(美、德)蛋白质一级结构(序列)数据库2.蛋白质二级结构(预测)数据库蛋白质回环数据库:同源模型数据库:蛋白质预测数据库:(蛋白质序列功能位点数据库):cn.expasy.org/DSSP(DefinitionofSecondaryStructureofProteins,蛋白质二级结构构象参数数据库):(FamiliesofStructuralSimilarProteins)蛋白质家族数据库:(HomologyDerivedSecondaryStructureofProteins,同源蛋白质数据库):蛋白质三级结构数据库PDB(ProteinDataBank)数据库,美国Brookhaven国家实验室管理生物大分子三维空间结构原子坐标数据库NCBISTRUCTUREMMDB(MolecularModellingDataBase)数据库,包含了从PDB获取的实验确定的生物高聚物结构分子模型数据库SWISS-MODELRepository数据库,由瑞士生物信息研究所负责的蛋白质三维结构数据库CATH数据库:CATH(Class,Architecture,TopologyandHomologoussuperfamily)是与SCOP类似的一个数据库。SCOP(Structuralclassificationofproteins)数据库,英国医学研究会(MRC)剑桥分子生物学实验室开发的蛋白质结构分类数据库。包含描述蛋白质域的家族、超家族、折叠、等级等信息。蛋白质晶体学是一门十分活跃的边缘学科,1960年-2012年之间已经有15名蛋白质晶体学家荣获诺贝尔奖。X-射线衍射(X-raydiffraction)和核磁共振(nuclearmagneticresonance,NMR)技术是当前人们认识蛋白高级结构的主要手段,但两种技术都有不足之处。前者要求必需得到高标准的蛋白晶体,后者对分子量大于3万的大蛋白不能测定。英国女化学家多萝西·霍奇金(DorothyHodgkin)在20世纪30年代初通过X射线发现胃蛋白酶拥有完美的晶体,这个里程碑式的发现开启了生物结晶学研究的时代。霍奇金1949年测定出了青霉素的结构,1957年又测定出了维生素B12的结构,并因此获得1964年诺贝尔化学奖。蛋白质三级结构:1988年,在世界上首次解析了一种膜蛋白——紫细菌光合反应中心的高分辨率三维结构,诺贝尔化学。2002年,钾离子通道和水通道的晶体结构,诺贝尔化学奖。2009年,核糖体的晶体结构,诺贝尔化学奖。2012年,Lefkowitz和Kobilka因研究GPCR的结构和功能而获得诺贝尔化学奖2020/3/2821X射线衍射技术在蛋白质分析中的应用蛋白质结构测定:1959年佩鲁茨和肯德鲁用了23年的时间对血红蛋白和肌血蛋白进行了X射线衍射分析,解决了血红蛋白的三维空间结构获得了1962年诺贝尔化学奖。血红蛋白的空间结构血红蛋白的X射线衍射图二、蛋白质数据库检索工具SRS,(SequenceRetrievalSystem)是欧洲分子生物学网EMBnet的主要检索工具,现已直接进入。的主要检索工具,现在可以直接从Pubmed上进入。三、蛋白质分析软件序列相似性分析蛋白质理化性质分析特征序列分析翻译后修饰分析结构功能域分析亚细胞定位分析1.整体相似性序列对比:理论基础是进化学说2.局部相似性序列对比:其生物学基础是蛋白质功能结构域的高度保守性。所以,通过比较分析保守位点上的残基可以对蛋白质的结构和功能进行预测。3.序列两两对比:通常用打分矩阵的方法。即两条序列分别作为矩阵的两维,矩阵点是两维上对应两个序列的相似性分数,分数越高则说明两个序列越相似。常用对比程序BLASTP:多序列对比:是把两条以上可能有系统进化关系的序列进行对比的方法。也可用作同源性分析。目前,使用最广泛的多序列对比程序是CLU
本文标题:生物信息学蛋白质数据库
链接地址:https://www.777doc.com/doc-4611424 .html