您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据库 > NCBI所有数据库简介
美国国家生物技术信息中心(NationalCenterofBiotechnologyInformation)唐志立它的使命包括四项任务:1.建立关于分子生物学,生物化学,和遗传学知识的存储和分析的自动系统2.实行关于用于分析生物学重要分子和复合物的结构和功能的基于计算机的信息处理的,先进方法的研究3.加速生物技术研究者和医药治疗人员对数据库和软件的使用。4.全世界范围内的生物技术信息收集的合作努力。文献Literature书库BooksNCBI的书库不断收集生物医学方面的书籍,提供这些书籍的出版信息,摘要,目录和全文的链接,用户可以直接在检索文本框输入一个观念就可以查询。医学主题词表MeSHMedicalSubjectHeadings)是NLM美国国家医学图书馆为PubMed用于索引文章。控制词汇的同义词典=agQ4kAJ3_2rYUuE02sR56wgn5PQjeRUDw5K0JT_acSlA7tk6E-JkxH-o5xLFgMz5_O4n0H01IzprV77l9rBnQK美国国家医学图书馆目录NLMCatalogNLMCatalog为藏书超过130万册的美国国立卫生图书馆(NLM)记录设立目录信息,包括杂志、图书、手稿、计算机软件、录音文件和其它电子资源。每一条记录都可链接到NLMLocatorPlus和具有相近题目或MeSH词汇的相关文件目录信息。PubMedPubMedPubMed是一个免费的搜寻引擎,提供生物医学方面的论文搜寻以及摘要。公共医学中心PubMedCentralPubMedCentral(PMC)是美国国立卫生研究院提供的一项服务,存档生物医学,生命科学科研文献,PMC获得NLM(NationalLibraryofMedicine)的授权,收录存档生物/医学文献,以电子副本的形式储存.PMC与2000年2月份启动,目前由NCBI(NLM'sNationalCenterforBiotechnologyInformation)负责开发与维护.基因Genes表达序列标记ESTEST(ExpressedSequenceTags):EST数据库收录了GenBankEST中的所有数据和没有生物学注释信息的“单分子识别首次通过(first-passsingle-read)”的cDNA序列。EST是从一个随机选择的cDNA克隆进行5’端和3’端单一次测序获得的短的cDNA部分序列,代表一个完整基因的一小部分,在数据库中其长度一般从20到7000bp不等,平均长度为360±120bp。EST来源于一定环境下一个组织总mRNA所构建的cDNA文库,因此EST也能说明该组织中各基因的表达水平。基因GeneGene数据库为用户提供基因序列注释和检索服务,还会链接到NCBI的MapViewer、EvidenceViewer、ModelMaker、BLASTLink(Blink)、proteindomainsfromtheConservedDomainDatabase(CDD)等数据库资源以及其它与基因相关的资源。EntrezGene数据库收录了来自5300多个物种的430万条基因记录。基因表达文库数据集GEODataSetsGeneExpressionOmnibusDataSetsGEODataSets储存由GeneExpressionOmnibus(GEO)repository(资源库)中得来的基因表达以及分子丰富性的数据。GEODataSets:GEO数据库(收录整个试验的数据)基因表达文库概况GEOProfilesGEOProfiles储存单独的由GeneExpressionOmnibus(GEO)repository中得来的基因表达以及分子丰富性的数据。GEOProfiles数据库(它负责收录一个基因在一次试验中的定量基因表达数据)HomoloGeneHomoloGeneHomoloGene数据库是一个在20种完全测序的真核生物基因组中自动检索同源基因的系统,包括直系同源与旁系同源。HomoloGene的结果报告包括基因同源性和来自OMIM、小鼠基因组信息学(MouseGenomeInformatics,MGI)、斑马鱼信息网络(ZebrafishInformationNetwork,ZFIN)、酵母基因组数据库(SaccharomycesGenomeDatabase,SGD)、直系同源基因簇(ClustersofOrthologousGroups,COG)和果蝇数据库(FlyBase)的基因表型信息。HomoloGene下载功能能下载HomoloGene中的转录体、蛋白质和基因组序列信息,还能下载基因组中特定基因的上游和下游序列。PopSetPopSet包含研究一个人群、一个种系发生或描述人群变化的一组组联合序列。PopSet既包含核酸序列数据又包含蛋白质序列数据。唯一基因数据库UniGeneunigene是UniversalGene的英文缩写,意为广泛通用的基因数据库,通过电脑对相同基因座(Locus)的收集整理集合形成一个非冗余的基因数据库。健康HealthClinVarClinVar到目前为止、在遗传变异和临床表型方面,NCBI和不同的研究组已经建立了各种各样的数据库,数据信息相对比较分散,ClinVar数据库的目的在于整合这些分散的数据、将变异、临床表型、实证数据以及功能注解与分析等四个方面的信息,通过专家评审,逐步形成一个标准的、可信的、稳定的遗传变异-临床表型相关的数据库基因型和表型数据库dbGaP是国立卫生研究院赞助的用于归档、精选和发布由调查基因型和表型间相互作用的研究所产生的信息的数据仓库。dbGaP中的信息是以层次结构组织的,包含登记的主体,表型(作为变量和数据集),各种分子实验数据(SNP和表达阵列数据,序列和表观基因组标记),分析和记录。有关提交研究的公开可访问的元数据,摘要水平数据和与研究相关的文档能够在dbGaP网站免费访问。来自全世界的科学家能够通过受控访问应用访问个体水平数据。GTRGTRTheGeneticTestingRegistry,基因检测注册表(GTR®)为自愿提供基因测试信息提供一个中央位置。范围包括测试的目的,方法,有效性,测试的有用性的证据,和实验室的接触和凭据。总体目标GTR是推进公共卫生和研究健康与疾病的遗传基础。MedGenMedGen组织与人类医学遗传学相关的信息,如遗传因素的属性条件孟德尔人类遗传OMIMon-lineMendelianinheritanceinman联机孟德尔人类遗传数据库;持续更新的关于人类基因和遗传紊乱的数据库。主要着眼于可遗传的或遗传性的基因疾病,包括文本信息和相关参考信息、序列纪录、图谱和相关其他数据库。PubMedHealthPubMedHealthPubMed健康为消费者和临床医生提供信息在预防和治疗的疾病。PubMed健康专门从事临床疗效研究的评论,与消费者易读的总结以及完整的技术报告。临床疗效研究发现回答这个问题“什么作品?“在医学和卫生保健。蛋白质类Proteins保守结构域ConservedDomainsConservedDomainDatabaseCDD保守结构域数据库是关于蛋白质功能单元注释的资源。它的域模型收藏包括一套来自NCBI,利用三维结构洞察序列/结构/功能的关系。ProteinProtein一个综合来自其他资源中的蛋白序列集合,包括GenBank,RefSeq,TPA,SwissProt,PIR,PDB中的序列蛋白质聚类数据库ProteinClustersProteinClusters(蛋白质聚类数据库)收录了由完整的原核生物基因组和叶绿体基因组编码的28万多条已确认的RefSeq蛋白质序列,并将这些序列按照分类学的规则进行了归类(聚类)。NCBI可以将这些蛋白质聚类信息用于基因组范围内的比对,也可以用于简化的BLAST——简单的微生物蛋白BLAST(ConciseMicrobialProteinBLAST,)比对之用。蛋白聚类数据库还包括注释信息、出版信息、结构域和结构信息、相关库外链接和分析工具(例如多序列比对工具和系统发生分析工具)信息等。蛋白质聚类数据库还通过GenomeProtMap()与其它基因组数据库有链接。结构Structure即结构数据库或称分子模型数据库(MMDB),包含来自X线晶体学和三维结构的实验数据。MMDB的数据从PDB(ProteinDataBank)获得。NCBI已经将结构数据交叉链接到书目信息、序列数据库和NCBI的Taxonomy中运用NCBI的3D结构浏览器和Cn3D,可以很容易地从Entrez获得分子的分子结构间相互作用的图像。基因组Genomes组装Assembly基因组序列拼接组织和附加信息.提供稳定的访问和数据的基因组装配数据跟踪。底层数据库的模型,可以容纳的装配结构,包括无序重叠或支架序列集,细菌的基因组组成的一个完整的染色体,或复杂的结构,如人类基因组等位基因变异模型。该数据库提供了一个程序集和版本,以明确确定一组序列,构成一个特定版本的组件,并跟踪变化,以更新的基因组组件。BioProjectBioProjectBioProject是生物数据的集合相关的一个倡议,来自一个组织或联盟。BioProject记录为用户提供一个为生成项目找到到链接到不同的数据类型地方。随着NCBI中归档的数据集的量和复杂性的快速增加,对收集和组织相关元数据的需求也在快速增加。尽管以前已经为一些归档数据库收集了元数据,但是在NCBI没有集中的方式收集这些信息,并跨数据库使用它们。最近建立了BioProject数据库以促进提交到NCBI、EBI和DDBJ数据库的项目数据的组织和分类。它捕获有关研究项目的描述性信息,导致到归档数据库的大量提交,将跨多个归档的相关数据整合在一起,并充当了一个中心入口,通过该入口告知用户数据的可用性。附随地,正在开发BioSample数据库以捕获有关项目中研究的生物样品的描述性信息。BioProject和BioSample记录链接到存储在归档数据库中的相应数据。支持通过一个基于网络的SubmissionPortal(提交入口)进行提交,它通过一系列表格以输入描述他们的项目和样品的丰富元数据指导用户。总之,这些数据库提供了NCBI归档数据库中大量数据的改善的用户查询、定位、整合和解释方式。生物样品BioSampleBioSample数据库包含用于实验分析中关于生物材料描述克隆Clone克隆数据库是一个集克隆和库信息的数据库,包括序列数据、地图位置和分发信息。它取代了前NCBI克隆注册表。dbVardbVardbvar是NCBI数据库中关于基因组结构变异–包括插入、缺失、重复、倒置,替换,移动元件插入易位,和复杂的染色体重排表观基因组学Epigenomics从我们收集不同的数据集的表观基因组图谱,探讨,观点,和下载DNA和组蛋白修饰图谱。基因组Genome即基因组数据库,提供了多种基因组、完全染色体、Contiged序列图谱以及一体化基因物理图谱。基因组概览序列GSSGSS(GenomeSurveySequences):收录了没有生物学注释信息的单分子识别首次通过的基因组序列。核苷酸Nucleotide该数据库由GenBank、DDBJEMBL三部分数据组成。所有已知的核苷酸及蛋白质序列与之相关的生物学信息参考文献探针数据库ProbeProbedatabase(探针数据库)是一个公共的核酸试剂数据库,它可以提供试剂信息、销售厂家信息、探针有效性信息,还可以计算序列相似性。该数据库储存了960万条探针序列,这些探针可以分为31大类,包括用于基因分型的探针、发现SNP的探针、基因表达探针、基因沉默探针、基因测序探针等
本文标题:NCBI所有数据库简介
链接地址:https://www.777doc.com/doc-2071824 .html