您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 基因组、ORF、CDS、CDNA
开放阅读框(或开放读码框架,openreadingframe,ORF)是DNA上的一段碱基序列,由于拥有特殊的起始密码子和直到可以从该段碱基序列产生合适大小蛋白才出现的终止密码子,该段碱基序列编码一个蛋白。当一个新基因被识别,其DNA序列被解读,人们仍旧无法搞清相应的蛋白序列是什么。这是因为在没有其它信息的前提下,DNA序列可以按六种框架阅读和翻译(每条链三种,对应三种不同的起始密码子)。ORF识别包括检测这六个阅读框架并决定哪一个包含以启动子和终止子为界限的DNA序列而其内部不包含启动子或终止子,符合这些条件的序列有可能对应一个真正的单一的基因产物。ORF的识别是证明一个新的DNA序列为特定的蛋白质编码基因的部分或全部的先决条件。Anopenreadingframe(ORF)isaportionofagene’ssequencethatcontainsasequenceofbases,uninterruptedbystopsequences,thatcouldpotentiallyencodeaprotein.WhenanewgeneisidentifiedanditsDNAsequencedeciphered,itisstillunclearwhatitscorrespondingproteinsequenceis.Thisisbecause,intheabsenceofanyotherknowledge,theDNAsequencecanbetranslatedorreadinsixpossiblereadingframes(threeforeachstrand,correspondingtothreedifferentstartpositionsforthefirstcodon).ORFidentificationinvolvesscanningeachofthesixreadingframesanddeterminingwhichone(s)containsastretchofDNAsequenceboundedbyastartandstopcodon,yetcontainingnostartorstopcodonswithinit;asequencemeetingtheseconditionscouldcorrespondtotheactualsingleproductofthegene.TheidentificationofanORFprovidesthefirstevidencethatanewsequenceofDNAispartorallofageneencodingforaparticularprotein.基因组:在生物学中,一个生物体的基因组是指包含在该生物的DNA(部分病毒是RNA)中的全部遗传信息,又称基因体(genome)。基因组包括基因和非编码DNA。1920年,德国汉堡大学植物学教授汉斯.温克勒(HansWinkler)首次使用基因组这一名词。更精确地讲,一个生物体的基因组是指一套染色体中的完整的DNA序列。例如,生物个体体细胞中的二倍体由两套染色体组成,其中一套DNA序列就是一个基因组。基因组一词可以特指整套核DNA(例如,核基因组),也可以用于包含自己DNA序列的细胞器基因组,如粒线体基因组或叶绿体基因组。当人们说一个有性生殖物种的基因组正在测序时,通常是指测定一套常染色体和两种性染色体的序列,这样来代表可能的两种性别。即使在只有一种性别的物种中,“一套基因组序列”可能也综合了来自不同个体的染色体。通常使用中,“遗传组成”一词有时在交流中即指某特定个体或物种的基因组。对相关物种全部基因组性质的研究通常被称为基因组学,该学科与遗传学不同,后者一般研究单个或一组基因的性质。CDS是Codingsequence的缩写,是编码一段蛋白产物的序列,是结构基因组学术语ORF开放阅读框是基因序列的一部分,包含一段可以编码蛋白的碱基序列,不能被终止子打断。当一个新基因被识别,其DNA序列被解读,人们仍旧无法搞清相应的蛋白序列是什么CDS与开放读码框ORF的区别(1)开放读码框是从一个起始密码子开始到一个终止密码子结束的一段序列;不是所有读码框都能被表达出蛋白产物,或者能表达出占有优势或者能产生生物学功能的蛋白。(2)CDS,是编码一段蛋白产物的序列。(3)cds必定是一个orf。但也可能包括很多orf。(4)反之,每个orf不一定都是cds。(5)Openreadingframe(ORF)-areadingframethatdoesnotcontainanucleotidetripletwhichstopstranslationbeforeformationofacompletepolypeptide.Codingsequence(CDS)-TheportionofDNAthatcodesfortranscriptionofmessengerRNAORF-----translation,CDS----transcriptiontranslation是理论上的,而transcription则显然是事实存在的。cDNA为具有与某RNA链呈互补的碱基序列的单链DNA即complementaryDNA之缩写,或此DNA链与具有与之互补的碱基序列的DNA链所形成的DNA双链EST(ExpressedSequenceTag)表达序列标签—是从一个随机选择的cDNA克隆,进行5’端和3’端单一次测序挑选出来获得的短的cDNA部分序列,代表一个完整基因的一小部分,在数据库中其长度一般从20到7000bp不等,平均长度为360±120bp。由于cDNA文库的复杂性和测序的随机性,有时多个EST代表同一基因或基因组,将其归类形成EST簇(ESTclusteF)mRNA携带遗传信息,在蛋白质合成时充当模板的RNA。ORF序列:即为Openreadingframe,表明这个DNA序列可能是一个基因,但具体的基因编码序列需要其他的内容来补充,因为这一段DNA序列按三联体密码子读可以有六种读法。如果明确这段DNA序列的启动子和终止子序列就可以明确这段序列的氨基酸信息。cDNA序列:互补DNA序列,指的是mRNA为在逆转录酶的作用下将形成DNA的过程。这个DNA即为cDNA序列,它没有内含子和外显子的区别,在原核生物中可以作为一个多肽的编码基因序列,但在真核生物内由于没有内含子,所以它不能完全作为一个多肽的编码基因序列。CDS序列:编码序列,从起始密码子到终止密码子的所有序列。EST序列:表达序列标签。一个多肽链编码基因的短的cDNA序列,平均长度为360±120bp,一般可以作为分子标记使用;当出现EST序列的时候,很可能也就是一个编码基因所在的部位。转录起始位点:基因开始转录的部位,一般具有一些特殊的序列,如Pribnow框盒,其序列为TATAAT;-10序列:-35序列,其保守序列为TTGACA;这些特殊序列的主要作用为:Pribnow框盒:①与RNA聚合酶紧密结合;②形成开放启动复合体;③使RNA聚合酶定向转录。-10序列:影响转录的效率;-35序列:
本文标题:基因组、ORF、CDS、CDNA
链接地址:https://www.777doc.com/doc-2339565 .html