外显子、内含子、mRNA、CDS
1.DNA复制:以DNA为模板,在DNA聚合酶的催化作用下,将四种游离的dNTP按照碱基互补配对原则合成新链DNA
转录:以DNA为模版,在DNA指导的RNA聚合酶的作用下,将四种游离的NTP按照碱基互补配对的原则合成RNA
翻译:以mRNA为模板,在核糖体内合成蛋白质的过程
特点:DNA复制 模板为双链DNA,合成的新链与模板链一模一样,原料为四种dNTP,为半保留复制 需要引物
转录 模板为双链DNA,为半不连续转录 不需要引物 原料为四种NTP 合成的新链除了把DNA上的T改为U外,其他一样
翻译 模板为mRNA 原料为20中游离的氨基酸 3个碱基决定一个氨基酸
2.mRNA
mRNA (messenger RNA, 信使RNA)
信使RNA是由DNA经hnRNA剪接而成,携带遗传信息的能指导蛋白合成的一类单链核糖核酸。
3.基因DNA分为编码区和非编码区,编码区包含外显子和内含子,一般非编码区具有基因表达的调控功能,如启动子在非编码区。编码区则转录为mRNA并最终翻译成蛋白质。
外显子和内含子都被转录到mRNA前体hnRNA中,当hnRNA进行剪接变为成熟的mRNA时,内含子被切除,而外显子保留(若考虑可变剪接,某些内含子也会保留,外显子会被删除)。
内含子存在于DNA中,在转录的过程中,DNA上的内含子也会被转录到前体RNA中,但前体RNA上的内含子会在RNA离开细胞核进行翻译前被切除(若考虑可变剪接,某些内含子也会保留,外显子会被删除)。
4.CDS Sequence coding for amino acids in protein 蛋白质编码区 CDS是Coding sequence的缩写,是编码一段蛋白产物的序列,是结构基因组学术语。
与开放读码框ORF的区别
开放读码框是从一个起始密码子开始到一个终止密码子结束的一段序列;不是所有读码框都能被表达出蛋白产物,或者能表达出占有优势或者能产生生物学功能的蛋白。 CDS,是编码一段蛋白产物的序列。 cds必定是一个orf。但也可能包括很多orf。 反之,每个orf不一定都是cds。 Open reading frame (ORF) - a reading frame that does not contain a nucleotide triplet which stops translation before formation of a complete polypeptide. Coding sequence (CDS) - The portion of DNA that codes for transcription of messenger RNA ORF-----translation, CDS----transcription translation 是理论上的,而transcription则显然是事实存在的。
5.外显子拼接形成成熟的mRNA,多数基因都有UTR,它们也是外显子拼接的产物,所以,你会发现mRNA的长度要大于CDS,只有CDS才编码蛋白,AUG以前的mRNA编码前导序列。
外显子并不一定编码蛋白质,成熟mRNA的UTR也可以是外显子,外显子就是RNA剪接后留下的部分
外显子与CDS区不是完全一致的,cds区一定属于外显子,但是外显子不一定是CDS区,也就是说外显子不一定都能翻译成蛋白的。
mRNA包括UTR和CDS!
内含子(intron)是断裂基因中外显子之间的间隔序列(intervening sequence,IVS),可参与前体RNA的转录,但其转录的RNA序列于转录后的加工中大多数内含子会被切除,一般不包括于成熟的RNA分子中(考虑可变剪接,内含子会保留)。外显子(exon)在断裂基因中,转录成熟RNA中相应序列的DNA片段。
解释外显子,内含子,CDS、cDNA、EST、mRNA、ORF间的区别
内含子和外显子的分界线在于:GU-AG法则。即每个内含子的开始两个碱基都是是GU(或GT),最后两个是AG。
CDS是Coding sequence的缩写,是编码一段蛋白产物的序列,是结构基因组学术语
ORF序列:即为Open reading frame ,表明这个DNA序列可能是一个基因,但具体的基因编码序列需要其他的内容来补充,因为这一段DNA序列按三联体密码子读可以有六种读法。如果明确这段DNA序列的启动子和终止子序列就可以明确这段序列的氨基酸信息
CDS与开放读码框ORF的区别
(1)开放读码框是从一个起始密码子开始到一个终止密码子结束的一段序列;不是所有读码框都能被表达出蛋白产物,或者能表达出占有优势或者能产生生物学功能的蛋白.
(2) CDS,是编码一段蛋白产物的序列.
(3) cds必定是一个orf.但也可能包括很多orf.
(4)反之,每个orf不一定都是cds.
(5)Open reading frame (ORF) - a reading frame that does not contain a nucleotide triplet which stops translation before formation of a complete polypeptide.
Coding sequence (CDS) - The portion of DNA that codes for transcription of messenger RNA
ORF-----translation,CDS----transcription
translation 是理论上的,而transcription则显然是事实存在的.
cDNA为具有与某RNA链呈互补的碱基序列的单链DNA即complementary DNA之缩写
,或此DNA链与具有与之互补的碱基序列的DNA链所形成的DNA双链。互补DNA序列,指的是mRNA为在逆转录酶的作用下将形成DNA的过程。这个DNA即为cDNA序列,它没有内含子和外显子的区别,在原核生物中可以作为一个多肽的编码基因序列,但在真核生物内由于没有内含子,所以它不能完全作为一个多肽的编码基因序列。
EST (Expressed Sequence Tag)表达序列标签—是从一个随机选择的cDNA 克隆,进行5’端和3’端单一次测序挑选出来获得的短的cDNA 部分序列,代表一个完整基因的一小部分,在数据库中其长度一般从20 到7000bp 不等,平均长度为360 ±120bp .由于cDNA文库的复杂性和测序的随机性,有时多个EST代表同一基因或基因组,将其归类形成EST簇(EST clusteF)
mRNA携带遗传信息,在蛋白质合成时充当模板的RNA.