生物信息的传递- 从DNA到RNA
转录是基因表达的核心步骤
因为只有mRNA所携带的遗传信息才能被用来指导蛋白质的生物合成,所以人们一般用U,C,A,G这四种核苷酸的组合来表示遗传性状。
翻译和转录的速率基本相等,37℃时,转录生成mRNA的速率大约是每分钟2500个核苷酸,即每秒合成14个密码子,蛋白质合成速率大约是每秒钟15个氨基酸。正常情况下,从一个基因开始表达到细胞中出现其mRNA的间隔约为2.5分钟,再过半分钟左右就能在细胞内检测到相应的蛋白质。
我们把与mRNA序列相同的那条DNA链称为编码链(coding strand)或称有意义链(sense strand),并把另一条根据碱基互补原则指导mRNA合成的DNA链称为模板链(template strand)或称反义链(antisence strand)
RNA链频繁发生自身折叠,在互补序列间形成碱基配对区,所以尽管RNA是单链分子,它仍然具有大量的双螺旋结构特征。
除了Watson-Crick配对的碱基,RNA中还具有额外的非Waston-Crick配对碱基,如G-U配对,该特征使得RNA链自我配对的能力得到增强,更易形成双螺旋结构,常常出现局部区域碱基配对。双螺旋RNA的小沟宽而浅,几乎没有序列特异性信息,大沟狭且深,使得与其相互作用的蛋白质氨基酸侧链难以接近它,因此RNA不适合与蛋白质进行序列特异性的相互作用,虽然有一些蛋白质可以序列特异性方式结合在RNA上。
因为RNA没有形成长的规则双螺旋的限制,常常形成大量的三级结构。由于RNA骨架上未配对的区域可以不受限制地自由旋转,所以碱基和核糖磷酸骨架之间的非常规相互作用使RNA常常折叠成包括不规则的碱基配对的复杂三级结构,如tRNA中的三碱基配对以及碱基与骨架的相互作用。利用RNA结构的复杂性,研究者可以通过构建含有随机序列的RNA文库筛选到与特定小分子,多肽等具有高亲和力的RNA。RNA各组分在细胞中的分布见下表:
作为功能分子,RNA在以下几个方面发挥重要的作用:1,作为细胞内蛋白质生物合成的主要参与者。2,部分RNA可以作为核酶在细胞中催化一些重要的反应,主要作用于初始转录产物的剪接加工。3,参与基因表达调控与生物生长发育密切相关。4,在某些病毒中,RNA是遗传物质。
RNA转录的过程
RNA转录以四种三磷酸核苷(NTPs)为原料。转录的基本过程包括:模板识别,转录起始,通过启动子,及转录的延伸和终止。
1,模板识别
模板识别( template recognition)阶段主要指RNA聚合酶与启动子DNA双链相互作用并与之相结合的过程。启动子( promoter)是基因转录起始所必需的一段DNA序列,是基因表达调控的上游顺式作用元件之一。
真核细胞中模板识别与原核细胞有所不同。真核生物RNA聚合酶不能直接识别基因的启动子区,所以,需要被称为转录调控因子的辅助蛋白质按特定顺序结合于启动子上,RNA聚合酶才能与之相结合并形成复杂的转录前起始复合物( PIC),以保证有效地起始转录。
2,转录起始,
转录起始( initiation)不需要引物。RNA聚合酶结合于启动子上以后,使启动子附近的DNA双链解旋并解链,形成转录泡以促使底物核糖核苷酸与模板DNA的碱基配对。转录起始就是RNA链上第一个核苷酸键的产生。大致分为3个阶段:
1,RNA聚合酶全酶对启动子的识别,聚合酶与启动子可逆性结合形成封闭复合物( closed complex),此时DNA链仍处于双链状态。
2,伴随着DNA构象上的重大变化,封闭复合物转变成开放复合物( open complex),聚合酶全酶所结合的DNA序列中有一小段双链被解开。对于强启动子来说,从封闭复合物到开放复合物的转变是不可逆的,是快反应。
3,开放复合物与最初的两个NTP相结合并在这两个核苷酸之间形成磷酸二脂键后转变成包括RNA聚合酶,DNA和新生RNA的三元复合物( ternary complex)
一般情况下,形成的三元复合物可以进入两条不同的反应途径:一是合成并释放2~9个核苷酸的短RNA转录物,即所谓的流产式起始。转录起始后直到形成9个核苷酸短链的过程是通过启动子阶段,此时RNA聚合酶一直处于启动子区,新生的RNA聚合酶处于启动子区,新生RNA链与DNA模板链的结合不够牢固,很容易从DNA链上掉下来并导致转录重新开始。一旦RNA聚合酶成功地合成9个以上核苷酸并离开启动子区,转录就进入正常的延伸阶段。所以通过启动子的时间代表一个启动子的强弱。通过启动子的时间越短,表明该基因转录起始的频率也越高。
二是RNA聚合酶聚合新生RNA链达到9~10个核苷酸时,σ亚基被释放,转录起始复合物通过上游启动子区并生成由核心酶,DNA和新生RNA所组成的转录延伸复合物。
除了RNA聚合酶之外,真核生物转录起始过程中至少还需要7种辅助因子参与,这些蛋白辅助因子统称为转录因子( transcription factor , TF)。因为不少辅助因子本身就包含多个亚基,所以转录起始复合物的相对分子质量特别大。
3,转录延伸
当RNA聚合酶催化新生的RNA链的长度达到9~10个核苷酸时,σ因子从转录复合物的RNA聚合物全酶上脱落下来,RNA聚合酶离开启动子,核心酶沿模板DNA链移动并使新生RNA链不断伸长的过程就是转录的延伸( elongation)。
4,转录终止
当RNA链延伸到转录终止位点时,RNA聚合酶不再形成新的磷酸二脂键,RNA-DNA杂合物分离,转录泡瓦解,DNA恢复成双链状态,而RNA聚合酶和RNA链都被从模板上释放出来,这就是转录的终止( termination)
根据体外实验中RNA聚合酶是否需要辅助因子参与才能终止RNA链膜延伸,可将大肠杆菌中的终止子分为不依赖ρ因子和依赖ρ因子两大类。1,不依赖ρ因子的终止,在不依赖ρ因子这类终止反应中,没有任何其他因子参与,核心酶就能终止转录。现已查明,模板DNA上存在终止转录的特殊信号——终止子,又称内在终止子( intrinsic terminator),每个基因或操纵子都有一个启动子和一个终止子。内在终止子有两个结构特点:1,终止位点上游一般存在一个富含GC碱基的二重对称区,由这段DNA转录产生的RNA容易形成发夹结构。2,在终止位点前面一段由4~8个A组成的序列,所以转录产物的3'端为寡U,这种结构特征的存在决定了转录的终止。新生RNA中出现发夹结构会导致RNA聚合酶的暂停破坏RNA-DNA杂合链5'端的正常结构。
2,依赖于ρ因子的终止
有些终止位点的DNA缺乏共性,而且不能形成强的发夹结构,因而不能诱导转录的自发终止。ρ因子是一个由6个相同亚基组成的六聚体,它具有NTP酶和解旋酶活性,能水解各种核苷酸三磷酸,它通过催化NTP的水解促使新生RNA链从三元转录复合物中解离出来从而终止转录。ρ因子的作用机制可用穷追 (hot pursuit)模型来解释。
抗终止:由于不同的生理需求,在转录过程中有时即使遇到了终止信号,仍然需要继续转录,于是出现了抗终止现象。抗转录终止主要有两种方式:1,破坏终止位点RNA的茎-环结构 (学习完操纵子后回来再搞清楚这里的问题,page80)
2,依赖于蛋白质因子的转录抗终止 λ噬菌体中由N基因编码产生产生的N蛋白具有抗转录终止作用,但是其发挥功能依赖于宿主产生的NusA、NusB、S10等几种蛋白质,这些蛋白结合到终止子附近的DNA位点是实现抗转录终止的必要条件。
转录机器的主要成分——RNA聚合酶
以DNA序列为模板的RNA聚合酶主要以双链DNA为模板(若以单链DNA为模板则活性大大降低),以4种核苷三磷酸作为活性前体,并以Mg2+/ Mn2+为辅助因子,催化RNA链的起始,延伸和终止,它不需要任何引物,催化生成的产物是与DNA模板链相互补的RNA。
原核生物的RNA聚合酶:
大肠杆菌RNA聚合酶首先由2个α亚基,一个β亚基,一个β'亚基和一个ω亚基组成核心酶,加上一个σ亚基后则成为聚合酶全酶 ( holoenzyme),相对分子质量为4.65X10^5。转录起始过程需要全酶,由σ因子辨认起始位点,延长过程仅需要核心酶的催化。转录的真实性取决于有特异的终转录起点。核心酶随可以合成RNA,但不能找到模板DNA上的起始位点。带有σ因子的全酶才能专一地与DNA上的启动子结合。
σ因子的作用在于帮助转录起始,一旦转录开始它就脱离了起始复合物,而由核心酶负责RNA链的延伸。
真核生物RNA聚合酶:
真核生物共有3类RNA聚合酶,其结构比大肠杆菌更复杂,它们在细胞核中的位置不同,负责转录的基因不同,对α-鹅膏蕈碱的敏感性也不同。
启动子与转录起始
大肠杆菌RNA聚合酶与启动子的相互作用主要包括启动子区的识别,酶与启动子的结合及σ因子的结合与解离。
启动子区的结构:启动子是一段位于结构基因5'端上游区的DNA序列,能活化RNA聚合酶,使之与模板DNA准确地相结合并具有转录起始的特异性。
转录单位( transcription unit)是一段从启动子开始至终止子( terminator)结束的DNA序列,RNA聚合酶从转录起点开始沿着模板前进,直到终止子为止,转录出一条RNA链。在细菌中一个转录单位可以是一个基因也可以是几个基因。转录起点是指与新生RNA链第一个核苷酸相对应DNA链上的碱基,通常为一个嘌呤。常把起点前面,即5'末端的序列称为上游序列(upsteam),而把其后面即3'末端序列称为下游序列( downstream)。在描述碱基的位置时,一般用数字表示,起点为+1,下游方向依次为+2,+3……等,上游方向依次为-1,-2,-3……等。序列的书写方向通常是固定的,使转录从左(上游)向右(下游)进行,mRNA同样按照5'-->3'方向书写。
Pribnow设计一个实验,他把RNA聚合酶全酶与模板DNA结合后,用DNase I 水解DNA,然后用酚抽提,沉淀纯化DNA后得到一个被RNA聚合酶保护的DNA片段。
又有人做了50多个启动子的序列分析后发现,在被保护区内有一个由5个核苷酸组成的共同序列,是RNA聚合酶的紧密结合点,现在称为Pribnow区(Pribnow box),这个区的中央大约位于起点上游10bp处,所以又称为-10区。
提纯被保护的片段后却发现,RNA聚合酶并不能重新结合或并不能正确选择起始点,表明在保护区外可能还存在与RNA聚合酶对启动子的识别有关的序列。果然,科学家不久就从噬菌体的左右启动子和SV40启动子的-35bp附近找到了另一段共同序列:TTGACA。经过数年努力,分析了46个大肠杆菌启动子序列以后确证绝大部分启动子都存在这两端共同序列,即位于-10bp处的TATA区和-35bp处的TTGACA区。现已查明,-10区的TATA区和-35位的TTGACA区是RNA聚合酶与启动子的结合位点,能与σ因子相互识别而具有很高的亲和力。
启动子区的识别:
,,,,,,
在细菌中常见两种启动子突变,一种叫下降突变(down mutation),如果把Pribnow区从TATAAT变成AATAAT就会大大降低其结构基因的转录水平;另一种突变叫上升突变 (up mutation),即增加Pribnow区共同序列的同一性。例如,在乳糖操纵子的启动中,将Pribnow区从TATGTT变成TATATT,就会提高启动子的效率。
增强子及其功能:
除了启动子以外,近年来发现还有另一序列与转录起始有关。在SV40的转录单位上发现它的转录起点上游约200bp处有两段72bp长的重复序列,它们不是启动子的一部分,但能增强或促进转录的起始除去这两段序列会大大降低这些基因的转录水平,若保留其中一段或将之取出插至DNA分子的任何部位,就能保持基因的正常转录。因此,称这种能强化转录起始的序列为增强子或强化子(enhancer)。
无论把这段72bp序列放在转录起点上游1400bp处还是下游3300bp处,它都有转录增强作用。增强子很可能通过影响染色质DNA-蛋白质结构或改变超螺旋的密度而改变模板的整体结构,从而使得RNA聚合酶更容易与模板DNA相结合,起始基因转录。
增强子具有以下特点:
1,远距离效应 一般位于上游-200bp处,但可增强远处启动子的转录,即使相距十多个千碱基对也能发挥作用。
2,无方向性 无论位于靶基因的上游,下游或内部都可发挥增强转录的作用。
3,顺式调节 只调节位于同一染色体上的靶基因,而对其他染色体上的基因没有作用。
4,无物种和基因的特异性 可以连接到异源基因上发挥作用。
5,具有组织特异性 SV40的增强子在3T3细胞中比多瘤病毒的增强子要弱。
6,有相位性 其作用和DNA的构象有关
7,有的增强子可以对外部信号产生反应
真核生物启动子对转录的影响:
真核基因的启动子在-25~-35区含有TATA序列,在-70~-80区含有CCAAT序列(CAAT区,CAAT box),在-80~-100含有GCCACACCC或GGGCGGG序列(GC区,GC box)。习惯上,将TATA区上游的保守序列称为上游启动子元件(upatream promoter element,UPE)或称上游激活序列(upstream activating sequence,UAS)
原核和真核生物基因转录起点上游区的结构比较:
TATA区和上游启动子元件(CAAT区或GC区)的作用不同。前者主要作用是使转录精确地起始,如果除去TATA区或进行碱基突变,转录产物下降的相对值不如CAAT区或GC区突变后明显,但发现所获得的RNA产物起始点不固定。研究SV40晚期基因启动子发现,上游激活序列的存在与否,对该启动子的生物活性有着根本性的影响。若将该基因5'上游-21~-47核苷酸序列切除,基因完全不表达。下图为SV40基因启动子上TATAAA及临近区域对基因转录活性的影响。
CAAT区和GC区主要控制转录起始频率,基本不参与起始位点的确定。CAAT区对转录起始频率的影响最大,该区任一碱基的改变都将极大地影响靶基因的转录强度,而启动子区其他序列中一二个碱基的置换则没有太大影响。此外,在TATA区和相邻的UPE(上面有解释,上游启动子元件)之间插入核苷酸也会使转录减弱。
研究发现,真核细胞中存在大量特异性或组成型表达的,能够与不同基因启动子区UPE相结合的转录调控因子。基因转录实际上是RNA聚合酶,转录调控因子和启动子区各种调控元件相互作用的结果。
转录的抑制
RNA转录的抑制剂根据其作用性质主要可以分为两大类:第一类是DNA模板功能抑制剂,通过与DNA结合而改变模板的功能;第二类是RNA聚合酶的抑制物,它们与RNA聚合酶结合而抑制其活力。
1,DNA模板功能抑制剂
放线菌素D(actinomycin D)是DNA模板功能的抑制物,可与DNA形成非共价复合物。还有一些烷化剂
2,RNA聚合酶抑制剂
利福霉素(rifamycin),利迪链霉素(streptolydigin)和α-鹅膏蕈碱都是RNA聚合酶的抑制物。
原核生物与真核生物转录产物比较:
1,只有一种RNA聚合酶参与所有类型的原核生物基因转录,而真核生物有3种以上的RNA聚合酶来负责不同类型的基因转录,合成不同类型的,在细胞核内有不同定位的RNA。
2,转录产物有差别。原核生物的初级转录产物大多数是编码序列,与蛋白质的氨基酸序列呈线性关系;而真核生物的初级转录产物很大,含有内含子序列,成熟的mRNA只占初级转录产物的一小部分。
3,原核生物的初级转录产物几乎不需要剪接加工,就可直接作为成熟的mRNA行使翻译模板功能;真核生物转录产物需要经过剪接,修饰等转录后加工成熟过程才能成为成熟的mRNA。
4,原核生物细胞中,转录和翻译不仅发生在同一个细胞空间里,而且这两个过程几乎是同步进行的,蛋白质合成往往在mRNA刚开始转录时就被引发了。
真核生物mRNA需要经过转录后加工。只有成熟的,相对分子质量明显变小并经化学修饰的mRNA才能进入细胞质基质,参与蛋白质的合成。
原核生物常以AUG(有时GUG,甚至UUG)作为起始密码子,而真核生物几乎永远以AUG作为起始密码子。
原核生物mRNA的特征
1,原核生物mRNA的半衰期短
当一个mRNA的5'端开始降解时,其3'端部分有可能仍在合成或被翻译。
2,许多原核生物mRNA可能以多顺反子的形式存在 把只编码一个蛋白质的mRNA称为单顺反子。把编码多个,,,称为多顺反子。多顺反子mRNA是一组相邻或相互重叠基因的转录产物,这样的一组基因可被称为一个操纵子(operon),是生物体内的重要遗传单位,如大肠杆菌乳糖操纵子转录称编码3条多肽的多顺反子mRNA,经过翻译生成 β-半乳糖苷酶,透过酶及乙酰基转移酶。
几乎所有mRNA都可以被分成3部分:编码区和位于AUG之前的5'端上游非编码区以及位于终止密码子以后不翻译的3'端下游非编码区。对多顺反子来说,后面几个顺反子的翻译起始受上游顺反子结构的调控。
一种情况是,第一个蛋白质合成终止以后,核糖体分解成大,小亚基,脱离mRNA模板,第二个蛋白质的翻译必须等到新的小亚基和大亚基与该蛋白质起始密码子相结合后才能开始。当然,前一个多肽翻译完成以后,核糖体大,小亚基分离,小亚基也可能不离开mRNA模板,而是迅速与游离的大亚基结合,启动第二个多肽合成。
3,原核生物mRNA的5'端无帽子结构,3'端没有或只有较短的多(A)结构
原核生物起始密码子AUG上游7~12个核苷酸处有一被称为SD序列(ShineDalgarno sequence)的保守区,因为该序列与16S rRNA 3'端反向互补,所以被认为在核糖体与mRNA的结合过程中起作用。如果把16sRNA 3'末端的6个保守核苷酸反过来写,则为3'-UCCUCC-5'。所有已知大肠杆菌mRNA的翻译起始区都含有4~5个(至少3个)对应于SD序列的核苷酸。所有已知大肠杆菌mRNA的翻译起始区都含有4~5个(至少3个)对应于SD序列的核苷酸。
细菌16S rRNA的3'末端既非常保守,又高度自我互补,能形成发夹结构。与mRNA互补的部分也参与这个发夹的形成。表面上看这似乎是一对矛盾,一个序列不可能在形成发夹结构的同时又与mRNA相结合。事实上,这正好说明序列配对是动态的,可变的,翻译起始复合物的生成很可能包含了rRNA3'末端发夹结构的改变。
真核生物mRNA的特征
凡是编码功能蛋白的真核基因都通过RNA聚合酶Ⅱ进行转录,真核基因几乎都是单顺反子,只包含一个蛋白质的信息,其长度在几百到几千个核苷酸之间。一个完整的基因,不但包括编码区(coding region),还包括5'和3'端长度不等的特异序列,它们虽然不编码氨基酸,却在基因表达的过程中起着重要作用。所以,基因的分子生物学定义是:产生一条多肽链或功能RNA所必需的全部核苷酸序列。真核生物mRNA结构上最大的特征是5'端的帽子及3'的多A结构。
1,真核生物mRNA的5'端存在帽子结构
真核生物mRNA(不包括叶绿体和线粒体)5'端都是经过修饰的,基因转录一般从嘌呤(主要是A,也可能是G)起始,第一个核苷酸保留了5'端的三磷酸基团并能通过其3'-OH位与下一个核苷酸的5'磷酸基团形成二脂键,转录产物的起始序列为pppApNpNp……。然而,如果在体外用核酸酶处理成熟mRNA,其5'端并不产生预期的核苷酸三磷酸,而产生以5'——>5'三磷酸基团相连的二核苷酸,5'终端是一个在mRNA转录后加上去的甲基化鸟嘌呤。
mRNA 5'端加"G"的反应是由鸟苷酸转移酶完成的,这个反应非常迅速,很难在体外或体内测得5'自由三磷酸基团的存在。帽子结构很早就被加上了。一般认为,帽子结构是GTP和原mRNA 5'三磷酸腺苷(或鸟苷)缩合反应的产物,新加上的G与mRNA链上所有其他核苷酸方向正好相反,像一顶帽子倒扣在mRNA链上,故而得名。
零号帽子,1号帽子,2号帽子。
帽子结构可能使mRNA免遭核酸酶的破坏。
2,绝大多数真核生物mRNA具有多A尾巴
除组蛋白基因外,真核生物mRNA的3'末端都有多A序列,其长度因mRNA种类不同而变化,一般为40~200个。多A序列是在转录后加上去的,可能在细胞核中核内不均一RNA阶段就已经加上了多A。目前还不清楚RNA聚合酶Ⅱ所转录基因的精确终止位点,但研究发现,几乎所有真核基因的3'末端转录终止位点上游15~30bp处的保守序列AAUAAA对于初级转录产物的准确切割及加多A是必需的。实验证明,尽管多A位点及AATAAA的存在对于基因的转录和成熟意义重大,但RNA聚合酶Ⅱ却不在多A位点终止,而往往继续转录,因此,大部分已知基因的初级转录产物拥有多A位点下游0.5~2kb核苷酸序列。
加多A时需要由内切酶切开mRNA 3'端的特定部位,然后由多A合成酶催化多腺苷酸的反应。如果将上述保守序列切除,该基因组合的转录活性就会消失。点突变实验将AAUAAA变为AAGAAA,虽然维持了该基因的转录活性,却发现mRNA的剪接加工受阻,因而没有功能性mRNA产生。
多A是mRNA由细胞核进入细胞质基质所必需的形式,它大大提高了mRNA在细胞质基质中的稳定性。当mRNA刚从细胞核进入细胞质基质时,其多A尾巴一般比较长,随着mRNA在细胞质内逗留时间延长,多A逐渐变短消失,mRNA进入降解过程。此外,翻译起始因子eIF4F和包绕在多A尾的poly-A尾结合蛋白之间相互作用使真核mRNA保持环状,因而多A还能增强mRNA的可翻译能力。
真核生物mRNA大多具有多A尾巴,这一特性被广泛用于分子克隆。常用寡dT片段与mRNA上多A相匹配,作为反转录酶合成第一条cDNA链的引物。
尽管大部分真核mRNA有多(A)尾巴,细胞中仍可有多达1/3没有多(A)的mRNA。我们把带有多(A)的mRNA称为多(A)+ ,而把没有多(A)的mRNA称为多(A)- #多(A)-应该位于核内吧。
RNA剪接( splicing),内含子( intron),外显子( exon)
真核生物tRNA前体的转录加工(朱玉贤分子生物学第四版100页)
真核生物rRNA前体的转录后加工(同上)
真核生物mRNA的剪接:
RNA剪接一般有三种(不包括tRNA的加工过程):pre-mRNA剪接,Ⅰ类和Ⅱ类自剪接内含子。
由DNA转录生成的初级转录产物——核内不均一RNA( hnRNA),即mRNA的前体,经过5'加帽和3'酶切加多腺苷酸,再经RNA的剪接,编码蛋白质的外显子部分就连接成为一个连续的可读框( open read frame , ORF),通过核孔进入细胞质基质,就能作为蛋白质合成的模板了。
不同生物细胞内含子的边界处存在相似的核苷酸序列,表明内含子剪接过程在进化上是保守的,比较同源基因的进化过程发现内含子的异化大于外显子,特定的内含子还可能在进化过程中丢失,因此,内含子的"功能"及其在生物进化中的地位是一个引人注目的问题。另外,许多人类疾病是内含子剪接异常引起的,边界保守序列突变。
RNA序列决定了剪接的发生位点
比较不同基因的核苷酸序列发现,mRNA前体中内含子的两端边界存在共同序列,这些共同序列结构可能是产生mRNA前体剪接的信号。多数mRNA前体内含子序列5'端边界序列为GU,3'端边界序列为AG。把这种保守序列模式称为GU-AG法则,又称为chambon法则。
除了边界序列之外,外显子与内含子交界处的序列,内含子内部的部分序列也可能参与内含子的剪接。在3'端剪接位点AG的附近有一段富含嘧啶的区域,含有10~20个嘧啶核苷酸,5'端有一保守序列(5'-GUPuAGU-3') 此外许多发生分叉剪接的核mRNA内含子3'端上游18~50个核苷酸处,存在一个序列为Py80NPy75APy95的保守区,其中A为百分之百保守,且具有2'-OH,是参与形成分叉剪接中间物的特定腺嘌呤,称为分支点。上述保守序列都是mRNA前体剪接过程中各种核糖核蛋白剪接调节因子的结合位点,对于有效和准确的剪接非常重要。
RNA剪接中的两步转酯反应
RNA剪接是由两步转酯反应完成的,这两步转酯反应使得mRNA前体中原有的某些磷酸二脂键断开并形成一些新的磷酸二脂键。第一步转酯反应是由位于分支位点的保守腺苷酸的2'-OH引发的。它作为亲核基团攻击5'剪接位点保守鸟苷酸的磷酰基团。结果,外显子3'端的核糖与内含子5'端磷酸之间的磷酸二脂键被断开,游离出来的5'磷酸则与分支点保守腺苷酸的2'-OH连接。因此,除了5'——>3'骨架磷酸二脂键,新的磷酸二脂键从保守腺苷酸的2'-OH伸出来,产生一个三叉交汇点。
第二步转酯反应中,5'外显子作为亲核基团,攻击3'剪接位点的磷酰基团,导致两个结果:一是把5'和3'外显子连接起来了,二是把内含子作为离去基团释放出去。因为内含子的5'端已经在第一次转酯反应中与分支点腺苷酸相连接,所以新释放出来的内含子形状像一个套索( lariat form)。
RNA剪接大多发生在剪接体上,转酯反应是由一个被称为剪接体的大型复合体介导的。这个复合物包含约150种蛋白质和5种RNA,大小与核糖体差不多。研究表明,许多相对分子质量较小(106~185bp)的核小RNA(smll nuclear RNA, snRNA)以及与这些RNA相结合的核蛋白(被称为核小核糖核蛋白颗粒,small nuclear ribonucleo-protein particle, snRNPs)参与RNA的剪接。剪接体中有5种核小RNA(U1,U2,U4,U5, U6)每种长100~300核苷酸,与几种蛋白质形成复合物。这些RNA-蛋白质复合物被称为核小核糖核蛋白(small nuclear ribonuclear protein, snRNP)。剪接体就是由这些snRNP形成的巨型复合体。但是,每种snRNP执行的任务不同,因此,在剪接反应的不同时期,剪接体中含有不同的snRNP。剪接体中可能还有一些与剪接体松散结合的不属于snRNP的蛋白质。
snRNP在剪接中的功能如下:1,识别5'剪接位点和分支点。2,按需要把这两个位点集结到一起。3,催化或协助催化RNA的剪接和连接反应。只有参与剪接反应的RNA与RNA之间,蛋白质与RNA之间以及蛋白质与蛋白质之间具备很好的协同作用,才能完成复杂的剪接反应。
剪接过程如下:
mRNA链上每个内含子的5'和3'端分别与不同的snRNA相结合,形成RNA和RNP复合物。
一般情况下,由U1snRNA以碱基互补的方式识别mRNA前体5'剪接点,由结合在3'剪接点上游富嘧啶区的U2 AF(U2 auxiliary factor)识别3'剪接并引导U2 snRNP与分支点相结合,形成剪接前体(pre-spliceosome),并进一步与U4,U5, U6-snRNP三聚体相结合,形成60S的剪接体,进行RNA前体分子的剪接。
哺乳动物细胞中,mRNA前体上的snRNP是从5'向下游"扫描",选择在分支点富嘧啶区3'下游的第一个AG作为剪接的3'位点。AG前一位核苷酸可以影响剪接效率,一般来说,CAG=UAG>AAG>GAG。如果mRNA前体上同时存在几个AG,可能发生剪接竞争。
RNA可变剪接:
在高等生物中,内含子通常是有序或组成型地从mRNA前体中被剪接,然而,在个体发育或细胞分化时可以有选择性地越过某些外显子或某个剪接点进行变位剪接,产生出组织或发育阶段特异性mRNA,称为内含子的可变剪接或变位剪接,产生出组织或发育阶段特异性的mRNA,称为内含子的可变剪接或变位剪接。如上图3-29。
Ⅰ类和Ⅱ类自剪接内含子
与前面所述的mRNA前体中主要(GU-AG类)和次要( AU-AC类)内含子的剪接方式不同的是Ⅰ类,Ⅱ类自剪接内含子,因为带有这些内含子的RNA本身具有催化活性,能进行内含子的自我剪接,而无须借助于形成剪接体。如下图总结了存在于生物体内的各种内含子。
1,Ⅰ类自剪接内含子 Ⅰ类自剪接内含子的剪接主要是转酯反应(trans-esterification),即剪接反应实际上是发生了两次磷酸二脂键的转移。在Ⅰ类自剪接内含子切除体系中,第一个转酯反应由一个游离的鸟苷或鸟苷酸( GMP,GDP或GTP)介导,鸟苷或鸟苷酸的 3'-OH作为亲核基团攻击内含子5'端的磷酸二脂键,从上游切开RNA链。在第二个转酯反应中,上游外显子的自由3'-OH作为亲核基团攻击内含子3'位核苷酸上的磷酸二酯键使内含子被完全切开,上,下游两个外显子通过新的磷酸二酯键相连。Ⅰ类自剪接内含子释放出线性内含子,而不是一个探索状结构。
2,Ⅱ类自剪接内含子 这类内含子主要存在于真核生物的线粒体和叶绿体rRNA基因中。在Ⅱ类自剪接内含子切除体系中,转酯反应无须游离鸟苷酸或鸟苷,而是由内含子本身的靠近3'端的腺苷酸2'-OH作为亲核基团攻击内含子5'端的磷酸二酯键,从上游切开RNA链后形成套索状结构。再由上游外显子的自由3'-OH作为亲核基团攻击内含子3'位核苷酸上的磷酸二酯键,使内含子被完全切开,上下游外显子通过新的磷酸二酯键相连。
Ⅲ类自剪接内含子与Ⅱ类相似,只是边界序列的保守性和次级结构有所不同。
RNA的编辑,再编码和化学修饰
RNA的编辑是某些RNA,特别是mRNA前体的一种加工方式,如插入,删除过取代一些核苷酸残基,导致DNA所编码的遗传信息的改变。介导RNA编辑的机制有两种:位点特异性脱氨基作用和引导RNA指导的尿嘧啶插入或删除。
RNA的再编码:
RNA的化学修饰:
核酶:有催化作用的RNA