转座子对基因调控的作用

本篇为转载,原创作者为    AI写代码的DNA    义冠    转座元件对基因调控的作用    谢谢大佬,受益匪浅     

Regulatory activities of transposable elements: from conflicts to benefits

  TE顺式调节活性

    1.TE顺式调节活性的起源

    自主移动的TE序列通常会编码一些与自我复制相关的基因,使得它们的扩增不再依赖于宿主基因组。不过,作为基因组的 “寄生虫”,TE需要宿主的一些生化机制来实现其自身基因的表达。TE能够模仿宿主的顺式调节元件,很多TE进化出了顺式调节序列,来模仿宿主的启动子。在LTR转座子中,顺式调控序列和RNA聚合酶II启动子就存在于该TE序列的两端。LINEs转座子的5'端也存在RNA聚合酶II启动子。SINEs转座子存在RNA聚合酶III的结合位点。所以对于整个逆转座子而言,如果其是一个完整的TE,那么均存在RNA聚合酶的结合位点。

左侧:完整的TE序列;右侧:通常在基因组中存在的TE残存序列

    TE的含量、形态和复制机制在很大程度上影响了其含有启动子和调控序列。比如,LTR转座子每次进行转座插入时,都会在宿主基因组上形成两个新的长末端重复序列,而这些长末端重复序列往往能够诱导异位重组(减数分裂过程中未对齐的同源染色体之间发生的不平等交叉引起的复制称为异位重组)。进而,导致了转座子中的编码序列丢失,仅剩下了长末端重复序列(Intact LTR 变成 Solo LTR)也即LTR的转座最终的结果是给宿主基因组增添了新的顺式调控元件(上图)。有研究显示,在人类基因组中内源性病毒(LTR的一种)占了基因组的8%,但是其中的90%都不是完整的TE序列,仅仅是长末端重复序列。

    LINEs类的转座子占了人类基因组的20%,但是绝大多数的LINEs转座子也不是完整的序列,而是5'端被截断的残存序列(上图),因而该类转座子丢失了启动调控序列。对于DNA转座子,通常是通过“剪切粘贴”完成转座的,其转座的结果往往是形成了微小倒置重复序列(MITEs),这些序列同样丢失了启动调控序列(上图)。所以,不同类型的转座子其转座之后,启动调控序列有的留存,有的丢失。

    TE启动子活性在空间和时间上表现出一定的差异,这种差异取决于宿主细胞的类型,以及面临的环境压力(比如感染等)。

   TE对宿主基因表达的影响不仅局限于生殖系细胞或者早期胚胎中,在体细胞中也同样存在,TE插入更加倾向于发生在生殖系细胞形成的阶段或者胚胎发育早期,在体细胞表达的TE不会进行跨代传递,对TE的进化没有明显的作用。

    2.TE的非随机整合

    TE能够模仿宿主的顺式调节元件,那么如果一个TE插入到宿主基因附近,那么其在很大程度上会干扰正常宿主基因的表达。很多TE也进化出了一些机制,使得它们能够倾向于在某些特定序列进行插入,以此提高TE扩增和扩散的几率。比如有些TE能够选择性的在基因贫乏的区域或者异染色质区进行插入,这些区域犹如避风港,最大程度上减少了TE插入受到的选择压力。

    当然, 还有一些TE会选择在开放转录活跃的染色质区进行插入。比如玉米种的Mutator,水稻中的mPing,酵母菌中的Tf1和果蝇中的P元件等,这些TE倾向于选择宿主基因的 5’ 端进行插入在某些逆转录病毒中,比如HIV-1,其会选择宿主基因中转录活跃的区域进行整合插入。一方面,有利于插入序列的扩增,另一个方面,这些插入会干扰临近基因的表达。对基因表达的干扰不仅是对宿主有害,还有可能会被宿主所用,对宿主产生有利的影响。比如在果蝇中某些CYP450基因的调控序列插入,可以提高基因表达量,有利于抵抗外界杀虫剂的作用。

    随着时间的延长,自然选择和遗传漂变(小的群体中,由于不同基因型个体生育的子代个体数有所变动而导致基因频率的随机波动称为遗传漂变)的作用会逐渐显现,因此会模糊掉TE插入的位点选择性。


    TE丰富的调控活性

    总体来说,TE表现的更像宿主基因组的寄生虫,宿主本身也进化出了很多机制来抑制TE的转录表达。研究也证实,宿主基因组中的TE的序列,绝大多数都处于静默非表达状态。当然,也有很多研究发现了TE通过顺式和反式作用来影响宿主基因表达的例子。TE并不像人们想的那样一直处于静默状态。

    通过转录组学的分析发现,TE是形成组织特异性启动子的重要原因。比如,RNA-seq显示TE来源的启动子形成的嵌合转录占了哺乳动物转录组的绝大部分,特别是对于胚胎发育早期的个体。在植物中,TE来源的启动子也占了绝大部分。

    除了启动子外,TE还能够提供很多其他类型的顺式调节元件,比如增强子enhancer,隔离子insulator和抑制元件等。在哺乳动物中,对于各种不同的转录因子,TE能够提供5%-40%的结合位点(平均20%)。特别是LTR类型的TE,其提供的因子结合位点更多。而且,对于某一类转录因子,其结合位点常常来自少数几类TE(具有一定的特异性)。因而推测,结合位点可能存在于TE的祖先序列,然后通过转座扩散到整个基因组。

    TE来源的转录因子结合位点具有进化分支特异性。比如,对小鼠和人类细胞中26对同源转录因子结合位点的分析显示,绝大多数都具有物种特异性。说明两个物种自分化之后,其TE在各个物种中进行了大量扩增,形成了灵长类特异性TE和啮齿类特异性TE。另一原因可能是这些转录因子结合位点在各个物种的进化过程中经历了中性替换(中性学说认为分子水平上的大多数突变是中性或近中性的,自然选择对它们不起作用,这些突变全靠一代又一代的随机漂变而被保存或趋于消失,从而形成分子水平上的进化性变化或种内变异),由于不同物种中中性替换的差异导致了物种特异性。不管怎样,这些研究都说明转座是哺乳动物进化过程中获得转录因子结合位点的重要机制。

    TE也可以作为隔离子(元件边界)来发挥作用。这些TE序列能够把基因组分隔成100Kb-1Mb大小不等的转录区段。一些研究显示,TE序列,特别是SINEs,含有CTCF或者TRIIIC因子结合位点,这些因子具有隔离活性,并参与核结构的形成。有些TE还参与基因组三维结构的形成。总而言之,TE对基因组的染色体的高级结构的形成有重要作用。

    TE除了提供上述一些顺式DNA调控元件之外,还贡献了大量的非编码调控RNA,比如微小miRNA, IncRNA(Long non-coding RNA)

TE顺式调控和反式调控

  

  TE调控活性的生物作用

    上文说明了TE是生物基因调控的重要影响因素。那么这些调控对宿主表型有哪些影响,影响程度有多大呢?

    1.TE和宿主的竞合关系

    这儿的竞合关系也可以认为是宿主对TE的驯化,使得TE成为有利于宿主的一部分。大量的研究表明,不同物种中同源TE序列在进化上具有相当的保守性,提示这些TE序列可能受到负向自然选择的作用。此外,这些TE在基因组上的分布也不是随机均匀分布,而是倾向于分布在转录因子基因和发育相关基因附近。在脊椎动物进化过程中,TE为调控序列的形成提供了大量可用的非编码序列。

    某些SINE家族序列被称为基因组中的“活化石”。这些SINE序列在四足动物中高度保守。在小鼠中,MIR元件(Mammalian-wide interspersed repeat)插入形成了位于内含子中的增强子,它促进了Foxp3基因的表达,而该基因又是调节性T细胞形成的重要基因,对怀孕期间母体-胎儿之间的免疫耐受有重要作用。可见该TE元件对小鼠胎盘发育有多么重要。

    此外,两个古老的TE(MaLR和一个SINE)在哺乳动物进化中起到了下丘脑特异性增强子的作用,调节前促黑激素基因POMC的表达。

    这些例子都说明了TE在进化中被宿主细胞所驯化,成为宿主重要的一部分。同时,这些被驯化的TE受到负向选择作用,表现出了一定的保守性。

    2.竞合TE的识别

    不同物种间竞合TE的保守性意味着这些TE可能具有一定的生物学功能,但是在识别这些TE的时候有一些要注意的问题。首先,该TE必须有足够长的进化时间,以便其能够显现出进化上的保守性。但是这些相对古老的TE在识别上有一定的困难,特别是在一些进化比较快的物种中(比如果蝇),中性替换可能模糊掉TE原本的样子。在人类和小鼠中,这些相对保守的TE通常不是同源的,而是一些新生的TE插入。判断这些较新生的TE是否为宿主所驯化就存在一定的困难,由于进化时间较短,难以识别出相应的负向选择信号。

    尽管如此,还是有很多研究发现了一些和宿主存在竞合关系,被驯化了的TE。比如,哺乳动物唾液中的淀粉酶表达源于逆转录LTR的插入。此外,还有哺乳动物子宫内膜中催乳素的表达等,也和TE的插入有关。

    下图总结了几种TE通过调节表达而影响表型的例子。

a:人类全能性相关转录体HPAT5是一种lncRNA,其由内源性病毒序列和Alu序列组成,该转录体能够调节let-7家族的微小RNA,从而在胚胎发育过程中内细胞层的形成发挥作用。b:MER14转座元件在AIM2基因上游提供了一个干扰素表达增强子,调节感染过程中的炎症反应。c:在cortex基因的内含子中的TE插入提升了cortex的表达量,从而改变了蛾子的体色,更加适应周围环境。d:在MANTLED基因内含子中Karma的转座插入导致了转录的提前中断,从而在油棕榈中形成了含有外层包被的果实。

另一种用来识别被宿主驯化的TE的方法是通过基因敲除或者基因编辑。

    3.TE介导的顺式调节的多样性

    TE最先发现于玉米中,随后在更多作物中被发现。事实上,很多人工性选择的性状都是通过TE对其附近基因顺式调控来实现的。比如,玉米中,Hopscotch逆转座子作为增强子插入到teosinte branched1基因中,从而改变了玉米的相应的性状。在血橙中,copia样的逆转座子发挥了低温诱导的增强子的作用,调控ruby基因的表达,从而改变了果实的颜色。

    在人工选择的动物驯化中,TE同样发挥了重要作用。比如在家蚕中,Taguchi(LINE)转座子在EO基因区域的插入抑制了蝉蛹的过早成熟。在狗和家猫的驯化中,比如体型和毛色,也有TE插入的顺式调节作用。

    英国蛾子体色的变化是自然选择的经典案例,最新的研究发现,其体色变化的基础是一个TE在cortex基因内含子中的插入。(该例子也可以看作是一种人工选择。)

    这些例子都说明不管在植物中,还是在动物中,TE在人工选择的过程中都发挥了巨大的作用,TE通过调节基因表达而改变了某些性状。也提示了,某些人工选择并非是通过SNP频率的改变来实现的。

    4.TE和基因调控网的进化

    上文的一些例子都是TE对单个基因表达的影响,实际上TE还可以通过更为复杂的关系影响多个基因,进而影响整个通路。MER20 转座子累积了很多cAMP介导的增强子位点,对哺乳动物子宫内膜相关基因表达有重要影响,为哺乳动物的形成奠定了基础。MER130家族的扩增为小鼠带来了和前脑活动相关的大量增强子,在哺乳动物新皮质层的进化中有重要意义。

    还有一些研究认为支系特异性TE驱动了基因调控网的进化。比如在过去1500万-2500万年时间内,小鼠特异性内源性病毒RLTR13给小鼠带来了数百个胎盘发育相关的特异性增强子,从而促进了哺乳动物胎盘发育的多样性。

    不过要注意的是,TE插入和基因表达的相关关系并不一定代表因果关系。TE插入到一些原本高表达的基因附近可能会导致其有更多的机会和转录因子结合,从而使二者表现较高的相关性。再者,如果TE导致基因表达过于剧烈,可能会受到负向选择作用,所以那么轻微改变表达的TE可能更有机会留存,使得TE的表达和附近基因的表达水平具有相似性。

    此外,TE还可能参与染色体的剂量补偿。对果蝇Drosophia miranda新形成的X性染色体的研究发现,ISX转座子在X染色体上提供了大量和剂量补偿机制相关的结合位点,对性染色体的形成和进化起到了促进作用。


    TE调控的致病性

    尽管上文提到了很多TE被宿主驯化,成为了有利于宿主的一部分。但是毕竟TE是寄生起源的,具有自私属性,其对宿主造成的害处也是显而易见的。

    TE主要通过两个机制导致宿主得病:插入致突变和染色体重排。

    生殖系细胞中新TE的插入妨碍了正常基因的表达,会导致人类一百多种遗传病。在体细胞中,转座和TE介导的染色体重排通常和肿瘤的发生有关。

    1.TE致病调控

    TE插入是人类基因中非常常见的结构变异,通过改变周边基因的表达提升相关疾病的患病风险。比如C4补体系统和精神分裂症。研究发现,C4基因内含子中携带内源性病毒的个体会有较高的C4表达量,进而会导致神经突触异常,从而促进了精神分裂症的发生。

    2.TE重新激活的原因和后果

    尽管人类基因组中含有大量的TE序列,但是大多数都处于休眠状态。但是在很多癌细胞中,TE的表达水平明显增高。一般认为,一些环境因素和自然过程,比如感染,细胞应激,衰老等因素会造成基因组表观标志(如甲基化)不稳定,从而激活了TE的转录表达活性。

a:在外加压力和细胞自身衰老的情况下,被表观标志沉默的TE序列可能重新被激活,进而导致一系列病理过程。b:转座子去甲基化导致淋巴癌细胞相关的基因激活。

    一方面,TE的激活导致TE转座率的升高。比如在人类中,LINE-1的低甲基化和转录激活导致了转座率的升高,从而促进了某些肿瘤的发生(特别是在上皮细胞中)。最新的研究发现,LINE-1的插入是一种致癌因素,其激活了肝脏肿瘤细胞和结直肠癌的肿瘤细胞通路。

    除了插入导致突变,TE还有可能会编码一些对细胞有害的多肽。比如,过量表达的内源性病毒的包膜蛋白,能够造成神经元退行性病变和一些自免疫障碍。另外,在细胞质中积累过多的来自TE的核酸序列(双链RNA,cDNA和DNA-RNA杂合体等)可能会有免疫增效剂作用,进而激发自身免疫反应等异常。

    3.对宿主基因的不当调节

    被激活的TE可以通过改变宿主基因的表达而致病。很多TE通过DNA甲基化而失活,但是它们一旦去甲基化激活,便可以通过顺式或者反式作用造成宿主基因失调。

    虽然这种TE的异位去甲基化激活并不多见,可能仅仅是一些很小概率的随机事件,但是一旦被激活,可能就会受到正向自然选择的作用。比如在肿瘤发生过程中,这些TE可能赋予肿瘤细胞竞争优势,促使肿瘤细胞大量扩增。

    TE大量表达的非编码RNA也可能存在致癌属性。比如BRAF激活的非编码RNA(BANCR)在黑色素瘤细胞中大量存在,促进了细胞的大量增殖和迁移。在一些腺癌中,EVADR(属于IncRNA)有大量表达,其来源就是内源性病毒MER48。虽然这些RNA不编码蛋白,但是对肿瘤的发生有促进作用。

    除了上述在人类中的例子,在油棕榈中,MANTLED基因的内含子中存在Karma转座子插入,如果其去甲基化激活,会导致转录RNA提前截断,进而表现出果实的异常。

    4.TE是一把双刃剑

    对于宿主而言,这些致病性TE会受到负向选择压力,在群体中被逐渐清除掉。但是也可能这些TE中只有很小一部分在某些个体中表现出致病性,在其他大部分个体中对宿主适应性影响不大。这种情况下,自然选择可能不足以将这些致病性TE从群体中清除。还有很多TE被宿主驯化,成为对宿主有利的因子。但是这种TE可能会是一把双刃剑,稍有不慎就有可能对宿主产生有害的作用。

    比如,在人类中,AIM2基因编码一些重要的免疫因子,同时也能够抑制肿瘤的发生。MER41转座元件能够使得AIM2基因响应干扰素,对AIM2基因有重要作用。但是某些情况下,MER41转座元件会被超甲基化,进而变成沉默的TE。此时,AIM2基因的转录表达就会发生异常,进而导致肿瘤和自身免疫病的发生。所以对于宿主来说,MER41转座元件既带来了有利的一面,也存在潜在的有害风险。


    结论和展望

    过去十余年,人们对TE有了较多的研究,对TE如何影响基因组进化有了进一步的了解。通过在基因组水平上对TE的研究,发现TE涉及到了复杂的机制和生化特性,使得人们认识到TE不仅仅再是基因组的“寄生元件”,而是宿主基因组基因调控的重要部分。TE的插入致突和基因重排可以改变宿主基因表达。不过,我们还需要更多的实验证据来支持目前的结论。

    此外,通过进化分析和回顾性分析的方法,我们还需要对一些古老的TE进行研究,通过对这些TE的研究能够加深我们对新生TE的认识,有助于我们理解TE在当代生物中是怎样影响基因调控网络的。同时,通过实时进化实验来观测TE面对选择压力时的表现,这也有助于我们理解TE对基因调控的作用。

    尽管一些例子已经证实了TE的激活和不当调控会造成肿瘤的发生,但实际上,不仅限于肿瘤,很多生理病理过程,如衰老、神经系统疾病、自身免疫病等都和TE的激活有关。但是我们目前对这些过程的理解还不全面。未来技术的进步会促使我们对TE的致病性有更加深入的认识。

你可能感兴趣的:(转座子对基因调控的作用)