miRNA的特征、功能及识别方法等详解

什么是miRNA
   MicroRNAs (miRNAs)是一种大小约21—23个碱基的单链小分子RNA,是由具有发夹结构的约70-90个碱基大小的单链RNA前体经过Dicer酶加工后生成,不同于siRNA(双链)但是和siRNA密切相关。据推测,这些非编码小分子RNA(miRNAs)参与调控基因表达,但其机制区别于siRNA介导的mRNA降解。第一个被确认的miRNA是在线虫中首次发现的lin-4 和let-7,随后多个研究小组在包括人类、果蝇、植物等多种生物物种中鉴别出数百个miRNAs。
 
miRNA 的特征
    已经被鉴定的miRNAs据推测大都是由具有发夹结构、约70个碱基大小形成发夹结构的单链RNA前体经过Dicer酶加工后生成的,有5’端磷酸基和3’羟基,大小约21—25nt的小分子RNA片断,定位于RNA前体的3’端或者5’端。
        最近3个研究小组分别从线虫、果蝇和Hela细胞中鉴定的100个新miRNAs中,有15%跨越线虫、果蝇和哺乳动物基因组具有高度的保守性(只有有1—2个碱基的区别),Lau 和Bartel 实验室的同事更加认为:所有的miRNAs可能在其他物种中具有直向同源物(Ortholog,指那些起源于同一祖先,在不同生物体中行使同一功能的基因群就可比作为一个门类,这些类似的基因被称为“直向同源物”)。
    Bantam 最早被认为是果蝇中参与细胞增殖的一个基因位点。已知几个包含增强子的转座子插入跨越这个位点的一段12.3kb区域会导致果蝇的眼和翅重复生长,而由转座子介导的一段跨越该位点的23kb片断缺失则导致突变果蝇个体小于野生型果蝇。Cohen和同事用一段3.85kb的片断导入21kb片断缺失的果蝇中使其恢复原来的大小。但是奇怪的是表达这个3.85kb片断中的EST却没有同样的效果。Cohen将这个片断和疟蚊Anopheles gambiae的同源序列进行比较,发现一段90bp的高度保守区,经过RNA folding program (mfold)发现这个保守序列可以形成发夹结构,使得这个区段很象是一个miRNA的前体。这个结果经过Northern blot证实突变果蝇的幼体缺少一个21bp的bantam miRNA ,用这个90bp的mRNA前体经过一系列的“功能缺失”—“功能恢复”实验,证实 bantam miRNA在细胞增殖中的作用。研究人员用计算机程序检索在hid mRNA的3’非编码区找到了bantam的3个潜在的结合位点( hid是果蝇中一个诱导凋亡的基因),并证实 bantam miRNA抑制hid 的翻译而非转录。
        miRNAs的表达方式各不相同。部分线虫和果蝇的miRNA在各个发育阶段的全部细胞中都有表达,而其他的miRNA则依据某种更为严谨的位相和时相的表达模式(a more restricted spatial and temporal expression pattern)——在不同组织、不同发育阶段中miRNA的水平有显著差异。
 
miRNA的功能
    对microRNAs (miRNAs)的研究正在不断增加,原因是科学家开始认识到这些普遍存在的小分子在真核基因表达调控中有着广泛的作用。在线虫,果蝇,小鼠和人等物种中已经发现的数百个miRNAs中的多数具有和其他参与调控基因表达的分子一样的特征——在不同组织、不同发育阶段中miRNA的水平有显著差异,这种miRNAs表达模式具有分化的位相性和时序性( differential spatial and temporal expression patterns),提示miRNAs有可能作为参与调控基因表达的分子,因而具有重要意义。
    第一个被确认的miRNA——在线虫中首次发现的lin-4 和let-7,可以通过部分互补结合到目的mRNA靶的3’非编码区(3’UTRs),以一种未知方式诱发蛋白质翻译抑制,进而抑制蛋白质合成,通过调控一组关键mRNAs的翻译从而调控线虫发育进程(reviewed in Pasquinelli 2002)。
    bantam miRNA是第一个被发现有原癌基因作用的miRNA。除了lin-4、let-7,已知还有一些miRNAs可能参与在细胞分化和组织发育过程中起重要作用的基因的转录后调控,例如mir-14、mir-23 等。
    在植物miRNAs的研究中有两条线索提示miRNAs可能参与植物的发育过程。一是在carpel factory (car) 突变株中3个miRNAs的表达水平显著下降。CARPEL FACTORY 是一个类似Dicer的酶,参与植物的发育,其缺失突变株表现为胚胎和叶片发育的缺陷。实验结果提示这种缺陷是由于缺少miRNAs加工而造成的。多数的植物miRNAs在某些特定组织中高水平表达也提示他们可能参与了植物组织的发育。
    对一部分miRNAs的研究分析提示:miRNAs参与生命过程中一系列的重要进程,包括早期发育(Reinhart 2000),细胞增殖,细胞凋亡,细胞死亡(Brennecke 2003),脂肪代谢(Xu 2003)和细胞分化(Kawasaki 2003)。此外,一个研究表明,2个miRNAs水平的下降和慢性淋巴细胞白血病之间的显著相关,提示miRNAs和癌症之间可能有潜在的关系(Calin 2002)。
    由于miRNAs存在的广泛性和多样性,提示miRNAs可能有非常广泛多样的生物功能。尽管对miRNA的研究还处于初级阶段,据推测miRNAs在高级真核生物体内对基因表达的调控作用可能和转录因子一样重要。有一种看法是:miRNAs可能代表在一个新发现的层次上的基因表达调控方式。
    然而,大多数miRNAs的功能仍然是个谜。
 
miRNA的作用方式
    最早被发现的两个miRNAs——lin-4 and let-7被认为是通过不完全互补结合到目标靶mRNA 3’非编码区端,以一种未知方式诱发蛋白质翻译抑制,进而抑制蛋白质合成,阻断mRNA的翻译。多个果蝇miRNAs也被发现和他们的目标靶mRNAs的3’非编码区有部分同源。由于miRNAs和其潜在的目标靶之间并非完全互补,这使得通过信息学的方法鉴定miRNA的目标靶位点变得困难。因而也无法确定miRNAs的作用方式是什么,以何种机制影响mRNA的翻译,以何种方式调控基因表达。miRNAs的作用目标靶和活性机制一直是各地的研究人员的关注热点。
    在植物中目前有一个miRNA和3个潜在的目标靶基因完全互补(这些scarecrow 基因编码潜在的转录因子),尽管目前还不清楚这些基因是否就是miRNA的目标靶,这仍是第一次发现miRNA 和其潜在的目标靶完全互补,也提示miRNA可能包含和siRNA类似的作用方式。
 
识别 miRNAs的方法
    多个研究小组采用生物化学结合是生物信息学的方法开展对miRNAs的研究工作。由于据推测都是由Dicer酶降解RNA得到的,21—23个碱基大小、有5’端磷酸基和3’羟基的RNA片断,有的实验室采用改良的定向克隆方法来筛选具有相同特征的小分子——筛选一定大小的RNA分子,连接到3’和5’的适配子(adapters),逆转录并通过PCR扩增、亚克隆并测序。miRNA前体在基因组上的定位和聚类是通过向基因组数据库查询进行。这个方法有助于判断miRNAs是否是mRNAs、tRNAs、rRNAs等分子的降解产物。生物信息学的方法被鉴别出来,已经鉴别出来的miRNAs只不过是沧海一粟,由于很多已经鉴别出来的miRNAs是从单个克隆中鉴别出来的,所以可以假设还有很多miRNAs在分离和鉴定过程中被“漏掉”了,测序工作还远远不够。
    有的实验室通过一种RNA folding program ’mfold’  来判断C. elegans 和C. briggsae 之间的高度保守区域是否含有潜在的miRNA前体,然后用Northern Blots的方法来确定这些miRNAs是否真的表达了。
    尽管有数百个miRNAs通过生化或者是
1) miRNA的计算机RNA组学方法
    生物信息学方法是依据在不同的物种中,其成熟的miRNA 具有较大的序列同源性以及前体的茎环结构具有相当大的保守性这一特征在基因组数据库中搜索新的miRNA 基因。该方法根据比较基因组学原理并结合生物信息软件在已测序基因组中进行搜索比对,根据同源性的高低再进行RNA二级结构预测,将符合条件的候选miRNA与已经通过实验鉴定的miRNA分子进行比较分析,最终确定该物种miRNA的分布及数量。近年来随着miRNA预测方法的不断发展,人们发现的miRNA数量呈几何级数增长。这些预测方法从简单的序列比对搜索发展到现在的机器学习算法,程序设计越来越智能化,复杂化。
    随着人miRNA基因转录出的pri-miRNA迅速加工成具有茎环结构的pre-miRNA,随后被切割成miRNA:miRNA*双体,并被选择性地组合进核糖核酸沉默诱导复合体(RISC)并进行靶基因识别。在相似的物种中,miRNA是很保守的;但在相距较远的物种间,miRNA又有一定的分歧,尤其体现在pre-miRNA上。这些miRNA功能作用机制的阐明为预测软件的研发提供了理论依据,但仍需要不断修补和完善。近年来,几个基于这些规则的miRNA预测程序先后被开发(表1.1),并被广泛使用。
 

 


程序名

发布于

预测目标

适用方式

算法

输入序列格式

适用长度

涉及的程序

适用于

miRscan

2003

Pre-miRNA

Web

N

两物种比对序列

<100bp

Blast

线虫

miRseeker

2003

Pre-miRNA

Local

N





Mfold、AVID、Blast

果蝇

ERPIN

2001

Pre-miRNA

Local/Web



Fasta序列、Fasta文件



Blast

动植物

Srnaloop

2003

Pre-miRNA

Local

N

Fasta序列



RepeatMasker、Blast、RNAfold

线虫

MIRFINDER

2004

Pre-miRNA

Local

SVM

两物种比对序列



RNAfold、RepeatMasker、PatScan、RNAVIZ

植物

PalGrade

2005

Pre-miRNA

Local

SVM

基因组序列



RNAfold



MiRAlign

2005

Pre-miRNA

Web

N

Fasta序列

50-300bp

RNAfold、ClustalW、RNAforester

动植物

microHARVESTER

2005

Pre-miRNA & miRNA

Web

N

pre-miRNA、miRNA

<450bp

RNAfold、Blast、T-Coffee

植物

findMiRNA

2005

Pre-miRNA & miRNA

Local

N

Fasta序列



RNAfold、Blast、mfold

拟南芥

miR-abela

2005

Pre-miRNA

Web

SVM

Fasta序列、Fasta文件

<1000bp

RNAfold、SVMlight

动物

BayesMiRNAfind

2006

Pre-miRNA & miRNA

Web

NBS

Fasta序列

<500Kbp

Mfold、BLAT

动物

ProMiRⅡ

2006

Pre-miRNA & miRNA

Local/Web

HMM

序列(只包含A、G和C,T或U)

70-150bp

RNAfold、Blast、pipeline vist、HMmiRNApairwise

动物

Vmir

2006

Pre-miRNA

Local



基因组序列

<2Mbp

RNAfold、mFold

病毒

RNAz+RNAmicro

2006

Pre-miRNA

Local

SVM

多物种比对序列

<400bp

RNAz、libSVM

动物

Microprocessor SVM

2006

Drosha剪切位点

Local/Web

SVM

Fasta序列

<180bp

RNAfold、ScorePin、 Gist SVM

动物

miRDEEP

http://seqanswers.com/wiki/MiRDeep

miREAP

http://sourceforge.net/projects/mireap/

    miRTour: Plant miRNA and target prediction tool
 http://bio2server.bioinfo.uni-plovdiv.bg/miRTour/

MiRPara

http://www.whiov.ac.cn/bioinformatics/mirpara

MiRPara: a SVM-based software tool for prediction of most probable microRNA coding regions in genome scale sequences.

miRNAkey – A software pipeline for the analysis of microRNA Deep Sequencing data


http://ibis.tau.ac.il/miRNAkey/

2) miRNA的靶基因预测方法
     miRNA的研究意义之重大是毋庸置疑的。然而,与新的miRNA的频频发现相比,miRNA的功能研究相对缓慢。到目前为止,在发现的4449多个miRNA中,确定功能的miRNA仅有几十个。导致miRNA功能研究进展缓慢的非常重要的原因是miRNA的作用靶标难以确定。事实上,通过实验方法确定miRNA的作用靶标非常耗时,目前尚无高通量的靶标鉴定方法。因此,通过理论方法预测miRNA的作用靶标成为当前识别miRNA作用靶标的较为理想的途径。以下重点介绍几种经典预测软件的算法分析,其他软件(表1.2)请查看相应网站
 

 


表1.2  miRNA靶序列预测程序及查询数据库
Table1.2 miRNA target prediction programs and related databases

靶序列预测程序

适用物种

相关网站

EMBL miRtarget prediction

果蝇

http://www.russell.embl-heidelberg.de/miRNAs

miRanda

果蝇,脊椎动物

http://microrna.org/miranda.html

PicTar

脊椎动物,果蝇

http://pictar.bio.nyu.edu

TargetScan,TargetScanS

脊椎动物

http://genes.mit.edu/targetscan

RNA hybrid

果蝇

http://www.techfak.uni-bielefeld.de/persons/marc/mirna/targets

ViTa

病毒

http://vita.mbc.nctu.edu.tv

miTargert

动物

http://cbit.snu.ac.kr/~miTarget

MovingTarget

果蝇

——

MiRTif

动物

http://mirtif.bii.a-star.edu.sg

miRacle

动物

http://miracle.igib.res.in/miracle

PatScan

植物

Rhoades et al. (2002)

microTar

动物

http://tiger.dbs.nus.edu.sg/microTar

EIMMo

人,果蝇,线虫,斑马鱼

http://www.mirz.unibas.ch/ElMMo

miRU

植物

http://bioinfo3.noble.org/miRNA/miRU.html

DIANA-MicroT

人,鼠

http://diana.pcbi.upenn.edu/DIANA-microT

RNA22

动物

http://cbcsrv.watson.ibm.com/rna22.html

MicroInspector

动植物、病毒

http://mirna.imbb.forth.gr/microinspector

试验验证靶序列数据库

 

 

mirBase

 

http://www.microrna.sanger.ac.uk/targets/v2

TarBase

 

http://www.diana.pcbi.upenn.edu/tarbase.html

Argonaute

 

http://www.rna.uni-heidelberg.de/apps/zmf/argonaute/interface

miRNAMAP

 

http://mirnamap.mbc.nctu.edu.tw

miRGen

 

http://www.diana.pcbi.upenn.edu/cgi-bin/miRGen/v3/Targets.cgi


 
 
miRNA和siRNA的关系
    miRNA和siRNA之间的关系令人迷惑。从表面上说,一个是非编码的单链小分子RNA,在进化上高度保守,通过翻译抑制调控基因表达而不影响转录本的稳定性;另一个是针对编码区的双链小分子RNA,每个转录本都可能有很多个siRNAs,是通过降解目标靶,在转录后调控基因表达。由于每个mRNA模版可能产生很多个siRNAs,要给每个siRNA定一个基因的名字就很困难。miRNA是进化进程中高度保守的,因此给直向同源物一个同样的名字可能有助于了解他们的功能,而给另一个物种中一段无关的序列一个同样的名字就容易造成混乱。
    然而,据推测miRNAs通常是由较大的(70?90 nt)的茎环结构(发夹结构)前体经Dicer酶切割得到的,而Dicer同样负责将长双链RNA切割为siRNA,而且二者的长度也差不多,同样有调控基因表达功能。因而这两类小分子RNA之间的关系格外令人关注。
    两个广为人知的miRNA——在线虫中首次发现的lin-4 和let-7,可以通过部分互补结合到目的mRNA靶的3’非编码区(3’UTRs),通过一种未知方式诱发蛋白质翻译抑制从而抑制蛋白质合成。这种结合并不诱导mRNA靶的降解,就是说作为翻译抑制子本身不影响对应mRNA的丰度,其原因据推测是由于miRNA和结合位点之间不完全互补。这就区别于siRNA的介导的mRNA的降解。但是其他一些miRNAs可能以类似siRNA的方式介导目的RNA的降解。实验表明引入和let-7目的mRNA靶完全互补的miRNA会诱导mRNA靶的降解。还有实验结果表明一些miRNA,包括在植物中发现的Scarecrow miRNA,能结合完全互补的mRNA链从而降解mRNA序列,抑制蛋白合成。这提示miRNAs可以和siRNAs一样作用,这两种小分子RNA作用通路可能有重叠的部分。这种重叠同样提示siRNAs可能也有和miRNAs同样的功能。
    一个很有趣的实验证实这个观点:Doench和同事挑选一个已知在体内可以有效使CXCR4基因沉默的siRNA,然后在荧光素酶报告基因的3’端插入对应的CXCR4结合位点——其中一个拷贝是插入一个完全匹配的CXCR4结合位点,另一个拷贝插入4个只有3’和5’端匹配,而中间不同的CXCR4结合位点,这样选定的siRNA就不能完全结合到这个结合位点——中间形成一个突起的不匹配的环。将这两个拷贝转入Hela细胞并用siRNA诱导基因沉默。结果很有趣——两个实验都录得荧光素酶活性下降了超过10倍,RT-PCR和Northern分析证实,第一个实验的荧光素酶转录本下降了超过10倍,这正是正常的siRNA介导的RNAi反应,目标靶mRNA降解导致表达水平的下降,而第二个实验中荧光素酶转录本仅仅下降1.2倍,这种目的基因表达水平下看起来象源于miRNA介导的翻译抑制降,而不是siRNA介导的影响mRNA的稳定性导致。实验表明:siRNA可能以miRNA的方式作用于mRNA。实验人员还进行了另一个实验:改变第二个实验中的不匹配环的碱基序列看起来不影响抑制效果,但是siRNA和报告基因上的结合位点的匹配程度越高抑制效果越好,增加siRNA的量,抑制效果越好——这一点和siRNA抑制的情况一样——唯一不同的是:完全匹配的结合位点(siRNA作用方式)可以单独起作用而相互不影响,而增加不完全配对的结合位点(注意在第二个实验中用了4个CXCR4结合位点)的个数对翻译抑制有显著的加乘作用。
    在哺乳动物细胞中还没有找到内源的siRNA,外源的siRNA介导的RNAi作用正是一种抵御机制。而miRNAs则广泛存在于哺乳动物细胞中,从理论上推测可能参与多种调控作用。这两种小东西的作用机制和相互关系的本质就显得更加扑朔迷离。如何在实验中正确鉴定siRNA和miRNA,甚至是其他的小分子RNA都成为一个值得关注的问题。

miRNA与miRNA*

 

miRNA* 是 pre-miRNA 上的一段 RNA,其位置恰好与成熟的 miRNA 相对。虽然 Dicer 在对pre-miRNA 的加工过程中能够产生RNA 双链中间体,但是这种中间体通常寿命比较短暂而不易被探测。不过,如果大量的前体均可产生并只产生一种 miRNA,则其双链中的星号链也可以成为成熟的 miRNA。

miRNA*与miRNA在miRNA前体的两个不同臂上,普遍情况,miRNA进入复合体,miRNA*降解掉

所谓的星链(我们是这么叫的),其实所谓microRNA及其miR*是相对的,microRNA经过加工后是两条链的,但是在沉默复合体中有一条是有作用的,我们习惯上叫它microRNA,而另一条叫miR*,但是有一点希望你注意,那就是miR*与microRNA并非完全匹配。所以你根据microRNA的互补链的得到的序列不一定是miR*(


miRNA基因组位置

根据miRNA基因组位置,miRNA可以分为下列几种:1、位于编码蛋白质转录单元的内含子中;
2、位于非编码转录单元的内含子中;3、位于基因间隔区中。混合miRNA依据剪接模式的不同而成为以上一种基因组织形式。
一些内含子miRNA的位置在许多物种中是非常保守的[3-8]。 
另外一些miRNA基因在基因组中和表达模式中成簇排列,意味着它们的转录以多顺反子形式的原初转录本进行(图1.1)。
在人类基因组中大约50%的已知miRNA成簇表达,而且一个簇的miRNA经常是彼此相关的。

你可能感兴趣的:(miRNA的特征、功能及识别方法等详解)