【陈巍学基因-3】small RNA-seq

Micro RNA参与许多的生命调节过程,是近十年来的一个研究重点。

这次介绍:
1.small RNA建库测序方法
2.small RNA的生物信息学分析

  • 表达量差异分析
  • 聚类分析
  • 靶基因的Gene Ontology分析(GO分析)
  • 靶基因的KEGG Pathway分析

3.血清、血浆micro RNA测序

  • 意义
  • 样本准备

视频时长11分钟,建议在Wifi条件下观看:
视频地址:https://v.qq.com/x/page/l0311patuuj.html

small RNA-seq,也就是“小RNA的测序”。小RNA,包括了micro RNA/tRNA/piRNA等一系列的、片段比较短的RNA。其中,micro RNA因为其基因数量众多,同时,表达量变化丰富,是近10年来的一个研究重点,我们今天分2部分来介绍samll RNA测序。

  • 第1部分是介绍small RNA的建库测序方法。
  • 第2部分是介绍small RNA的生物信息学分析。

建库方法

这张图是small RNA建库的流程图。在small RNA的结构上,都是5’端有一个磷酸基团,在3’端有一个羟基基团。

在建库过程中,先在它的3'端连上一个3'端专用的接头。然后,再在5'端连上一个5'端专用接头。

然后进行逆转录,得到第一链的cDNA。

接着再进行PCR扩增这样就得到了双链的测序文库。

这张图,就是建好的small RNA文库。

用Agilent Bioanalyzer 2100进行电泳,得到的电泳图。

如图所示,扩增之后得到的small RNA的文库。

在整个的扩增混合物中,只占很小的一个比例。

所以,一般情况下,这个文库还要经过进一步的电泳胶分离。切胶回收,才能得到比较纯的、我们要的small RNA文库。

纯化好的文库,再用Agilent Bioanalyzer 2100进行电泳。我们就可以看到比较纯粹的small RNA文库了。

目前用illumina Truseq small RNA建库试剂盒。对组织中抽提到的总RNA进行small RNA建库。一般一个反应需要1微克的总RNA。同时small RNA建库,对(总)RNA的质量也会有一定的要求。一般是要求总RNA的RIN值大于等于8.0。

生物信息分析

接下来,介绍第2部分:small RNA的生物信息分析。

small RNA生物信息分析的第1步,是把测序的序列进行过滤。也就是把引物二聚体、和含有多个N的这些序列去掉。然后,就是统计各种长度的small RNA各有多少条。一般情况下,人源组织所测到的small RNA会在22BP左右有一个主峰。这个主峰就是micro RNA,同时,30BP左右又会有一个副峰,这个峰,主要是piRNA。

第二步,就是把small RNA,比对到参考基因组上。在参考基因组上比对好之后,就可以把这些序列和已知的small RNA数据库进行比对了。比较有名的small RNA数据库是miRBase,这个数据库目前这个数据库已经收录了2000多条人源的micro RNA基因。在对人源样本的测序过程当中,大家最关心的主要是micro RNA和piRNA,这2种small RNA。那么在测序过程当中,实际上还会测到rRNA的碎片和tRNA的序列。因为rRNA和tRNA在人的基因组中是十分保守的,所以一般不是我们关注的重点。

对表达量的分析

对已知small RNA的分析,主要是对表达量的分析。small RNA的表达量,一般用TPM来衡量。TPM是Transcripts Per Million reads的缩写。也就是1百万条测到的序列当中,某个目标small RNA的序列条数。TPM的密度分布图,能整体展示样本的small RNA基因表达情况。图中,横轴是一个small RNA基因的表达量。越向右呢,则这个基因的表达量越高。纵轴是有特定表达量的基因数量,越向上,则基因数目越多。

从这张图上可以看出,少量的基因有高表达,大多数基因的表达量,还是相对偏低的。用火山图,则可以整体地观察两个样本之间的表达差异。火山图的横座标,是某个small RNA基因的表达的增减。从0向右,则表达量上升,从0向左,则表达量下降。纵轴则是表达量差异的显著性,越向上,则差异越显著。一张火山图,可以让我们轻松地观察2个,样本之间,small RNA的表达差异。

聚类分析,则可以帮助我们直观地观察,一批样本当中,那些样本有共同的表达特征。又有哪些small RNA基因有相似、相近的表达量。

如这张图中所展示,样本经过聚类分析,明显地可以看出,其small RNA的表达谱,呈现2种表达情况,上绿下红的样本呢,自然地被分到了一组,上红下绿的样本呢,就会被自然地分到另外一组。通过聚类分析,我们可以观察到样本内在的共同特征。

在人类细胞中micro RNA主要是通过和mRNA结合,来阻止mRNA翻译成蛋白,从而起到抑制靶基因表达的作用。目前,只有少数的micro RNA和靶基因mRNA的对应关系是经过了实验验证的。大多数还是通过序列互补、结合热稳定性等预测性手段来预测的。所以,这些关系不是很精确的。虽然这种预测不是很精确,但是它能为我们的科研提示有用的研究目标。

靶基因 GO 和 Pathway 分析

GO分析和KEGG Pathway分析是非常常用的生物信息学分析手段。通过GO分析,表达差异被富集到分类的GO的子项目当中,通过这个图,可以看到“生物过程”、“分子功能”、和“细胞组件”的哪些环节出现了明显的差异。柱子越高,则表示差异越明显。

有向无环图,是进一步把差异一步一步地富集到更精细的小概念当中进行展示。

在这个图当中,越向下,功能就越是细分。同时,颜色越深的方块呢,则表示差异在这个小概念当中,富集程度越高。通过对表达差异的micro RNA和它对应的靶基因进行KEGG分析,可以把可能被影响到的通路进行富集分析。这个图,就是KEGG分析的结果。在此图中,KEGG富集的程度,通过富集因子、Qvalue、和富集到此通路上的基因个数,来进行衡量。

点的面积越大,则富集的基因数越多,富集因子越大,则表示富集的程度越大。接下来这个通路图,是对某个特定通路的进一步的细化分析。

它可以让我们看到,在一个整体的通路中,具体是哪个、或哪几个节点会有显著的差异。

寻找新的 micro RNA 基因

寻找到新的micro RNA基因。一般是测序测到新的、有发夹结构的microRNA前体的序列,同时测到对应的成熟的micro RNA序列,并且在基因组上又找到了对应的基因序列,这样,大体上就判断(可能是)找到了一个新的micro RNA基因了。

血浆 micro RNA 测序

随着技术的持续进步,目前用血清、或者血浆中的micro RNA来诊断疾病,成为诊断医学十分关注的一个研究方向。这是因为:

    1. 血清当中有大量的、种类丰富的micro RNA。并且这些micro RNA可以相对稳定地存在
    1. 同时我们已经知道micro RNA参与多种基因的表达调控
    1. 血液又是我们最容易获得的诊断样本之一
    1. 而且,目前血清、或者血浆中的micro RNA已经可以被方便地测到

所以,许多学者都在研究血清micro RNA,以期望从中找到新的诊断Biomarker。目前,做一个血清micro RNA测序,大约只需要0.5毫升左右的血清、或者血浆。也就是相当于1毫升的原血就够了。用于micro RNA测序用的血清、或血浆,可以用3倍体积的Trizol LS来进行保存。也就是说,0.5毫升的血清,加上1.5毫升的Trizol LS。混合均匀之后呢,-20℃、或-80℃保存。然后,通过干冰运输,交给专业的测序公司,就可以进行测序、分析了。

参考:https://mp.weixin.qq.com/s/HcHmyayU_6Or28Pp-iq1cQ
转载请注明出处

你可能感兴趣的:(【陈巍学基因-3】small RNA-seq)