2019-11-19

待整理:

现在,RNA-seq已经被应用到不同的研究方向(如图1.2),比如:基因和剪接异构体表达水平的估计,差异表达分析,剪接事件分析,寻找新剪接异构体,检测非编码RNA和融合基因(gene fusion)等。

基因表达系列分析(SAGE)是通过快速和详细分析成千上万个EST(express sequenced tags)来寻找出表达丰富度不同的SAGE标签序列。

在转录组学研究中,基因表达水平分析主要研究基因以及所包含的剪接异构体在转录过程中表达程度。

RSEM(Lict al,2011)对bowtic的比对结果进行统计,进一步得到了每个样品比对到每个基因上的readcoun数目,并对其进行FPKM转换,进而分析基因的表达水平。在RNA-seq技术中,FPKM(expected number of Fragments Per Kilobase of transcript sequence per Millions base pairs sequenced)是每百万fragments中来自某一基因每千碱基长度的fragments数目,其同时考虑了测序深度和基因长度对fragments计数的影响,是目前最为常用的基因表达水平估算方法(Trapnell,Cole,et al,2010)。所以我们将readcount数进行了FPKM转换。

raw data 和clean data有什么区别?

由Illumina HiseqTM2000测序所得的原始测序序列数据称为raw reads,测序得到的原始数据需要去除含有带接头和低质量的reads,为保证序列信息的分析质量,需要对raw reads进行过滤,得到高质量的clean reads,后续的分析都基于clean reads。
最终获得的clean reads使用Trinity 软件进行拼接,通过序列之间的overlap将序列延伸成contig,由contig 构建 compent 并建立优化de Bruijn graph,通过path最终形成转录本。

上传到ncbi的一般是哪种形式?
自己使用的测序

Illumina HiSeq测序。

二代测序常见的有几种平台类型?
测序技术 测序平台 测序原理
一代测序 ABI3730、ABI3500 双脱氧终止法,毛细管电泳法
二代测序 GS 454、SoLiD、Illumina HiSeq 焦磷酸测序法、连接测序法、测序边合成边测序法
三代测序 PacBio RS、Oxford Nan-opore Min-lon 单分子测序、纳米孔测序

测序技术迄今经历了三代的发展。其实,早在DNA双螺旋结构发现后不久,名为降解法(sequencing by degradation,SbD)的DNA测序技术便已经被发明出来,但是该方法操作复杂,结果不稳定,在当时没有被推广开来进行规模化的应用。紧接着,Sanger和Coulson在1975年发明了“Plus and Minus”测定DNA序列(Sangerand Coulson,1975);Maxam and Gilbert在1977年又发明了化学降解法测序。最终在同年,Sanger在核酸聚合反应中引入ddNTP(双脱氧核苷三磷酸),著名的双脱氧链终止法诞生(Sanger,Nicklen,and Coulson,1977)。此外在同一时期,其他的测序方法如连接酶测序法(sequencing by ligation,SbL)、焦磷酸测序法(pyrosequencing)、杂交测序法(sequencing by hybridization,SbH)(Drmanac R.et al.,2001;Drmanac R.et al,1989;Drmanac S.et al.,1998)等,由于技术条件的限制没有获得大规模的应用,这些技术统称为第一代测序技术
第二代测序技术是伴随着人类基因组计划诞生的测序技术(Schuster,2008)。自1990年起,随着测序规模越来越大,高通量测序平台,即第二代测序技术应运而生(Fuller ef al.,2009;Mardis,2008;Shendureand Ji,2008;王曦等,2010)。第二代测序技术主要有三种测序方法:Ilumina公司的边合成边测序技术,在该技术基础之上开发了Genome Analyzer 测序平台;Roche公司的焦磷酸测序技术,也称为454测序技术,在该技术基础上,Roche公司开发了GSFLX、GSJunior测序平台;ABI公司使用连接技术开发了Solid测序平台。

最近,第三代测序技术已经被开发出来,以PacBio公司的SMRT和Oxford Nanopore Technologies公司的纳米孔单分子测序技术为代表(Klumpp,Fouts,and Sozhamannan,2012;Niedringhaus et al.,2011)。其中PacBio SMRT的基本原理:DNA聚合酶和模板结合,4色荧光标记4种碱基(dNTP),不同的荧光配对显不同的颜色。同时DNA聚合酶是实现超长读长的关键之一。尽管该技术测序速度很快,但是其测序错误率高,达到15%。目前只能通过多次测序来进行纠错。Oxford Nanopore Technologies公司的单纳米孔单分子测序技术与以往的测序技术不同之处在于,它是基于电信号的测序技术。该技术的关键在于一种特殊纳米孔的设计,当单链的DNA碱基通过纳米孔时,流过纳米孔的电流强度就会发生变化。从电流的变化来识别不同的碱基,以达到测序的目的。

你可能感兴趣的:(2019-11-19)