10x Genomics单细胞全长转录组测序

敢问目前最火的转录组研究技术是什么?我想回答一定是单细胞转录组测序(scRNA-seq)和全长转录组测序(Iso-Seq)。由于其各自的优势,近几年scRNA-seq和Iso-Seq在转录组研究中大放异彩。那么有没有比二者更火的转录组研究技术呢?当然有,那就是即将为大家介绍的新产品—10x Genomics单细胞全长转录组测序(10x scIso-Seq),该产品同时结合scRNA-seq和Iso-Seq技术优势,可在进行单细胞水平基因表达分析的基础上实现单细胞全长转录本的研究。

 

技术背景

目前,已有多项研究表明不同细胞类型间存在广泛的Isoform多样性。相比于普通转录组测序通过短读长拼接获得可变剪切信息,Iso-Seq直接获得全长转录本序列,为准确进行可变剪切的研究开创了新局面。但目前Iso-Seq主要广泛应用于组织整体的Isoform分析,在单细胞上的成功应用也仅限少量细胞。

举个例子 ▼

例如,基于FACS分选、SMART-seq2单细胞cDNA扩增结合三代测序的方法对7个小鼠B1a细胞的转录组分析表明,这些细胞间存在广泛的Isoforms多样性[1]。而利用二代数据很难分析一个基因位点的多个亚型,对于三代数据在单个细胞中鉴定的CD37基因的几种Isoforms,Illumina数据要么无法组装出完整的Contigs,要么产生其他未检测到的Contigs。

图1 小鼠B1a细胞间基因Isoforms的多样性(图片来自参考文献[1])
图2 短读长测序和长读长测序进行小鼠B1a细胞间基因Isoforms研究的比较(图片来自参考文献[1])

虽然基于类似的方法已经实现了近百个细胞的单细胞Isoforms研究[2],但远远达不到10x Genomics单细胞转录组测序的细胞数目,这严重限制了这类技术的大规模应用。但目前的scRNA-seq由于采用短读长测序,一般仅被用于实现单细胞水平的基因表达定量。而将10x Genomics的高通量单细胞捕获平台与常规的Iso-Seq结合,实现两种技术的优势互补,无疑是最佳的解决方案。

 技术原

贝瑞基因推出单细胞水平和全长转录本兼得的转录组研究利器—10x scIso-Seq将10x Genomics单细胞转录组测序与PacBio测序平台的全长转录组测序相结合,即利用10x Genomics单细胞平台进行数千至上万个单细胞的捕获和全长cDNA的扩增(被细胞特异性10x Barcode编码)。然后将上述cDNA分为两份,一份进行10x Genomics单细胞转录组文库构建和测序;对另一份被同样的细胞特异性10x Barcode标记的全长cDNA,我们采用在PacBio SMRTbell文库基础上自主优化的文库构建技术进行全长转录组文库构建,并在PacBio Sequel II平台上进行测序。最后为实现上述两种数据的联合分析,我们自主开发的分析流程可在全长转录组序列中识别和检测Barcode序列,并与Illumina序列中被细胞类型分类的Barcode进行匹配,确定每个全长转录组序列的单细胞来源,从而实现Isoform的细胞类型分类。

图3 10x scIso-seq技术原理


 技术优势 

由于10x scIso-Seq是在10x Genomics单细胞转录组测序的基础上结合了常规Iso-Seq测序,因此该技术与常规10x Genomics单细胞转录组测序、Iso-Seq和基于其他平台的单细胞全长转录组测序技术相比都具有明显优势:

基于10x Genomics单细胞捕获平台,可同时实现上万个细胞的全长转录组测序,通量远高于其他单细胞全长转录组研究方法,实现细胞组成复杂组织的单细胞全长转录组研究。

同时进行单细胞转录本3’端测序和全长转录组测序,可进行常规10x Genomics单细胞转录组和Iso-Seq的全部分析;同时由于两种测序数据来自相同的cDNA序列,可实现两种数据的联合分析,如挖掘细胞类型特异性Isoforms和细胞类型间Isoforms比较,为单细胞转录组研究提供更多信息。


  举个例子 ▼

2018年发表的一篇同时结合二代和三代测序数据对小鼠小脑单细胞转录组的研究就体现了细胞类型分辨的Isoform的巨大优势[3]。该研究首先利用短读长测序将6627个细胞分成17个簇,同时基于长读长测序注释了大量细胞类型特异的Isoforms。例如,对阿尔茨海默症相关的重要基因Bin1在小鼠参考基因组Gencode中注释了四个可变外显子(A1、A3、A4和A5)和两种组合类型。利用该方法则发现了另外两个可变外显子A2和A6和12种新组合。其中,神经元单细胞的主要Isoforms(包括A1-4和A6,但不包括A5)和小胶质细胞、少突胶质细胞的主要Isoforms(外显子A1-6跳跃)在Gencode中没有被注释。比较发现,在Bin1的Isoforms在细胞类型间存在明显差异。例如,可变外显子A1和A2-6的跳跃发生在所有的小胶质reads和在大多数的星形胶质细胞和少突细胞reads中,但不是在神经元亚型。

图4 细胞类型间阿尔茨海默症相关基因Bin1的Isoforms差异左:基于短读长测序的细胞聚类;右:各细胞类型中阿尔茨海默症相关基因Bin1的Isoforms比较(图片来自参考文献[3])


参考文献

1. Byrne A, Beaudin A E, Olsen H E, et al. Nanopore long-read RNAseq reveals widespread transcriptional variation among the surface receptors of individual B cells[J]. Nature communications, 2017, 8(1): 1-11.

2. Volden R, Palmer T, Byrne A, et al. Improving nanopore read accuracy with the R2C2 method enables the sequencing of highly multiplexed full-length single-cell cDNA[J]. Proceedings of the National Academy of Sciences, 2018, 115(39): 9726-9731.

3. Gupta I, Collier P G, Haase B, et al. Single-cell isoform RNA sequencing characterizes isoforms in thousands of cerebellar cells[J]. Nature biotechnology, 2018, 36(12): 1197-1202.

你可能感兴趣的:(10x Genomics单细胞全长转录组测序)