Hemberg-lab单细胞转录组数据分析(二)

单细胞测序实验方法

开发scRNA-seq的新实验方法和操作手册是目前很火的研究领域,而且最近这些年已经发表了一些改进方法。上图可以看出检测的细胞数目以指数形式增加,以下是一份不完全的列表:

  • STRT-seq

  • Smart-seq

  • CEL-seq

  • MARS-seq

  • SCRB-seq

  • Smart-seq2

  • Drop-seq

  • InDrop-seq

  • CEL-seq2

  • Seq-well

  • SMARTer

  • Microwell-seq 【2018,郭国冀团队】

总体流程如下图所示:

这些方法可以用不同的方式分类,但两个最主要的优化是:定量捕获

定量有两种类型—-全长型标签型 (tag-based)。全长型力图捕获并均匀测序整条转录本,标签型只捕获转录本的5'3'端。不同定量方式需要自己对应的计算分析方法。全长方案理论上可以对整个转录本进行均匀测序,但实际上总会有测序覆盖偏好性的存在。标签型的主要优点是可以与唯一的分子标识符(UMIs)结合进行更精确定量 (后面详细描述)。其缺点是,测序限制在转录本的5'3'端,可能会降低比对率,并且难以区分不同剪接体的表达。

捕获的策略决定了实验通量、细胞如何被选择和除测序外的哪些额外信息可获得。最常用的三种捕获方式是基于微孔- (microwell-),微流- (microfluidic-),液滴- (droplet-),细分如下图所示。

对于基于微孔的捕获平台,先用移液管或者激光切割的方式分离细胞并放到微流孔中。它的一个优点是可以结合流式细胞荧光分选(FACS, fluorescent activated cell sorting)根据表面Marker分选细胞。因此特别适合分选细胞子集用于测序。另一个优点是可以获得细胞形态全览图,提供多一个维度的信息,可用于鉴定微孔中是否有损伤的细胞或双份细胞,主要缺点是通量低且每个细胞所需的工作量相当大。

微流型平台,比如Fluidigm’s C1,提供了一个更加整合的系统,同时可以捕获细胞和完成文库构建的准备过程。因此它们比微孔型平台通量更高。但是微流型平台大约只能捕获10%的细胞,不适合处理稀有细胞或者细胞量很少的情况。此外,微流控芯片相对昂贵,不过更小的反应体积可以节省试剂的费用。

液滴型方法是将单独的细胞和一个包含建库所学酶的珠粒 (bead)包裹在一个纳米级液滴里面。特殊地,每个珠粒(bead)包含一段独特的条形码序列 (barcode),会加到所有来自于液滴里面这个细胞的序列上,用于区分不同细胞的转录本。因此所有的液滴可以混合在一起测序,然后再根据barcode序列确定其是否归属于同一细胞。液滴型平台通常有最高的通量,因为文库的准备成本很低,约为0.05美元/每个细胞。随之而来的,测序成本往往是其限制因素,通常测序深度比较低,只检测几千个转录本的表达。

Microwell-seq是浙江大学郭国冀老师研究组综合以上技术的优势开发出的新的大规模低成本单细胞捕获测序技术,单个细胞制备成本可以到0.02美元。

采用光刻技术制作微孔矩阵硅片(微孔直径28 um,深度35 um,100,000个微孔),以此为模具制作PDMS微柱模具。这两个模具可以反复使用。最终用于富集的微孔板是通过倾到5%的琼脂糖凝胶到PDMS微柱模具上生成的。细胞悬液加到凝胶微孔模具上,利用重力使细胞落入微孔,通常一个微孔只能容纳一个细胞,一块板子可以同时捕获约10000个单细胞。每一步操作都可视、可控制,doublets可以通过镜检洗除。随后每个空加入包含107-108特定探针集的与孔径大小匹配的磁珠,标记每个细胞中的mRNA(每个磁珠的寡核苷酸序列中都有一段特异的序列用于标记细胞来源),然后使用Smart-seq2方法进行后续的反转录、扩增。扩增后的cDNA片段使用转座酶片段化(这步倒有些类似ATAC-seq),富集3’末端转录本序列测序。

如何选择合适的平台?

平台选择取决于手上的生物问题,举个例子,如果一个人对描述组织的细胞类型构成感兴趣,能够捕获大量细胞的液滴型平台很可能是最合适的,而如果感兴趣的是有已知的表面Marker的稀有细胞群体,那最好用流式细胞FACS分选法富集细胞并对少量细胞进行测序。

如果对研究不同剪接体的表达感兴趣,全长转录本定量会更适合。相反,UMIs只适用于tagged protocol,更有利于稳定定量基因水平的表达。

Enard团队和Teichmann团队的最近两项研究对几种不同单细胞分选和建库方案进行了比较,Ziegenhain等用同一种老鼠胚胎干细胞 (mESCs)比较了五种不同方案。通过控制细胞数量和测序深度,作者能直接比较不同方法检测敏感性,噪音水平和费用差异。他们的一个结论如下图,不同方法检测到的基因数量 (检测阈值固定)差别挺大。如图所示,drop-seq检测到的基因数目最少,和Smart-seq2检测到的基因数差了近乎两倍,意味着不同方案的选择对研究影响很大。

Svensson等人则采用了一种不同的方法,即通过使用已知浓度的合成转录本 (spike-ins, 后面详细介绍)来评估不同方案的准确性和敏感性。通过广泛比较同样发现不同的细胞分离建库方式差别较大。Bulk测序的准确性和敏感性相对最好,其它方法准确性高的,敏感性就会差一些。

随着实验操作技术的发展和计算方法的改进,后续研究可以帮助我们进一步了解不同方法的适用优缺点。这些比较研究不仅有助于研究人员决定使用哪种方案,而且可以通过基准测试确定哪个方法组合最有效来研发新的单细胞实验和计算方法。

你可能感兴趣的:(LINUX,生物信息,转录组,生物信息,单细胞,转录组,单细胞转录组)