前言
细胞是生命的基本单位
大多数关于人类基因组、癌症或其它领域的研究,是从多个细胞水平进行的,实验结果往往是 细胞群体基因表达的均值,或者 只代表数量上占优势细胞的生命活动信息,而无法准确反映样本中细胞异质性的很多信息,忽略了细胞间基因表达调控的差异性。
一、什么是单细胞转录组?
什么是bulk RNA-seq
RNA-seq用于由细胞混合物组成的样本中,称为bulk RNA-seq,常用于研究control/diseased、wild-type/mutant之间的转录组差异。然而,使用bulk RNA-seq,我们只能估计每个基因在细胞群中的平均表达水平,没有考虑该样本中单个细胞基因表达的异质性。
举个栗子,早期发育研究或大脑等复杂组织。
为了解决异质性的问题,2009年首次报道了单细胞水平的RNA-seq,即scRNA-seq,与bulk RNA-seq不同的是,使用scRNA-seq可以评估每个基因在不同细胞群中的表达水平分布。
成功解决了转录组中细胞特异性变化的问题。可以发现新的或稀有的细胞类型,识别control/diseased组织之间的差异细胞组成或了解发育过程中的细胞分化。
二、为什么要进行单细胞转录组研究?
普通转录组(Bulk RNA)是生物组织样品中在某个时间对应的所有mRNA转录情况,通常作为组织或者样品某个时刻状态的重要指标,不同的样品、不同组织、不同物种、不同的处理都会造成mRNA表达情况的改变,从而调控机体的生命状态或者执行某些细胞功能,相对于蛋白而言,mRNA的稳定性和检测的便利性,大大促进了转录组技术的发展和应用。
“Every cell is unique—it occupies an exclusive position in space, carries distinct errors in its copied genome and is subject to programmed and induced changes in gene expression. Yet most DNA and RNA sequencing is performed on tissue samples or cell populations, in which biological differences between cells can be obscured by averaging or mistaken for technical noise.” ----Method of the Year 2013(Nature Methods )
但是样品或者组织的转录组是所有细胞的一个转录组表达量的平均值,不能反映样品中所有细胞或者某群细胞的状态,因此需要对单个细胞的或者某群细胞的转录状态进行深入的研究,这样将更精细、更准确反映组织的状态。
如果在进行免疫或者药物反应研究的时候,可以更精准地针对细胞或者细胞亚群进行免疫治疗或者靶向治疗,这是精准医疗必要条件。
世界上没有两片相同的叶子。对于多细胞生物来说,细胞与细胞之间是有差异的。当然了,这个差异可大可小。
比如说,受精卵从一个细胞开始分裂,并逐渐形成囊胚,最终发育成个体的时候,细胞与细胞之间的差异会越来越大:有的分化成神经元,有的分化成骨骼肌,各自表达着不同的遗传信息,承担着不同的生理功能。
又比如在肿瘤组织中,肿块中心的细胞,肿块周围的细胞,淋巴转移灶的细胞,以及远端转移的细胞,其基因组和转录组等遗传信息,是存在差异的。而这种差异,在临床上,可以决定该肿瘤对某种疗法是否有效。
这就是所谓的遗传信息的异质性。
传统的研究方法,是在多细胞水平进行的。因此,最终得到的信号值,其实是多个细胞的平均,丢失了异质性的信息。为了让大家能够更加直观地理解这个问题,我们不妨来看下面这张图:
为了检测某个蛋白质的表达量,我们可以用Western blot和流式细胞术来实现。但是,用Western blot的话,我们并没有办法区分上述的情况:目的蛋白只在10%的细胞中强表达,还是在50%的细胞里中等表达,还是在所有细胞中弱表达呢?因为最终电泳跑出来,就是一条差不多强度的带。但如果用流式细胞术这种在单细胞水平对荧光强度加以测定的技术,就能区分上述的情况了。
同样道理,单细胞测序能够检出混杂样品测序所无法得到的异质性信息。而这将带领整个遗传学领域进入新的次元。
三、如何实现单细胞测序?
单细胞测序流程包括:单细胞的分离制备、遗传物质的提取扩增以及遗传物质的高通量测序。
01 细胞分离
相比传统测序,单细胞测序需要先将组织或体液中的细胞群分离成单个细胞,而这也恰恰是难点之处。
主要的技术包括梯度稀释法、显微操作技术、荧光激活细胞分选、微流控技术和激光捕获显微切割。
核心策略包括两种:
- 一是将单个细胞分离出来,并独立构建测序文库;
- 二是基于标签(Barcode)的单细胞识别。
采用策略一,挨个分离单细胞再分别建库测序,就像是把米一粒粒从谷仓里播出来,而面对一个组织样本上万的细胞数量,这样显然是杯水车薪,不仅受成本限制,最终通量也会非常低。
为了克服这个困难,标签(barcode)的巧妙应用让单细胞识别提高了效率:不需要挨个分离并提取出单个细胞,只需要给每个细胞加上一个独一无二的核酸序列标签再测序分析即可。微流控便是应用了这一原理,细胞通量提高的同时,周期快速、成本低,细胞捕获效率也大大提升。
这种策略就好像银行的取号排队系统:将不同的客户打上不同的标记,并分配特定的窗口,按需排队。无数的“大堂经理”水凝胶将不同的“核酸标签”编号交给不同的顾客,并带着顾客们一个个排队进入大厅办理“测序”业务。一次实验,就能测得数百上千个单细胞的信息。
不过,针对具体的测序类型,给细胞加 barcode 的方案有不小的区别。
对于RNA(转录组mRNA)来说,会比较容易理解一些。由于mRNA测序前需要做逆转录,那么我们只需要在poly T引物的5’端加入barcode即可。具体可见下面的示意图:
如果测序对象是DNA,比如全基因组,就需要用别的方式来加barcode。目前主要是通过一种经过改造的高效转座酶(transposase)Tn5来实现。
02 基因组扩增
如果单个细胞中的DNA和RNA含量无法达到测序要求,需要对其进行扩增。目前分为单细胞全基因组扩增和单细胞转录组扩增。
单细胞全基因组扩增(WGA)是通过将单个细胞溶解得到微量基因组 DNA 进行高效地扩增,获得高覆盖度的单细胞基因。最常用的技术为有多重置换扩增技术(MDA)。
单细胞转录组扩增,则需要通过PCR将mRNA逆转录成cDNA。Smart和Smart-seq2 是目前常用的mRNA全长扩增技术。SMART用多聚 T 碱基作下游引物开始逆转录,使用逆转录酶SMARTscibeRT 酶,在转录的末端延长出几个超过模板的 C 碱基,转录出c DNA带 3 个 G 碱基的上游引物进行扩增。Smart-seq2技术利用全基因组扩增技术中用到的 Phi29DNA 聚合酶的链置换和连续合成特性,对环化的 cDNA 进行高效扩增6。
基于二代测序平台的单细胞基因组测序技术(scWGS)作为一种功能强大的工具,能够在单细胞层面研究全基因组水平的遗传变异,包括拷贝数变异(CNV)和单核苷酸变异(SNV)等,进而可用于研究细胞间的遗传异质性、细胞谱系分化、以及克隆演化等问题。然而,二代测序平台虽然具有测序准确度高的优点,但是其测序读长相对较短(150bp X2),目前已有的基于二代测序平台的单细胞基因组测序技术更适用于检测基因组拷贝数变异(CNV)、短的插入缺失(Indel,50bp)的检测仍然具有很大的局限性。
四、核心原理&实验流程
10x Genomics单细胞转录组测序技术如何在单细胞维度上获取基因表达信息?
单细胞转录组测序的显著优势在于能够在单细胞水平上对细胞转录组进行测序,即在更高分辨率的水平下对细胞的差异表达进行检测。因此,该技术的核心在于能够成功区分样品中的不同单细胞转录本。10x Genomics平台利用微流控技术,结合Barcode-单细胞-油滴的对应关系,最终得到了捕获单个细胞的“胶珠”,实现了真正意义上的单细胞测序。
该方法的基本实验流程包括细胞悬液制备,加条码和文库构建、高通量测序、数据分析和可视化报告。使用该平台前先要对样本进行解离,以制备符合上机要求的单细胞悬液。在完成细胞悬液的制备后,即可将悬液和建库试剂加入芯片,然后上机。该仪器基于微流控技术,能将单个细胞与带有条形码和引物的凝胶珠包裹到微液滴中,完成单个细胞的捕获。单个细胞捕获完成后,在微液滴中进行细胞裂解,再通过逆转录得到cDNA并扩增,最后进行高通量测序。
该方法的核心在于凝胶珠的设计——每个凝胶珠上包含数十万条探针,这些探针由TruSeq Read 1、10x Barcode、UMI及Poly(dT)VN组成,分别用于结合测序时所需要的引物序列、区分不同微液滴中的单个细胞、区分同一细胞中不同的mRNA序列以及捕获细胞中的mRNA。最终测序所得的序列将根据10x Barcode及UMI序列来对不同的单细胞和同一细胞中不同的mRNA序列进行区分,最终得到单细胞分辨率下的表达谱。
五、怎样进行单细胞转录组研究?
在思考这个问题之前,我们首先需要考虑的是什么是单细胞转录组?只有了解单细胞转录组本质以后,才能更好了解如何去研究?
10xGenomics单细胞转录组基本流程如下图所示,我们最终得到的是一个表达矩阵,此矩阵一般每行为基因,每列为细胞。其实这个矩阵就是每个细胞所有的基因表达情况。
后续10xGenomics单细胞转录组的分析几乎都是基于上述方式得到的表达矩阵进行分析的,不管是聚类还是发育轨迹构建,其实单细胞转录组研究的本质就是研究我们捕获细胞的的异质性,也就是研究细胞与细胞具体有什么差异,研究样品中有什么类型的细胞,这些细胞有什么差异。
异质性具体如何研究?虽然现在单细胞转录组分析的工具和方案有几百种,就本质来说,只有两种研究方法:一种是细胞类型的差异;另外一种是发育轨迹的构建。现在所有的工具都可以归类到此两类。
单细胞转录组表达矩阵的获取
10xGenomics单细胞转录组表达矩阵一般是通过cellranger软件获取,cellranger为10xGenomics官方分析软件,一般后续高级分析或者重新分析都是基于此矩阵。
具体cellranger使用方法如下图所示:
一般cellranger资源消耗如下图所示:
单细胞转录组测序的一般流程包括细胞质控、批次评估/校正、降维聚类、分群注释、差异表达、富集分析、拟时分析、细胞间相互作用分析和其它深度分析。
其中,
- 细胞质控是为了剔除低质量的细胞;
- 批次评估/校正是为了去除批次效应对数据的扭曲;
- 降维聚类是为了将数据转变为低维可视化结果;
- 分群注释是为了对细胞类型进行鉴定以找出特异性的细胞类型;
- 差异表达是为了获得细胞类群间/不同分组间的差异表达/特征基因;
- 富集分析是为了揭示特定细胞亚群参与的生物学过程,确定其生物学功能;
- 拟时分析能够揭示细胞亚群间在时间上的动态变化和前后发育关系;
- 细胞间相互作用分析能够了解某一细胞亚群是通过哪些受配体、影响哪些其它细胞亚群来行使其生物学功能的。
此外,还有一些深度分析方法可根据特定研究目的进行设计和使用。
六、单细胞测序的应用
单细胞测序技术,能够揭示单个细胞的基因结构和基因表达状态,反映细胞间的异质性。随着精准治疗时代的到来,已经应用于肿瘤检测、胚胎发育、免疫细胞治疗及干细胞分化等一系列生物医学的研究和临床试验中,正成为生命科学研究的焦点。
随着精准治疗时代的到来,未来单细胞技术,将会有助于人类的科学研究以及临床应用,尤其是在肿瘤、微生物、神经科学、免疫学等领域,应用会越来越广泛。
01 肿瘤研究
2021年6月15日,Cell 杂志发表了一篇通过单细胞分析探测肿瘤的血管选定研究的文章。该研究采用了单细胞转录组测序技术(scRNA-seq),对31964个具有AAT(抗血管生成)抗性小鼠的肺肿瘤血管内皮细胞(TECs)和周细胞进行了检测。结果显示实验组与健康对照组的TECs和周细胞的表达谱都非常相似。同时还发现基质重塑巨噬细胞有助于浸润性癌细胞的血管选定;M1样巨噬细胞亚型可使血管细胞保持静止。该研究重在体现对抗VEGF(血管内皮生长因子) 阻断 AAT时,肿瘤血管选定的临床重要性,而且有助于确定肿瘤血管的细胞表型,从而在研究抑制肿瘤新生血管生成,抑制肿瘤细胞的生长和转移的道路上向前迈进了一大步5。
02 新冠治疗
2020年7月,北京大学谢晓亮团队在Cell上发表了一篇关于新冠病毒特效药的文章。此项目首先从60名新冠康复病人的血液中分离出B细胞,利用单细胞转录组+单细胞BCR测序技术对这些B细胞进行检测,筛选出8558种病毒蛋白结合抗体序列,并找出14株高活性的中和抗体。之后进行小鼠实验,最终成功筛选出一种非常有效的中和抗体BD-368-2。经实验证实,此中和抗体可以大幅度提升新冠治愈率,缩短治愈时间,甚至可以提供短期的病毒免疫,在治疗和预防方面都发挥重要作用7。
03 阿尔兹海默症研究
2019年5月,Nature报道,通过对24名阿尔茨海默病人和24名正常人尸检大脑样本的8万个细胞进行单细胞转录组测序。研究不仅分析出兴奋性和抑制性神经元,还分析稀有的非神经元脑细胞,如少突胶质细胞、星形胶质细胞和小胶质细胞。这些细胞类型中的每一种在阿尔茨海默病患者中都表现出明显的基因表达差异。其中,轴突再生和髓鞘形成相关的基因在阿尔茨海默症中表现出明显差异8。
除此之外,单细胞测序也应用于“人类细胞图谱计划”开展、胚胎和组织器官发育研究等研究当中。
七、单细胞测序的未来与趋势
01 单分子测序加持
基于二代测序平台的单细胞基因组测序技术(scWGS)作为一种功能强大的工具,能够在单细胞层面研究全基因组水平的遗传变异,包括拷贝数变异(CNV)和单核苷酸变异(SNV)等,进而可用于研究细胞间的遗传异质性、细胞谱系分化、以及克隆演化等问题。
然而,二代测序平台虽然具有测序准确度高的优点,但是其测序读长相对较短(150bp X2),目前已有的基于二代测序平台的单细胞基因组测序技术更适用于检测基因组拷贝数变异(CNV)、短的插入缺失(Indel,50bp)的检测仍然具有很大的局限性。
为了克服二代测序平台测序读长短的缺点,三代测序技术应运而生。在过去的十年中,长读长单分子测序技术的出现极大地促进了基因组学领域的发展。但是人体一个单细胞中的基因组DNA只有6pg(0.000006微克)左右,而目前长读长单分子测序通常需要1微克以上的基因组DNA(相当于数十万个细胞的基因组DNA含量)作为起始样品,因而无法用于微量样品以及单细胞样品的基因组测序。
为了解决以上难题,来自北京大学的汤富酬研究组开发了一种高精度的基于单分子测序平台的全新的单细胞基因组测序方法9。该方法使用优化后的Tn5转座反应,能从单个细胞中扩增出平均长度约6kb的基因组DNA片段(测序读长相比于基于二代测序平台的单细胞基因组测序技术增加了20倍)。测序后的数据中,产生的环化测序(circular consensus sequencing, CCS)片段的平均读长在6kb左右, 最长可达43kb。
02 单细胞测序的未来趋势
目前,全球潜在科研市场体量已经达到130亿美元以上,单细胞测序技术的市场更以年均20%以上的速度逐年增长。单细胞分析技术在临床和药物开发方面的应用前景更为广阔。
如今,单细胞测序正如火如荼,在单个细胞层面让我们在前所未有的水平理解转录组、免疫组和表观组的多样性。
随着测序技术不断飞速发展,在不久的将来,单细胞测序技术一定能够将精准医疗推向更广阔的空间,更多的患者能够享受负担得起的特异性高效疗法,提高治疗效率和治疗过程的体验。在人类健康的舞台上绽放更加绚烂的光芒。
参考文献
1.Giovanni Iacono, Ramon Massoni-Badosa, Holger Heyn. Single-cell transcriptomics unveils gene regulatory network plasticity[J]. Genome biology, 2019, 20(1).
2.Gioele L M , Ruslan S , Amit Z , et al. RNA velocity of single cells[J]. Nature, 2018.
3.Park J , Shrestha R , Qiu C , et al. Single-cell transcriptomics of the mouse kidney reveals potential cellular targets of kidney disease[J]. Science, 2018:eaar2131.
4.Zhang X, Lan Y, Xu J, et al. CellMarker: a manually curated resource of cell markers in human and mouse[J]. Nucleic Acids Research, 2019.
5.Aran D, Looney A P, Liu L, et al. Reference-based analysis of lung single-cell sequencing reveals a transitional profibrotic macrophage[J]. Nature Immunology, 2019, 20(2): 163-172.
6.Aibar S , González-Blas, Carmen Bravo, Moerman T , et al. SCENIC: single-cell regulatory network inference and clustering[J]. Nature Methods, 2017.
7.Wouter, Saelens, Robrecht, et al. A comparison of single-cell trajectory inference methods[J]. Nature Biotechnology, 2019.
8.F, Alexander, Wolf, et al. PAGA: graph abstraction reconciles clustering with trajectory inference through a topology preserving map of single cells.[J]. Genome biology, 2019.
9.Diether L , Els W , Bram B , et al. Phenotype molding of stromal cells in the lung tumor microenvironment[J]. Nature Medicine, 2018.
10.Zheng C , Zheng L , Yoo J K , et al. Landscape of Infiltrating T Cells in Liver Cancer Revealed by Single-Cell Sequencing[J]. Cell, 2017, 169(7):1342-1356.e16.
参考文献:
单细胞测序 - 维基百科,自由的百科全书 (wikipedia.org)
Eberwine J, Sul JY, Bartfai T, Kim J. The promise of single-cell sequencing. Nature Methods. January 2014, 11 (1): 25–7. PMID 24524134. doi:10.1038/nmeth.2769.
Pennisi E. Chronicling embryos, cell by cell, gene by gene. Science. April 2018, 360 (6387): 367. PMID 29700246. doi:10.1126/science.360.6387.367.)
https://www.seqchina.cn/8993.html. 测序中国
Haijian Sun, Jian Chen, Bing Ni, et, al. Recent advances and current issues in single-cell sequencing of tumors. Cancer Letters. 2015; 365(1). 1-10. doi: 10.1016/j.canlet.2015.04.022.
https://zhuanlan.zhihu.com/p/408893824. 知乎
Hai-jian Sun, Jian Chen, Bing Ni, et, al. Recent advances and current issues in single-cell sequencing of tumors. Cancer Letters. 2015; 365(1). 1-10. doi: 10.1016/j.canlet.2015.04.022.
Simone Picelli, Omid R Faridani, Åsa K Björklund, et, al. Full-length RNA-seq from single cells using Smart-seq2. Nature Protocols. 2014. 9(1); 171-181. Doi: 10.1038/nprot.2014.006.
Fan, X., Yang, C., Li, W. et al. SMOOTH-seq: single-cell genome sequencing of human cells on a third-generation sequencing platform. Genome Biol 22, 195 (2021). https://doi.org/10.1186/s13059-021-02406-y
参考:
https://zhuanlan.zhihu.com/p/28844468
https://mp.weixin.qq.com/s/swcGW1aoVJVj8Sy1s0fKw
https://blog.csdn.net/m0_72224305/article/details/127139525
https://www.jianshu.com/nb/42316581