刘小泽写于18.9.27 手痒又想接触新技术,看看前沿研究,充实自己
为何需要研究单个细胞?
世界上没有两片相同的树叶
基因组、转录组测序是从大量细胞中获得一定量的DNA/RNA然后进行测序(可以理解为Bulk sequencing),结果当然也是反应细胞群体的特征。
比如有三组细胞,每组10个,其中第一组有一个致病能力很强悍的恶性细胞,第二组有5个致病能力中等的恶性细胞,第三组全部是致病能力较差的恶性细胞。这三组用一般的Western blot做出来的结果可能一样,因为他们整体情况差不多,但是就个体而言,我们可能对第一组那个很强悍的细胞感兴趣,为什么它能用一己之力,将整个群体带坏?
这就说明细胞是有异质性的(即:相同表型的细胞遗传信息由于生物过程的随机性和环境扰动的原因可能存在显著差异),有许多低丰度的信息会在分析整体中丢失。为此,在单个细胞水平上,对基因组、转录组、表观组进行高通量测序分析的单细胞测序方法诞生(Single cell sequencing)。这样就可以解释这样的现象:不同肿瘤细胞在生长速度、免疫特性、侵染能力等表型的差异,以及它们对不同肿瘤药物的敏感性不同。又或者可以研究一个组织的不同细胞表达和功能,例如血液中免疫细胞存在T细胞、B细胞、自然杀伤细胞、巨噬细胞、嗜酸粒细胞等,而且T细胞还能继续细分;胚胎、大脑的不同脑区的细胞转变更为复杂,因此需要研究某一种细胞。
单细胞测序开始应用于2010年,从2013年MALBAC技术应用以后开始迅速发展并被Nature Methods评为年度技术,2017年10月16日,与“人类基因组计划”相媲美的“人类细胞图谱计划”,其中就需要关键的“单细胞测序”技术;对于肿瘤高异质性、单核微生物细胞、大脑神经细胞、免疫细胞检测、重新定义细胞亚型、寻找罕见的细胞类别等研究都很有帮助。
来自Nature Method评论:“Every cell is unique—it occupies an exclusive position in space, carries distinct errors in its copied genome and is subject to programmed and induced changes in gene expression. Yet most DNA and RNA sequencing is performed on tissue samples or cell populations, in which biological differences between cells can be obscured by averaging or mistaken for technical noise.”
怎么得到单个细胞的信息?
1. 获得单个细胞- 细胞分离
https://www.jianshu.com/p/9fc521bf82ba
首先需要单细胞悬液(如组织解离液或者细胞培养悬液)做检测样品
(传统)有限稀释法:不需要高级设备,通过稀释悬液(稀释完理论上只有一个细胞),移液器吸取一定体积悬液。效率仅20%左右
显微操作法:直接观察到细胞然后吸取,不利于高通量,并且实验技术要求高
(较常用)流式细胞法:FACS(Fluorescence activated cell sorting)利用流式细胞仪,根据细胞表面标记进行筛选,可以选出单个细胞或者特定细胞亚群。当然它需要较大的细胞量
微流控技术:细胞分选效果较好,但需要固定的芯片
2. 实现高通量
早期(2010-2014)的Fluidigm C1平台(基于Smart-Seq + Fluidigm),最早被应用于单细胞领域,几个小时只能捕获96个左右的细胞;
后来2015年左右发展出了MARS-Seq、CytoSeq、Drop-Seq、inDrop技术;
2017-18年,10X Genomics、BD Rhapsody兴起【基于UMI(Unique Molecular Identifier)+ CL(Cell Label),UMI的引入可以使定量结果不受PCR bias的影响】。它们实现了测定1-6K不等的细胞量,覆盖大部分组织的单细胞群体类型
10X Genomics起源自Drop-Seq技术, 横向孔道逐个导入凝胶微珠Gel beads,第一个纵向道输入细胞。当凝胶微珠和细胞碰撞会被吸附在微珠上,然后通过微流控技术运送到第二个纵向通道(“油管”)。这时就会形成一个个的油滴GEMs(一个油滴就是一个凝胶微珠,也就是一个单细胞),然后收集在EP管中。每一个凝胶微珠都布满了不同的Barcode和UMI连接的序列,然后再加上PolyT就形成了像“刺”一样的捕获抓手,随后细胞裂解,利用3'端 poly(A) 碱基互补特定抓取mRNA构建转录文库。据说可以7分钟内完成100~80,000个细胞的捕获
比10X晚一年发布的BD Rhapsody平台源于Cytoseq蜂窝板技术,采用20W+的微孔(远超过细胞数量,目的就是为了一孔一个细胞),因此可以叫做“微孔捕获”,效率会相对更高一些。捕获后也是裂解细胞,再进行mRNA抓取。
今年还诞生了一种SPLiT-seq方法,可以兼容与甲醛固定的细胞或细胞核,并且不需要专用设备,省去用定制化微流体或微孔分选单细胞的过程,号称“1美分单细胞测序”。
3. 怎么测序
一个细胞的DNA/RNA微乎其微,在皮克量级上(万亿分之一克),这么细微的量怎么能满足测序仪要求?因此,测序前需要扩增,使用全基因组扩增技术(WGA),主流三种方法:
PCR扩增法: 对特殊位点可能存在偏好,导致覆盖度偏低;
等温法:MDA(Multiple displacement amplification)为代表,覆盖度较好,但一致性较差;
MALBAC: 多重退火和成环循环扩增技术,覆盖度、一致性保持中等水平
单细胞分析内容
Marker基因(区分细胞用的标记基因)分析、细胞分群、细胞类型鉴定、拟时序分析(分析细胞分化轨迹)、基因相关性分析(基因调控网络)
详细一点,比如:外周血单个核细胞细胞亚型的分析(为发现细胞亚型新Marker基因);研究干细胞不同亚型的特征,构建谱系,预测分化;寻找异常增殖的细胞,结合病理进行疾病分型;判断细胞嵌合状态,尤其是骨髓干细胞移植前后,来判断手术效果;新细胞发现
目前10X Gemonics提供了大量的测试数据,可以试一试。关于转录组的数据集放在这里:
https://support.10xgenomics.com/single-cell-gene-expression/datasets
关于10X处理软件的使用:
https://support.10xgenomics.com/single-cell-gene-expression/software/overview/welcome
处理+可视化三件套:Pipelines、Loupe™ Cell Browser、R Kit(下载需要简单的邮箱注册)2018-7-31刚更新了2.2.0版本
最低系统要求:(比一般的转录组苛刻多了)
最低8核Intel/AMD(16核以上比较好)
内存64G起步(128以上比较好)
硬盘1T
64位Linux
流程大体上还是比对、定量、表达矩阵
#下载 Cell Ranger - 2.2.0(663M)
wget -O cellranger-2.2.0.tar.gz "http://cf.10xgenomics.com/releases/cell-exp/cellranger-2.2.0.tar.gz?Expires=1538100646&Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cDovL2NmLjEweGdlbm9taWNzLmNvbS9yZWxlYXNlcy9jZWxsLWV4cC9jZWxscmFuZ2VyLTIuMi4wLnRhci5neiIsIkNvbmRpdGlvbiI6eyJEYXRlTGVzc1RoYW4iOnsiQVdTOkVwb2NoVGltZSI6MTUzODEwMDY0Nn19fV19&Signature=jQAzPkqHZ8fwjucWuT0viw1LkZxmOkpNbdMYkVLI9PBhNaQrAR9S1UlZgtG2mGXQGYOy3J3H3I-tprCaoZZkjUk-xn3cn-KV-MOF5dqn2BU6wLdX33fbw-jtreZqP160C6f0qryBZytMRXwDPCvRZGuYvWzdkD3ZROER2smCM9WeHsNLEaCGKfrnIqR5h5owWpbvYyi6OsLZYGudNk6soFp0G8IMDyDFrPUZMdHmN9hBTrwWWylFavwWL555Xtkdo3IIR33u5nfOsiOyz86GcPs1SXJdaTb4TzQ7qODMlVADWqcAkE2eZg5Yg0lxMiWM5L3BwDCsUGWClQlrwXD4wg__&Key-Pair-Id=APKAI7S6A5RYOXBWRPDA"
# 下载人类参考基因组 GRCh38(11G)
nohup wget http://cf.10xgenomics.com/supp/cell-exp/refdata-cellranger-GRCh38-1.2.0.tar.gz &
#人类 hg19(11G)
nohup wget http://cf.10xgenomics.com/supp/cell-exp/refdata-cellranger-hg19-1.2.0.tar.gz &
# 小鼠(9.6G)
nohup wget http://cf.10xgenomics.com/supp/cell-exp/refdata-cellranger-mm10-1.2.0.tar.gz &
# 人和小鼠(9.6G)
nohup wget http://cf.10xgenomics.com/supp/cell-exp/refdata-cellranger-hg19-and-mm10-1.2.0.tar.gz &
# ERCC
wget http://cf.10xgenomics.com/supp/cell-exp/refdata-cellranger-ercc92-1.2.0.tar.gz
# Chromium Single Cell 3' v2
wget http://cf.10xgenomics.com/supp/cell-exp/chromium-shared-sample-indexes-plate.csv
# Chromium Single Cell 3' v1
http://cf.10xgenomics.com/supp/cell-exp/chromium-single-cell-sample-indexes-plate-v1.csv
# Gemcode Single Cell 3'
http://cf.10xgenomics.com/supp/cell-exp/gemcode-single-cell-sample-indexes-plate.csv
除了这个配套的流程,还有一些R包可以进行下游分析,例如Seurat包
https://satijalab.org/seurat/pbmc3k_tutorial.html(教程更新到18-3-22)
可以进行单细胞测序数据的质控、过滤、标准化、减弱批次效应、PCA、tNSE亚群聚类分析、差异基因分析等【目前就学了聚类分析路还很长哦】
#提供了处理好的表达矩阵( 10X得到的外周血单个核细胞 Peripheral Blood Mononuclear Cells,共有2700个细胞,用Illumina NextSeq 500进行测序)
wget https://s3-us-west-2.amazonaws.com/10x.files/samples/cell/pbmc3k/pbmc3k_filtered_gene_bc_matrices.tar.gz
欢迎关注我们的公众号~_~
我们是两个农转生信的小硕,打造生信星球,想让它成为一个不拽术语、通俗易懂的生信知识平台。需要帮助或提出意见请后台留言或发送邮件到[email protected]