CROP-seq文献学习(CRISPR液滴测序)

最近听了一个讲座,里面提到了一些对于我来说比较陌生的技术:CROP-seq、CRISP-seq、Perturb-seq。(虽然这些技术早在2017年就发表了)于是就查阅了文献,看看这些都是些啥技术。这篇文章就先来学习CROP-seq。这里我只是记录了文献里的一部分内容,主要是作者如何构建的系统,对于他们后续的验证我这里只是记录了一小部分。

学习的文献是:Pooled CRISPR screening with single-cell transcriptome readout

在整个细胞群里进行CRISPR筛选已经被广泛的使用于例如细胞增殖、药物抗性,和病毒感染等生物过程的基因鉴定。将guide-RNA文库转染进细胞里,之后进行筛选(图1A)。那么这样一来,gRNA的分布就可以根据细胞的数量来判断。(这里我的理解是:如果gRNA靶向一个基因以后,细胞无法再增殖,甚至死亡,那么我们就可以认为这个被靶向的基因是维持细胞增殖的,或者是survive必需的基因)细胞群的CRISPR筛选可以很好的用于那些影响细胞存活和增殖的机制研究。然而,这个技术不支持复杂的分子readout,例如它不能揭示复杂、富有信息量的转录谱。

图1A

Arrayed CRISPR筛选,一次只能进行一个基因的靶向,但这个技术是可以用RNA-seq作为readout的。这个技术的缺点是由于费用非常高,并且通量很低,需要人工的把单个细胞分离(图1B)。

图1B,可以看到一个孔放一个gRNA进行转染

这里我们提出了一个互补的筛选范例,单细胞的CRISPR筛选,检测每一个单细胞的gRNA和该细胞转录组(图1C)。

图1C: 该技术基于液滴的单细胞RNA-seq方法,在检测每个细胞的转录谱的同时也检测表达的gRNA

为了实施这个想法,作者将CROP-seq方法结合了4个主要成分:(1)一个gRNA载体,这个载体使得每一个独立的gRNA可以在单细胞RNA-seq实验中被检测到。(2)单细胞RNA-seq的高通量分析。(3)a computational pipeline for assigning single-cell transcriptomes to gRNAs(不知道怎么翻译才准确)(4)生信方法分析并解释gRNA诱导的转录谱。CROP-seq提供了一种可扩展的解析复杂的信号通路和其他生物机制的方法(图1d)。

图1d

(1)从单细胞转录组数据里直接检测gRNA
CRISPR gRNA通常由RNA聚合酶III从human的U6启动子进行转录。它们缺乏polyA尾巴,所以用现有的单细胞RNA-seq实验室没有办法检测到的。所以作者将现有的CRISPR库筛选载体(LentiGuide-Puro)进行了改装,将gRNA包括在polyA的mRNA转录本里(图1e)。

图1e:如图所示,CROP-seq的lentiviral结构是中间那个。它把hU6-gRNA包含在了3'LTR区里,这样在病毒整合进细胞的基因组过程中,这个hU6-gRNA就会被复制。这个结构可以表达一个RNA聚合酶III转录本,进行基因编辑。同时表达一个带polyA尾巴的RNA聚合酶II的转录本,该转录本可以被单细胞RNA-seq测序检测到

由于经典的LentiGuide-Puro是来源于一个lenti病毒载体,这个载体通过400bp关键启动子元件的deletion进行自我失活。作者假设在3'端的LTR区可以兼容一个hU6-gRNA的cassette大小的插入。在这个区域,gRNA变成了具有puro抗性的mRNA的一部分,这个mRNA被RNA聚合酶II转录,并且可以利用polyA富集的方法进行RNA-seq。具有功能的gRNA继续由hU6启动子促进表达,另外,完整的hU6-gRNA的cassette在反转录的过程中可以被拷贝进5'LTR,随之整合进病毒中。因此CROP-seq方法解决了在单细胞转录组水平上对gRNA的检测的问题,使得该方法可以把多种单细胞RNA-seq分析和大批量的筛选gRNA库兼容在一起。

那么作者是怎么重新构建的这个载体呢?

首先作者用PCR方法扩增了质粒的4个部分,然后重新组装了质粒(Sup Fig1)。这个hU6-gRNA在3ʹ LTR的插入不会影响病毒颗粒的形成,也不会影响puro的抗性。

Sup Fig1:(a)从LentiGuide-Puro质粒里扩增4个片段(b)利用LCR方法把4个部分进行组装,这个组装是利用C和D之间作为“桥梁”的4个核苷酸进行翻转来实现的,就是“LCR009”那一部分。这样一来hU6-gRNA的cassette就被包进3’ LTR里了

作者用LentiGuide-Puro和CROPseq-GuidePuro两种质粒包病毒,检测了这两个载体的效果。他们分别在两个质粒上连接了3个验证的gRNA,分别靶向DNMT3B, MBD1, 和 TET2。还另外连接了一个更长的有可能影响病毒活性的结构,然后比较这些病毒的滴度(图1f)。

图1f

基因组编辑效率利用几种表达cas9的细胞系(K562, Jurkat, and two HEK293T clones)来作为基准进行验证。作者用了两个gRNA来同时进行验证(图1g)。基因组编辑在两个载体里的效率都非常高,平均可以达到95.5% (LentiGuide-Puro)和90.5%(CROPseq-Guide-Puro)。靶向2个基因的编辑特点也在两种载体里非常相似。

图1g

接下来作者检测了单细胞RNA-seq是否能检测到gRNA(CROPseq-Guide-Puro载体)(图1h)。他们构建了3个knock-out细胞系,gRNA分别靶向DNMT3B, MBD1, 和TET2,然后将gRNA分别转染进细胞,确保每一个细胞里都有特异的gRNA。当使用CROP-seq把三种细胞系按照1:1:1的比例混在一起的时候,单细胞转录组的结果显示在gRNA上有很高的测序覆盖率。

图1h

结合所有的CROP-seq的结果,作者评估了gRNA的分配置信度(图1i),这个值取决于每个细胞检测到的基因数量。例如,如果每个细胞检测500个基因,置信度是38.7%,如果每个细胞检测4000个基因,那么置信度是78.9%。

图1i

(2)单细胞CRISPR筛选t细胞受体诱导
之后作者利用了他们构建的系统,检测了Jurkat细胞里T细胞受体的活性。作者设计了一个gRNA库,靶向6个高水平的T细胞受体的调节分子信号通路,和23个转录因子,每个基因设计了3个不同的gRNA。作者还同时设计了20个不靶向于任何基因的阴性对照、9个重要基因的gRNA作为阳性对照。Jurkat细胞转染cas9构建为稳转细胞系,然后用CROPseq-Guide-Puro gRNA库去感染细胞,puro筛选。之后用CD3或者CD28抗体激活TCR,进行CROP-seq分析(图2a)。通过测序质粒文库,比较gRNA的分布。作者发现阳性对照的敲除效果很好,确定了CROP-seq的载体的效率很高(图2b)。而针对TCR信号通路设计的gRNA靶向效率有明显的差异,靶向ETS1,RUNX1,和GATA3 的gRNA敲除效率很好,说明这些转录因子对于Jurkat细胞是比较重要的。相反,其他的gRNA效率和阴性对照差不多,说明这些没有抑制增殖的作用。

图2 a,b,c

作者对TCR诱导的单细胞RNA-seq转录谱(CROP-seq)进行了降维分析(图supp Fig 6a-c),根据gRNA靶向的基因进行分组的主成分分析显示,细胞群可以被分为naïve和TCR诱导两组。

图supp Fig6a-c

当然作者还进行了很多的后续验证部分,我就没有放上来,总体来说,作者是把单细胞测序和CRISPR筛选结合在了一起。作者在文章结尾处写到,在他们的文章审稿的时候,另外两种技术Perturb-seq 和 CRISP-seq也发表了出来。这两种技术是利用了barcode来进行单细胞的CRISPR筛选。和这两种方法比起来,CROP-seq有一个很关键的优势就是它可以直接读取gRNA,大大简化了gRNA文库的单细胞CRISPR筛选。

你可能感兴趣的:(CROP-seq文献学习(CRISPR液滴测序))