CRISPR-Cas9是继ZFN、TALENs等基因编辑技术推出后的第三代基因编辑技术,短短几年内,CRISPR-Cas9技术风靡全球, 成为现有基因编辑和基因修饰里面效率最高、最简便、成本最低、最容易上手的技术之一,成为当今最主流的基因编辑系统。
一、什么是CRISPR-Cas系统
CRISPR-Cas系统是原核生物的一种天然免疫系统。某些细菌在遭到病毒入侵后,能够把病毒基因的一小段存储到自身的 DNA 里一个称为 CRISPR 的存储空间。当再次遇到病毒入侵时,细菌能够根据存写的片段识别病毒,将病毒的DNA切断而使之失效。
CRISPR-Cas系统包含CRISPR基因座和Cas基因(CRISPR关联基因)两部分。
1、CRISPR(/'krɪspər/)是原核生物基因组内的一段重复序列。CRISPR全称Clustered Regularly Interspersed Short Palindromic Repeats(成簇的规律性间隔的短回文重复序列)。分布在40%的已测序细菌和90%的已测序古细菌当中。 (注:生活在深海的火山口、陆地的热泉以及盐碱湖等极端环境中,有一些独特结构的细菌,称为古细菌)
CRISPR基因序列主要由前导序列(leader)、重复序列(repeat)和间隔序列(spacer)构成。
①前导序列:富含AT碱基,位于CRISPR基因上游,被认为是CRISPR序列的启动子。
②重复序列:长度约20–50 bp碱基且包含5–7 bp回文序列,转录产物可以形成发卡结构,稳定RNA的整体二级结构。
③间隔序列:是被细菌俘获的外源DNA序列。这就相当于细菌免疫系统的“黑名单”,当这些外源遗传物质再次入侵时,CRISPR/Cas系统就会予以精确打击。
2、Cas基因位于CRISPR基因附近或分散于基因组其他地方,该基因编码的蛋白均可与CRISPR序列区域共同发生作用。因此,该基因被命名为CRISPR关联基因(CRISPR associated,Cas)。
Cas基因编码的Cas蛋白在防御过程中至关重要,目前已经发现了Cas1-Cas10等多种类型的Cas基因。
依据Cas蛋白在细菌免疫防御过程中参与的角色,目前将CRISPR-Cas系统分为两大类。
第一大类:它们切割外源核酸的效应因子为多个Cas蛋白形成的复合物,包括Ⅰ型、Ⅲ型和Ⅳ型。
第二大类:它们的作用因子是比较单一的Cas蛋白,比如Ⅱ型的Cas9蛋白和Ⅴ型的Cpf蛋白。
目前,被最为广泛应用的CRISPR系统是II型CRISPR-Cas系统,也就是CRISPR-Cas9系统。
二、CRISPR-Cas9的作用原理
对于CRISPR-Cas9的作用机理可以分为三个阶段来理解。
1、第一阶段:CRISPR 的高度可变的间隔区的获得(俘获外源DNA,登记“黑名单”)
CRISPR 的高度可变的间隔区获得,其实就是指外来入侵的噬菌体或是质粒DNA 的一小段DNA 序列被整合到宿主菌的基因组,整合的位置位于CRRSPR 的5' 端的两个重复序列之间。因此,CRISPR 基因座中的间隔序列从5' 到3' 的排列也记录了外源遗传物质入侵的时间顺序。
新间隔序列的获得可能分为三步:
第1步:Cas1和Cas2编码的蛋白将扫描入侵的DNA,并识别出PAM区域,然后将临近PAM的DNA序列作为候选的原型间隔序列。
第2步:Cas1/2蛋白复合物将原间隔序列从外源DNA中剪切下来,并在其他酶的协助下将原间隔序列插入临近CRISPR序列前导区的下游。
第3步:DNA会进行修复,将打开的双链缺口闭合。这样一来,一段新的间隔序列就被添加到了基因组的CRISPR序列之中。
2、第二阶段:CRIPSR 基因座的表达(包括转录和转录后的成熟加工)
CRISPR序列在前导区的调控下转录产生pre-crRNA(crRNA的前体),同时与pre-crRNA序列互补的tracrRNA(反式激活crRNA)也被转录出来。pre-crRNA通过碱基互补配对与tracrRNA形成双链RNA并与Cas9编码的蛋白组装成一个复合体。它将根据入侵者的类型,选取对应的“身份证号码”(间隔序列RNA),并在核糖核酸酶Ⅲ(RNaseⅢ)的协助下对这段“身份证”进行剪切,最终形成一段短小的crRNA(包含单一种类的间隔序列RNA以及部分重复序列区)。
crRNA,Cas9以及tracrRNA组成最终的复合物,为下一步剪切做好准备。
3、第三阶段:CRISPR/Cas 系统活性的发挥(靶向干扰)
crRNA,Cas9以及tracrRNA组成最终的复合物就像是一枚制导导弹,可以对入侵者的DNA进行精确的打击。这个复合物将扫描整个外源DNA序列,并识别出与crRNA互补的原间隔序列。这时,复合物将定位到PAM/原间隔序列的区域,DNA双链将被解开,形成R-Loop。crRNA将与互补链杂交,而另一条链则保持游离状态。
随后,Cas9蛋白精确的平端切割位点位于PAM上游3个核苷酸位置,形成平末端产物。Cas9蛋白的HNH结构域负责切割与crRNA互补配对的那一条DNA链,而RuvC结构域负责切割另外一条非互补DNA链。最终在Cas9的作用下DNA双链断裂(DSB),外源DNA的表达被沉默,入侵者被一举歼灭。
三、CRISPR-Cas9基因编辑技术及应用…
tracrRNA-crRNA在被融合为单链向导RNA(sgRNA)时也可以发挥指导Cas9的作用。
CRISPR-Cas9基因编辑技术就是通过人工设计的 sgRNA(guide RNA)来识别目的基因组序列,并引导 Cas9 蛋白酶进行有效切割 DNA 双链,形成双链断裂,损伤后修复会造成基因敲除或敲入等,最终达到对基因组DNA 进行修饰的目的。
CRISPR-Cas9的广泛应用
1、基因敲除(Knock-out)
Cas9可以对靶基因组进行剪切,形成DNA的双链断裂。在通常情况下,细胞会采用高效的非同源末端连接方式(NHEJ)对断裂的DNA进行修复。但是,在修复过程中通常会发生碱基插入或缺失的错配现象,造成移码突变,(移码突变:是指DNA分子由于某位点碱基的缺失或插入,引起阅读框架变化,造成下游的一系列密码改变,使原来编码某种肽链的基因变成编码另一种完全不同的肽链序列。)使靶标基因失去功能,从而实现基因敲除。为了提高CRISPR系统的特异性,可将Cas9的一个结构域进行突变,形成只能对DNA单链进行切割造成DNA缺口的Cas9 nickase核酸酶。因此想要形成双链断裂的效果可以设计两条sgRNA序列,分别靶向DNA互补的两条链,这样两条sgRNA特异性的结合靶标序列,即可形成DNA断裂,并在修复过程中通过移码突变实现基因敲除
2、基因敲入(Knock-in)
当DNA双链断裂后,如果有DNA修复模板进入到细胞中,基因组断裂部分会依据修复模板进行同源重组修复(HDR),从而实现基因敲入。修复模板由需要导入的目标基因和靶序列上下游的同源性序列(同源臂)组成,同源臂的长度和位置由编辑序列的大小决定。DNA修复模板可以是线性/双链脱氧核苷酸链,也可以是双链DNA质粒。HDR修复模式在细胞中发生率较低,通常小于10%。为了增加基因敲入的成功率,目前有很多科学家致力于提高HDR效率,将编辑的细胞同步至HDR最活跃的细胞分裂时期,促进修复方式以HDR进行;或者利用化学方法抑制基因进行NHEJ,提高HDR的效率
3、基因抑制、基因激活(Repression or Activation)
Cas9的特点是能够自主结合和切割目的基因,通过点突变的方式使Cas9的两个结构域RuvC-和HNH-失去活性,形成的dCas9只能在sgRNA的介导下结合靶基因,而不具备剪切DNA的功能。因此,将dCas9结合到基因的转录起始位点,可以阻断转录的开始,从而抑制基因表达;将dCas9结合到基因的启动子区域也可以结合转录抑制/活化物,使下游靶基因转录受到抑制或激活。因此dCas9与Cas9、Cas9 nickase的不同之处在于,dCas9造成的激活或者抑制是可逆的,并不会对基因组DNA造成永久性的改变。
4、多重编辑(Multiplex Editing)
将多个sgRNA质粒转入到细胞中,可同时对多个基因进行编辑,具有基因组功能筛选作用。多重编辑的应用包括:使用双Cas9nickases提高基因敲除的准确率、大范围的基因组缺失及同时编辑不同的基因。通常情况下,一个质粒上可以构建2~7个不同的sgRNA进行多重CRISPR基因编辑。
5、功能基因组筛选
利用CRISPR-Cas9进行基因编辑可以产生大量的基因突变细胞,因此利用这些突变细胞可以确认表型的变化是否是由基因或者遗传因素导致的。基因组筛选的传统方法是shRNA技术,但是shRNA有其局限性:具有很高的脱靶效应以及无法抑制全部基因而形成假阴性的结果。CRISRP-Cas9系统的基因组筛选功能具有高特异性和不可逆性的优势,在基因组筛选中得到了广泛的应用。目前CRISPR的基因组筛选功能应用于筛选对表型有调节作用的相关基因,如对化疗药物或者毒素产生抑制的基因、影响肿瘤迁移的基因以及构建病毒筛选文库对潜在基因进行大范围筛选等。