【Single Cell Genomics】Part1 单细胞基因组学

文章目录

  • 1 Single Cell Genomics
    • 1.1 Why single cells
    • 1.2 传统single cell分析
    • 1.3 scRNA-seq
  • 2 Scaling up scRNA-seq technology
    • 2.1 分析单细胞技术进化
    • 2.2 basic pipeline
  • 3 Beyond RNA: scATAC-seq, Multi-Omics
  • 4 Dealing with noise and doublets in single-cell data

来自Manolis Kellis教授(MIT计算生物学主任)的课
YouTube:Single Cell Genomics - Lecture 10 - Deep Learning in Life Sciences (Spring 2021)
Slides: slides
本节课是三个部分,这篇是第一部分。
本节课讲的是单细胞基因组学方面的分析,第一部分是一些基础知识的介绍,第二、第三部分是请了领域里的大佬来介绍相关的工作,比如Fabian Theis。
首先回顾传统基因组学方法,以及为何scRNA-seq技术对于理解生物学的微观复杂性十分重要。然后讨论单细胞技术的快速进展,以及如何扩展这些技术以处理更大规模的数据集。扩展介绍了scATAC-seq和多组学数据的整合。

【Single Cell Genomics】Part1 单细胞基因组学_第1张图片

1 Single Cell Genomics

1.1 Why single cells

【Single Cell Genomics】Part1 单细胞基因组学_第2张图片

为什么要研究单细胞

  1. 细胞异质性
  2. 细胞分化多样性
  3. 统一细胞类型也存在基因表达差异
  4. 等等

【Single Cell Genomics】Part1 单细胞基因组学_第3张图片

如果从全样本分析,会出现误导

平均值不能代表整个population的多样性,还有容易忽略一些稀有事件,所以我们需要进行single cell data分析来capture

1.2 传统single cell分析

【Single Cell Genomics】Part1 单细胞基因组学_第4张图片

传统的技术有很多的缺陷

为什么用RNA而不是DNA做单细胞分析

DNA作为遗传信息的稳定存储介质,通常在不同细胞中都一样。而RNA则是表达和功能的动态介质,存在于多种分子形式中,数量远远超过DNA,因此需要通过扩增来捕捉和分析

单细胞RNA也需要做扩增后捕捉

1.3 scRNA-seq

【Single Cell Genomics】Part1 单细胞基因组学_第5张图片

从组织样本到单细胞RNA-seq:

  1. 取样
  2. 将组织样本分解成单个细胞
  3. 通过流式细胞排序或其他技术分离出单个细胞
  4. 使用例如Fluidigm C1这样的微流控平台来捕获单个细胞,并准备进行RNA测序
  5. 将RNA转录成cDNA,然后通过PCR或体外转录(IVT)进行扩增。
  • 右侧热图:来自不同单细胞的基因表达数据
    • 每一列代表一个单细胞的基因表达情况
    • 每一行代表一个特定的基因
    • 颜色深浅表示基因表达水平
      • 黄色较高,紫色较低。

这些细胞被分为不同的组,每组细胞接受了不同的处理(例如,PAM、LPS和PIC是不同的刺激物),并在不同的时间点进行了采样(0小时、1小时、2小时、4小时和6小时)。这种类型的数据可用于分析基因表达如何随时间和条件的变化而变化,以及如何在单个细胞水平上展示不同的反应模式。

【Single Cell Genomics】Part1 单细胞基因组学_第6张图片

下面红色的是RNA-seq,上面是单细胞,可以看出大体差不多,但是存在变异,这些就是分析的挑战

【Single Cell Genomics】Part1 单细胞基因组学_第7张图片

使用RNA FISH方法,不需要扩增,就能验证scRNA-seq分析可靠性。通过在细胞内直接视觉化RNA分子来确认scRNA-Seq得到的基因表达模式

【Single Cell Genomics】Part1 单细胞基因组学_第8张图片

这里展示了house keeping genes和variable genes的表达模式对比

house keeping genes是在所有或大多数细胞类型中持续表达的基因,通常涉及基本的细胞功能,如细胞结构和基本代谢。在单细胞之间变化不大

variable genes在不同的单细胞之间表达差异很大,这表示它们可能参与细胞对环境变化的响应。

这种信息对于理解细胞如何响应不同的生理和病理条件是很重要的。通过比较不同的表达模式,研究者可以更好地揭示细胞内部的调控机制和细胞间的功能差异

2 Scaling up scRNA-seq technology

【Single Cell Genomics】Part1 单细胞基因组学_第9张图片

随着时间的推移,分析的单细胞数量有了显著的增长,特别是在2015年后,表明了scRNA-seq技术的快速发展和扩展。这种指数级扩展反映了技术进步,使得科学家能够在单次实验中分析更多的单细胞,这对于理解细胞的异质性、复杂的组织结构以及多种疾病的细胞机制至关重要。

2.1 分析单细胞技术进化

【Single Cell Genomics】Part1 单细胞基因组学_第10张图片

从复杂生物样品中分离单个细胞进行分析的方法进化

  1. Pipette and 96-well plate:这是一种基本的方法,使用移液管手动分离和转移单个细胞到一个96孔板的各个孔中。
  2. Capillary pipette under Microscope:这种方法涉及使用显微镜来直观观察细胞,并使用细毛细管移液管精确操作单个细胞。
  3. FACS (Fluorescence-Activated Cell Sorting):FACS是一种高级技术,使用激光和荧光检测来对标记的细胞进行排序和分离。
  4. LCM (Laser Capture Microdissection):LCM允许研究者使用激光直接从组织切片上切下单个细胞或特定区域的细胞。
  5. Microfluidics:微流控技术可以自动化单细胞的分离和封装过程,通常是通过在油中形成水滴,每个水滴包含一个单独的细胞。
  6. Blood collection and CTC (Circulating Tumor Cell) enrichment:这种方法使用靶向肿瘤细胞表面标记物(如EpCAM)的抗体,结合磁性粒子进行细胞富集,从而从血液样本中分离出循环肿瘤细胞。

2.2 basic pipeline

【Single Cell Genomics】Part1 单细胞基因组学_第11张图片

虽然几种方法不同,但是目标和工作流程基本是一样的

  1. Cell Isolation:

    • 第一个步骤是单细胞的分离。图中展示了几种不同的单细胞分离技术:
      • 使用水凝胶微滴捕获细胞。
      • 通过流式细胞排序(FACS)技术基于细胞表面标志分选不同的细胞群体(例如,Population A 和 Population B)。
      • 利用微流控芯片(如Fluidigm C1)来物理分隔细胞。
  2. Amplification Method:

    • 分离后的细胞需要进行RNA的扩增。这个步骤可以通过两种主要方式进行:
      • 汇聚式PCR扩增(Pooled PCR amplification),用于同时扩增多个细胞的RNA,例如CEL-seq, MARS-seq, SCRB-seq, Drop-seq等技术。
      • 个体细胞扩增(Individual cell amplification),每个细胞分别进行RNA扩增,例如SMART-seq和STR-seq。
  3. Sequencing Method:

    • 扩增后的RNA通过测序技术进行读取。这包括3’端测序,只读取mRNA分子3’端的序列,或全长测序,读取整个mRNA分子的序列。
  4. Application:

    • 测序数据的应用主要是检测基因表达。全长测序还可以用来检测剪接变体(splicing variants)以及B细胞受体(BCR)和T细胞受体(TCR)多样性。

【Single Cell Genomics】Part1 单细胞基因组学_第12张图片

在单细胞测序(scRNA-seq)技术中,使用微滴而不是传统的微孔板来捕获和处理单个细胞的方法

  • 这是一种微流控技术,它利用油和水的不互溶性来形成稳定的微滴,每个微滴可以封装一个单独的细胞和所有必要的试剂。

  • 好处

    • 在高通量的情况下进行大规模的单细胞捕获和分析,因为生成和处理成千上万个微滴比同样数量的孔板孔更为经济和高效。这种技术通常用于“大规模平行处理”(massively parallel approaches)如Drop-seq和InDrop,如图中所示,每个细胞的成本可以降低至每个细胞$0.05,同时能够处理大量细胞样本

【Single Cell Genomics】Part1 单细胞基因组学_第13张图片

就是给每一个细胞和gel bead放在一个液滴中。每个gel bead上的条形码是独一无二的

细胞裂解产生很多RNA,会被gel bead上的寡核苷酸捕获,打上一个条形码(一个细胞对应的条形码是独一无二的)

然后不同细胞的RNA被逆转录成cDNA,混在一起进行一次测序,测序完的信息可以根据条形码追踪回是哪个细胞

【Single Cell Genomics】Part1 单细胞基因组学_第14张图片

这个技术就更加进步了

这里每个细胞是没有被分开的,而是每次shuffle到不同的孔中,不停的被打上条形码

最后只需要进行一次测序,然后用条形码的不同组合来区分不同的细胞

【Single Cell Genomics】Part1 单细胞基因组学_第15张图片

3 Beyond RNA: scATAC-seq, Multi-Omics

【Single Cell Genomics】Part1 单细胞基因组学_第16张图片

还有更多的单细胞分析技术,用来研究细胞的不同方面,包括它们的谱系(lineage)、状态(state)、空间位置(spatial position)、以及随时间变化的轨迹(trajectory)

  • Lineage:
    • 用于跟踪细胞的发展谱系,比如通过记录基因编辑事件来追溯细胞的谱系树。
  • State:
    • 描述细胞在特定时间点的状态,比如它们的基因表达模式、蛋白质水平,或者表面标记物。
    • 技术包括CITE-seq(结合了表面蛋白标记和RNA测序)、REAP-seq、FACS和对细胞内蛋白如PEA进行分析的技术。
  • Spatial position:
    • 分析细胞在组织中的精确位置,如MERFISH和smFISH等荧光原位杂交技术,以及STARmap。
  • Trajectory:
    • 用于推断细胞随时间的发展轨迹或分化路径,这通常涉及到计算伪时间(pseudotime),即一个假想的时间轴,用于比较细胞在发展过程中的顺序。
  • DNA methylation:
    • 诸如scBS-seq和snmC-seq等技术可以用来分析单个细胞中的DNA甲基化模式。
  • Genome sequence:
    • 包括SNS和SCI-seq等技术,用于分析单个细胞的基因组序列。
  • Chromatin accessibility:
    • 如scATAC-seq和sciATAC-seq等技术可以揭示染色质结构的开放区域,这些区域通常与基因调控活动相关。
  • Histone modifications:
    • 诸如scChIP-seq等技术用于分析单个细胞中的组蛋白修饰,这些修饰反映了基因表达调控的表观遗传状态。
  • mRNA:
    • 包括Drop-seq、Smart-seq、MARS-seq等技术,用于分析单个细胞的mRNA表达。

【Single Cell Genomics】Part1 单细胞基因组学_第17张图片

  • scATAC-seq工作流程
    • 单个细胞被捕获并裂解,释放出染色质,然后使用一种名为转座酶Tn5的酶
    • 该酶可以切割并标记开放的染色质区域。这些被标记的DNA片段随后被扩增和测序,以确定细胞内哪些基因区域是活跃的或可访问的
    • 这些信息对于理解基因如何在不同细胞类型中被调控非常有价值。

scATAC-seq与scRNA-seq的区别很大,因为细胞里面RNA会被大量拷贝,而基因组只有两套,所以scATAC-seq所研究的基因组区域难以被检测和量化

目前有很多的技术去解决这个问题,比如在单个细胞中聚合多个不同位置的信息

【Single Cell Genomics】Part1 单细胞基因组学_第18张图片

单细胞多组学的研究

  • ChromVAR等工具
    • 可以整合ATAC-Seq(测量染色质可及性)和RNA-Seq(测量基因表达)的数据
  • 单细胞多组学
    • 通过结合分析单个细胞的多种分子特征,可以得到关于细胞状态和功能的更全面视图

【Single Cell Genomics】Part1 单细胞基因组学_第19张图片

4 Dealing with noise and doublets in single-cell data

后面因为时间原因就没讲,自己看slides:slides

你可能感兴趣的:(生物信息,生物信息,深度学习,单细胞组学)