Science/Cell | 单细胞数据分析基因表达和染色质可及性
原创 风不止步 图灵基因 今天
收录于话题#前沿生物大数据分析
撰文:风不止步
IF=47.728/36.216
推荐度:⭐⭐⭐⭐⭐
亮点:
单细胞数据资源以其规模、对人类胎儿发育的关注、分析组织的广度、平行生成基因表达(本研究)和染色质可及性数据而闻名。进一步巩固单个技术框架,以从数百万个单细胞中生成和分析基因表达和染色质可及性数据。另外一种高度可扩展的方法SHARE-seq,用于测量同一单细胞内的染色质可及性和基因表达,提供一个可扩展的平台来研究跨组织内不同细胞的调节回路。
所有生物都由细胞组成,细胞是生命的最基本单位这个细胞理论提出两个世纪后,我们处于对健康和疾病中构成人体的所有细胞类型进行编目和定性的关键时刻。为此,在新技术和新计算方法的协同作用下,单细胞生物学领域正以惊人的速度发展,以使这些技术产生的数据具有意义。仅在过去的几年里,这种协同作用已经使许多人类器官以及整个模式生物的单细胞图谱变得引人注目和信息丰富。
人类的发展是一个非凡的过程,从受精卵开始,经过发芽阶段,然后是胚胎发育。在第10周结束时,胚胎已经获得其基本形态,被称为胎儿。在接下来的30周里,所有器官继续生长和成熟,不同的终末分化的细胞类型从它们的祖先中产生。尽管胚胎发育阶段已经用单细胞进行了深入的分析,但对胎儿阶段的分析更具挑战性。尽管最近出现了一些关于人类胎儿发育的单细胞研究,但这些研究仅限于个别器官或细胞系,没有获得一个全面的观点。
在人类胎儿发育过程中获得的不同组织,生成基因表达和染色质可及性的单细胞图谱。在15个不同的器官中,成功分析约400万个单细胞的基因表达和约80万个单细胞的染色质可及性。这些数据集的局限性包括不均匀的采样(即在一些器官中分析的细胞比其他器官多),缺失的组织(最明显的是骨髓、皮肤、骨骼和性腺),相对具有较低的测序深度,以及单细胞分子谱的稀疏性。尽管如此,依旧确定数百种细胞类型和亚型,这些细胞类型和亚型得到了量化特异性框架的支持,并且几乎所有的细胞类型或亚型都与已发表的小鼠图谱相匹配。
与器官特异性研究相比,分析的组织多样性使广泛分布的细胞类型可进行跨组织的比较。不得不强调对细胞类型的注释过程极大地受益于迄今为止已经产生的大量特定人类器官或其他哺乳动物的单细胞图谱。当然,注释过程中的决定可能是主观的(例如过度或不足的分类),这里的细胞类型和亚型注释都应被视为初步且可以修改的。
细胞分化和功能通过多个基因调控层进行调控,包括通过染色质可及性的变化来调节基因表达。Jason D.Buenrostro博士开发了一种高度可扩展的方法SHARE-seq,用于测量同一单细胞内的染色质可及性和基因表达。同时开发一种计算策略来识别顺式调节相互作用并定义调节染色质域 (DORC),这些域与超级增强子显着重叠。DORC的染色质可及性先于基因表达,这表明染色质可及性的变化可能会为细胞谱系承诺做好准备。因此,开发的这种计算策略(染色质潜力)可量化染色质谱系引发并预测细胞命运结果。SHARE-seq 提供了一个可扩展的平台来研究跨组织内不同细胞的调节回路。
SHARE-seq提供一个可通用的平台和机会,以包括每个细胞的额外信息层。随着进一步的发展,希望能整合其他scRNA-seq兼容的测量,如蛋白质测量、基因分型和系谱条码。此外,通过这种方法的大规模可扩展性,SHARE-seq可以被用于识别RNA条形码,特别是对基于CRISPR的扰动筛选有用。SHARE-seq可以通过用全基因组转座的方法取代ATAC-seq来进一步扩展DNA甲基化和染色质构象。因此,随着不断走向细胞图谱,预计SHARE-seq将可能在确定细胞类型和细胞状态的全部多样性以及定义它们的调节器方面发挥关键作用。
展望未来,继续开发和应用确定基因表达和染色质可及性的方法-与空间、表观遗传学、蛋白质组学,系谱历史和其他信息相配合,对于获得从单细胞子宫开始的人类细胞类型多样性的时间展开的全面视图是必要的。迄今为止,对人类发育的调查基本上是间接的,通过人类遗传学提名的关键分子因素,然后在模型生物和/或体外系统中进行调查。关于体内基因表达和调控的知识一直很有限,在填补这一空白的同时,希望能够更好地理解人类发育过程中罕见和常见疾病的分子和细胞基础,同时也为成功的治疗提供信息。
教授介绍
作者1
Jay Shendure华盛顿大学基因组科学教授
主要研究:实验室的使命是开发和应用遗传学、基因组学和分子生物学的新技术和方法。大部分工作都利用了下一代 DNA 测序技术,该技术正在有效地成为一种广泛使用的显微镜用于测量生物现象。正在进行的工作一般分为六个方面:开发新的分子方法;发育生物学的基因组方法;大规模并行功能基因组学;将基因组学转化为临床;人类疾病的遗传基础;基因组测序技术。
作者2
Buenrostro博士实验室试图使用单细胞方法提高我们对基因调控生物学的理解。为此,他们开发了整合分子生物学、显微镜和大规模生物信息学的新技术。这些努力包括单细胞ATAC-seq 的新方法-一种越来越流行的测量单细胞表观基因组的方法。总之,我们广泛应用这些工具来研究动态细胞系统,包括造血和白血病发展中细胞命运决定的表观遗传机制。
ATAC-seq 最初由 Buenrostro 及其同事于 2013 年开发,现在它的使用在基因组学中无处不在——例如在人类细胞图谱项目等重大努力中,以了解和绘制基因组功能图。作为这项工作影响力的体现,麻省理工学院的技术评论将 Buenrostro 评为其 2019 年“35 岁以下的创新者”之一。
Jason Buenrostro 是博德研究所的准成员,也是哈佛大学干细胞与再生生物学系的助理教授。他以前是 Broad 的 Broad Fellows 项目的研究员,以及哈佛大学研究员协会的初级研究员。
在斯坦福大学,他开发了新的高通量基因组学方法,以实现对基因调控的定量理解。
相关链接:
1.https://www.science.org/doi/10.1126/science.aba7721?url_ver=Z39.88-2003&rfr_id=ori:rid:crossref.org&rfr_dat=cr_pub%20%200pubmed;
2.https://pubmed.ncbi.nlm.nih.gov/33098772/
参考文献
1、Junyue Cao1,Diana R. O’Day et al. Ahuman cell atlas of fetal gene expression.(2020)
2、Sai Ma, BingZhang et al. Chromatinpotential identified by shared single cell profiling of RNA and chromatin.(2020)