单细胞转录组在心血管系统发育、疾病与医学中的研究

今天尝试翻译篇文章,感觉内容量比较大,需要一步一步去咀嚼,不要在头脑中模棱两可

Single-cell RNA sequencing in cardiovascular development, disease and medicine

导读:在过去的10年里,单细胞RNA测序(scRNA-seq)技术的进步对生物医学研究产生了革命性的影响,使单细胞转录组分析的分辨率和吞吐量达到前所未有的水平(先笼统的说单细胞转录组技术在过去产生的影响以及实现的水平,接下来开始整体具体陈述其应用-4点(细胞水平分析与Zoom in比较)。具体来说,scRNA-seq促进了新细胞或罕见细胞类型的鉴定,单细胞轨迹构建和干细胞或祖细胞分化的分析,以及在单细胞分辨率下健康和疾病相关组织的比较。描述了单细胞转录组在整体具体上的作用,研究人员又开始阐述在心血管领域中的具体作用)在过去的十年中,这些应用已经在心血管研究的进展中发挥了关键作用,证明了哺乳动物心脏和血管细胞图集的生成,阐明了心血管发育和干细胞或祖细胞分化的机制。在本文中,研究人员总结了目前可用的scRNA-seq技术和分析工具,并讨论了使用scRNA-seq的最新发现,这些发现极大地提高了我们对心血管系统的发展和心血管疾病的机制的认识。此外,研究人员还研究了整合多模式单细胞平台的新兴策略,重点关注未来在心血管精准医学中的应用,即使用单细胞组学方法来表征细胞对药物或环境刺激的特异性反应,并开发有效的患者特异性治疗方法(重点阐明三点)

论文ID

原名:Single-cell RNA sequencing in cardiovascular development, disease and medicine

译名:单细胞RNA测序在心血管发育、疾病与医学中的研究

期刊:Nature Reviews /Cardiology

IF:20.26

发表时间:202008

通讯研究人员:Joseph C. Wu

通讯研究人员单位:斯坦福大学心血管学院

DOI号:10.1038/s41569-020-0359-y  


实验设计


介绍

传统的bulk测序技术与PCR等技术检测的是细胞群体水平的基因平均表达情况,这可能在高异质性细胞群与转录组差异的研究中产生误解。采用荧光激活细胞分选法或共轭磁珠辅助法可以基于细胞膜表面蛋白与靶细胞群体进行分选。虽然这些方法确实产生了重要的发现,但它们是费力和昂贵的,并且不能完全识别细胞异质性的完整图谱,并留下一些未描述的细胞亚群。单细胞转录组测序的产生实现了从平均到每个细胞独特的Zoom in,能够揭示细胞群的异质性与新的细胞状态以及阐述细胞分化与发育中的动态转变,对于心血管疾病的研究具有重要作用。

接着,作者介绍了单细胞转录组在细胞水平中的具体应用。器官图谱的产生对于器官特定功能的了解具有重要作用。由于scRNA-seq能够交叉分析给定样本中多种细胞类型的单细胞转录组,因此也可以根据基因表达预测通过配体-受体结合的细胞间通讯。这些类型的分析预计将进一步补充空间转录组学的进展。重要的是,单细胞基因组学、转录组学、表观基因组学和蛋白质组学的结合将是评估细胞群体异质性及其对患者特异性药物反应和不良反应的贡献的关键。

在本篇综述中,研究人员探讨了scRNA-seq的实验流程和应用,讨论了相关的数据分析策略,并总结了心血管研究中使用scRNA-seq发表的研究成果。此外,我们还描述了整合多模式单细胞组学平台的潜力,这有望提高我们探寻心血管领域知识缺口的能力,并加速精准医学的进步。

结果

单细胞RNA测序技术

在过去的10年里,各种单细胞方法已经发展起来,它们有不同的方法来捕获和扩增细胞,以及mRNA转录长度、捕获的靶细胞数量和每个细胞读取深度的差异。每种方法各有优缺点,但是单细胞转录组测序分析有一套共有流程。

单细胞制备的主要挑战包括起始样品的脆弱性、物理压力、缓冲液的选择、细胞解离时间和单细胞产量。最小的处理,同时保持样本完整性和实验和运行之间的标准化是减少数据可变性的关键。操作时间的减少减少了人为错误,提高了数据的一致性和质量。对于基于微滴的scRNA-seq,在捕获单细胞之前需要准备单细胞的活种群,并且必须消除细胞聚集或聚集、死细胞碎片和自由漂浮的mRNA。


质控与均一化

当单细胞捕获、文库准备和测序完成后,读取比对可以应用于原始测序数据,使用通用RNA-seq读取比对器STAR,利用公共平台(如10x Genomics的Cell Ranger)生成特征条形码矩阵。Cell Ranger也可以过滤和计数条形码和独特的分子识别器以及标准化数据从多个实验达到相同的测序深度。其他预处理管道,如dropEst、Dr.seq2和scPipe,也可用于生成表达矩阵。现有的用于Bulk RNA-seq数据的工具,如FastQC或RNA-SeQC,可以用于处理scRNA-seq数据。详细的质量控制和标准化方法以前已经发表过。

比对后,可以使用大量的R包或python包进行数据的质量控制、可视化和分析。迄今为止,Monocle39、Scanpy40、Scater41、Scell42、Seurat43和sina44软件包是用户驱动的、无监督的单细胞基因表达分析最常用的软件包。使用Seurat,各种质量控制参数,如线粒体基因百分比,总基因计数和每个细胞的唯一分子标识数,可以被可视化。为下游分析这些参数的阈值。值得注意的是,与所有其他细胞类型(5-20%)相比,心肌细胞具有异常高的线粒体基因含量(占总转录本的58 -86%)

降维

scRNA-seq数据的多维特性,即单维表示单个基因的表达,必须降低其可解释的可视化和分析。到目前为止,各种各样的降维算法和无监督聚类已经被开发出来。在为感兴趣的数据集选择最优算法时,必须考虑计算和生物学上的优缺点,因为没有一种单一的方法被认为是金标准。关于不同算法的差异和具体性质的更多细节已经在之前发表过。

随着基于液滴的scRNA-seq的出现,数据集的大小越来越大,现在产生了更多的细胞捕获,提供更大的能力并提高了识别罕见细胞群的能力。此外,线性变换,如主成分分析(PCA),由于高水平的dropout和噪音46,不能捕捉细胞关系。非线性降维算法,如t分布随机邻居嵌入(t-SNE)47和一致流形近似和投影(UMAP)48,由于其灵活性和生成可视可解释结果的能力,因此变得越来越受欢迎。

因此,公开可用的包可允许从用户定义的PCAs从t-SNE和UMAP进行投射和可视化。非线性降维的分辨率,即k-means值(由大往小调,先细分群,再粗分群),可由用户设置和调整。单个的k-means值或分辨率与产生的簇的数量直接相关,不可能是完全正确的,这需要研究者从生物学和生理学的角度来验证从选择的分辨率得到的簇的数量和类型是否确实有效

数据分析

未监督细胞群分类:与传统的bulk分析相比,scRNA-seq的一个显著优势是识别和描述给定样本中存在的异质细胞群。从生物学角度来看,心脏中的细胞群代表不同的细胞类型,如心肌细胞、内皮细胞、成纤维细胞和免疫细胞,但它们也可以代表相同细胞类型的不同功能状态,如心室、心房或起搏器心肌细胞,或血管生成细胞与静止内皮细胞。因此,非监督的聚类方法必须执行来定义细胞群,并以经验来确认由数学聚类定义的细胞群是否确实代表生物学上相关的或正确的细胞类型或状态。

在单细胞研究中,监督聚类指的是机器学习方法,它指示一个细胞是否属于基于典型的细胞-簇对的聚类。例如,MetaNeighbor允许用户评估细胞类型特异性转录特征如何在独立的数据集上重复49。相反地无监督聚类是涉及到数据本身的结构的机器学习,而不需要其他数据集的任何干预。

许多基于机器学习算法的聚类策略已经建立起来50。一种流行的策略是k-means方法,它迭代地确定每个细胞被分配到的最近的k簇中心。这种策略是无监督聚类的一个例子,因为聚类的数量k是一个由用户任意定义的参数,而不是从以前的任何数据集学习到的。该方法一般是在特征选择和降维后使用,不需要很大的计算能力。k-means方法的主要缺点是,它假设一个预定数量的圆形,同样大小的集群,这当违反时,会导致无法检测到可能的稀有细胞群。

另一种广泛使用的方法是分层聚类,它将单个细胞组合成更大的聚类或者把群分成更小的亚群。该策略包括使用欧几里得距离等测量值计算单元之间的距离。层次聚类方法比k均值慢,但允许识别不同粒度的聚类之间的关系。层次聚类方法包括通过imputation(归责)和dimensionality(维度)、pcaReduce52和sincere进行聚类。

图聚类是第三种方法,涉及基于社区检测的算法,广泛用于分析更大的数据集。社区检测方法的优势在于它可以扩展到数百万个细胞。Louvain算法是目前最流行的用于scRNA-seq数据分析的社区检测算法之一46。这种方法首先将每个独立的单元作为独立的集群处理,然后以逐步的方式执行模块化优化。对于每个单元,算法检查是否可以通过将该单元从当前的集群移动到另一个集群来增加网络模块化。随后,属于同一簇的细胞被聚集为超级细胞形成一个新的网络。迭代地重复这两个步骤,直到不能进一步增加模块化为止。利用PhenoGraph53和Seurat43方法可以实现Louvain算法。其他独立的无监督聚类方法包括贝叶斯信息准则和Akaike信息准则,它们可以用来估计最优的聚类数量54。

谱系重建

细胞轨迹分析工具使细胞谱系的时间顺序或生物的种群在开发过程中从多个时间点的细胞或干细胞或祖细胞分化拟时间的概念,一个标量测量细胞的长时间在无监督manner55铺平了道路。在过去的5 - 6年里,基于降维、最近邻图、簇网络和RNA速度的四种主要的谱系重建算法被开发出来。每一种方法的计算和生物学细节,以及单细胞转录组学和遗传谱系追踪的结合如何促进我们对发育、组织稳态和疾病的理解,之前已经描述过56。谱系重建工具在描述冠状动脉发育57、第一和第二心脏场祖细胞规范58以及涉及人类心脏发育的所有主要细胞类型的基因表达变化方面特别有用。

在过去的一年中,谱系追踪超出基于表达的计算重建已经成为可能,通过跟踪体细胞突变线粒体DNA (mtDNA),使用scRNA-seq或类似的方法来评估染色质易访问性如单细胞分析转录酶可及性染色质使用测序(scATAC-seq) 。mtDNA的突变率通常比核DNA高10- 100倍,许多研究人员利用这一差异证明,mtDNA突变的积累可以作为内源性遗传条形码,在体外和体内追踪细胞谱系。mtDNA序列变化已被跟踪,以重建造血细胞和实体瘤的克隆混合物中的细胞关系。与核基因组测序相比,这种方法使克隆追踪规模增加了1000倍。一种基于scATAC-seq(内源性突变的表观基因组和线粒体条形码谱系,或徽章)形成的类似方法同时被开发出来,以促进急性髓系白血病患者造血干细胞及其后代的克隆进化分析60。这些单细胞方法补充了现有的遗传谱系追踪技术,并将克隆追踪研究扩展到任何真核生物的任何细胞或组织类型,包括人类心血管组织。

细胞内相互作用的预测

使用传统的Bulk分析工具几乎不可能在不同的细胞和组织类型之间分析和解释旁分泌信号通路。分析scRNA-seq数据的信息学工具的发展提供了研究细胞间通信和信号传递的一个有前途的解决方案。例如,在现有的人类数据库的基础上,已经建立了一份2000对小鼠配体受体对的清单,用于分析成年小鼠心脏每种细胞类型中配体受体对的表达模式。令人惊讶的是,分析显示在非心肌细胞群体中存在着密集的通讯网络;心脏成纤维细胞被认为是最有营养的细胞群,具有密切的多细胞连接,支持特定的邻近细胞群的生存。在胎鼠心脏中,通过细胞间通讯分析,确定心外分泌和心内膜分泌的旁分泌因子,这些因子在心脏形成过程中调节心肌细胞增殖和小梁向致密心肌的过渡。内皮细胞分化的人诱导多能干细胞(iPSCs)的scRNA-seq同样揭示了分化过程中产生的多种细胞类型之间广泛的细胞间相互作用和分子间的相互作用。然而,这些相互作用网络并没有考虑细胞类型的实际解剖位置或边界,也没有提供细胞串扰的确切证据(缺点)。应对相应的生物样品进行足够的体内或体外实验,包括但不限于FACS、免疫组化、原位杂交或酶联免疫吸附试验(ELISA),以验证生信细胞类型鉴定和配体受体对预测分析。然而,上述工具对于大规模、无监督地预测异质细胞群中的多细胞信号通路是非常强大的。因此,使用scRNA-seq的细胞间通信预测分析可以补充各种正交方法(如蛋白质组学)和成像模式,以发现和阐明细胞串话的新机制

[if !supportLists]2. [endif]生成心血管细胞图谱

心脏发育

scRNA-seq已被用于广泛的心血管系统组织和细胞类型(表2)。2016年,两组研究人员通过对胚胎心脏解剖定义区域的分析,独立生成了所有主要心脏细胞类型在不同发育阶段的单细胞图。Li等人使用随机森林算法分析了小鼠在胚胎期第8.5天(E8.5)至第10.5天的心脏转录谱,并能够以91%的准确性预测个体心肌细胞在发育过程中的解剖位置,包括以胰岛1标记的谱系追踪细胞(Isl1;也被称为胰岛素基因增强蛋白(Isl1),它存在于流出道和右心室64。del发笑等人采用了类似的方法,分析从E9.5至出生后第21天的心脏细胞,以揭示胚胎和出生后成熟过程中阶段特异性心肌细胞的转录程序。这两项研究都发现,同源框蛋白Nkx-2.5的缺陷导致心肌细胞成熟的严重缺陷,并描述了发育中的胚胎中已知的心肌细胞类型的大量异质性。

scRNA-seq也被证明对鉴定调节形成心脏的早期心脏谱系的出现和分离的机制非常有用。例如,小鼠野生型和Mesp1阴性的心血管祖细胞(CPCs)的单细胞转录组分析表明,Mesp1是祖细胞从多能性退出和早期胃肠期诱导心脏基因表达程序所必需的66。不同的Mesp1 CPC群体被发现对应于产生不同心脏谱系和解剖区域的祖细胞,并且在早期心脏发生过程中识别出与谱系承诺和多样化相关的关键分子指纹,正如之前通过Cre loxp介导的谱系追踪研究所显示的那样。在心脏命运决定的早期阶段,Nkx2 5+/和Isl1+/+ CPCs的scRNA-seq也导致了之前未知的祖细胞亚群的鉴定。发育轨迹分析还表明,Nkx2-5的长时间表达使CPCs走向单向心肌细胞命运,而Isl1+/+ CPCs在分化成多个发育分支之前通过一个吸引状态。同样,从Nkx2-5和Isl1 lineage-tracing胚胎老鼠心脏细胞分离进行 scRNA-seq评估了第一和第二心脏区域的祖细胞分化识别了两个祖细胞类型不同的分化动力学并揭示了CPCs和终末分化心血管细胞之间的沟通。同样,对被囊动物心咽发育的scRNA-seq分析揭示了第一和第二心脏谱系中不同的分子信号通路。基于网络的计算方法也被用于预测谱系特异性转录因子,Hand2被确定为流出道细胞而不是右心室细胞存在的标记物70。有趣的是,Hand2-null小鼠胚胎的右心室没有正常形成,随后的scRNA-seq分析表明流出道心肌规格的失败,而不是右心室心肌规格的失败,是先天性心脏缺陷表型的原因。这些发现表明,在单细胞水平上了解先天性心脏病的致病机制,对于准确定义和定位构成该疾病表型表现的细胞亚群至关重要。此外,单细胞测序的未来应用将有助于确定独特的患者特异性病因,这些病因可能在病理生物学上有所不同,因为不同的细胞异质性和基因表达模式会导致共同的疾病表型。

成年心脏稳态与疾病

除了胚胎和出生后的心脏外,单细胞转录组学还被用于描述成年小鼠心脏的细胞亚群。通过对未受伤的成年小鼠心脏的非心肌细胞的scRNA-seq,在内皮细胞、心脏成纤维细胞和免疫细胞之间发现了一个广泛的细胞间通信网络,这可能参与维持心脏稳态61。此外,心肌细胞基因表达的类型特异性和性别特异性差异也可能参与心脏稳态和重构。出生后小鼠心脏的单核RNA测序发现了儿童线粒体心肌病小鼠模型的细胞类型特异性缺陷34。此外,使用SORT测序方法对稳态条件下和缺血损伤后的成人心脏进行分析,发现在已知细胞类型内存在多个亚群。成年小鼠心脏中的所有细胞,包括心肌细胞,使用FACS通过直径为130 m的大喷嘴分离;使用高前向散射宽度可以丰富地分离出形状不规则的成年心肌细胞,这一点通过tdTomato报告系谱追踪方法得到证实。两个独立的组能够通过无Langendorff酶解心室组织获得存活的成年心肌细胞21,72,然而另一个研究小组报告,如果不使用Langendorff仪器,分离存活的和未破碎的心室心肌细胞很困难72。Gladka等证明缺血再灌注触发在各种细胞类型中出现了以前未知的细胞亚群,并发现活化成纤维细胞中Ckap4的增加。使用Langendorff灌注和基于块的方法73分别分离小鼠和人类心室,Nomura等人在Smart-seq2平台上对成年心肌细胞进行scRNA-seq,在单细胞水平上识别肥厚心肌细胞的基因模块。值得注意的是,Monocle-based cellular-trajectory分析小鼠心肌细胞在不同时间点的,经历了TAC显示p53 myocyte-specific增强剂的重要作用因素2核转录因子红细胞两个相关因子2信号轴促进DNA氧化损伤后心肌细胞肥厚亚群的致病基因的激活。这些发现被来自心力衰竭患者心肌细胞的scRNA-seq获得的数据证实74。scRNA-seq 冰冻损伤斑马鱼心脏的心肌细胞边界地带显示边界地带损伤后的心肌细胞单细胞转录组像胚胎心肌细胞,能够解释在斑马鱼心脏再生引起心肌细胞皮质骨小梁和皮质细胞类型过程中观察到的小梁心肌细胞向皮层心肌细胞的转变。

为了研究心肌梗死(MI)后新生血管中内皮细胞的异质性,Li等人对从内皮特异性谱系中分离出来的内皮细胞进行了基于液滴的scRNA-seq,在基线和MI后7天追踪小鼠心脏。在PCA鉴定的10个内皮细胞群中,与对照组相比,心肌梗死后5个内皮细胞群显著富集于心脏,同时与心脏重塑、内皮细胞细胞外基质相互作用、增殖和细胞周期调控相关的基因上调。质膜囊泡相关蛋白(Plvap)在MI后的小鼠心肌模型和人类心脏的5个集群中的3个高表达。有趣的是,Plvap表达的增加定位于梗死边缘区的内皮细胞,一种与MI后促进内源性心脏组织修复的生长因子定位共享的分子模式。心肌梗死后7天对心脏成纤维细胞和免疫细胞的类似分析揭示了这些非心肌细胞群的动态通量,每一种细胞都有自己的中间过渡状态和独特的转录特征

综上所述,越来越多的研究已经使用scRNA-seq来阐明心肌梗死后各种非心肌细胞群的作用,提高了我们对缺血组织重塑过程中微环境变化的理解。未来的研究将受益于对这些细胞类型和过渡状态的具体功能的更深入的机制研究,特别是在损伤后的不同阶段,如早期急性炎症(心肌梗死后1天)和晚期重塑(心肌梗死后30天)。这样的研究将有助于更好地描述病理心肌纤维化过程中内皮细胞向间充质细胞转变的动力学或间叶细胞到内皮细胞的过渡在心血管生成的期间。现在,转录组调查和后续的细胞间相互作用的验证在non-cardiomyocyte细胞和心肌细胞之间的沟通在组织修复和重塑过程中还没有被充分研究,并填补这些我们在知识方面的缺口有利于改善我们对不同阶段参与心脏损伤和修复的细胞反应的理解。

scRNA-seq也被用于描述人类胚胎心肌细胞的基因表达状况12。通过单细胞标记逆转录测序,从18个人类胚胎(妊娠5至25周)中提取了大约4000个解剖定义的心脏细胞,以绘制出人类心脏的发育轨迹。四种主要的心肌细胞类型(心肌细胞、内皮细胞、成纤维细胞和瓣膜间质细胞)被鉴定出来,心肌细胞和成纤维细胞在发育过程中都经历了基因表达的逐步变化12。重要的是,人类和小鼠心脏之间的比较分析揭示了人类心脏发育的几个独特特征,表明存在种间差异,这些差异可能在bulk分析中不明显,但可能在单细胞转录组水平上可以辨别出来。Cui等人比较了小鼠和人类scRNA-seq数据集中发育中的心脏中的四种主要细胞类型(心肌细胞、内皮细胞、成纤维细胞和心外膜细胞),并报告称,在研究的细胞类型中,来自人类和小鼠的心肌细胞在转录上最相似12。进一步的转录组分析显示,心肌细胞在小鼠和人类7周E10.5最为相似,而5-week-old从人类最类似成纤维细胞在小鼠E9.5,指示异步小鼠与人类之间的时间轴在心脏细胞的分化和成熟发展。此外,RNASE1在人内皮细胞中特异性表达,在人成纤维细胞中特异性表达THY1,在人心外膜细胞中特异性表达CFB和ITLN1,所有这些都在小鼠心脏中低水平表达。相比之下,Icam2在小鼠内皮细胞中特异性表达,Rnf213在小鼠心外膜细胞中特异性表达,突出了不同细胞类型基因表达谱的种间相似性和差异。目前正在努力生成大规模的、单个的人类成年心脏图谱,特别是使用心肌细胞的单核RNA-seq和非心肌细胞的scRNA-seq 82。总之,这些研究证明了scRNA-seq在深入了解细胞间变异和确定心脏发育和疾病中的关键转录程序方面的效用。

血管和造血细胞

冠状血管的形成是一个高度动态、有序的发育过程。尽管动脉和静脉的发育受相互拮抗的转录程序控制,但在发育和再生过程中,预先存在的静脉往往通过未知的细胞命运转换产生新动脉。scRNA-seq技术在阐明血管发育过程中细胞的动态转变方面发挥了关键作用。例如,将scRNA-seq与谱系追踪转基因小鼠结合发现,冠状动脉是由发育过程中由静脉细胞衍生的特定前动脉群体形成的57。研究发现,静脉细胞逐渐从静脉表型转变为动脉表型,直到细胞亚群克服转录阈值转变为动脉前状态。静脉特异性转录因子政变转录因子2 (COUP- tf2)被认为是这一命运开关的关键中介,为静脉源性动脉形成的机制提供了分子视角。健康成年小鼠的主动脉单细胞图谱识别了所有的主动脉细胞类型及其亚群85,幼龄(8周)和老年(18个月)小鼠的主动脉对比显示内皮细胞群的转录组差异很大。

scRNA-seq也被用于描述主要血管疾病中的细胞状态和命运决定。动脉粥样硬化动脉是由多种细胞组成的,包括内皮细胞、血管平滑肌细胞和免疫细胞,这些细胞对细胞外细胞的可塑性和敏感性各不相同。特别是,尽管VSMCs是一种终末分化的细胞类型,但众所周知其可塑性很强,使用单细胞分析有助于描绘VSMCs的细胞表型调节为一种独特的成纤维细胞样细胞类型(称为纤维细胞)91。此外,单细胞分析有助于识别指导人类动脉粥样硬化血管中VSMC分化状态的特定组蛋白变体92。动脉粥样硬化的典型特征是大量的免疫细胞,包括一些巨噬细胞亚群,它们的功能和表型特征较差,部分原因是标记物数量有限。为此,应用涉及健康和动脉粥样硬化主动脉巨噬细胞的scRNA-seq数据的非监督聚类分析,可以与健康对照组相比,识别富集于病变主动脉的髓系亚群93。这些亚群包括单核细胞、单核细胞来源的树突状细胞和两个巨噬细胞群,这些巨噬细胞富含炎症分子,激活髓系细胞2 (TREM2)和IL-1β表达的触发受体,几乎只在动脉粥样硬化主动脉中可见。类似地,单细胞分析方法与大规模细胞测定术(CyTOF)结合使用,在小鼠动脉粥样硬化斑块中生成更广泛的免疫细胞库图谱94。总的来说,在病变的主动脉中发现了11种不同的白细胞群,包括三个主要的B细胞亚群,以及在主动脉白细胞中富集的几种细胞类型特异性通路。重要的是,主动脉白细胞的组成可以预测动脉粥样硬化患者的临床事件,这表明单细胞分析具有翻译潜力。对6 - 8周龄小鼠降主动脉内皮细胞的scRNA-seq显示了三种主要的细胞群:成熟血管内皮细胞、有间充质特征的内皮细胞和有炎症特征的内皮细胞。

器官图谱

除了对特定组织或器官系统进行鉴定外,单细胞转录组分析也在更大范围内进行,以建立各种主要器官的全面细胞图谱6,7。使用组合索引法,在妊娠第9.5天13.5天,从61只小鼠胚胎中的200万个细胞中生成了小鼠器官发生细胞图谱,允许可视化所有类型细胞的发育轨迹96。一份名为Tabula Muris的单细胞转录组数据汇编,涉及来自20个不同成年小鼠器官和组织的10万个细胞,也使用基于流式细胞仪和基于液滴的scRNA-seq方法生成6。该数据集对于确定细胞类型的基因表达差异特别有用,这些细胞类型存在于许多组织中,如内皮细胞、心脏成纤维细胞和组织常驻免疫细胞(如巨噬细胞)。基因表达指纹和独特的表面标记蛋白的鉴定可以提高这些细胞的分离和鉴定,为新的靶向治疗打开大门。该Tabula Muris概要是公开可用的,允许所有领域的研究人员不仅使用它作为一个生物学参考,而且进一步贡献其更详细的分析。基于组合索引(sci-ATAC-seq)构建了一个类似的单细胞染色质可及性图谱,以评估13个不同的成年小鼠组织。sci-ATAC-seq数据与前面提到的scRNA-seq图谱的配对揭示了大多数重叠器官的细胞类型分配的显著一致性,尽管有些在肺和大脑中发现了差异。但这些综合方法为阐明不同组织和细胞类型的表观遗传和转录调控的复杂机制提供了广阔的前景。多机构联盟已经形成,目前正产生人类细胞地图册,包括人类细胞Atlas consortium97陈扎克伯格倡议和人类生物分子图谱计划(HuBMAP) 98年由美国国立卫生研究院,这将使变化的表征,在成人心脏内的所有细胞类型在自然老化和应对疾病(图4)。最后,公开访问的数据库scRNA-seq研究,如PanglaoDB99、scRNASeqDB和SingleCell Portal可以在线获得,其中scRNA-seq数据集可以根据原始组织或细胞类型进行分类和识别,包括人类和小鼠的心脏、血管和iPSC衍生物。

多能干细胞模型

人类iPSC模型已被证明在患者特异性疾病建模和再生治疗中有用,但主要的挑战,包括iPSC来源的心血管细胞的不成熟和未解决的异质性,仍然存在。因此,许多研究利用scRNA-seq确定了参与分化的转录调节信号通路,识别引起的所有细胞分化类型,和优化和修改方案去生成专门的心脏和血管细胞亚型(表3)。

利用现有方法生成的人类ipsc衍生心肌细胞(iPSC-CMs)在形态、大小、电生理特性、钙处理、收缩性和代谢功能方面具有胎儿般的特征。Friedman等人对处于iPSC-CM分化不同阶段的40000个细胞进行了scRNA-seq,并报道了非dna结合同源结构域蛋白HOPX的失调导致iPSC-CMs的持续不成熟状态。在另一项研究中,从多余10,000个细胞基于液滴的scRNA-seq中鉴定出iPSC-CM分化过程中的心脏转录调控因子;iPSC-CMs表达COUP-TF2和T-box转录因子TBX5更为成熟和心房样形象,而与YRPW毛/ enhancer-of-split相关主题的表达蛋白2 (HEY2) iroquois-class homeodomain蛋白质IRX4和肌球蛋白轻链2,心室/心肌同种型(MYL2)富含心室样 iPSC-CMs。通过对等基因iPSC系的基因组编辑,证实转录因子NR2F2和HEY2分别在形成类心房、类心室的iPSC- cms电生理和基因表达谱中发挥着不同的调控作用。总之,这些研究的结果强调了iPSC-CMs的异质性,并揭示了控制细胞成熟和特异腔室人iPSC-CMs的特点的心脏转录因子。

人ipsc来源的内皮细胞(iPSC-ECs)也已被用于血管疾病建模,并在体外有效地概述遗传和环境因素对血管功能障碍的影响然而,与iPSC-CMs一样,目前可用的iPSC-ECs受到细胞不成熟和异质性的限制。诱导分化过程中基于液滴的iPSC-ECs的scRNA-seq导致iPSC-ECs的四个主要亚群被富集的基因表达APLNR、CLDN5、ESM1和GJA5标记;CLDN5+簇代表代谢活跃的iPSC-ECs, GJA5+簇代表动脉样iPSC-ECs, APLNR+簇代表炎症反应性iPSC-ECs, ESM1+亚群代表活化细胞。在另一项研究中,McCracken等人对两独立的人类胚胎干细胞来源的内皮细胞(ESC-EC)分化方案进行了纵向基于液滴的scRNA-seq分析。ESC-EC产品方案拟时间轨迹显示分化为内皮细胞和间充质细胞类型在第6天分化,与接受成熟细胞类型分化在第八天,以减少表达间充质细胞的SNAI2和增加表达ANGPT2为特点,ESM1和GNG11在内皮细胞群。尽管在最初的内皮细胞承诺后,ESC-ECs进一步成熟,但没有进一步的器官特异性内皮表型承诺的标志物被观察到。未来的研究应侧重于识别器官特异性转录组学特征,并进一步优化分化方案去产生解剖定义的多能干细胞来源的ECs。

单细胞多组学方法

组合索引

目前,scRNA-seq技术的一个主要局限性是从分离的单细胞中制备RNA-seq文库的成本很高。成本随细胞加工数量的增加而线性增加,这给单个实验室和多机构联盟造成了巨大的障碍。为了应对这一挑战,新的多路复用方法被开发出来,以增加通量,同时也降低每个单元的成本。其中一种方法是组合索引,这涉及到使用两种独立但概念相同的方法,即单细胞组合索引RNA测序108和基于连接的分裂池转录组测序109,在这种方法中,单个细胞或细胞核被分离、贴条形码、合并,然后再次分裂以获得额外的条形码。与基于液滴或微孔平台使用的单个条形码不同多轮细胞分裂和条形码索引能够对大量单细胞或细胞核的转录组进行独特的标记。这些组合索引策略可以将分析的细胞数量增加10倍到1000倍,而不需要对单个细胞进行物理隔离这项技术的最新迭代可以在一次运行中从60个胚胎中提取多达200万个细胞。然而,尽管在通量上有令人瞩目的增长,组合索引通常产生较浅的测序深度,可能无法识别极其罕见的细胞群,这通常是执行scRNA-seq分析的主要目标(通量-测序深度--识别细胞群上的区别)。因此,这是一种取舍在优化实验设计和设置时,应仔细考虑实验的广度和深度

组合单细胞技术

除了scRNA-seq技术,还有无数其他单细胞组学技术也在开发或使用中。这些技术包括单细胞染色质可及性(如scATAC-seq)、DNA甲基组学和蛋白质组学,所有这些技术都携带着独特的信息,这些信息不能仅由scRNA-seq完全捕获,即使在其最大深度和通量。例如,染色质组织和可及性的整体或局部变化可以先于主要的转录事件,在mRNA表达水平上检测到它们之前,并可能代表一个更稳定的细胞表型或状态。scATAC-seq已被开发用于同时探测数以万计细胞的染色质可及性谱,并识别控制转录的调控元件。这项技术已经开始揭示果蝇胚胎发生(人类造血)以及T细胞受体特异性的新调控环境。scATAC-seq需要考虑的一点是,它通常需要额外的步骤来物理隔离单个核,考虑到在多次离心和再悬浮过程中核膜的脆弱性和半通透性,这一过程需要额外的小心。与scRNA-seq一样,根据感兴趣的样本定制隔离方案确保核的完整性和敏感性至关重要。随着这些工作流程的持续优化,预计scATAC-seq将改变我们探究表观基因组调控机制的方式,特别是在分析平行scRNA-seq基因表达谱时。一项较早的研究表明,两种组学平台可以通过一种新的基于索引的联合分析在算法上或同时集成

与染色质可及性一样,dna甲基化景观也可以为不同细胞的分化潜能和转录活性提供独特的见解,这些方式可能无法通过RNA表达反映或推断出来。各种各样的策略已被开发用于单细胞DNA甲基组分析,其中一些已经与scRNA-seq或染色质可及性数据配对,以揭示表观遗传和转录调控的协调机制。然而,尽管在整合多组学数据方面取得了进展,但我们对这些调控过程如何自身分层表现为下游细胞表型和行为状态的理解仍然有限。一个技术瓶颈似乎是缺乏一种类似的单细胞方法,可以以类似的灵敏度和通量来询问细胞蛋白质组。综合方法允许同时审讯单细胞转录组连同成千的蛋白质已经开发使用oligonucleotide-conjugated抗体,称为细胞转录组的索引和抗原表位进行排序(CITE-seq)或TotalSeq,但这些方法目前限于少数表面蛋白和依赖的可用性专门设计的抗体。单细胞蛋白质组学这一新兴领域正在不断努力,以开发可替代的蛋白质检测方法,以提高灵敏度和范围(如Edman降解的变化),改进样品制备管道和改进基于质谱的平台。工作流程的优化和标准化可能对实现真正的单细胞分辨率的整体多组学分析至关重要,该分析可以在蛋白质水平上连接上游基因调控机制和观察到的下游表型。

最后,空间转录组正迅速成为一个强大的技术,提供了一个全新的维度在单细胞附近解决上述组学技术(图2)。例如,条形码oligo-dT微阵列幻灯片已经成功地用于RNA映射到特定XY-positions在组织切片上解决~ 100µm分辨率 (ref。128)。一种被称为玻片测序的新方法是将组织样本中的RNA转移到覆盖着已知位置的dna条形码珠子的表面,这样就可以通过测序来确定RNA的空间位置。该方法大大提高了转录组图谱的空间分辨率至10 m,与细胞的平均长度大致匹配,为组织的高维结构分析和复杂的类器官模型提供了广阔的前景。Asp等人通过整合空间转录组学、scRNA-seq和原位测序,生成了人类心脏在前三个月发育的时空图谱,以创建3D空间细胞图谱。其他组学技术的类似方法(如染色质可及性的空间映射)也有望在不久的将来出现,为使用定位坐标可追踪到单细胞的高维多组学分析打开大门。心血管精准医学

卫生保健的主要挑战之一是患者对治疗的反应并不一致。目前,市场上大约90%的药物对50%的治疗无效。这些病人特异性药物反应的机制仍然是难以捉摸的,与广泛的遗传和环境因素似乎有贡献。在这些因素中,患者特异性细胞间的异质性被认为是个体间药物反应差异的基本因素和驱动因素,这凸显了单细胞技术在推进精准医疗中的日益重要的作用。

scRNA-seq的早期临床应用主要集中在肿瘤。原发性肾肿瘤及其肺转移显示出相当大的细胞异质性,针对两个独立通路的联合治疗已被证明比单一治疗更有效132。与此同时,其他研究表明,多种非恶性肿瘤相关细胞,包括基质细胞和免疫细胞,在肿瘤进展和维持中发挥关键作用。毫不奇怪,给定肿瘤组织的细胞组成因患者不同而有很大差异,这对诊断和治疗反应有重要意义。同样,心血管疾病的治疗也是次优的,因为患者在药物反应方面存在显著差异135。例如,来自不同个体的iPSC-CMs的Bulk转录组分析揭示了人与人之间对常见心血管药物的细胞和分子反应的差异136,137。然而,这些Bulk分析无法检测可能导致不同药物反应的细胞异质性的个体特异性差异,单细胞多组学分析将是揭示这些信息的关键。

由scRNA-seq生成的细胞图集显示,心脏和周围血管系统由多种细胞类型组成,包括心肌细胞、成纤维细胞、内皮细胞、血管平滑肌细胞、瓣膜间质细胞和居民免疫细胞,每一种细胞类型都可以进一步分为亚型。不同类型的细胞,特别是非心肌细胞对心脏发育、内稳态和疾病的功能贡献越来越受到重视,这促使近年来对各种心血管疾病中新的细胞群和亚型的单细胞研究迅速增加。然而,与癌症一样,心血管细胞群的组成和行为在个体之间有很大差异,这可能导致治疗反应的不一致。

未来应对这些挑战的一种方法是在临床干预之前创建患者特异性细胞图谱。可以想象,基于scrna序列的细胞数量、基因表达谱和细胞异质性的评估将补充现有的诊断测试,并帮助医生确定最有效的、个性化的治疗方案。以往使用scRNA-seq发现的患者血浆生物标志物的分析,或者在一些罕见病例中,通过活组织检查或间隔肌瘤切除术获得的患者心脏样本的直接分析,原则上可用于监测疾病状态和选择最佳治疗时间点。在某些情况下,异常高数量的免疫细胞或升高的细胞因子表达可能鼓励联合治疗免疫调节药物,以限制干预后延长炎症。考虑到它的高灵敏度,scRNA-seq也可能在临床中检测疾病状态下稀有细胞群体被证明是有用的,那可以更有效地靶向和输送药物。

尽管有这些潜在的好处,在scRNA-seq可以常规应用于临床之前,必须克服许多技术、后勤和资金障碍。考虑到其固有的复杂性,scRNA-seq作为一种独立的治疗决策技术可能是不可行的,而且它将来整合到临床环境中很可能需要进一步发展组合分析和并行诊断试验。此外,实施将需要样品制备和数据分析的标准化协议,以及医生友好的界面和软件。其他重大的财政和后勤考虑可能会阻碍将该技术立即纳入目前的保健系统。然而,考虑到scRNA-seq技术在最初几次迭代中获得的势头,这些挑战很可能得到解决。随着scRNA-seq管道的持续改进、测序成本的降低以及数据驱动的精准医学的进步,转译单细胞应用将继续增长,并很可能重新定义未来患者的治疗方式。

结论

在过去的几年里,转录组学已经实现了一个巨大的飞跃,从对个体平均群体的研究发展到对单个细胞的分析。尽管它的历史很短,但scRNA-seq已经开始推动跨学科的新发现,这是传统的Bulk分析方法不可能实现的。仅在心血管领域,scRNA-seq已被许多群体使用,并在识别新细胞群、阐明谱系轨迹和表征各种发育和疾病背景下的细胞间通信方面发挥了作用。除了使用在细胞解体特定类型的变化发展和疾病,scRNA-seq技术也被用于生成心血管等各种组织的单细胞图谱(表2)。这些图谱形成了可以公开访问的参考数据库,这可供来自各个领域的研究人员进一步分析。

尽管仍存在一些技术限制,但随着实验和分析管道的不断改进和标准化,预计scRNA-seq在基础研究和转化研究中的应用将呈指数增长。特别是,将scRNA-seq与其他组学技术(如单细胞基因组学和scATAC-seq)相结合,目前正在进行研究,有望阐明单细胞分辨率的基因调控机制。将多组学方法整合到当前的工作流程中存在许多挑战,但也有望与实验室和临床的现有方法相结合。因此,scRNA-seq技术不仅有潜力改造基础科学,而且有潜力推进精准医学。

你可能感兴趣的:(单细胞转录组在心血管系统发育、疾病与医学中的研究)