更多精彩文章生信人
第一篇:单细胞技术的进展
近年来,下一代测序(next-generation sequencing,NGS)技术的迅速发展,为从癌症基因组学到各种微生物群的复杂生物系统,都提供了许多有价值的见解。基于NGS的基因组学、转录组学和表观基因组学技术现在也越来越关注于单个细胞的表征 [1]。与传统的bulk-seq 相比,这些单细胞分析将有助于研究人员发现新的和潜在的生物学机制[2]。
单细胞测序技术是指能够在单个细胞的水平上,对基因组或转录组进行高通量测序,利用其对多个生物学问题进行揭示的技术。众所周知,将基因型与表型联系起来的一个重要技术即为转录组分析,但是,即使我们体内的所有细胞都具有几乎相同的基因型,但任何一个细胞中的转录组信息都仅反映了一部分基因的活性。此外,由于我们体内的许多不同细胞类型转录组表达均具有独特性,因此常规的 bulk 测序只能为一组细胞提供平均表达信号。越来越多的证据进一步表明,即使在相似的细胞类型中,基因表达也具有异质性[3,4]。与传统高通量测序相比,单细胞测序不仅能够分析相同表型细胞的异质性,还可以发现揭示新的细胞类型,并揭示细胞的发育轨迹,具有广阔的应用前景[5]。对单个细胞中的转录组进行更精确的了解对于阐明其在细胞功能中的作用,以及了解基因表达如何促进有益或有害状态至关重要。Kalisky等[6]对当前单细胞转录组技术进行总结,包括方法名称、可捕获细胞数、基因数及原理。
从以上图表可以发现单细胞技术的制备方法多种多样,但也发现了一定的局限性,如测全长的方法捕获细胞数量有限,捕获细胞较多的技术不能够捕获转录本全长等,为我们在下一步技术的开展奠定基础。
特定的生物信息单细胞分析通常的工作流程包括[7]:(1)预处理;(2)比对;(3)质量控制;(4)归一化;(5)降维;(6)差异性表达;(7)亚群分析;(8)伪时序的构建;
在流程的每一部分都具有多种多样的工具及面临的挑战,我们对质量控制和基因差异表达两个重要方面进行总结。
(1)质量控制;scRNA-Seq实验从测序仪中生成FASTQ文件,其中包含数百万个由RNA序列和 Tag 标签(UMI 标签和 barcodes 等)组成的 reads。这些 reads 需要先进行预处理,然后再与参考基因组进行比对。对于 scRNA-seq,使用类似于bulk RNA-seq 的预处理和质量控制 (Quality Control, QC)分析 。Cutadapt [8]是一种去除衔接子序 列的工具,Trimmomatic [9]既可以去除衔接子序列,还可以执行基于质量的序列修除。这些工具通常用于scRNA-seq实验中,而其他通用质量控制工具,例如 FASTQC或HTQC[10] 也可对质量控制产生作用。SinQC[11]和SCell [12]是专门为scRNA-seq 数据设计的两个 QC 工具。SinQC 使用测序文库质量来确定基因表达异常值。它计算不同的质量指标(例如,映射 reads 的总数、映射率和库复杂度),以将用户指定的数据集部分识别为噪声。SCell 是一种多功能工具,可用于离群值检测。它使用Gini 指数估计在背景水平表达的基因,该指数可测量统计离散度,并删除背景分数明显高于平均值的样本。
(2)差异性表达;差异表达(different expression,DE)分析是调用基因表达的过程,该过程表明不同样本组之间在统计学上有显着差异。尽管DE 通常不是单细胞实验设计的主要目标,但由于它需要在目标细胞之间进行预先定义分组信息,因此在 scRNA-Seq 实验中较为常见。其中针对bulk RNA-Seq 开发的两种 DE 方法 EdgeR 和 DESeq2,对于某些 scRNA-Seq 数据可以给出最佳结果[13]。Dropout事件是 scRNA-Seq 的独特噪声类型,在bulk RNA-Seq 实验中很少发生。它是指由于逆转录步骤中转录物丢失而导致基因在一个细胞中大量表达而在另一细胞中不可检测的现象。为了解决细胞群中频繁的 dropout 事件和生物学变异性,有学者已经为 scRNA-Seq 数据开发了更复杂的算法。scRNA-Seq 的另一个独特挑战是某些基因可能表现出双峰性,这意味着跨一组细胞的表达水平集中于两种模式,而不是一 种模式。为了提供更准确的差异表达分析以捕获双峰性,工具Monocle [14]有一个用于差异表达的模块,该模块将数据与非参数广义性模型拟合,而 BASICS 的工作 流程为检测单细胞数据集中的高变或低变基因提供标准[15]。但是,尚不清楚哪种方法通常具有更好的性能。
第二篇:单细胞转录组技术在病毒研究方面的进展
近年来,单细胞测序的应用领域也是不断扩展,从肿瘤遗传发育到感染免疫等方面。病毒感染导致的结果常常是由感染的病毒亚群和宿主反应之间复杂的动力学交互所导致。虽然病毒和细胞亚群的高度异质性逐渐被揭示,但病毒感染的动力学变化和病毒的致病机理依然需要进一步阐释。在该部分,我们将讨论单细胞与病毒感染的相互作用,感染细胞的状态以及宿主的免疫反应等方面。
(1)甲型流感病毒(Influenza A virus,IAV)
IAV 是一种十分常见的呼吸道病毒,每年的季节性流感均会对公共卫生造成压力和经济负担。部分流感病毒株也会形成局域性流行,严重影响社会稳定,威胁人类健康。流感病毒的主要靶标细胞为呼吸道的上皮细胞,并通过唾液酸受体进入靶细胞。宿主对感染的反应源于许多单个细胞(感染和未感染)的综合反应。要了解在组织和生物体水平上控制宿主反应的因素,至关重要的是定义单细胞感染反应的变异模式。
为了剖析甲型 IAV 与宿主细胞异质性之间的相互作用,Vera等[16]将单个病毒颗粒感染的细胞宿主和病毒转录组相组合,观察到病毒基因表达的异质性模式,以及在感染细胞群的单个细胞水平上存在多种不同的转录反应。分析表明,病毒 NS 片段基因表达与被感染细胞亚群中其余病毒基因组的表达不同,并且NS 片段表达的这种独特模式在塑造宿主细胞对感染的反应中起主要作用。最后作者发现季节性的人类 IAV H1N1和H3N2株在单细胞水平上宿主抗病毒基因转录异质性的模式显着不同。在 bulk-seq中感染细胞诱导IFN-1和ISG的过程可以被很好地捕获。但是,通过常规 bulk 测定获得的平均值会掩盖感染细胞和旁观者细胞之间的转录差异,并掩盖了感染人群中存在的任何异质性。Russell等[17]利用单细胞mRNA测序来检查IAV感染的转录结果,发现病毒的转录能力在细胞间差异非常大——在许多受感染的细胞中,病毒转录物的表达量不到总mRNA 的百分之一,但少数细胞的病毒 mRNA 却占其一半以上。一些被感染的细胞不能表达一个病毒基因,但是这种基因的缺失仅解释了部分病毒转录负荷的变化。尽管病毒载量有所变化,但病毒 mRNA 的相对丰度在受感染的细胞之间相当一致。先天性免疫途径中激活的基因很少,但是一些细胞基因与病毒 mRNA 的数量共同变化,其结果突出了单细胞水平病毒感染的复杂性。实际的流感病毒感染起始通常只涉及少量病毒感染少量细胞[18],先天免疫应答的激活具有内在的随机性[19],并且只有一些感染流感的细胞表达抗病毒干扰 素基因[20]。然而,宿主和病毒因子在细胞间变化的程度以及单个感染细胞中它们之间的关联仍然不清楚。先期的大量研究说明 IAV 缺少编码病毒RNP的四个基因中任何一个的表达的细胞表达的总病毒mRNA要比都表达的细胞少很多[21]。
(2)1 型单纯疱疹病毒(Herpes simplex Virus1,HSV-1)
HSV-1 是一种常见的人类病原体,属于疱疹病毒科。HSV-1 的初始感染同时具 有溶解阶段和潜伏阶段。在溶解阶段,病毒在接触部位感染上皮细胞,与这些宿主 细胞一起复制,然后破坏它们并释放病毒后代。潜伏期仅限于神经元,在该神经元中,病毒在整个宿主生命中保持潜伏,偶然会发生反应。通常情况下,淋巴感染通常是无症状的,但在某些情况下(尤其是在免疫受损的个体和婴儿中),它可能会危及导致脑膜炎和脑炎等疾病。
疱疹病毒感染在宿主细胞中引发一系列扰动,在单个细胞的水平上仍知之甚少。研究人员通过溶解感染 HSV-1 在最初几个小时中对人类原代成纤维细胞进行单细胞转录组分析,定义了早期病毒基因表达的精确时间顺序,并提出了病毒基因的规律性表达。作者通过结合三种不同的计算方法来确定与感染相关的宿主细胞基因和途径:基因和途径过度分散分析,细胞状态转变概率的预测以及未来的细胞状态。研究人员发现与抗感染性相关的转录因子 NRF2,两个已知的 NRF2 激动剂甲基 Bardoxolone 和 Sulforaphane 损害病毒产生,表明 NRF2 激活限制了病毒感染。该研究提供了对 HSV-1 感染早期阶段的认识,并作为研究病毒感染中异质细胞状态的蓝图[22]。Drayman等[23]结合了活细胞成像和单细胞 RNA 测序来识别原代人细胞 HSV-1 感染期间病毒和宿主的转录异质性,发现个别感染的细胞之间病毒基因表达水平的极端可变性,并表明这些细胞聚集成转录组上不同的细胞亚群。作者发现,抗病毒信号传导是在极少数的流产感染细胞中启动的,而高度感染的细胞则经历了细胞重编程为类胚胎转录状态。这些发现揭示了具有可变感染结果的细胞中的转录差异,并为HSV-1 操纵宿主途径提供了新的思路。
(3)新型冠状病毒(SARS-CoV-2)
等等,其实在介绍新冠病毒之前,我更想介绍一下单细胞测序技术在肺脏中应用,毕竟他们其实是相辅相成的。
肺脏是至关重要的生理器官,由多种介导呼吸作用和气体交换的细胞组成。肺组织中包含多种免疫细胞类型,例如肺泡和间质巨噬细胞、树突状细胞、粒细胞和淋巴细胞(包括循环和组织驻留记忆 T 细胞)。肺脏不断暴露于致病性和非致病性的微生物和环境中,这表明动力学机制对于维持组织完整性至关重要。当该过程被破坏时,肺修复中的特定缺陷会触发肺纤维化,造成以肺功能、结构完整性和呼吸能力丧失为特征的进行性疾病。
scRNA-seq 可以用来测量单个细胞的基因表达谱,并提供了一个新的机会来高精度地定义参与组织稳态和疾病的细胞类型和分子途径。在研究肺脏发育过程中,Guo等[24]利用 scRNA-seq对出生后1天的小鼠肺脏进行单细胞测序,发现在AT1 细胞和 AT2 细胞之间存在转化的过渡态被称为 AT1/AT2,其分化熵值较高,表明其分化能力较强。Cohen等[25]报告了一种创新方法,可使用蛋白质-配体相互作用网络 来分析 scRNA-seq 概况,以推断发育中的肺中的细胞间相互作用。他们使用 scRNA-seq 分析了鼠肺,并在胚胎和出生后七个阶段对细胞群体进行采样。除了细 胞亚群和状态分类外,他们还利用已发表的配体-受体对在“元细胞”之间建立一个相互作用组,以阐明具有相似表达谱的细胞群之间的作用。最终的相互作用网络表明,肺部驻留的嗜碱性粒细胞是一种相对罕见的细胞类型,与肺中的免疫细胞和非 免疫细胞高度相关。Paul 等[26]通过scRNA-seq揭示了肺纤维化期间单个细胞群体内的变化。作者不仅绘制了肺纤维化患者的单细胞图谱,还发现了只表达于肺纤维化患者的新型巨噬细胞亚群,而在上皮细胞内,发现参与 Wnt 分泌和应答的基因的表达仅限于肺纤维化患者。该研究为探究疾病状态下患者的生理状态的变化及其细胞亚群的变化奠定基础。Vila等[27]发现肺微血管对于气体交换至关重要,并且作者发现 VEGFA 为小鼠肺中某一类上皮细胞所必需,包括 I 型肺泡上皮细胞和部分上皮 细胞亚群,并且发现了碳酸酐酶 4(Car4)在该类细胞中的高表达,为 AT1 细胞的 信号传导作用,并阐明肺泡形成机制提供支持。Kathiriya 等通过单细胞测序定义了 以肺泡修复至关重要的高 H2-K1 表达为标志的 club 样谱系阴性上皮祖细胞 (lineage-negative epithelial progenitors,LNEPs)的不同亚群(约 5%)。博来霉素损伤后,H2-K1 细胞在体内扩增并分化为肺泡谱系。然而,受损的 H2-K1 细胞自我 更新功能较差,从而限制了其完全修复。在最近的几年中,对肺间充质异质性的理 解以及对间充质细胞在指导肺脏发育得到了极大的发展[28,29]。在理解间充质细胞在 肺部发育和疾病中的作用时,识别细胞身份并描述哪些特定标记物表征特定亚群是重要的障碍[30]。通过单细胞测序技术在其中的应用,帮助亚群的细分更为明显和精确,为精准治疗奠定基础。另一项比较重要的工作发现在肺部发育过程中,许多细胞在 11 周之后将会定型为特定细胞谱系,但仍有一部分细胞依然作为非特异性祖细胞[31]。这就提出了以下问题:这些未定型细胞在肺发育后期的确切时间和分化途径,以及它们可能持续多长时间,后期在单细胞测序方面的工作也会对该方面产生较为深刻的见解。由于间充质细胞和上皮-间质相互作用被认为是纤维化发病机制的关键驱动因素,因此,在单细胞测序工作中有部分专门研究多种慢性肺部疾病,例如特发性肺纤维化(Idiopathic pulmonary fibrosis,IPF)。
第一篇报道新冠肺部免疫微环境的单细胞文献是深圳第三人民医院在medRixv预印本上发表题为The landscape of lung bronchoalveolar immune cells in COVID-19 revealed by single-cell RNA sequencing[32]的研究内容,文中对患者肺泡灌洗液(Balf)进行转录组分析及TCR分析,比较分析了重症患者和轻症患者的肺部免疫微环境。结果发现新冠患者中的NK和T细胞比例明显增高。与轻症患者相比,重症患者中CD8+ T细胞比例较低,增殖细胞比例较高,并证实了假设,即轻症患者中CD8+ T细胞更有助于清除病毒,而重度患者中的CD8+ T细胞正在准备增殖。在重症COVID-19患者中,肺巨噬细胞群体的平衡失调,表现为Group1 单核细胞衍生巨噬细胞(FCN1 +)、Group2和3 巨噬细胞(SPP1 +)显着增加,而Group 2 lung AM(FABP4+)几乎完全消失;Wang[33]等对5例健康人和13例新冠肺炎病人的外周血进行了单细胞测序,结果新冠肺炎患者的大部分细胞类型展现出了强有力的干扰素α反应和急性免疫反应。另外,高细胞毒性效应T细胞亚群如CD4+效应因子- gnly、CD8+效应因子- gnly和NKT CD160的强化扩增与中度患者的恢复期相关。在重症患者中,免疫特征表现为干扰素反应紊乱,严重的免疫衰竭,T细胞受体库倾斜和广泛的T细胞扩张。这些发现说明了疾病进展过程中免疫反应的动态性质。
此后,Qian等[34]发现新冠患者的肺泡灌洗液微环境出现了显著的细胞组份变化,包括出现了大量活化的中性粒细胞、单核细胞、B细胞、NK细胞等,但肺泡巨噬细胞、上皮细胞等类型却明显减少。并且发现中性粒细胞在主动清理病毒过程中发挥重要作用。但此类中性粒细胞同时表达大量炎症细胞因子并表现出长时间不受控制的激活状态,这可能是导致细胞因子风暴和重症病变的主要元凶。
2021年2月3日,Cell 杂志发表题为:COVID-19 immune features revealed by a large-scale single cell transcriptome atlas(大规模单细胞转录组图谱揭示COVID-19免疫特征)的研究论文。研究团队对来自196人(包括中度新冠患者、重症患者、恢复期患者,及健康对照)的284个样品进行了单细胞RNA测序,创建了拥有146万个细胞的全面免疫景观[35]。
总结
在单细胞技术的进展方面,我们发现测序的方法继续涌现,但本质都是为了提高深度,捕获更多细胞或者降低成本。在分析工具方面,算法的不断开发和改进帮助单细胞分析更加趋近于生物合理性,降低 dorpout 和 doublet 比例,提高准确性。
在病毒研究进展方面,通过对病毒侵袭细胞进行分析,发现病毒感染导致的结果常常是由感染的病毒亚群和宿主反应之间复杂的动力学交互所导致。病毒感染后所产生的免疫效应及不同细胞细胞因子配受体之间相互作用的揭示,都将帮助我们系统性了解机体抵抗病毒的发生发展。在单细胞转录组技术在肺脏中的应用中,除了发现部分新型细胞亚型在特定疾病中发挥重要角色外,也在肺部发育过程中细胞之间的分化和成熟方面取得重要进展。
随着单细胞技术的不断改进,在不同方面的应用也将越来越频繁,单细胞转录组技术可能会 成为今后进行生物学研究必备的一种技术,帮助我们在细胞层面上更好的理解生命体的发生发展,为疾病的预防与治疗提供更为准确的靶点,也为揭示生物机制,阐明生物进化提供更为精准的工具。
更多精彩文章生信人
个性化生信分析需求 生信分析思路获取 可填写生信意向表单
[1] Hwang B, Lee JH, Bang D. Single-cell RNA sequencing technologies and bioinformatics pipelines [J]. Exp Mol Med, 2018, 50(8):96.
[2] Chattopadhyay PK, Gierahn TM, Roederer M, et al. Single-cell technologies for monitoring immune systems [J]. Nat Immunol, 2014, 15(2):128-135.
[3] Shalek AK, Satija R, Shuga J, et al.Single-cell RNA-seq reveals dynamic paracrine control of cellular variation[J]. Nature, 2014, 510(7505):363.
[4] Li L, Clevers H. Coexistence of Quiescent and Active Adult Stem Cells in Mammals [J]. Science, 2010, 327(5965):542-545.
[5] Maamar H, Raj A, Dubnau D. Noise in Gene Expression Determines Cell Fate in Bacillus subtilis [J]. Science, 2007, 317(5837):526-529.
[6] Kalisky T, Oriel S, Bar-Lev TH, et al. A brief review of single-cell transcriptomic technologies [J]. Brief Funct Genomics. 2018, 17(1):64-76.
[7] Poirion OB, Zun X, Ching T, et al. Single-Cell Transcriptomics Bioinformatics and Computational Challenges [J]. Front Genet, 2016, 7:163.
[8] Martin M. Cutadapt removes adapter sequences from high-throughput sequencing reads [J]. Embnet Journal, 2011, 17(1).
[9] Bolger AM, Lohse M, Usadel B. Trimmomatic: a flexible trimmer for Illumina sequence data [J]. Bioinformatics, 2014, 30(15):2114-20.
[10] Yang X, Liu D, Liu F, et al. HTQC: a fast quality control toolkit for Illumina sequencing data [J]. BMC Bioinformatics, 2013, 14:33.
[11] Jiang P, Thomson JA, Stewart R. Quality control of single-cell RNA-seq by SinQC [J]. Bioinformatics, 2016, 32(16):2514-2516.
[12] Diaz A, Liu SJ, Sandoval C, et al. SCell: integrated analysis of single-cell RNA-seq data [J]. Bioinformatics, 2016, 32(14):2219-2220.
[13] Schurch NJ, Schofield P, Gierliński M, et al. How many biological replicates are needed in an RNA-seq experiment and which differential expression tool should you use? TopHat: discovering splice junctions with RNA-Seq[J]. RNA, 2016, 22(6):839-851
[14] Trapnell C, Pachter L, Salzberg SL. TopHat: discovering splice junctions with RNA-Seq [J]. Bioinformatics, 2009, 25(9):1105-1111.
[15] Vallejos CA, Marioni JC, Richardson S, et al. BASiCS: Bayesian Analysis of Single-Cell Sequencing Data [J]. PloS Comput Biol, 2015, 11(6):e1004333.
[16] J. Cristobal Vera, Jiayi Sun,Yen Ting Lin, et al. A common pattern of influenza A virus single cell gene expression heterogeneity governs the innate antiviral responseto infection. bioRxiv, 2019, doi: https://doi.org/10.1101/858373.
[17] Russell AB, Trapnell C, Bloom JD. Extreme heterogeneity of influenza virus infection in single cells. Elife, 2018,7. pii: e32303. doi: 10.7554/eLife.32303.
[18] Varble A, Albrecht RA, Backes S, et al. Influenza A Virus Transmission Bottlenecks Are Defined by Infection Route and Recipient Host [J]. Cell Host Microbe, 2014, 16(5):691-700. [19] Shalek AK, Satija R, Adiconis X, et al. Single-cell transcriptomics reveals bimodality in expression and splicing in immune cells [J]. Nature, 2013, 498(7453):236-240.
[20] Killip MJ, Jackson D, Pérez-Cidoncha M, et al. Single-cell studies of IFN-β promoter activation by wildtype and NS1-defective influenza A viruses [J]. J Gen Virol, 2016, 98(3):357-363.
[21] Eisfeld AJ, Neumann G, Kawaoka Y. At the centre: Influenza A virus ribonucleoproteins [J]. Nat Rev Microbiol, 2015, 13(1):28-41.
[22] Wyler E, Franke V, Menegatti J, et al. Single-cell RNA-sequencing of herpes simplex virus 1-infected cells connects NRF2 activation to an antiviral program [J]. Nat Commun, 2019, 10(1):4878.
[23] Drayman N, Patel P, Vistain L, Tay S. HSV-1 single-cell analysis reveals the activation of anti-viral and developmental programs in distinct sub-populations [J]. Elife, 2019, pii: e46339. doi: 10.7554/eLife.46339.
[24] Moisés Selman, Thannickal VJ, Pardo A, et al. Idiopathic Pulmonary Fibrosis [J]. Drugs, 2004, 64(4):405-430.
[25] Guo M, Du Y, Gokey JJ, et al. Single cell RNA analysis identifies cellular heterogeneity and adaptive responses of the lung at birth [J]. Nat Commun, 2019, 10(1):37.
[26] Cohen M, Giladi A, Gorki AD, et al. Lung Single-Cell Signaling Interaction Map Reveals Basophil Role in Macrophage Imprinting[J]. Cell, 2018, 175(4):1031-1044.
[27] Reyfman PA, Walter JM, Joshi N, et al. Single-Cell Transcriptomic Analysis of Human Lung Provides Insights into the Pathobiology of Pulmonary Fibrosis [J]. Am J Respir Crit Care Med, 2019,199(12):1517-1536.
[28] Dickey, Derrick D. Strategies for improving adeno-associated viral infection of airway epithelial cells [J]. University of Iowa, 2012.
[29] Warburton D. Overview of Lung Development in the Newborn Human [J]. Neonatology, 2017, 111(4):398-401.
[30] Mcculley D, Wienhold M, Sun X. The pulmonary mesenchyme directs lung development [J]. Curr Opin Genet Dev, 2015, 32:98-105.
[31] Endale M, Ahlfeld S, Bao E, et al. Temporal, spatial, and phenotypical changes of PDGFR alpha expressing fibroblasts during late lung development [J]. Dev Biol, 2017, 425(2):161-175.
[32] The landscape of lung bronchoalveolar immune cells in COVID-19 revealed by single-cell RNA sequencing ;medRxiv.
[33] Zhang JY,et al. Single-cell landscape of immunological responses in patients with COVID-19. Nat Immunol. 2020 Sep;21(9):1107-1118. doi: 10.1038
[34] Wauters, E., Van Mol, P., Garg, A.D. et al. Discriminating mild from critical COVID-19 by innate and adaptive immune single-cell profiling of bronchoalveolar lavages. Cell Res 31, 272–290 (2021).
[35] Ren X, Wen W,et al. COVID-19 immune features revealed by a large-scale single-cell transcriptome atlas. Cell. 2021 Apr 1;184(7):1895-1913.e19. doi: 10.1016/j.cell.2021.01.053. Epub 2021 Feb 3. PMID: 33657410; PMCID: PMC7857060.