五月初讨论时候还在说没看到肥心的文章出来,这几天就搜到了。发的cell reports,9.423分。作者提供了分析代码。
Highlights:
- We sequence single cardiomyocytes from patients with hypertrophic cardiomyopathy
- Diseased cells show diverse gene expression profiles that might be linked to HCM
- Comparison of healthy and diseased cells reveals disease-specific gene expression
- FACS-data quantify cell size and allow identification of cell-size-related genes
1. Single-cell gene expression analysis of septal myectomy samples from patients with HCM
2. scRNA-seq identified HCM-related gene expression changes
作者主要是想测心肌细胞。为了的得到活性比较好的心肌细胞,送样策略使用了18年一篇Circulation里面用到的消化+流式分选的方法,通量不高,五个样品得到2292个细胞。
作者对5例左室流出道梗阻肥心患者(室间隔部分切除术取的)的样品进行了单细胞测序(HCM)。对照的正常左室心肌数据来自心衰及恢复期的成人心脏单细胞重建揭示心功能下的细胞图谱(Ctrl1, n=1400),正常室间隔心肌来自2020年发表在nature上的Cells of the adult human heart(Ctrl2, n=27604)。
三组数据都是不同的平台,而且HCM和Ctrl1是测的心肌细胞,Ctrl2测的是细胞核。但是!神奇的是,他们好像没有去批次???C图也可以看到,细胞完全分开。D图展示了几个细胞群的marker基因,HCM的高表达基因NPPA和NPPB,都是cardiac stress相关的基因。
3. scRNA-seq reveals different subpopulations of HCM CMs
Fig 1E F G:对HCM的2292个细胞做了重新聚类,得到6个cluster。G图展示了marker基因和使用HOMER
, Lisa
和TRIAGE
计算出来的转录因子。
Fig 1H:这个图展示了不同cluster的特异性基因。但是说法很有意思。
这其实是分亚群的时候常遇到的问题,unable to detect a clear separation between clusters 1 to 4,其实也就是四个群鉴定出来的高变基因的pct.1不够高,pct.2也不低,画top10基因的热图会明显看出群跟群之间分不开。这里的cluster1和4尤其明显。但是一般这种情况我就调低分辨率把群减少了,他们这里直接展示UMAP图感觉也是有点勉强。
Fig 1I:Composite expression of HCM cluster enriched genes. 看起来是把6个cluster的marker基因分别算了评分又重新在所有细胞的umap图上投射了回去。主要想说明的应该和Fig 1D的意思差不多:HCM各个cluster的特异性基因都是在HCM的细胞中特异性表达的。
4. NPPA expression is specific for a subset of CMs in patients with HCM
利钠肽Natriuretic Peptide A and B (NPPA/ANP and NPPB/NBP)的表达被认为是心肌细胞肥大,应激和衰竭的标志。Fig1D提示NPPA在HCM的心肌中表达显著增加,Fig 1G提示在HCM的各个心肌群中,cluster3的NPPA和NPPB表达更显著。
Fig 2A:作者寻找了与NPPA表达有相关性的基因(cutoff: p.adj<0.01),鉴定出83个positively correlated genes 和48 negatively correlated genes。
相关性分析方法:
参考:基因相关性的计算
G图是把矩阵按样本来源拆开,每个样品计算出一个NPPA基因和其它基因的相关性,将五个样品的矩阵合在一起得到行为基因列为样品,中间是相关性的矩阵,绘制的热图。
Fig 2B C:UMAP图展示了代表性的正相关和负相关基因
Fig 2D E:免疫组化结果显示ANP阳性细胞主要在HCM样品的纤维化边缘区,再正常心脏中则没有检测到ANP阳性心肌细胞。
Fig 2F:所有细胞中NPPA的表达,也可以看到ANP阳性细胞主要在HCM样品,正常不表达。
Fig 2G:算出来的top相关基因的相关系数在不同HCM样品中的热图,黑点表示p<0.05。提示这些NPPA与这些基因的相关是具有普遍性的
Fig 2H:和NPPA一样,跟NPPA表达呈正相关的基因在Ctrl1和Ctrl2中都表达很低。
5. XIRP2 correlations are more pronounced in HCM CMs
这部分的三张图和上图的A, G, H是一样的。只是把上面一部分的cluster 3的marker基因NPPA换成了cluster 2的marker基因XIRP2。
按这个思路每个cluster都能整一张没啥意义的figure出来...这篇文章里面只描述了细胞数最多的cluster 3和cluster 2。
6. Regulon analysis reveals potential gene modules and TFs driving HCM
为了进一步探究可能与HCM相关的gene expression pattern,作者使用SCENIC进行了转录因子预测。
为了narrow down对HCM比较重要的regulon,作者首先选择了至少在3个患者的样品中鉴定出来的regulon(A),然后选择了regulons most consistently linked to the same group of genes(B)。作者一共鉴定出了22个regulon(C),这22个转录因子在HCM的样品中都有表达(D)。
基因表达通常由TFs的转录后激活而不是TFs的差异表达所决定。由于SCENIC主要是基于转录因子差异表达的数据,作者下一步想要去探究不依赖于TF表达模式的groups of co-expressed genes (modules)。
作者首先选择了在5个病人样品中都表达且在至少5%的细胞中表达的基因,得到1871个基因。随后使用这1871个基因在每个样品中分别构建了gene-gene correlation matrices。随后作者选择了1871个基因中至少和10个基因有显著性相关性的基因(respectively 356, 334, 382, 120, 389 genes per patient)。相关性矩阵的Hierarchical clustering analysis提示存在着patient-specific modules(Fig 5A)。对这些鉴定出来的模块做了patient-to-patient comparison提示存在着five shared modules(Fig 5B, S4B, and S4C)。这些不同病人间都存在的模块可能具有重要的生物学意义。这些模块在不同的亚群中活化情况不同(Fig 5C)。随后作者对不同的模块做了富集分析,提示它们具有不同的功能(Fig S4D)。找到基因共表达模块之后,作者使用HOMER
预测了每个模块中可能参与基因共调控的TF(Fig 5B)。结果显示模块2富集到了MEF2 (myogenic enhancer factor 2, a well-known regulator of muscle genes), SRF和SOX9 (参与心机肥厚的调节) 的binding sites,提示模块2的基因可能参与心肌肥厚。
7. Integration of cell size with scRNA-seq reveals hypertrophy-associated genes
HCM的标志是心肌细胞的肥厚,因此把CM的细胞大小和单细胞的数据整合可能具有一定的提示意义。作者使用患者4和5的心肌细胞进行了流式检测,通过FSC-A获得了细胞大小。
作者首先检测了基因数和细胞大小的相关性(理论上越大的细胞mRNA reads越多),发现呈正相关(Fig S6A B)。Further correlation analysis revealed genes that were both positively and negatively correlated with cell size(Fig 6A)。作者还发现,和其他基因相比,模块2的基因显示出更高的与细胞大小的相关性(Fig 6B)。提示模块2的基因对心肌肥厚可能具有重要意义。
Fig 6C:作者在另外的一个包含了9个control和97个HCM的队列中检测了NPPA和NPPB的表达,提示它们在HCM样品中显著升高。
Fig 6D:RT-PCR的结果也证实了模块2中top ranked gene MYL2和模块2中其它基因呈正相关,与单细胞的结果一致。
Fig 6E F:EGA染色证实HCM患者心肌细胞存在肥厚
Fig 6G H:6个HCM患者的心脏切片中,3个患者的增大的心肌细胞存在MLC-2的高表达。