今天开始在博客上留下我学习的痕迹,算是一种写作锻炼,也希望大家可以和我交流,共同学习,欢迎批评指正。
1、介绍背景,提出问题。介绍了乳腺癌的起源,并提出理解乳腺中群体细胞的异质性和分化层次仍然是困难的。
2、本文的工作。用单细胞测序技术分析了7个人的原发乳腺细胞,共2570个细胞。用Seurat包做聚类分析揭示了三个上皮细胞群体的存在,一个basal,两个luminal(L1,L2).拟时序构建分化轨迹发现在basal和luminal中存在紧密的联系。
3、研究的意义。我们的分析对乳腺上皮细胞提供了细胞群体上的见解,为理解生物系统为什么出错奠定了基础。
数据:GSE113197.
GEO ID |
Platform |
Individual 1 |
GSE113099 |
Fluidigm C1 |
Individual 1 |
GSE113127 |
Individual 2 |
|
GSE113198 |
Individual 3 |
|
GSE113196 |
10× Genomics |
Individual 4-7 |
QC: 1)Fluidigm C1: > 900 genes/cell ; >3 cells/gene→703 cells,4500 genes average per cell
2)10× Genomics:500-6000 genes/cell ; mitochondrial gene<10%
因为10X技术可以测更多的细胞,更多的基因,所以本研究采用了这两种方法。
对个体1-3做了聚类分析,识别到3个群体,basal L1,L2.并识别了每组的差异表达基因。
同时,作者发现在这三个群体中,三个个体的细胞都有分布,这说明聚类结果了可靠性。还识别了一些群体特异表达的基因作为marker基因,后续的分析会用到。
将我们识别到的marker和以前的marker基因相比较.作者发现L1群体和luminal 祖细胞关系密切,L2和成熟的luminal细胞相似,basal中存在一些乳腺干细胞的表达。除此之外,在basal群体中发现了间充质marker ZEB1和干细胞marker TCF4的高度表达,有趣的是,以前的研究证明间充质细胞和干细胞具有直接的联系,这表明表达这两个marker的basal中的一类细胞可能具有干细胞的潜能。
为了看是否有其他的细胞类型存在,作者用了一个更scalable的方法10X对接下来的4-7个体进行了测序。在三个大的群体中又发现了一些不同的细胞状态。还有一些离群点8,9,10.,它们是非上皮细胞,后续作为一个X群体进行分析。
然后,用Seurat方法找到这些不同状态的marker基因,并作细胞类型注释。发现在三个大群体中存在着一些小群体,并有各自的功能。如L1中存在的分泌功能,milk production等。这也可以反应出L1群体主要是与分泌有关。
接着,又对个体5,6,7做了同样的事,发现不同个体,三个大群体中包含的细胞状态的个数不同,这可能是由于个体差异或者是取样的位置不同导致的。
为了找到这些不同个体相同cluster之间的共性,作者用了别人文章里的gene score的方法。
从图中可以看出,L1存在两种不同的表达状态,命名为L1.1,L1.2,L1.1,L1.2,basal中至少存在两种不同的状态。最后,得出了个体通用的细胞状态,如下。
用monole方法,从4-7个体中分别取了1000个细胞,共4000个细胞来构建分化轨迹。
从图a中可知,L1.2位于L2和L1的交界处,表明它是luminal-restricted bi-potent progenitor,并且还是L1.1的祖细胞,这与以前的研究不同。
将我们识别到的亚群与已知的乳腺癌亚型相比较,发现乳腺癌的Luminal A and Luminal B subtypes 和L2类型相似,Myo和TNBC的间充质类相似,TNBC的basal1和L1.1最相似,这些发现或者可以揭示不同的乳腺癌亚型起源于哪种上皮细胞。