生信分析 题目是肿瘤干细胞相关文章,真的就使用了干细胞数据吗?

肿瘤干细胞是肿瘤中具有自我更新能力并能产生异质性肿瘤细胞的细胞(有点绕口),对肿瘤的存活、增殖、转移及复发有着重要作用。那么很多相关SCI文章题目写的都是“ XX肿瘤干细胞、、、”,真的是研究分析了实实在在的肿瘤干细胞吗?其实不然,因为有它——mRNAsi(肿瘤干性指数),你也可以根据公共数据库的肿瘤mRNA表达谱数据做肿瘤干性的研究。

今天分享的文章发表在Frontiers in Oncology杂志,影响因子4.848

通过转录组分析鉴定乳腺癌和乳腺癌干细胞中与免疫相关的治疗相关生物标志物:一项临床前瞻性研究

首先让我们通过摘要了解下这篇文章的主要内容,癌症干细胞(CSC)是代表肿瘤复发和转移的一部分肿瘤细胞。这些细胞对放射疗法和化学疗法具有抗性。目前以CSCs为靶点的免疫治疗策略已经取得了初步的成效,但其作用机制尚不清楚。在本研究中,作者从TCGA数据库和GEO数据库中获取数据,进行生存分析和加权基因共表达网络分析来检测生存和干性相关的基因。作者应用单样本基因集富集分析(ssGSEA)方法将患者按免疫状态分为三组,并通过ESTIMATE分析证明其可靠性。接下来应用oncomine、GEPIA、HPA、qRT-PCR和功能分析筛选关键基因并进行分析。好啦,让我们一起来看一看作者具体做了哪些研究吧~

一.材料和方法

1.1 本研究的设计和数据处理

该研究流程图如图1所示。作者从数据库中收集了患者和健康个体的基因表达数据和临床信息。然后应用计算生物学工具评估干性和免疫特性,并识别出乳腺癌患者的生物标志物。最后通过qRT-PCR评估关键基因的表达。

图1.流程图

1.2 数据收集

从TCGA数据库下载了乳腺癌的数据,包括1,104例患者组织和113例非肿瘤组织。利用GTEx项目从中获得了80个健康个体的样本。使用Perl语言将健康组织样本和癌症样本的RNA-seq结果合并到一个矩阵文件中。mRNAsi数据来自Tathiane M.Malta等人,其中mRNAsi是基于表达数据计算的指数。从Bao X等人获得用于免疫细胞类型和信号通路激活的29个标记基因集。

1.3 差异表达基因

应用“ edgeR” R软件包来筛选乳腺癌样本和正常组织样本的差异表达基因。

1.4 WGCNA和模块合并

应用以上筛选的差异表达基因使用R包WGCNA构建共表达网络。可以得到与mRNAsi干细胞指数相关的模块。这些模块是生物学意义的基因集合,模块整体与干细胞指数是具有相关性的。然后计算基因与样本性状的相关性,并计算显著性GS(是使用基因表达与临床表型之间的线性回归中的相关p值确定的)。根据模块重要性选择与mRNAsi相关的重要模块,模块重要性定义为模块内的平均GS,并揭示了模块与样本性状之间的相关性。

1.5识别mRNAsi和生存相关的基因

模块成员(MM)定义为模块自身基因与基因表达谱之间的相关性。用GS和MM筛选与mRNAsi相关的关键基因,筛选条件为cor.gene MM>0.8和cor.gene GS>0.5。

1.6 乳腺癌患者的免疫浸润分组

通过R包GSVA中的单样本基因集富集分析(ssGSEA),将单个癌症样本的RNA-seq数据转换为每个免疫相关基因集的富集分数。通过使用R包sparcl中的层次聚类分析,将具有不同富集得分的肿瘤样本分为低,中,高浸润簇。

1.7 乳腺癌的肿瘤微环境(TME)分析

根据乳腺癌基因集计算TME评分,用estimate R包预测肿瘤纯度。TME的评估分为四类(基质评分,免疫评分,ESTIMATE评分和肿瘤纯度)。

1.8 识别关键基因

所有与生存时间和mRNAsi相关的互作基因均与三个浸润簇进行相关分析。使用Oncomine,GEPIA和Human Protein Atlas数据库检查乳腺癌和健康组织之间以及不同肿瘤之间关键基因的差异表达。

1.9 关键基因的功能分析

通过共表达分析和蛋白互作网络分析,得到核心基因之间的调控关系。接下来,对这些核心基因进行富集分析,找到相关的GO和通路。

二.结果展示

2.1 筛选与生存相关的DEG

作者总共筛选了2261个差异表达基因,其中有989个上调基因和1272个下调基因(图2)。作者又进一步筛选了与生存相关的DEG(包括89个上调基因和123个下调基因)。

图2.筛选差异表达基因

2.2 mRNAsi与临床特征的相关性分析

mRNAsi作为评估肿瘤细胞干性的指标,被认为是CSC的定量描述。Wilcox分析显示,癌症组的mRNAsi水平显著高于正常组(图3A)。生存分析显示mRNAsi低组的患者在随访5年内的总体生存时间更长(图4A)。作者还发现,mRNAsi的得分在乳腺癌的发展过程中呈非线性上升趋势(图3C,D)。

图3. 乳腺癌中mRNAsi的差异分析

图4. mRNAsi和TME的预后价值分析

2.3 重要模块与mRNAsi相关基因的识别

通过WGCNA基因共表达网络分析识别与乳腺癌干性相关的基因,将具有相似表达模式的DEGs分配到一个模块中,获得了9个重要的生物学模块,然后作者探讨了这9个模块与临床特征(包括mRNAsi和EREG-mRNAsi)之间的相关性。结果显示3个模块与mRNAsi相关(图5)。作者从与mRNAsi相关性最强的模块中选出100个关键基因,并从212个与生存相关的DEG和100个与mRNAsi相关的基因的互作中选择了18个共同基因。

图5. 乳腺癌的加权基因共表达网络

2.4 乳腺癌TME的免疫表型景观

作者首先通过ssGSEA评估每个样本的免疫细胞浸润状态,并根据基因表达数据得到29个标记基因集的富集得分。根据该得分将所有1104个乳腺癌样本分为三组(低浸润:11例患者;中度浸润:618例患者;高浸润:475例患者)(图6)。然后应用ESTIMATE方法验证该模型的可靠性,并通过多个指标评估每个样本的细胞组成。结果显示,高浸润簇的患者具有更高的基质评分,更高的免疫评分,更低的肿瘤纯度和更高的总体ESTIMATE评分。

图6.乳腺癌患者的三个浸润簇和TME相关性

作者还应用生存分析来评估ESTIMATE评分的预后价值。结果发现高免疫评分,低肿瘤纯度和高ESTAMATE评分具有更长的总生存时间(图4B-E)。作者还发现,在肿瘤进展过程中,基质评分和ESTIMATE评分呈非线性下降趋势,而在淋巴结进展过程中,ESTIMATE评分呈非线性上升趋势(图7)。

图7. mRNAsi和TME的临床病理特征分析

2.5 关键基因识别与对应功能分析

在这一部分,作者分析了与三个免疫细胞浸润簇的相关性的18个与mRNAsi相关的基因,最终选择了13个关键基因(图8)。

图8. 18个mRNAsi相关基因与浸润簇的相关性分析

肿瘤样本中这13个关键基因的表达水平均高于正常样本(图9)。

图9. 正常和肿瘤样本之间基因差异表达分析

生存分析显示,这些基因表达水平较高的患者的总体生存较差(图10)。

图10.13个关键基因的生存分析

接下来作者对这13个关键基因进行PPI和富集分析(图11)。

图11.关键基因的互作

GO富集分析表明这些基因与细胞增殖有关(图12)。KEGG结果显示,最富集的术语是同源重组和Fanconi贫血通路,并且与DNA损伤和修复密切相关。TIMER结果显示,大多数关键基因与B淋巴细胞和树突状细胞的功能密切相关(图3E)。

图12. GO和KEGG富集分析

接下来作者基于免疫组织化学方法通过Oncomine和HPA对泛癌和正常样本中这些关键基因进行差异表达分析,其中HPA可以对蛋白质表达进行评估。结果发现,PIMREG,MTFR2和CEP55在乳腺癌和许多其他癌症中均过表达(图13A,H–M)。

图13.多种癌症和乳腺癌中关键基因的mRNA表达

2.6 使用qRT-PCR验证关键基因表达

在这一部分,作者通过qRT-PCR评估了PIMREG,MTFR2和CEP55的表达水平,这些基因在乳腺癌样本中的表达高于临近的正常样本。作者还研究了基因表达与TNM分期之间的关系。结果显示,在TNM II期组和III期组之间,PIMREG和MTFR2的表达水平明显不同(图13B-G)。接下来,作者研究了PIMREG,CEP55和MTFR2的表达水平是否与乳腺癌细胞系中BCSC标记的表达有关。比较了两种乳腺癌细胞系:MCF7和MDA-MB-231。应用了两个著名的乳腺癌干细胞标记CD44和ALDH1家族成员A1来验证该结果。结果表明,与BCSC阴性细胞(MCF-7)相比,BCSC标记阳性细胞(MDA-MB-231)中PIMREG,CEP55和MTFR2的表达水平较高。

好啦,这篇文章的内容就这么多啦~总之,作者识别了13个与干性和免疫逃逸有关的关键基因,并且乳腺癌的干性和免疫逃逸程度在乳腺癌进展早期呈非线性增加。还识别了PIMREG和MTFR2,这两个基因是有效的诊断标志物和治疗的潜在靶标。内容丰富、研究手法多样值得学一学呢!

看完了是不是觉得茅塞顿开,SCI研究还能这么做,如果有研究相关课题的宝宝们想做相关分析可以留言联系我们哦!

更多精彩文章解读 可关注生信人网站https://biosxr.gaptools.cn/pc

更多专业个性化分析需求,可填写生信意向表单

你可能感兴趣的:(生信分析 题目是肿瘤干细胞相关文章,真的就使用了干细胞数据吗?)