仍然继续上次的任务-文献速度。
第一篇
Comprehensive Characterization of Molecular Differences in Cancer between Male and Female Patients
2016年
【主题】
13个cancer types 在male和female的区别,提出在特定的癌症中针对性别特异性采取不同的治疗方案。
【结果】
包含癌症类型:These cancer types include bladder urothelial carcinoma (BLCA), colon adenocarcinoma (COAD), glioblastoma multiforme (GBM), head and neck squamous cell carcinoma (HNSC), kidney renal clear cell carcinoma (KIRC), kidney renal papillary cell carcinoma (KIRP), acute myeloid leukemia (LAML), brain lower grade glioma (LGG), liver hepatocellular carcinoma (LIHC), lung adenocarcinoma (LUAD), lung squamous cell carcinoma (LUSC), rectal carcinoma (READ) and thyroid carcinoma (THCA).
主要 研究了男、女之间下面的差异
下图黄色、紫色代表哪些癌症有更大的性别差异,明显紫色,后面的癌症研究也主要围绕在紫色这几个癌症。
高sex-effect组和低-effect组在甲基化、mRNA和miRNA上的差异。在weak sex-effect组,甲基化在男、女上的差异非常小。
DMD: Another gene of interest in LUAD is DMD, which encodes a protein called dystrophin and is presumably responsible for Duchenne and Becker muscular dystrophies(duchenne型和becker型肌营养不良症 ). The mutations in this gene were highly biased toward female patients (8.4% vs. 19.6%, p < 3.7×10−4, FDR = 0.029).
LUAD的mutation signature 上男女差异比较大,其中有DMD基因。
hypermethylation leads to gene silencing while hypomethylation results in the up-regulation of gene expression
GSEA分析验证了mRNA和methy所在通路。下面这个图是很有意思,我所知道的热图的颜色红和蓝都是代表的基因表达量的高低,现在蓝代表男、红代表女的话,那么如何体现上面的基因高表达导致的底甲基化以及高价机会促使基因沉默呢?热图上用什么来体现基因表达量的高低和甲基化的高低呢?
最后一张图就厉害了,表示FDA批准的药物及其相关临床可操作基因之间的图谱(左)和观察到的这些临床可操作基因在不同癌症类型中的sex bias。不同的符号形状表示不同类型的分子标记,填充的形状表示该基因是相应癌症类型的临床治疗靶点。
其中,文章提到的LUAD的重要治疗靶点EGFR和唯一被确定了的有性别差异的LICH癌症的CTNNB1,可能影响到EGFR inhibitors, PI3K inhibitors, AKT inhibitors and WNT inhibitors在图中有所展示。
EGFR, a major therapeutic target in LUAD, showed a higher mutation frequency in female patients but did not reach the FDR cutoff (9.8% vs 15.8%, p < 0.042, FDR = 0.28), which is consistent with previous reports (Marchetti et al., 2005; Schuette et al., 2015). The only sex-biased mutation gene we identified in LICH was CTNNB1, the activation of which could affect the sensitivity to EGFR inhibitors, PI3K inhibitors, AKT inhibitors and WNT inhibitors.
第二篇
Identification of hub genes in prostate cancer using robust rank aggregation and weighted gene co-expression network analysis
2019年
【背景】
-
RRA : Robust Rank Aggregation (RRA) method --- integrate 10 eligible PCa microarray datasets from the GEO and identified a set of significant differentially expressed genes (DEGs) between tumor samples and normal
- RRA的原因: small sample sizes in individual studies and use of different technological platforms create substantial inter-study variability and difficult statistical analyses. To solve this problem, integrated bioinformatics methods such as Robust Rank Aggregation (RRA) have been utilized in various cancer studies .
- RobustRankAggreg (RRA) package was used to conduct gene integration.
通过DEG结合了wgcna(找到co-expression networks)来确定基因,并进行验证。
发现找到的这些基因在PCa中高表达,并且表达量越高越和肿瘤的分期相关。
ROC和K-M plots证明这些基因在PCa的诊断上也有很好的诊断价值。
作者又结合了甲基化分析,发现这些基因都源于低甲基化,是通过GSEA和GSVA来进行分析发现都和肿瘤的增殖有关。
文章提到-四个基因**LMNB1, TK1, RACGAP1 and ZWINT **可作为PCa的诊断和预后分子标记。
【结果】
1.流程图
在10个GEO数据集中确定了上下调基因后,列出了前20上下调基因
2.差异基因在染色体上的分布
3.kegg和go分析
不过这次是用的chord plot,来自GOplot包,可以参考一篇画法https://mp.weixin.qq.com/s/Jvf_VFWAEOJUKznOESHmYg
这种类型的图表可视化了实体之间的相互关系。实体之间的连接用于显示它们共享某些相同的东西。这使得弦图非常适合于比较数据集内或不同数据组之间的相似性。
节点沿圆排列,通过使用圆弧将点之间的关系连接在一起。值被分配给每个连接,它由每个弧的大小成比例地表示。颜色可以用来把数据分组到不同的类别,这有助于进行比较和区分组。当有太多的连接显示时,过度混乱成为弦图的一个问题。
4.WGCNA分析
用的TCGA的数据
The pink module contained a total of 120 genes, shown in Figure 6A. By setting module membership (MM) >0.8 and gene significance (GS) >0.3, we selected 20 hub genes from the pink module: RRM2, KIFC1, TACC3, PRC1, BIRC5, CDK1, ASF1B, E2F1, RACGAP1, MYBL2, TPX2, CDC20, TOP2A, NUSAP1, UBE2T, LMNB1, CCNB1, ZWINT, STMN1, and TK1.同时这些基因的相关性也很高
5.hub基因在TCGA数据集中验证。
从前面20个基因挑选了4个鲜为报道的基因,并做验证。这些基因的表达量在PCa中显著高于癌旁,并且ROC显示也与预后相关。同时,随T分期和N分期增高,表达量也增加。
另外,文章提到了 Gleason scores
6.四个基因的表达和甲基化的关系
都是肿瘤组织中的甲基化要低于正常组织
7.这四个基因的表达量与肿瘤纯度和免疫浸润的关系
TCGA-PRAD dataset,下图是第一个基因的,每个基因都做了相同的分析,图略
8.GSEA和GSVA分析
热图显示GSVA信号通路。GSVA-derived clustering heatmaps of differentially expressed pathways for single hub genes