卵巢癌全基因DNA拷贝数分析

今天跟大家分享的是今年一月份发表的一篇文章,主要是基于卵巢癌的全基因组DNA拷贝数分析揭示与肿瘤侵袭/迁移能力相关的关键基因和生物学过程。这是一篇比较基础的生物信息学文章,生信小白不可错过。


Genome-wide DNA copy number profiling and bioinformatics analysis of ovarian cancer reveals key genes and pathways associated with distinct invasive/migratory capabilities

基于卵巢癌的全基因组DNA拷贝数分析揭示与肿瘤侵袭/迁移能力相关的关键基因和生物学过程

卵巢癌(OC)转移是改善患者预后必须克服的主要障碍。最近的研究表明拷贝数变异(CNVs)经常导致致癌驱动因素的改变。本研究采用CytoScan HD阵列分析6位OC患者和正常人类OC细胞系全基因组的CNVs和杂合性缺失(LOH),以确定导致OC独特侵袭/迁移能力的遗传因素。结果表明,Xq11.1和Xp21.1处的LOH和8q21.13处的扩增是新发现的的特异CNVs。接着通过生物信息学分析筛选卵巢癌相关的CNVs。此外,利用PASTAA分析的信息预测转录因子与靶基因的相互作用。最终,将上述数据与基因表达和临床结果数据相结合,识别到 GAB2、AKT1、EGFR等六个候选基因。在转录调控网络中,4个已知的癌症相关转录因子(TFs)与6个CNVs驱动基因相互作用。蛋白质/DNA序列显示,这4个TFs中有3个是OC中潜在的基因相关转录因子。证明这六个基因可以作为OC的潜在生物标志物。


一. 转移性OC和正常卵巢上皮组织中CNV和LOH频率的比较

4例OC患者均有染色体畸变。卵巢肿瘤中每个切片平均染色体臂异常为38.75,正常组织中为40.5(P<0.05)。正常组织中有40例染色体臂异常,占100%(20/20);卵巢肿瘤中25%(1/4)。两组间LOH的百分比相似(表1)。CNVs的全基因组分布如图1所示。两组中大多数的不平衡都与LOH有关。与正常样本相比,OC样本中最常见的CNV区域既包括Xq11.1、Xp21.1等LOH区域,也包括8q21.13、8q11.21、8q23.3等扩增区域。在这些区域中,Xq11.1和Xp21.1处的LOH和8q21.13处的扩展是特异的CNVs。

卵巢癌全基因DNA拷贝数分析_第1张图片

 表1.染色体臂和组织中CNVs和LOH的频率

卵巢癌全基因DNA拷贝数分析_第2张图片

 图1. 患者1-22条染色体的拷贝数改变状态


二. HO-8910和HO- 8910PM细胞系CNV数据的验证

为在体外验证细胞模型的不同生物学行为,进行细胞迁移实验。结果表明,HO-8910PM(高转移卵巢癌细胞)和HO-8910(卵巢癌细胞)细胞系在24 h的迁移距离和透过隔膜的细胞数目均有显著差异。虽然HO-8910和HO-8910PM细胞的CNVs有明显的重叠,但两个亚克隆之间有较大的区域差异。并且识别出一些HO-8910PM特异性扩增以及在HO-8910P中M特异性缺失的拷贝数片段。CNV剖面图如图2C所示。

卵巢癌全基因DNA拷贝数分析_第3张图片

 图2. OC转移速度不同细胞系中不同的生物学行为和CNVs


三. HO-8910PM细胞差异表达基因的筛选及富集分析

通过DAVID数据库分别对在HO-8910PM特异性扩增(479个)以及特异性缺失(400)的基因进行GO和KEGG的富集分析,分析结果如图3所示。

卵巢癌全基因DNA拷贝数分析_第4张图片

 图3. 特异性扩增以及特异性缺失基因的富集分析

四. 蛋白-蛋白相互作用(PPI)网络的构建与聚类识别

在KEGG数据库中富集的HO-8910PM特异性扩增基因和HO-8910PM特异性缺失基因中(p>0.05),共有71个是共享的。从STRING数据库中获取这71个基因的人类PPI数据,并构建蛋白质互作网络。利用Cytoscape中的MCODE算法识别网络中高度互联区域。PPI网络共有54个节点,112条边。连接度最高的前16个基因包括GAB2,AKT1,EGFR等。

卵巢癌全基因DNA拷贝数分析_第5张图片

 图4.蛋白质互作网络


五. 评估候选基因表达和患者预后

选择互作网络中连通度最高的16个基因作为候选基因,基于Kaplan-Meier评估这16个基因特征的预后价值。OC患者的无进展生存期(PFS)是根据hub基因的低表达和高表达来确定的。结果显示, GAB2、AKT1、EGFR、COL6A3高表达与OC患者PFS预后较差相关(P<0.05)。UGT1A1和UGT1A8的高表达与OC患者PFS预后较好相关(P<0.05)(图5)。

卵巢癌全基因DNA拷贝数分析_第6张图片

 图5. hub基因表达的预后价值

六. GAB2的预后价值

为研究16个基因特征与分期和等级之间的预后意义,研究者选择这些基因进行单因素和多因素Cox回归分析,其中GAB2的统计显著性最大。在单因素和多因素分析中,GAB2比分级和分期具有更高的统计效能。

卵巢癌全基因DNA拷贝数分析_第7张图片

 表2. GAB2,分级,分期的单因素和多因素Cox回归分析


七. 与6基因特征相关的转录调控因子(TFs)

通过PASTAA分析预测到4个与OC相关的候选TFs (p<0.01),即RFX1、ATF3,CREB和LHX3。将TFs和靶基因导入Cytoscape软件构建TFtarget基因调控网络(图6A)。与HO-8910细胞中相应的表达相比, RFX1、ATF3和CREB在HO-8910PM细胞中广泛上调,而LHX3在两个细胞系中表达无明显差异(图6B)。这4个TFs中有3个是OC中潜在的基因相关转录因子。证明这六个基因可以作为OC的潜在生物标志物。

卵巢癌全基因DNA拷贝数分析_第8张图片

图6.靶基因及其预测TFs


文章的内容大概就是这些,我们来总结下吧。首先,识别出在高度转移的卵巢癌细胞系中特异性扩增或者缺失的基因,并分别对其进行GO和KEGG富集分析。接着,选择在高度转移的卵巢癌细胞系中既为特异性扩增,也为特异性缺失的71个基因,并基于这71个基因构建蛋白质互作网络。对蛋白质互作网络中的16个hub基因进行预后价值评估,其中6个基因的表达与OC患者预后相关。基于PASTAA分析预测这6个靶基因的TFs, 4个TFs中有3个是OC中潜在的基因相关转录因子,证明这六个基因可以作为OC的潜在生物标志物。

这是一篇很套路化的生物信息学分析文章,思路简单,实验过程也不复杂,感兴趣的同学可以模仿下哦。可能会有同学好奇为什么思路简单的文章也可以发5分呢,因为人家有数据,还有钱测数据啊!像贫穷的你和我就只能留下羡慕的泪水,然后奋发图强,多读文章,开拓更好,更新,更有创意的的实验思路了。闲话不多说了,希望我们都能变成更好的自己,下次见。

你可能感兴趣的:(卵巢癌全基因DNA拷贝数分析)