2019年9月week4 病毒感染与整合致癌

The landscape of viral expression and host gene fusion and adaptation in human cancer
全文链接
Topic:病毒感染与整合致癌
Nature Communications volume 4, Article number: 2513 (2013)

摘要
病毒引起所有人类癌症的10-15%。最近,大规模并行测序已被证明可有效发现新型病毒和病毒-肿瘤的关联,但该方法尚未应用于全面的患者队列。
在这里,我们根据TCGA中超过7,000亿个转录组测序数据,筛选出已知和新型表达的病毒,涵盖了4,433种肿瘤和19种癌症类型的人类癌症。生成的地图确认并扩展了当前知识。我们观察到复发性融合事件,包括在RAD51B和ERBB2中插入人乳头瘤病毒。宿主和病毒基因表达之间的共适应模式为乳头瘤病毒癌基因功能提供了线索。重要的是,我们的分析强烈反对在一些经常提出这种病的癌症中的病毒病因学。我们提供了前所未有的病毒-肿瘤图谱,为将来使用转录组测序数据研究肿瘤相关病毒提供了参考。

19种人类癌症中的肿瘤病毒图谱
4,433 tumours and 19 cancer types
基于的mRNA_seq测序数据

2019年9月week4 病毒感染与整合致癌_第1张图片
(a)分析流程。 非人reads与3,590个RefSeq病毒基因组的数据库相匹配,该数据库由12个其他已知的和2个部分新的基因组组成,这些新的基因组由病毒读物的从头组装检测。 (b)包括的癌症类型和统计数据。 条形图显示了具有较强病毒表达(> 10µp.p.m。文库中的病毒读取)和较弱检测(2–10µp.p.m。)的肿瘤比例。 (c)主要病毒类别阳性肿瘤的相对数量,分别显示强和弱检测

图2:在178个肿瘤中检测到的28种病毒的RNA表达和宿主病毒融合。

2019年9月week4 病毒感染与整合致癌_第2张图片
2

乳头瘤病毒在各种癌症中的患病率

HPV的总体发生与当前的知识非常吻合:CESC显示与HPV的相关率为96.6%,与最近的大型调查相似(图2a)。
在CESC中未发现其他病毒,进一步支持了检测具有高度特异性。
在84例阳性宫颈肿瘤中发现了十二种HPV类型,均以前被认为是相关的,其中HPV16和HPV18预计占主导(分别为阳性病例的65.5%和13.1%)。
HNSC显示出14.1%的HPV相关性,其中83.7%和14.0%的阳性肿瘤分别归因于HPV16和HPV33。
这与CESC明显不同,并且与早期数据兼容。
较不常见但以前观察到的相关性包括膀胱尿路上皮癌(BLCA)中的HPV6b和高风险类型,以及肺鳞状细胞癌(LUSC)和子宫内膜样癌(UCEC)中的HPV16。
HPV通常表现出突出的表达,FVR值高达848p.p.m。(> 140.000读取),但通常在100-200-p.p.m。

范围(图3a)。
图3:HPV和hbv阳性肿瘤中病毒表达水平的分布。

2019年9月week4 病毒感染与整合致癌_第3张图片
3

宿主病毒融合分析

人们认为,HPV基因组整合是HPV癌基因诱导的染色体不稳定性的结果,并且已经描述了在已知肿瘤基因内或附近的整合,有时还与局部拷贝数变化和靶向基因的表达改变相结合24、25、26。
与基因活性改变相关的整合在HBV诱导的肿瘤发生中同样重要。

我们采用了严格的程序来检测整合,如RNA-seq中的宿主病毒融合转录本所证明的那样,仅考虑了由多个不一致的测序配对对支持的断点,其中人类读数聚集在有限的区域内(方法)。
我们使用来自9个HPV阳性HNSC肿瘤的全基因组测序数据验证了我们的方法,发现9个RNA序列衍生的整合中有8个获得了全基因组测序文库中不相容伴侣对的支持(补充表S4)。
确认先前的数据25,我们观察到HPV18的积分频率较高(100%),而HPV16的积分频率较低(58.5%;图2b,补充数据2)。
同样,确证的是,大多数HBV阳性肿瘤和正常组织对照均具有病毒整合8(76.5%),并且所有HHV病例均缺乏整合(图2b)。
HPV和HBV整合都在整个基因组中广泛分布,并有一些反复整合的热点(图2b)。
在HNSC中的进一步分析表明,位置分布是非随机的,强烈希望在DNA拷贝数断点附近进行整合。
大部分整合簇(41.8%)与片段边界共定位(<10µkb,接近拷贝数映射分辨率),支持整合可能对HNSC中的局部基因组不稳定性产生广泛影响(图4,P<1e-8,随机检验)。

图4:HNSC中的整合与DNA拷贝数断点共定位。

2019年9月week4 病毒感染与整合致癌_第4张图片
将110个HPV整合簇(31个独特的整合)与使用TCGA分段Affymetrix SNP6微阵列数据确定的拷贝数断点进行比较。计算每个聚类到最近断点的距离,通过与均匀随机集成模型(基于1e8随机化的P< 1e8;100如图所示)。集成集群(41.8%)在10kb内,而随机期望<0.5%。10千碱基接近SNP6的映射分辨率(平均概率集间距)

接下来,我们通过比较有和没有整合的肿瘤来研究复发基因的表达和整合之间的关系。大多数基因表现出平均表达的改变,尽管个别肿瘤也有例外。在CESC两个具有强ERBB2转录诱导的肿瘤中,一个在该基因中整合了人乳头状瘤病毒(图5a)。MYC区的PVT1和LOC727677 lncRNAs在整合型肿瘤中的表达明显较高。RAD51B显示与人乳头瘤病毒整合的肿瘤有微弱的、不显著的减少。与先前的数据8一致,MLL4在HBV积分的LIHC样品中被强烈诱导,而FN1没有显著改变(图5b)。虽然正常对照样本在TCGA有限,但我们发现了9例基因整合与可用的匹配正常缺乏整合的病例(补充图S7)。与正常对照组相比,9例病例中有5例在肿瘤中显示出强烈的(超过4倍)诱导作用,包括MLL4 (6.0倍)。我们的结果支持肿瘤基因的活性可以通过病毒插入来改变,并指定ERBB2和RAD51B作为功能靶点。
图5:融合基因与复发相关基因的表达改变有关。

2019年9月week4 病毒感染与整合致癌_第5张图片
5

整合会影响拷贝数变异和表达量变化,病毒阳性样本的表达相关性可以跨癌种聚类

图6:宿主基因表达与病毒宿主共适应

2019年9月week4 病毒感染与整合致癌_第6张图片
6

具体生信步骤分析见
100篇泛癌研究文献解读之病毒感染及整合到肿瘤病人基因里
by: 生信技能树

总结:
病毒相关肿瘤中,HPV占重要地位。
融合基因
病毒相关肿瘤的跨物种聚类。

你可能感兴趣的:(2019年9月week4 病毒感染与整合致癌)