关于Omisc Core WES 计算TMB的一点见解

上周FDA授予Nanthealth公司Omisc Core WES基因检测许可,这是FDA批准的首个使用全外显子测序方法来检测实体瘤的体外诊断产品。Omisc Core比先前FDA批准的MSK-IMPACT测序区域大了20倍。扩大目的是用来准确计算TMB,肿瘤体细胞突变还是在肿瘤相关的468个基因里找。’report somatic alterations in 468 genes and sequencing of 19,396 protein-coding genes to determine overall tumor mutation burden’。

现分析WES为啥比目前流行的大panel好。TMB定义是:每Mb区域里非同义突变的体细胞变异个数。下图是MSKCC发表的MSK-IMPACT跟WES对比得结果[1]。


最理想的情况是MSK-IMPACT TMB与Exome TMB值一致,但事实有不可忽视的差异,例如我们选择TMB>10为高TMB值,那么有很大一部分如图1区域在WES判定为低TMB但在MSK-IMPCAT中判定为高TMB。从相关指数R2=0.76值来看,虽然相关性高,但仍然有很大的改进空间。两者不一致的根源在于统计抽样的大小。Exome TMB相当于检测了样本总体,MSK-IMPACT panel仅检测了一小部分样本,标准误差会随样本数增大而减小。按理说MSK-IMPACT测了2M碱基,已经很大了,例如统计中国人平均身高,抽样200万人已经足够。TMB的问题在于体细胞突变somatic是极小概率事件,每Mb碱基中平均约8个,如图3[1]。如果肿瘤样本的TMB值很高,两者的一致性高,这也符合统计原理。同时也可以知道Foundation Medicine文章图为什么比MSK好看一些[2]。


Omisc Core方法是 tumor/normal成对样本WES测序,等于放大版的MSK-IMPCAT,实验方法及分析流程一样。Foundation Medicine不设正常组织作对照,他们并没有完全公开somatic的计算方法。笔者发现几篇文献公布的算法计算大panel单样本somatic结果跟设对照的很不一致。常见方法是用人群基因组数据库来过滤种系变异,但如果没有患者正常组织,这些突变将很难与罕见的遗传变异区分开[1],MSKCC说很难的事情应该也就是很难的。单样本计算somatic及TMB又很有吸引力,可以节省一半成本。笔者发现市场上有检测机构的报告是这样的。


肿瘤特有突变也就是Somatic,其组织丰度怎么都在50%左右?而且是6个。这份报告很有可能报的是种系变异germline。那我们看看MSK的结果是怎么样的。图5统计了1万多个样本变异频率分布图,大于50%是小概率事件,一个样本中有6个50%基本上是不可能的。有人的做法是过滤掉40%以上的变异,而这又可能过滤掉非常重要的体细胞变异。


Foundation Medicine 采用SGZ(somatic-germline-zygosity)算法来预测体细胞变异,该方法不需要患者匹配的正常对照,可广泛应用于临床研究。SGZ通过对突变的等位基因频率(AF)进行建模来预测每个突变的体细胞与种系状态,考虑到肿瘤含量,肿瘤倍性和局部拷贝数。预测的准确性取决于测序深度和拷贝数模型拟合[3]。这种仅仅靶向1.1 Mb编码区的SGZ算法能否用到40Mb的全外显子上还有待观察,甚至SGZ算法除了Foundation Medicine自己发表一篇文章外,目前也未见其他机构发表。

因此外显子测序用于肿瘤靶向测序计算TMB值,应该跟NantHealth一样设置正常组织作对照,检测全外显子区域somatic来计算TMB。

参考资料:

[1] Ahmet Zehir. Mutational Landscape of Metastatic Cancer Revealed from Prospective Clinical Sequencing of 10,000 Patients.Nat Med. 2017 Jun; 23(6): 703–713.

[2] Zachary R. Chalmers. Analysis of 100,000 humn cancer genomes reveals the landscape of tumor mutational burden.Genome Med. 2017; 9: 34.

[3] James X. Sun.A computational approach to distinguish somatic vs. germline origin of genomic alterations from deep sequencing of cancer specimens without a matched normal.PLoS Comput Biol. 2018 Feb

关于作者:

刘远东:广州克拉斯基因科技有限公司创始人,算法研发工程师,有多年生信算法开发经验。开发了一系列肿瘤NGS检测算法,包括可以检测超高深度测序数据的UMI分子标签算法。广州克拉斯基因科技有限公司专注肿瘤云计算,简洁的界面化操作,无需在复杂的命令行下面计算;国内首家提供在线计算UMI测序数据的平台!

你可能感兴趣的:(关于Omisc Core WES 计算TMB的一点见解)