MSK-IMPACT (Integrated Mutation Profiling of Actionable Cancer Targets) 是美国纪念斯隆卡特琳癌症中心(MSK)的一款 NGS 大panel 产品,自2014年1月起被 MSK 用于制定晚期癌症患者的治疗方案。该Panel 一直进行迭代升级,涵盖基因数量也一直在增长,由2014年的341个基因,到2017年的468个基因,之后又增加了新的肿瘤驱动基因、与免疫治疗及克隆性相关的基因到2020年的已包括505个基因。MSK-IMPACT™于2017年11月16日通过FDA批准,成为第一款通过审批检测组织多癌种多基因的大Panel 产品。
MSK-IMPACT 通过对肿瘤组织 FFPE 样本和 Normal 样本进行 Panel 捕获、NGS测序及生信分析检测,可以广泛检测基因组中的肿瘤基因突变。它采用的测序平台是Illumina HiSeq™ 2500 Sequencer (qualified by MSK),检测的突变类型有 SNVs、INDEL(<30bp)、MSI,不能检测CNVs、重排和TMB。本篇文章主要对通过FDA审批 468 个基因版本的MSK-IMPACT 技术细节进行汇总介绍。
1 产品描述
附表Appendix 1a 列出了MSK-IMPACT的检测热点,附表Appendix 1b 列出了468个基因和相应的转录本信息,附表Appendix 1c 列出了73个Panel 覆盖深度低,不进行报出的基因和外显子区域信息。
1.1 样品制备
质控要求肿瘤细胞含量大于10%,切片含量大于20%,MSI检测肿瘤细胞含量大于25%
1.2 文库制备、1.3 杂交捕获
略
1.4 测序和数据分析
1.4.1 样本配对检测
利用纯合位点一致性对来自同一样本的Normal样品和Tumor样品的配对情况进行检测,可以预期配对样品纯合位点不一致性较低(<5%),不配对样品纯合位点不一致性较高(在25%附近)。如果配对样品纯和位点不一致水平较高(>5%),则被标记为“可能不配对”类型。
1.4.2 样本污染检测
检测杂合位点不同等位基因的频率,如果频率异常,对样品进行标记为“可能污染”类型。
1.4.3 对Normal样品中肿瘤的含量进行检测
Normal样品中不应该含有SNVs、INDEL。分析流程会对Normal样品中的变异热点进行检测,如果有热点的变异频率>1%,对样品进行标记
1.4.4 SNVs 及 INDELs 类型突变检测
SNVs( MuTect 软件) 和 INDELs( SomaticIndelDetector 软件) CALL变异流程需要 Normal 和 Tumor 配对样品,如果缺少Normal样品或者Normal样品的平均测序深度较低(<50X), 则从批处理样品中选择一个Normal样品作为对照。
1.4.4.1 分析同批次的阳性和阴性对照样品
对NC样品分析用于确定没有污染以及对PC样品分析用于保证分析的灵敏度
1.4.4.2 深度过滤
Tumor 样品质控要求 98% 的外显子覆盖深度大于200X,配对Normal样品深度大于50X
1.4.4.3 高置信度突变过滤
原始SNV 和INDEL 突变需要经过下面一系列的过滤来保证报出突变的准确性。
(1) VFtumor/VFnormal >=5,AD>=5,VF>=1%
(2) 突变是否在热点突变库中,Appendix 1a 为热点列表
(3) 热点: DP>=20,AD>=8,VF>=2%;非热点:DP>=20,AD>=10,VF>=5%
(4) 过滤注释结果,保留位于外显子区域的非同义突变,移码突变
1.4.5 MSI 检测
利用 MSIsensor 软件计算 MSK-IMPACT 覆盖的所有MSI位点的状态。MSIsensor会计算出一个score,如果阈值大于10,标记为MSI-H。
1.5 质量控制
1.5.1 对照Normal样品
病人组织或者外周血作为Normal样品,如果使用分批中不配对的Normal样品,可能会有一些稀有的胚系突变被当做体细胞突变
1.5.2 阳性对照(PC)
阳性对照是3个阳性样品(3个样品各自含有不同的类型和频率的突变信息)的混合,阳性对照的normal样品是统一批次Normal样品的混合,经过流程分析后,检验分析的结果。(1)已知的突变是否检出(2)检出的突变频率和原始样品的突变频率是否一致,Table2是已知的突变频率的样本。
1.5.3 阴性对照(NC)
阴性控制样本是以前的重复试验证实的没有肿瘤污染和没有胚系拷贝数突变的FFPE正常样品的混合物。以前的分析已经确定了正常样品特有多态性和频率,将流程产生的862个SNP的突变频率和预期的突变频率进行比较,计算Pearson一致性。预期突变频率应该大于0.9
1.5.4 空白对照
No Template Control(NTC)
1.6 结果报告
样品质量控制度量:
探针的Target区域大概是1.5Mb
1.7 确定流程阈值
这里计算所需要的覆盖深度都用到了功效分析(power analysis)的概念
1a 外显子覆盖深度的确定:
当设定潜在最低检测线如2%时,可以通过功效分析可以计算出某显著水平下的reads的深度。比如当突变频率为10%时,500X深度95%置信区间下,突变频率的范围在7.5%和13%之间。
所以,将10个不相关的FFPE的Normal样本等摩尔的混合创造了一系列预设的突变频率,最低的突变频率为5%。然后用862个SNPs验证了预设的突变频率和真实突变频率之间的关系。最后试验数据支持使用5%作为报告检测到的突变的下限,实际潜在的频率为10%。
2b 样本覆盖深度的确定:
如果一个样本的平均覆盖率低于200X,则该样本被标记为具有更高的假阴性风险。
3c 对于阳性突变检出所需的突变深度,等位基因深度和突变频率:
表4中的过滤标准保证了过滤大多数假阳性的SNVs和INDELs,同时保证真阳性的潜在检出频率在10%(观测到的检测频率在5%-17.6%)
1.8 panel表现评估
(1) 精密度验证
Run内和Run间设置重复,每个样品5个重复
1a Panel 精密度验证(标准品的验证)
10个样本(9个FFPE样本,一个商业细胞系)代表不同的肿瘤类型,不同的突变类型(突变类型已知),不同的突变频率(突变频率已知)。
2b Panel精密度和重复性一致性验证(标准品的验证)
Table6在对已知的突变进行精密度评估时,也对重复样品检出的已知突变外的其他突变进行了重复一致性的验证。
5个重复样本检出的所有突变数目的一致性
5个样品检出的突变频率的一致性
Table7列出了10个测试样本(每个样本5次重复)精密度验证的结果
3c 每个测试样本的精密度验证(标准样本的验证)
每个样本检测出的突变,以及每个突变在5个重复样本间的支持数,每个突变的阳性率
Table8列出了10个标准品的突变的阳性率
4d 良好参考材料精密度验证(另一种标准品)
为了验证测序错误和DNA提取对panel的影响,利用参考标准品(HapMap cell line NA20810),验证MSK-IMPACT,对比11,767个SNPs,23个重复样本,检出突变一致性和检出突变频率的一致性都很高。
5e MSI精密度验证:
用12个样本(6个不同层次的MSI-H样品,6个MSS样本)测试了MSIsensor软件检测MSI的精确度。Table9
(2)灵敏度验证(最低检测线LoD)
LoD是某一种突变在所有的重复中,95%的重复都可以稳定的检测出的突变等位基因频率。本部分就是验证假定突变的LoD。测试分为两个部分。第一部分是梯度稀释,确定可靠的最低突变频率;第二部分是在众多重复中,验证LoD.
1a 梯度稀释
选择10个FFPE样本,各选择5个覆盖度最高的外显子和覆盖度最低的外显子。制备5-8个梯度稀释
检出结果 Table10
2b 确定LoD
在最小突变频率5%附近,设计了3个del,4个insert,6个SNVs每个位点5次重复。
阳性突变检出结果 Table 11
(3)准确性分析(不同检测方法的对比分析)
1a SNV/indel 变异方法的比较
MSK-IMPACT方法与MSK-IMPACT方法正交验证后的原始结果进行了比较。共检测了433个FFPE样本的20个基因的48个外显子,检出267个唯一的突变位点。433个样品中的已知突变共432个样品检测出,一个样品的EGFR基因的INSERT漏检。
检出的一致性Table15A-C.
2b MSI方法的比较
为了确定MSK-IMPACT的MSIsensor的sore值用于区分MSS和MSI-H,用MSIsensor和免疫组化、PCR方法做了对比,最终确定了sore=10作为区分的阈值。
结果Table16和Table17
2 临床试验
最终的MSK报告的突变分为两种:一种是具有临床意义的癌症突变,一种是具有潜在意义的癌症突变。
1a 临床样本的验证
MSK测试了超过一万例的晚期肿瘤患者,并将病历信息以及突变信息存储在了下列网站。
https://www.cbioportal.org/study/summary?id=msk_impact_2017
3 参考文献
https://www.accessdata.fda.gov/cdrh_docs/reviews/DEN170058.pdf