易基因|全基因组cfDNA甲基化分析提高了早期乳腺癌无创诊断成像的准确性

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。

乳腺癌早期发现是提高患者预后和生存率的关键。基于乳房X线片和超声技术的乳腺影像报告和数据系统(BI-RADS)被广泛用于乳腺癌的早期诊断,但这种方法的假阳性率较高,会导致不必要的活检,尤其是对于BI-RADS-4类的患者来说。而携带DNA甲基化信息的游离DNA(cfDNA)已经成为一种非侵入性的癌症检测方法。在本文中,作者进行了一项前瞻性多中心研究,利用全基因组重亚硫酸盐测序数据来研究203名疑似恶性乳腺病变的女性患者cfDNA甲基化标志物的临床应用。cfDNA主要富集在低甲基化的基因组区域。作者设计了一套方法来挖掘最佳的DNA甲基化标记物,显著提高了BI-RADS 4类患者的早期诊断率(AUC从0.78-0.79到0.93-0.94)。作者通过开展基于血液的全基因组DNA甲基化研究,以单碱基分辨率从良性肿瘤中检测早期乳腺癌,结果表明结合液体活检和传统的成像诊断可以通过降低假阳性率和避免不必要的损害来改进当前乳腺癌早期诊断的临床实践。

易基因|全基因组cfDNA甲基化分析提高了早期乳腺癌无创诊断成像的准确性_第1张图片

方案设计

本研究收集了接受乳腺X线片和超声检查后活检的210例BI-RADS 4类乳腺病变女性患者。从CHCAMS的活检患者中收集了20个肿瘤样本(10个恶性和10个良性),用于全基因组亚硫酸氢盐测序(WGBS)。后续具体的研究方案如图1所示。

易基因|全基因组cfDNA甲基化分析提高了早期乳腺癌无创诊断成像的准确性_第2张图片

图1

主要结果

作者利用WGBS检测了每个受试者的cfDNA甲基化组。由于ctDNA在总cfDNA中的含量较低,作者设计了一个计算框架来提高cfDNA甲基化标志物的检测(图2),该框架包括基于肿瘤样本的差异甲基化区域的识别、cfDNA富集分析、片段大小选择、基于片段的cfDNA恶性比率的统计推断以及早期乳腺癌预测模型的建立。

易基因|全基因组cfDNA甲基化分析提高了早期乳腺癌无创诊断成像的准确性_第3张图片

图2

在文库制备和测序后,作者通过分析WGBS数据(n=101例恶性和102例良性)预测了cfDNA长度的分布情况,结果显示cfDNA长度分布呈现典型模式,在167bp处有显著富集。cfDNA与19个组织样本一起产生了总计4.0TB的WGBS数据,平均覆盖参考基因组的88%,平均深度为11.2 x。

cfDNA甲基化标记的鉴定。研究发现WGBS的cfDNA片段在编码区和基因间隔区富集,而在基因启动子区域缺失(图3A)。不同基因组区域的相应cfDNA数量与CpG密度和GC含量呈负相关(图3B)。在9个恶性肿瘤和10个良性肿瘤样本之间共鉴定出57,575个DMR(51,962个低DMR和5613个高DMR)。正如预期的那样,高DMR患者的CpG密度显著高于低DMR患者(p<0.0001;图3C)。因此,在所有恶性和良性样本中,低DMR中cfDNA片段的平均数量显著高于高DMR中的cfDNA片段平均数量(p<0.0001;图3D)。CpG富集的高DMRs中cfDNA片段的缺失可能是由于cfDNA中开放的染色质区域优先被消化。这些发现有助于作者优化低甲基化区域的cfDNA甲基化标记。异常低甲基化,一般在cfDNA丰富的基因体或基因间区的封闭染色质中,是各种恶性肿瘤的共同特征。为了保证高质量的cfDNA定量,本文选择了低DMRs作为候选的DNA甲基化标记。

计算每个患者样本的cfDNA恶性比率。利用发现队列数据,筛选出10个区分恶性和良性血浆样本的DMR。它们大多位于基因间区,其中恶性肿瘤患者的恶性比例明显高于良性病变患者( p < 0.05 ;图 3E)。但在10个甲基化标记中,有4个功能基因( RYR2、 RYR3、 GABRB3和 DCDC2C )和2个lncRNA ( AC096570.1和LINC00923 )。

基于cfDNA甲基化的早期乳腺癌预测模型。利用cfDNA分子标记物的恶性比率,使用随机森林分类器(Random Forest)计算发现队列中每个血浆样本的cfDNA甲基化预测评分( cfMeth评分)。发现组和验证组模型的曲线下面积( AUC )分别为0.89 (95 % CI , 0.84 ~ 0.94 ;图 3F)和0.81 ( 95 % CI , 0.69 - 0.93 ;图 3G ),优于BI-RADS结果(AUC = 0.78 - 0.79 )或相关肿瘤标志物检测结果( CA15 - 3和CEA AUC = 0.57 - 0.70)。

cf Meth评分与影像诊断的组合模型。采用岭回归(ridge regression)方法在发现队列中建立cf Meth评分与乳腺X光、超声检查的组合诊断模型。联合模型的表现优于任何一种单独的方法( AUC = 0.94,95 % CI,0.90-0.97 ;图3H )。恶性组和良性组在发现队列和验证队列中的组合评分分布均有统计学差异。联合模型的截断点被选为在发现队列中假阴性率小于2 %,其敏感性为98.7 %,特异性为68.8 %,准确性为83.8 %。在验证队列中,性能相似( AUC = 0.93 [ 95 % CI , 0.84-1.00 ] );图3I ),其敏感性为91.7 %,特异性为88.0 %,准确性为89.8 %,没有过度拟合的证据。总体而言,联合模型的检出率分别为93.3 % ( 42 / 45 )、100 % ( 34 / 34 )、100 % ( 22 / 22 ),肿瘤Ⅰ、Ⅱ、Ⅲ期诊断的特异性为73.5 %。

易基因|全基因组cfDNA甲基化分析提高了早期乳腺癌无创诊断成像的准确性_第4张图片

图3

结论

在单碱基分辨率下,作者进行了基于血液的全基因组DNA甲基化检测早期乳腺癌的研究,结果显示液体活检与传统的诊断显像相结合可以提高早期乳腺癌诊断的准确性。

cfDNA甲基化检测技术瓶颈:

对于cfDNA等相对微量且片段化十分严重的样本,常用甲基化检测主要包括cfMeDIP,微量WGBS技术。应用RRBS检测的CG位点极为有限,主要原因cfDNA自身就在选择片段范围之内,如果片段内CG含量高被酶切,反而更短不被富集,因此可能检测到的都是CG含量低的区域片段。

WGBS,太贵!

RRBS,位点太少!

新技术推介:

为助力低样本量多维度分析,深圳市易基因科技开发了富集覆盖CpG岛、启动子、增强子、CTCF结合位点的cfDNA甲基化测序方法——cfDNA-RBS,实现了高灵敏度和样本复用,使其具有高度可扩展性,并适用于有限的样本和单个细胞。

易基因建立的cfDNA-RBS技术,仅需15-20G测序数据,DNA建库起始量低至1ng的cfDNA样本,可以检测10M有效CG位点覆盖,是目前肿瘤甲基化标志物检测研究的优选技术。

微量cfDNA简化基因组甲基化测序(cfDNA-RBS)

100ul血浆或1ng cfDNA

10M有效CG位点覆盖

15-20G测序数据量

易基因|全基因组cfDNA甲基化分析提高了早期乳腺癌无创诊断成像的准确性_第5张图片

WGBS、cfDNA-RBS、RRBS系列技术指标比较

技术参数 WGBS cfDNA-RBS RRBS系列
原理 重亚硫酸盐测序 酶切富集+重亚硫酸盐测序 单双酶切富集+重亚硫酸盐测序
样本要求 1μg 1ng 100ng
测序数据量 90G 10-20G 10G
CG位点覆盖 56M 10-20M 6-10M
覆盖深度 15-20X 50-100 X 50-100 X
区域元件覆盖 全覆盖 CpG岛、启动子、增强子、CTCF结合位点等 CpG岛、启动子等
技术定位 金标准(受经费影响) 金标准,特别适用于cfDNA样本的Biomark筛选和机制研究 金标准,Biomark筛选和机制研究

目前,易基因科技有限公司在DNA甲基化修饰等表观遗传检测领域,积累了一系列国际先进技术,可对高通量单细胞甲基化组学研究,微量DNA甲基化测序,ctDNA、FFPE等严重降解痕量DNA甲基化检测等,提供多种有效解决方案。低成本、高通量的单细胞甲基化组学测序技术建立,将为研究者对不同时间和空间的单细胞表观修饰研究奠定基础。

1)微量细胞或单细胞全基因组甲基化测序(Micro DNA-WGBS)DNA起始量:

单细胞/100-1000个细胞

1ng基因组DNA

90%以上基因组CG覆盖

2)微量细胞或DNA简化基因组甲基化测序(Micro DNA-RRBS)DNA起始量:

1ng基因组DNA;

10-20M有效CG位点覆盖;

10-20G测序数据量;

3)微量cfDNA简化基因组甲基化测序(cfDNA-RBS)

100ul血浆或1ng cfDNA

10M有效CG位点覆盖

15-20G测序数据量

参考文献:DOI:10.1186/s12943-021-01330-w

Nature | 易基因DNA甲基化测序助力人多能干细胞向胚胎全能8细胞的人工诱导

一文看懂:ChIP实验和qPCR定量分析怎么做

3文聚焦:DNA甲基化对果实成熟的重要作用(橙+番茄+草莓)

一文读懂:十大DNA甲基化研究核心问题

全基因组cfDNA甲基化分析提高了早期乳腺癌无创诊断成像的准确性icon-default.png?t=M276https://mp.weixin.qq.com/s?__biz=MzAwNTY3NDIxMw==&mid=2650650246&idx=1&sn=710416e7dc5e4674cc45e488f7231460&chksm=8310130cb4679a1a29233c33dc0cd3e48eacbe66c8871d48cb872a55f0c165010ac0ed00a723&token=1313364995&lang=zh_CN#rd

你可能感兴趣的:(高分文献,技术解读,高分文章,生物学,生物信息学,经验分享)