【论文笔记】covid-19肺部感染区域分割基准

声明

不定期更新自己精度论文,通俗易懂,初级小白也可以理解

涉及范围:深度学习方向,包括 CV、NLP、Data Fusion、Digital Twin

【论文笔记】covid-19肺部感染区域分割基准_第1张图片

论文标题:

Towards Data-Efficient Learning: A Benchmark for COVID-19 CT Lung and Infection Segmentation

迈向数据高效学习:2019冠状病毒疾病CT肺部和感染分割的基准

论文链接:https://arxiv.org/abs/2004.12537v2

论文代码:https://github.com/HzFu/COVID19_imaging_AI_paper_list

实验数据集:https://github.com/ieee8023/covid-chestxray-dataset

本文创建的新数据集:https://github.com/JunMa11/COVID-19-CT-Seg-Benchmark 

发表时间:2020年12月 

创新点

1、提供了一个全新的 covid-19 数据集,包含了左肺、右肺和感染区域的注释

2、建立了三个肺部感染区域的分割基准任务

Abstract

目的:在 COVID-19 CT 扫描中准确分割肺部和感染在患者的定量管理中起着重要作用。大多数现有研究都是基于大型和私人注释数据集,从单一机构获得这些数据集是不切实际的,尤其是在放射科医生忙于与冠状病毒疾病作斗争时。此外,很难比较当前的 COVID-19 CT 分割方法,因为它们是在不同的数据集上开发的,在不同的设置中进行训练,并使用不同的指标进行评估。

方法:为了促进数据高效的深度学习方法的发展,在本文中,我们基于 70 个带注释的 COVID-19 病例建立了三个肺和感染分割基准,其中包含当前活跃的研究领域,例如少样本学习、领域泛化和知识转移。为了公平比较不同的分割方法,我们还提供了标准的训练、验证和测试分割、评估指标和相应的代码。

结果:基于最先进的网络,我们提供了 40 多个预训练的基线模型,这些模型不仅可以作为开箱即用的分割工具,还可以为有兴趣的研究人员节省计算时间COVID-19 肺和感染分割。左肺、右肺和感染的平均 Dice 相似系数 (DSC) 得分分别为 97.3%、97.7% 和 67.3%,平均归一化表面 Dice (NSD) 得分分别为 90.6%、91.4% 和 70.0% .

结论:据我们所知,这项工作提出了第一个用于医学图像分割的数据高效学习基准,以及迄今为止最大数量的预训练模型。所有这些资源都是公开的,我们的工作为促进深度学习方法的发展奠定了基础,以利用有限的数据实现高效的 COVID-19 CT 分割。

Method

Task 1:学习有限的注释

旨在解决很少的学习问题,因为很少有注释可用于培训。此任务仅基于COVID-19-CT-Seg数据集。它包含三个子任务,分别用于分割肺部,感染和两者;

其中4个案例用于训练,其余16个案例用于验证;

此外,MosMed数据集被用作独立的测试集。

【论文笔记】covid-19肺部感染区域分割基准_第2张图片

Task 2:学习从非 COVID-19 CT 扫描中分割 COVID-19 CT 扫描

旨在解决领域泛化的问题,其中只有域外数据 (non-COVID19数据集) 可用于训练。具体而言,在第一个子任务中,使用 StructSeg 肺数据集和 NSCLC 肺数据集进行训练;

在第二个子任务中,将 MSD 肺肿瘤,StructSeg 总靶标和 NSCLC 胸腔积液数据集用作训练集。

对于两个子任务,随机选择 80% 数据进行训练,其余 20% 作为域内测试集保留;

保留两个标记新型冠状病毒肺炎 CT 数据集中的所有病例进行测试。

【论文笔记】covid-19肺部感染区域分割基准_第3张图片

 Task 3:通过 COVID-19 和非 COVID-19 CT 扫描学习

旨在解决异构数据集的知识转移问题,其中域内和域外数据都包含在训练集中。

具体来说,在两个子任务(肺分割和肺部感染分割)中,80% 的非 COVID-19 数据和 20% 的 COVID-19 数据用于训练,而其余 20% 和 80% 的数据分别用于验证和测试 ;

此外,MosMed 数据集用作附加测试集。

评估指标

Dice 和 NSD

评估代码链接

https://github.com/JunMa11/COVID-19-CT-Seg-Benchmark/blob/master/utils/COVID-19-Seg-Evaluation.py

结论

作者创建了一个 COVID-19 CT 数据集,建立了三个分割基准任务,并提供了 40 多个基于最先进分割架构的基线模型。

所有相关结果均可在 https://github.com/JunMa11/COVID-19-CT-Seg-Benchmark 上公开获得。

统一的任务设置可以使研究之间的比较更加可行。公共基线可以为研究人员节省模型训练时间,以便他们可以专注于开发自己的方法。

希望本篇 paper 可以在未来几年加速 COVID-19 对有限数据学习的研究。

你可能感兴趣的:(论文笔记,深度学习,计算机视觉,人工智能)