ChestX-ray8论文个人理解

论文全名:

ChestX-ray8: Hospital-scale Chest X-ray Database and Benchmarks on Weakly-Supervised Classification and Localization of Common Thorax Diseases

 

地址:

https://arxiv.org/pdf/1705.02315.pdf

 

Abstract:

因为医学图像领域的数据集较少,所以作者提出了ChestX-ray8,它有108948张正面X光图像,它们来自32717名患者。作者用自然语言处理的方法从放射性专家的报告中提取出了8类图像标签。(所以叫ChestX-ray8)。作者最后使用了自己的模型来检测数据集中的疾病,并取得了不错的效果。

 

Introduction:

第一段:深度学习在图像方面已经取得了很多成果。

第二、三段:深度学习在医学上的一些相关工作。主要是在小数据集上进行的。

第四段:有三个因素使医学图像诊断的实现比较困难。

(1)数据难以通过众包( crowd-sourcing)获取,需要专业人员标注。而且,放射科的专家比较倾向于写复杂的逻辑推理报告而不是简单的描述语句(对文本处理造成困难)。

(2)X光图像一般为2000*3000,局部病理图像区域可能变化很大,但相对于整张图片仍旧很小。(这使检测很困难)

(3)CV领域中的技术都很依赖于ImageNet的预训练,然而这种预训练在医学领域应用并不好。

第五段:作者提出了ChestX-ray8。

 

Related Work

OpenI

 

Construction

数据库:PACS

(1)选出8个疾病关键词,找出数据库相关的报告作为语料库。

(2)标签挖掘:一个X光报告通常由“Comparison”, “Indication”, “Findings”, and “Impression”四个部分组成。一般使用Findings and Impression,如果没有的话用全篇。扫描两遍,第一遍扫描疾病关键词,第二遍关注其他疾病与normal关键词,如果没有,标为normal。

作者用了DNorm and MetaMap两种方法,并且合并了它们的结果。

(3)否定与不确定性去除:现有的很多方法在复合语句上表现不好,所以作者提出了一些规则

分词->解析->CCProcessed

(4)质量控制:找出一部分openI相关的报告,将openI数据集的结果作为标签,运用作者的方法,发现比MetaMap效果要好。

(5)图像处理,resize成1024*1024

(6)边界框,一小部分图片有bounding boxes。给出一张图和一个标签,找专家标注。

 

Common Thoracic Disease Detection and Localization

作者提出了一个框架用来检测这类问题。如下:

ChestX-ray8论文个人理解_第1张图片

主架构为预训练的经典模型,transition layer转成标准形式, LSE  pooling,预测。

预测标签使用one-hot形式。

损失函数为加权的Cross Entropy Loss:

ChestX-ray8论文个人理解_第2张图片

LSE pooling:

通过超参数r来调控倾向与全局还是平均:

ChestX-ray8论文个人理解_第3张图片

为了防止溢出:

ChestX-ray8论文个人理解_第4张图片

模型可以生成热度图 

 

Experiments:

略(自己看论文)

 

相关文章:

Chexnet: Radiologist-level pneumonia detection on chest x-rays with deep learning

https://blog.csdn.net/JianJuly/article/details/80262405

你可能感兴趣的:(ChestX-ray8论文个人理解)