玩转肺癌目标检测数据集Lung-PET-CT-Dx ——①从TCIA获取影像数据集

文章目录

    • 数据集介绍
    • 如何从TCIA下载数据集
      • 下载数据集的一部分

数据集介绍

Lung-PET-CT-Dx是一个公开肺癌目标检测数据集,该公共数据集源自 The Cancer Imaging Archive(TCIA)。TCIA是肿瘤研究方面的著名的医学影像公开数据库。大部分数据以 DICOM 格式存储,所有数据都经过去隐私处理。

该数据集由肺癌受试者的 CT 和 PET-CT DICOM 图像组成,带有 XML 注释文件(xml文件中用边界框标识了肿瘤位置和分类)。 这些PET/CT影像是从肺癌患者中回顾性获得的,患者均经肺活检确诊 。 根据组织病理学诊断对受试者进行分组,分为4类,“A”诊断为腺癌,“B”为小细胞癌,“E”为大细胞癌,“G”为鳞状细胞癌。

数据集中共有355例次的影像记录,记录了患者的CT或PET-CT的影像资料,CT图像的分辨率是512×512。

下面两张图是下载好的数据集的CT图像部分。其主要是胸部PET-CT的图像,包括了 灰度的CT图像 和 带代谢摄取增高显像的CT图像。

在这里插入图片描述

玩转肺癌目标检测数据集Lung-PET-CT-Dx ——①从TCIA获取影像数据集_第1张图片

如何从TCIA下载数据集

(该小节可能需要特殊方式访问目标网站)

Lung-PET-CT-Dx数据集源自TCIA。TCIA是肿瘤研究方向的医学影像公开数据库。
我们可以在官网的 Access The Data → Browse Data Collection 浏览所有数据集。
玩转肺癌目标检测数据集Lung-PET-CT-Dx ——①从TCIA获取影像数据集_第2张图片

我们可以在Filter table处,输入“lung”等关键词筛选我们需要的数据集。
玩转肺癌目标检测数据集Lung-PET-CT-Dx ——①从TCIA获取影像数据集_第3张图片


我们输入Lung-PET-CT-Dx进入我们的目标数据集页面。
找到下面的Data Access界面。
玩转肺癌目标检测数据集Lung-PET-CT-Dx ——①从TCIA获取影像数据集_第4张图片
Images 为我们需要下载的影像资料。
Annotation Files是目标检测的标注数据(即XML注释文件,标注了肿瘤位置和分类)。
Clinical Data是患者相关的临床资料。
下面两个可以直接下载。


第一个Image,我们点击Download,会发现下载了一个tcia文件(Lung-PET-CT-Dx-NBIA-Manifest-122220.tcia)。
这是一个下载列表文件,需要使用网站提供的 NBIA Data Retriever 软件进行下载。

单击下面的NBIA Data Retriever,在新页面中选择 Downloading the NBIA Data Retriever,如果你是Windows系统,点击 Windows即可下载安装文件。
玩转肺癌目标检测数据集Lung-PET-CT-Dx ——①从TCIA获取影像数据集_第5张图片

下载后打开安装文件完成安装。
安装完后直接打开软件会提示需要tcia文件。
在这里插入图片描述


我们把前面下载的 Lung-PET-CT-Dx-NBIA-Manifest-122220.tcia 文件直接和 NBIA Data Retriever 的快捷方式放在一起。
玩转肺癌目标检测数据集Lung-PET-CT-Dx ——①从TCIA获取影像数据集_第6张图片

然后打开 tcia文件 即可,单击Agree,即可看到下载页面了。
单击 Start,开始下载数据集(准备好半天的时间下载)。
玩转肺癌目标检测数据集Lung-PET-CT-Dx ——①从TCIA获取影像数据集_第7张图片

下载数据集的一部分

如果觉得数据集太大了,我只想要其中的一小部分该怎么做呢?
我们回到数据集页面,在刚才的 Images 处单击 Search 按钮。
玩转肺癌目标检测数据集Lung-PET-CT-Dx ——①从TCIA获取影像数据集_第8张图片


我们可以在这里逐条浏览数据集中的各条数据,甚至可以浏览每一张的CT图片。
对于我们想要的条目,可以单击购物车 Cart 按钮。
玩转肺癌目标检测数据集Lung-PET-CT-Dx ——①从TCIA获取影像数据集_第9张图片


挑完后,单击Cart进入购物车页面,单击Download即可下载对应的 tcia文件。
我们把这个文件和 NBIA Data Retriever 的快捷方式放在一起,即可打开下载我们想要的数据了。

玩转肺癌目标检测数据集Lung-PET-CT-Dx ——①从TCIA获取影像数据集_第10张图片

你可能感兴趣的:(深度学习实战,计算机视觉,图像处理,人工智能)