Creation and validation of a chest X-ray dataset with eye-tracking and report dictation for AI devel

Creation and validation of a chest X-ray dataset with eye-tracking and report dictation for AI development
原文地址:
https://www.nature.com/articles/s41597-021-00863-5?error=cookies_not_supported&code=0b2999b8-d081-4b0f-bb08-bed610edb01f
代码地址:
https://github.com/cxr-eye-gaze/eye-gaze-dataset
父数据集地址:
https://physionet.org/files/mimic-cxr/2.0.0/
https://physionet.org/content/chest-imagenome/1.0.0/
本篇文章处理后的数据集地址:
https://physionet.org/files/egd-cxr/1.0.0/

该数据集包含

  • 1083张CXR图像
  • 转录的放射学报告文本
  • 放射科医生的听写音频
  • 眼睛注视坐标数据

数据集介绍
该数据集由一名放射科医生在研究正面胸片时记录的眼睛注视信息组成。同时还提供了放射学报告阅读的口述数据(含有音频和时间戳文本)。我们还在每个图像上生成了包含解剖结构的边界框,并将它们作为这个数据集的一部分进行共享。这些边界框可以与眼睛注视信息结合使用,以产生更有意义的分析。
在这项工作中,我们使用公开可用的MIMIC-CXR数据库和公开可用的MIMIC-IV临床数据库的急诊科(ED)子集。 MIMIC-IV-ED子集包含与MIMIC-CXR数据库中的一些CXR检查相关的临床观察数据和结果。纳入和排除标准应用于MIMIC-CXR临床数据库中记录的患者属性和临床结果1083例,涵盖3种疾病情况:正常、肺炎和充血性心力衰竭(CHF)。通过一名医生佩戴眼部跟踪设备捕捉眼部注释信息。

数据集说明:
Creation and validation of a chest X-ray dataset with eye-tracking and report dictation for AI devel_第1张图片

1.master_sheet.csv 包含究临床适应症的电子表格和ICD-9衍生疾病标签。
2. eye_gaze.csv:电子表格包含原始的眼睛注视数据作为导出的。
3. fxations.csv:电子表格包含传真数据输出。
4. bounding_boxes.csv:包含关键正面CXR解剖结构的边界框坐标的电子表格。
5. 音频片段:包含每个双标识符的听写音频掩码(即mp3、wav)、文本掩码(即json)、分割掩码(即png)的文件夹。

你可能感兴趣的:(深度学习,网络)