医疗文本数据集-nlp

 

1. CCHMC

数据来自辛辛那提儿童医院医学中心放射科(Cincinnati Children s Hospital Medical Center’s Department of Radiology,CCHMC)。CCHMC的机构审查委员会批准了数据的发布。采用bootstrap方法对所有门诊x线胸片和再胸片进行为期一年的采样(Walters, 2004)。这些数据是最常用的数据之一,它们的设计提供了足够的代码来涵盖儿科放射学活动的实质比例。为了达到HIPAA标准,消除歧义包括三个步骤:消除歧义。

 

 

2. MIMIC

麻省理工学院计算生理学实验室开发的一个公开可用的数据集,包括与约40,000名重症监护患者相关的未识别的健康数据。它包括人口统计、生命体征、实验室检测、药物治疗等。最新版本的MIMIC是MIMIC- iii v1.4,包括38645名成年人和7875名新生儿的5.8万多所医院入院。数据跨度为2001年6月至2012年10月。

你可能感兴趣的:(数据集)