MIMIC-IV数据库介绍与使用说明

MIMIC-IV

  • 一些基本逻辑
  • 各模块和table介绍
    • Tables
      • Core
      • Hosp
      • ICU
      • ED
      • CXR
      • Note
  • 官网及数据库下载网址
  • 2022.6.12 更新

在word中更加详细的列出了各table中table所代表的含义以及我在使用中所遇到的问题,可在资源页面进行下载。
MIMIC-IV数据库介绍与使用说明_第1张图片

一些基本逻辑

病人定义:
subject_id
每个患者有唯一的subject_id
hadm_id
患者的每一次入院会有一个唯一的hadm_id
transfer_id
患者每一次更换病房会有一个唯一的transfer_id
stay_id
在相同类型病房内进行转移,则会更新一个transfer_id,但会有相同的stay_id,例如用ICU中的一个病房转移到另一个病房,则stay_id不变,transfer_id更新。
所有id的分配都是随机的,与时间先后无关。
date and time
后缀为date的,分辨率最低为天;后缀为timed的字段,分辨率最低为分钟。
charttime and storetime:分别是测量的记录时间与储存时间。通常以charttime为准
d and icd
命名为d_开头,为编码表。d_icd开头,为icd编码表。icd结尾的表,为使用icd编码的记录表。

各模块和table介绍

在word中列出了各table中table所代表的含义以及我在使用中所遇到的问题,可在资源页面进行下载。

Tables

分为六个模块,Core、Hosp、ICU、ED、CXR、Note

Core

Core模块包含患者跟踪数据。这里描述了人口统计、入院信息和住院病房转院情况
admission
患者入院信息,以每次入院为单位记录,每条记录有一个单独的hadm_id
patient
患者信息
transfers
病房转移信息

Hosp

Hosp模块涵盖的信息包括实验室测量,微生物学,药物管理,和收费诊断等

d_icd_diagnoses
包含国际疾病分类(ICD)第9版和第10版的诊断代码。icd_code一定要读取为字符串,因为开头为0是有意义的,若读取为数值会有重复,如01622和1622代表不同疾病。
diagnoses_icd
患者诊断信息表。seq_num代表诊断的优先级,序号越靠前越重要,而低优先级的排序有时并不准确。drgcodes
也是与诊断相关的表,使用Diagnosis Related Group(DRG) code.编码,与diagnose表中的主要诊断相对应。
d_icd_procedures
procedures_icd
患者住院期间的手术信息,包括在ICU期间的信息。
d_labitems
实验室检查定义表
labevents
病人实验室检查的记录
prescriptions
处方数据,药物数据
pharmacy
药房数据表,以pharmacy_id字段与prescriptions表相关联,相当于对prescriptions表中各处方信息的补充。
此外,还有微生物培养、收费、订单等表格

ICU

包含从ICU内使用的临床信息系统收集的信息。记录在案的数据包括静脉给药、呼吸机设置和其他图表项目等。
每个患者每次入院可能有多次icu,每次icu对应一个stay_id
d_items
包含ICU内发生的所有项目的编码,通过itemid字段与ICU模块内的其他表格关联。
ICU stays
入住ICU的时间信息
chartevents
Chartevents包含了一个病人可用的所有图表数据,有些lab数据与labevents表中的数据重复。

ED

急诊信息,包含急诊诊断,病人体征等信息。通过subject_id和hadm_id与其他模块相连接。急诊的患者如有hadm_id,则说明该患者住院治疗。ed患者不一定住院,住院的患者也不一定从急诊入院。
diagnosis table
诊断表为患者提供诊断列表。从急诊科出院后确定诊断。
edstays table
急诊科来访的主要跟踪表。它提供了病人进入急诊科和离开急诊科的时间
medrecon table
在进入急诊室时,工作人员会询问病人目前正在服用什么药物。这个过程被称为药物协调,医疗检查表存储了护理人员的调查结果
pyxis table
提供了通过pyxis系统配制药物的信息。
triage table
包含病人在急诊室第一次分诊时生命体征信息
vitalsign table
急诊室收治的病人常规的生命体征需要1-4小时。这些生命体征保存在生命体征表中
vitalsign_hl7 table
急诊收治的病人可通过遥测技术进行监测。每分钟的生命体征都被传送到医院的中央服务器,这些生命体征都被记录在这里。

CXR

X光胸片文件,源数据是dicom格式,但也提供了jpg格式的下载。包含了胸片及影像学报告。值得注意的是,存在有影像的患者没有住院记录的情况。
cxr-record-list
影像列表
cxr-study-list
影响报告列表
mimic-cxr-2.0.0-chexpert
使用CheXpert labeler(基于影像学报告的非人工标注,斯坦福与麻省理工合作)标注了14个标签,标签如下表
mimic-cxr-2.0.0-split
提供了参考的训练集、验证集、测试集划分

Note

官方还未发布
(NOT PUBLICLY AVAILABLE): 所有文本报告,出院、超声、心电、影像等报告

官网及数据库下载网址

官方介绍见 MIMIC官方网站
MIMIC-IV 数据库下载见 MIMIC-IV发布页
X光胸片dicom格式数据下载见 MMIC-CXR Database
X光胸片JPG格式数据见 MIMIC-CXR-JPG
急诊数据见 MIMIC-IV-ED

2022.6.12 更新

MIMIC-IV于2022.6.12发布V2.0版本,有以下变动
一、主要变化

  1. 移除了core模块,目前admissions, patients 和 transfers 表格存在hosp模块里;
  2. 移除了新生儿数据,后续将与新生儿重症监护室的数据一起在其他项目中单独发布。
  3. 添加了两个新表,ingredientevents和omr

二、ICU模块

  1. icustays
    由于patient表的变化,大约700个stayids(约1%)发生了改变。
  2. chartevents, d_items
    chartevents表中新增加了itemid=220001,以记录来自MetaVision 的1000多个问题 。大多数记录在案的问题与患者的护理计划有关,并在护士轮班期间(早上 7 点或晚上 7 点)记录在案。
  3. ingredientevents
    这是一个与 inputevents关联的新表。在 inputevents表中跟踪的每一次静脉给药都与一组成分相关。这些成分包括含水量、热量信息等。 inputevents表支持营养学相关研究,并通过对所有水成分求和以用于评估fluid input。目前,这些成分已从inputevents表中分离出来,添加至新表ingredientevents中。
  4. inputevents
    仅删除了包含空值的列:cancelreason
  5. procedureevents
    删除了以下仅包含空值的列:
    totalamount, totalamountuom, cancelreason, comments_editedby, comments_canceledby, comments_date, secondaryordercategoryname.

三、Hops模块

  1. admissions
    修复了患者通过急诊入院时缺少 edregtime 和 edouttime 的问题。
  2. patients
    1. dod现在填充了来自州死亡记录的院外死亡。对于入住 ICU 的患者,这一变化已将死亡日期记录从 8,223 条增加到 23,844 条(即,2.0版本中另外有15621名ICU患者的院外死亡记录)。也就是说,2.0版本的mimic iv中有随访数据了!
    2. 2.0版本中患者纳入MIMIC中的机制有所不同。很大程度上优化了合并同一患者多个医疗记录号码的逻辑。由于此更改,大多数表的数据内容都发生了变化。大约有1%的stays受到了影响。
  3. transfers
    修复了hadm_id为NULL的 ED 患者(即只入ED没有入院的患者)的outtime问题。原先存在的问题导致transfers表中所有hadm_id为NULL的患者在院内停留时间是错误的。2.0版本中已经修正了outtime列的这个问题。
  4. labevents, d_labitems
    1. 更改了d_labitems表中的43项itemid。
    2. loinc_code列已被删除。将在官方git代码仓中协作开发,其初始值将来自医院系统。
      ③许多以前在comments字段中有值的实验室指标现在在value字段中也有值。
  5. microbiologyevents
    microbiologyevents表中增加了新的病原体、检验、标本和抗生素。
  6. omr
    omr是一个新添加的表。 此数据的来源是在线医疗记录,其中包含有个人健康状况的多种信息。从 v2.0 开始, omr 表具有以下信息:血压、身高、体重、BMI和估计肾小球滤过率 (eGFR)。这些值可从住院和门诊访问中获得,并且在许多情况下,患者住院前的“基线”值是可用的。
  7. prescriptions
    formulary_drug_cd列已添加回来(以前在MIMIC-III中有)。此列与 emar_detail表中product_code列具有相同的值。

你可能感兴趣的:(MIMIC数据库,数据库,database)