Data-driven modeling of clinical pathways using electronic health records论文解读

Data-driven modeling of clinical pathways using electronic health records

  • 根据临床路径来聚类
  • 对临床路径的分类来探索路径不同的原因
  • 临床路径预测模型
  • 病人治疗应该是有个性化差异的
  • 相似病情特征的病人分到同一组,而不是像医生那样,只是看诊断。
  • 假设有一种临床路径可以将病人分开,相当于一种病人有一K-种适应的临床路径。
  • 风险预测,医嘱预测,状态预测,用药预测
  • 结构化和编码,共59个特征

Data-driven modeling of clinical pathways using electronic health records

1 Abstract

以数据驱动的临床路径预测模型,模型实现了一句临床路径的病人聚类,并且鉴于病人临床路径的多样性,利用分类器分析了不同病人参数情况 下临床路径多样性的原因,准确率有81.2%。

2 Introduction

临床路径可以帮助分配医疗资源,节省病人花费。
临床路径定义了部门到子部门之间患者的转移轨迹,临床路径依赖于疾病的严重程度,存在的并发症和治疗方法。
临床路径可以看出治疗方法的效果
Funkner等[7]和Krikunov等[8]使用临床路径的静态参数预测住院时间,结果,患者恢复时间和术前时间,无需构建通路,本文提出一种动态方法,依据患者治疗过程中新的事件和医疗参数来更新临床路径。
section2:讨论了问题陈述和提出的方法的关键要求
section3:介绍了使用EHR的临床路径预测模型的基础知识
section4:通过探索患者的临床路径,展示了所提出的方法应用的一个例子

3 Problem definitions

患者的治疗应该是个性化和精准化的,但是标准的治疗方法是更具有成本优势。
解决方法是:
1.将具有相似特征的患者分成一组,医生通常根据患者的诊断,疾病的严重程度,并发症的存在等对患者进行分组。然而,这种分组仅考虑一个患者的参数而忽略了复杂的一些参数,这里本文根据住院期间的临床路径,将患者聚类分组,这里假设存在一种临床路径,定义了一组数据,可以将每一组患者区分开来。
2.EHR记录了患者临床路径的时间戳,例如患者入院的地点和时间,患者的筛查类型,检查和手术的地点和时间,以及何时和何时出院。数据包括时间地点,还包括病史,诊断,检查结果,过程描述等。但是EHRs由于其非结构化性质(包括纯文本)而经常缺乏一致性,完整性和正确性。
3.可能缺失数据,缺失数据不全工作。

3 Related works

频繁项挖掘,优化算法,贝叶斯网络都可以用。
Peter等人11开发了Care Pathway Explorer,它提取了常见的医学事件序列,并探索这些序列如何与患者的结果相关联,但是是非免费的。

4 Modeling of clinical pathways

我们考虑使用数据驱动模型来预测具有数据同化的临床路径的结构。
CP模型是一个有向图,定点代表医院的部门,边代表病人的转移方向。如果顶点有多条边,则顶点包含一个数据驱动模型,以确定患者的CP,这取决于他/她的参数。
根据以前的参数和更新后的参数,可以做一个模型来选择合适的CP,因此,预测结果会随着住院时长的增加预测的越准确,图1显示了CP的构造和更新过程。CP模型允许估计风险并为患者预订医院资源。

5 Experimental study. Acute coronary syndrome

实验研究。 急性冠状动脉综合征

5.1. Case study

3434个数据
入院部门,常规护理部门,手术室和重症监护室
根据图。 2a大量患者在午夜入院,这一患者分布高峰并不真实。 午夜时间是医疗信息系统中的默认时间,此PDF最大值表示医务人员没有为事件设置真实时间
图2b显示了每天有多少ACS患者入院。 通常没有人或一名病人进入医院。 因此,有必要了解医院工作的细节以识别工件。

5.2. Clustering and determination of typical pathways.

1.缺失数据补全
2.下一步包括结构化和编码(因此状态序列由长度为1…59个字符的字母串表示)
3.患者的CP与部门和子部门(部门内具有特定专业性的设施)相关,与患者的当前状态相关,以及在多种途径中重复的循环模式。
4.这些状态序列就可以用来做聚类了,来识别同组的患者,最终利用K-means得到13个组,并且丢弃了少雨5个序列的三个组。
5.分组之后,需要将每个组的事件序列对齐,这就需要分析每个组的结构,包括手术数量,出院前最后的部门等,最后一步时确定主要的路径。
Fig. 3为有向图,top-3集群可以covers50%的例子,为70%的集群患者分配流量的边缘以粗体显示,以描绘集群中最常见的途径,AD,CD,IC,OR代表不同部门。
#4簇是ACS患者的典型治愈途径。
#1组描述了患有伴随疾病的患者。 这些患者通常需要在其他科室进行额外治疗。
#2包括具有模糊诊断的异质患者,其CP不在医疗指南的范围内。 这些患者大多没有手术。 此外,该群集的死亡率很高。

5.3. Forks

分支
属于同一类集合的患者通常在路径上也有分歧,可以定义分歧的重要性。
wi和wj为分支边的权重,n为分叉路口边的个数,本文提出了一个计算分叉路口重要性的一个公式。
根据上述公式,#1发现CD分叉口最重要,根据该公司,可以去探索为啥患者临床路径是多样性的。
训练了分类器在CD分叉口去做分类,准确率可以达到81.2%,每一个决策树的结点包含患者的参数,第一个参数为CD部门后出院的患者的个数,第二个参数为cd转移到AD OD的患者的个数,最重要的参数为CD结点时的持续时间,很大程度上决定了患者将来的临床路径走向。

6 Conclusion and future works

目的为实时的预测患者的临床路径,为了执行数据分析,检测和评估患者流量,结构化,CP类别确定,使用数据,文本和挖掘技术的组合,因此,该方法能够自动识别患者的动态并预测患者在集群内的通路。
增加额外的数据,也可以提升准确率。
作用:
1.发现的临床路径可以作为治疗患者的一个临床医疗手册。
2.再者,它可以比较医疗临床路径之间的不同,发现不同,例如:发觉推荐的治疗为啥在该患者中不是这么用的,是医疗事故还是一个值得推荐的优化的临床治疗方式?

你可能感兴趣的:(算法)