有效延缓痴呆症：延世大学发现梯度提升机模型能准确预测 BPSD 亚综合征

内容一览： 随着人口老龄化程度不断加剧，痴呆症已经成为公共健康问题。目前医学界治疗该病还只能通过药物缓解，尚未发现治愈的有效方法，因此，预防痴呆症尤为紧迫。在这一背景下，延世大学的研究人员开发了多个预测 BPSD 的机器学习模型，并对这些模型进行了验证。实验结果表明，机器学习能够有效预测 BPSD 亚综合症。

关键词： 痴呆症 BPSD 梯度提升机

本文首发自 HyperAI 超神经微信公众平台~

目前，全球超 5.5 亿人患有痴呆症 (阿尔茨海默病为最常见类型)，每年新发病例接近 1000 万， 随着人口老龄化程度不断加剧，预计到 2050 年，这一数字将增加两倍。痴呆症是一种脑部疾病，会导致患者记忆力、思维和推理能力缓慢下降。该疾病主要影响老年人，是导致老年人失去自理能力的主要原因之一，在全球最主要的死亡原因（按死亡总人数排列）中位于第七位，前三位分别是缺血性心脏病、中风及慢性阻塞性肺病。

通常，痴呆症患者除了认知障碍外，还表现出一系列行为和心理症状 (BPSD)，如躁动、攻击、冷漠和抑郁等。 这些症状是痴呆症护理中最为复杂、最具有挑战性的问题，它们不仅导致病人无法独立生活，同时也给照护人员带来相当大的负担。

近期，韩国延世大学 (Yonsei University) 的研究人员 Eunhee Cho 等人开发了多个用于预测 BPSD 的机器学习模型，并对它们进行了验证。目前该研究已发布在《Scientifc Reports》期刊，标题为「Machine learning‑based predictive models for the occurrence of behavioral and psychological symptoms of dementia: model development and validation」。

该研究成果已发表在《Scientific Reports》上

论文地址：

https://www.nature.com/articles/s41598-023-35194-5

数据集

本研究分三次进行数据收集，共使用了 187 名痴呆症患者信息进行模型训练，另外 35 名患者信息用于外部验证。其中第二次数据收集是对第一次数据收集参与者进行的重复测量，第三次数据收集则招募了新的参与者进行测量。研究中，第一次和第二次收集的数据用作训练集，第三次收集的数据集用于测试集。

为了对参与者进行全面的特征信息收集，研究人员首先调查了他们的健康数据（年龄、性别、婚姻状况等）和发病前的性格类型（韩国五大人格量表 BFI-K）， 其次使用身体活动记录仪监测夜间睡眠和活动水平，最后又采用了一种症状日记 (symptom diary) 来记录照料者感知到的症状的触发因素 (饥饿/口渴、排尿/排便、疼痛、失眠、噪音等) 以及患者每天发生的 12 种 BPSD。此外，这些症状也被划分为 7 个亚综合症， 下图直观展示了身体活动记录仪和症状日记数据的记录情况。

表 1：身体活动记录仪和症状日记的统计情况

SD： 标准差

TST： 总睡眠时间

WASO： 入睡后醒来时间

NoA： 醒来次数

MAL： 清醒时间

METs： 代谢当量

MVPA： 中度至剧烈的身体活动

BPSD： 痴呆症行为和心理症状

其他原因： 其他看护者感知的 BPSD 触发因素（治疗、噩梦等）

不过，由于参与者不服从或装置佩戴不当等原因，导致活动记录仪数据缺失，据统计，数据缺少者占总参与人数的 36%，平均每人缺失 0.9 天数据。因此，研究人员采用链式方程的多重插补方法 (multivariate imputation was applied using chained equations) 来处理这部分缺失数据。

实验过程

研究人员训练了 4 个模型，以确定预测每个亚综合症的最佳模型。基于研究结果，研究人员可以将这些模型应用于临床监测和预测 BPSD 亚综合症。同时针对潜在的 BPSD 影响因素进行干预，实现以患者为中心的痴呆症护理服务。此外，机器学习算法还可以嵌入智能手机应用程序中，以进一步提高其价值。

模型性能

研究人员采用了 4 个机器学习算法，包括逻辑回归(logistic regression)、随机森林 (random forest)、梯度提升机 (gradient boosting machine) 和支持向量机(support vector machine) ，通过各自特有的学习算法评估模型性能，挑选出预测 BPSD 亚综合征最好的模型。这里，逻辑回归模型最为常见和成熟，因此作为基准模型用于判断机器学习的性能提升程度。

基于训练集，通过五重交叉验证，不同模型预测 BPSD 亚综合征的性能如下图：

表 2：基于训练集，不同模型预测 BPSD 亚综合症性能

AUC： ROC 曲线下的面积

LR： 逻辑回归模型

RF： 随机森林模型

GBM： 梯度提升机模型

SVM： 支持向量机模型

ROC 曲线： ROC (Receiver Operating Characteristic Curve) 曲线是一种描绘 分类器 性能的图形工具。

AUC 值： AUC (Area Under the Curve) 值表示 ROC 曲线下的面积，用于衡量分类器性能。AUC 值越接近 1，表示分类器性能越好。

表 2 显示，梯度提升机模型在预测多动症 (0.706)、情感症状 (0.747) 和进食障碍 (0.816) 方面 AUC 值较高； 支持向量机模型在预测精神症状方面 AUC 值 (0.706) 最高；随机森林模型在睡眠和夜间行为方面 AUC 值 (0.942) 最高；逻辑回归模型在异常活动行为 (0.822) 和病理性欣快症 (Euphoria/elation, 0.696) 方面 AUC 值最高。

模型验证

研究人员使用了外部验证方法，在第三次收集的数据集上对模型进行验证。基于测试集，不同模型预测 BPSD 亚综合症的性能如下图：

表 3：基于测试数据集，不同模型预测 BPSD 亚综合症性能

AUC： ROC 曲线下的面积

LR： 逻辑回归模型

RF： 随机森林模型

GBM： 梯度提升机模型

SVM： 支持向量机模型

表 3 显示，对比逻辑回归模型，机器学习模型的表现都要更好。具体来看，对大多数亚综合症来说，随机森林和梯度提升机模型性能表现都优于逻辑回归和支持向量机模型；随机森林模型在预测多动症 (0.835)、病理性欣快症 (0.968) 和进食障碍 (0.888) 方面比其他预测模型的 AUC 值要高；梯度提升机模型在预测精神症状 (0.801) 方面比其他预测模型的 AUC 值要高；支持向量机模型在睡眠和夜间行为 (0.929) 方面 AUC 值最高。

综合两图表信息，研究人员发现在预测 7 个亚综合征方面，梯度提升机模型平均 AUC 值最高，即表现最佳。 与此同时，研究人员也提醒，在测试数据集的样本量较小情况下，需要谨慎推断预测性能的结果，并建议未来应进行更大样本量的重复实验以获得更准确的预测结果。

国内成果：提前十年预测痴呆症发病

在痴呆症预测方面，除了国外，国内也取得了令人瞩目的成果。 去年九月，复旦大学附属华山医院神经内科主任医师郁金泰临床研究团队，联合复旦大学类脑智能科学与技术研究院冯建峰教授、程炜青年研究员算法团队开发了 UKB-DRP 痴呆预测模型。

该模型可以预测个体未来五年、十年甚至更长时间内是否会发病， 筛查出处于痴呆症病程早期的群体，包括全因痴呆及其主要亚型 (如阿尔茨海默病)。该研究成果已发表在《柳叶刀》子刊《电子临床医学》上。