基于功能连接梯度的可重复生物标志物探索研究框架——Toward a connectivity gradient-based framework for reproducible biomarker

来源于NeuroImage杂志的Toward a connectivity gradient-based framework for reproducible biomarker discovery

摘要
背景:fMRI数据的高维度特性仍然是其用于可重复生物标志物探索研究的关键障碍。为了解决这一挑战,最近一些研究重点关注了静息态fMRI数据的降维技术,鉴别出了可用于描述不同皮层系统间平滑过渡的内在连接主成分,即所谓的“功能连接梯度”。这些梯度不仅复现了人类和灵长类动物大脑中所展现的认知组织规律,而且也体现了健康人群与疾病人群间的差异。

方法:本研究中,我们提供了功能连接梯度应用于生物标志物探索研究的关键性评估。利用人类连接组计划(HCP)数据(探索样本集 209名被试,验证样本集209×2名被试)和午夜扫描俱乐部(MSC)数据(9名被试),我们测试了功能连接梯度的几个关键特征可信度、可重复性和预测有效度。我们系统评估了三种分析参数的影响,包括
i)降维算法(线性与非线性方法),
ii)输入数据(原始时间序列数据与功能连接数据)
iii)数据量(静息态fMRI扫描时长)。

结论:在不同算法和样本集中,功能连接梯度对全脑连接方差贡献越多或者可信度越高,则其可重复性也越高。值得注意的是,在不同分析参数设置中,采用线性降维方法(如本文用的主成分分析)、设定更保守的功能连接阈值(95-97%)以及使用更长扫描时长(至少大于20分钟)数据,往往可以得到更高的可信度。更高可信度的梯度能够更准确地预测表型评分,强调了可信度是有效度的一个关键前提。重要的是,相比传统的基于边的连接度量,利用功能连接梯度得到的预测精度更高,这表明低维度、多变量的梯度方法更有优势。最后,本工作强调了在广泛应用这种新分析方法前系统评估其参数空间的重要性和意义。

背景介绍

过去十年中,大脑连接已成为影像生物标志物探索研究的核心焦点。早期的研究主要关注感兴趣的特定连接或网络,随着全脑网络拓扑概念的兴起,近期的研究重点关注系统水平上的大脑组织规律。静息态fMRI(R-fMRI)技术在这些研究中特别有用,因为它促成了功能成像中的多个重要发现,包括典型功能网络,基于连接信息的脑区划分以及脑网络的图论属性表征。

由于功能连接数据具有高维度特性,描述性指标越显重要,因为这些指标可以将复杂的全脑连接数据提炼成更简明的组织规律。最近提出的一种研究框架可以将这种复杂性降低为描述大脑连接空间的一组维度。通过将降维算法应用于功能连接数据,这种方法揭示出了多个主成分,被称作“梯度”(或非线性降维领域中的“流形”),这些梯度描述了功能连接模式沿皮层表面的平滑过渡,可以有效地解释宏观尺度上的认知功能机制。最近,这种方法在神经影像和脑网络领域获得了越来越多的关注,具有广泛的应用前景,但目前关于哪种具体方法最有希望将这些指标进一步发展为有效的影像生物标志物,还没有达成共识。

之前的功能连接梯度研究中,一类是关注特定区域,如纹状体、感觉运动区和内侧颞叶(包括内嗅皮层和海马)。这些研究揭示了**功能连接沿着主轴的有序变化,很好地复现了跨脑区的解剖连接过渡。**另一类是确定临床样本的生物标志物。Hong等人证明了在单模态到跨模态皮层过渡的层次结构中,自闭症相关的大脑网络存在特定的下降,并证明这些变化可预测自闭症的认知表现。虽然这些研究展示了新方法的可行性和潜在的临床应用,但关键问题仍然存在。重要的是,分析过程中可选的算法和参数很多,而且计算梯度的工具越来越多,因此需要充分评估分析过程的有效参数。本研究中,基于多个大样本数据集,我们系统评估了功能梯度的可信度、可重复性以及有效度。

研究方法

研究被试

从HCP数据中挑选三个独立数据集:i)探索数据集(209名被试),ii)验证集-1(209名被试)和iii)验证集-2(209名被试)。
采用MSC数据(高频采样数据集),共包含9名被试,每名被试各扫了10次30分钟R-fMRI数据。

预处理

HCP数据

包含以下几个主要步骤:不做slice timing校正,空间预处理,ICA+FIX去噪,滤波(0.008-0.8Hz),去掉前10个时间点(剩余1190个时间点),下采样到包含10k顶点的皮层,利用两次扫描数据合并交叉拼接生成两段30分钟长的时间序列(用于重测检验),最后利用Schaefer图谱(在10k皮层上包含998个脑区)为每个被试生成两个998*2380的时间序列矩阵。

MSC数据

包含以下几个主要步骤:Slice timing校正,头动校正,归一化和形变校正,配准到结构像上,采样到32k的皮层表面并下采样到10k顶点皮层,最后利用Schaefer图谱为每个被试生成10段998*818的时间序列矩阵。

分析策略

本研究中采用了4种分析策略:

分析-1 利用三种不同的降维算法——主成分分析(PCA),扩散映射嵌入(DE),拉普拉斯特征图(LE)——计算原始的功能连接梯度,并评估这些梯度的相似性和可重复性。

分析-2 利用两种指标——类内相关系数(ICC)和区分度(discriminability)——评估每个梯度的可信度,并针对不同的算法和输入数据(时间序列数据、无阈值和有阈值的功能连接矩阵)进行了比较。

分析-3 评估了R-fMRI扫描时长(5至50分钟)对可信度的影响。

分析-4 系统评估了每个梯度在不同的算法、输入数据和R-fMRI扫描时长的情况下,对于多种行为认知评分的预测精度。

研究结果

功能连接梯度的可重复性

在不同算法中相似度高的功能连接在不同数据集中也展现了很高的可重复性。

基于功能连接梯度的可重复生物标志物探索研究框架——Toward a connectivity gradient-based framework for reproducible biomarker_第1张图片

图1 功能连接梯度及其可重复性

功能连接梯度的可信度

不管采用何种方法,对于方差贡献更多的功能连接梯度(即低阶的梯度)往往有更高的ICC。相比时间序列数据,设定阈值后的功能连接矩阵,特别是设定更加保守的阈值(>90%),会得到更高的可信度。然而过于保守的阈值(>98%)反而会降低可信度。
基于功能连接梯度的可重复生物标志物探索研究框架——Toward a connectivity gradient-based framework for reproducible biomarker_第2张图片

图2 功能连接梯度及其可信度

不同扫描时长的可信度

扫描时长越长,可信度越高,一般要求至少大于20分钟。

基于功能连接梯度的可重复生物标志物探索研究框架——Toward a connectivity gradient-based framework for reproducible biomarker_第3张图片

图3 扫描时长对可信度的影响

功能连接梯度的行为预测

多种分析得到的平均预测精度与功能连接梯度的ICC和区分度明显相关。此外研究还表明采用基于PCA的方法、采用95-97%的阈值以及采用更长扫描时长的数据可以明显提高预测性能。
基于功能连接梯度的可重复生物标志物探索研究框架——Toward a connectivity gradient-based framework for reproducible biomarker_第4张图片

图4 行为预测及其可信度

文章总结

本研究系统评估了功能连接梯度在可重复生物标志物探索研究中的适用性,发现特定组合的分析策略更加有用,包括
i) 采用线性降维算法(如PCA),
ii) 选择对方差贡献大的功能连接梯度,
iii)设定更加保守的功能连接阈值来提取梯度,
iv)研究对象应该关注于更加可靠和更具预测性的高阶跨模态区域,而不是低级的初级感觉系统。

本研究强调了将功能连接梯度应用于生物标志物探索研究时所需注意的问题,特别是算法的选择,阈值的设定以及数据扫描的时长要求等。我们希望这些发现能为研究者有效利用功能连接梯度进行研究提供基础。

你可能感兴趣的:(脑科学核磁共振成像,神经科学工具箱,网络,机器学习)