A variance components model for statistical inference on functional connectivity networks
用于FC网络统计推断的方差成分模型
2017年 Mark Fiecas 提出了一个方差成分模型,以便对FC网络进行统计推断。fmri时间序列数据存在着固定的时间自相关和不同被试的异质性。这个模型以非参数和特定主体的方式估计自相关结构,并使用最小二乘法估计异质性引起的方差。
时间自相关:temporal autocorrelation inherent.
不同被试的异质性:heterogeneity across subjects in the study.
其他一般的统计模型不会考虑时间自相关性和被试异质性,所以这是本次模型的优势。
既往统计推断的模型方法大体分为两种:
(1)第一种是基于复杂网络分析的图论方法。这种方法用图的边来代表signal。
具体而言,把单个被试的signal correlation计算后,经fisher z转化,然后使用两样本t检验,再加上多重校正,来检验患者和对照组之间的FC假设。
(2)第二种是图的汇总统计(graph summary statistics)。
具体而言,这种方法不是单纯的以边的变化来统计推断了。它是估计图的汇总统计,例如小世界属性、模块化、富人俱乐部等,然后来综合进行统计推断,检验患者和对照组在图汇总统计上的差异。
(3)其他方法概述
其他的统计方法,例如指数随机图模型框架(exponential random graph modeling, ERGM)等等。
以上这些标准方法有一些问题。首先,这些方法隐含的假设了bold signal在时间上是不相关的,但其实这和现实相违背。其次就是,这些方法没有考虑到受试者之间的异质性。这些都会导致虚假的统计推断结果。并且,这些方法缺少了对FC网络的平等性进行评价。虽然也有用Hotelling T 2 T^2 T2检验,来进行网络整体的平等性检验,但是在受试者数量少的时候,这种检验的功效非常低,或者说不能被计算出来。
基于此,作者提出了方差成分框架模型,variance components framework,用于建模和进行FC网络的统计推断,并纳入每个受试者ROI时间序列中固有的自相关性和受试者之间的被试异质性。
假设我们有一个p长度的时间序列,横跨N个被试。在不丧失一般性的情况下(without loss of generality),假设所有被试的边缘的时间序列都被减少了(the marginal time series across all subjects have been detrended)。为了估计FC强度,我们计算了所有被试每个ROI边缘时间序列的样本相关性,这样的话,每个被试就有 q = p ( p − 1 ) / 2 q=p(p-1)/2 q=p(p−1)/2个ROI配对,这样,FC强度就可以由N个q长度的值来评估,该值在每个被试上对比了配对样本的相关性。
具体而言:
假设 r i j r_{ij} rij代表第 j j j个被试的第 i i i个样本相关系数,因此得 Y = ( r 11 , r 21 . . . r q 1 , r 12 , . . . r 1 N . . . r q N ) Y=(r_{11},r_{21}...r_{q1},r_{12},...r_{1N}...r_{qN}) Y=(r11,r21...rq1,r12,...r1N...rqN),假设 X X X是 N q ∗ q N_{q}*q Nq∗q的矩阵,即N个 q ∗ q q*q q∗q的单位矩阵。
由此,建立第一个误差项 ϵ \epsilon ϵ,这个误差项用来对**每个受试者ROI时间序列的时间自相关性的变异性和共变性(variability and covariability)**进行建模。因此 ϵ = ( ϵ 1 j , . . . , ϵ q j ) ′ N ( 0 , ∑ j ) \epsilon=(\epsilon_{1j},...,\epsilon_{qj})^{'} ~ N(0,\sum j) ϵ=(ϵ1j,...,ϵqj)′ N(0,∑j).
第二个误差项 ψ \psi ψ用于控制被试间的异质性。假设 ψ N ( 0 , ψ 0 ) \psi~N(0,\psi_{0}) ψ N(0,ψ0)其中 ψ 0 \psi_{0} ψ0是qxq的对角线单位矩阵。
将上述这些汇总起来,用一般线性模型来表示: Y = X β + ϵ + ψ Y=X\beta+\epsilon+\psi Y=Xβ+ϵ+ψ.
这个模型主要计算3个方面:(1)每个被试内的边缘时间序列的时间自相关性(2)每个被试的被试间的不同样本相关系数(3)从潜在人群中对受试者进行抽样而导致的变异性(即被试间差异,被试异质性)。
假设两个误差项 ϵ \epsilon ϵ和 ψ \psi ψ是相互独立的,因此其协方差为 V a r ( Y ) = ∑ + ψ Var(Y)=\sum + \psi Var(Y)=∑+ψ
1.作者证明出,只要数据有时间上的相关性,fisherz转换就不再是一个方差稳定变换。
模型估算细节:
1.获取 ψ 0 \psi_0 ψ0的初始估计值。
2.获得残差 R = Y − X ∗ β ^ R=Y-X*\widehat{\beta} R=Y−X∗β
3.使用残差R来更新估计值 ψ \psi ψ,从而更新 ψ \psi ψ
4.重复2和3步骤,直至收敛。
然后对该模型进行统计推断:
使用置换检验进行显著性校正,H0的无效假设为:两组的网络是相同的。
假设H0假设成立,那么被试的网络是可以交换的,因此:
1.将受试者在两组之间进行配对
2.使用上述2和3的步骤来估计 ψ \psi ψ和 β \beta β,并构建他们的方差矩阵
3.计算上述的统计量。
将上述过程重复1000次或5000次,来观察两组之间网络差异是否超过显著性阈值。
流程图如下:
模型使用介绍:
模型来源:LongiInclude.cpp
模型:
FCanalysis(datalist, N1, N2, Nperms, lag=50L, bw=5, steps_tol=1e-05, Psi0type='CS, MaxIter=20L, verbose=FALSE, SigmaType=“Unstructured”)
参数介绍:
datalist是每个受试者的TXP矩阵。P是网络中的ROIs,T是时间序列。
N1是group 1的被试
N2是group 2的被试
Nperms是置换检验运行次数
lag是计算中的最大滞后数
bw是MB窗口功能的带宽
step2_tol是迭代求解β和Psi的停止标准
Psi0type表示用于Psi0的结构,“CS”表示复合对称,
Scaled 表示缩放尺度,包括“缩放”、“零”、“非结构化”或“对角线”
MaxIter是执行Psi和beta求解的最大迭代次数
verbose是布尔值,表示是否应将置换测试状态更新打印到控制台
SigmaType是一个字符串,表示SigmaRoy方差应为“零”、“非结构化”或“对角”