中介变量(mediator) 是一个重要的统计概念,如果自变量 X 通过某一变量 M 对因变量 Y 产生一定影响,则称 M 为 X 和 Y 的中介变量。我们既往已经介绍了SPSS行中介效应分析,今天继续介绍R语言基于mediation包行中介效应分析。
我们先导入数据和R包
library(mediation)
bc<-read.csv("E:/r/test/yimin.csv",sep=',',header=TRUE)
我们先来看看数据,这是一个关于移民的数据(公众号回复:移民数据,可以获得数据),数据很多,我们来看看我们关心的几个数据。
Emo:焦虑状态,通过量表来评分,treat:治疗,分为有治疗和未治疗,age:年龄,educ:教育程度,gender:性别,income:收入,cong_mesg:发送移民信息,二分类变量,也是结局变量
假设我们想知道,我们可以不可以通过治疗来改变患者的焦虑状态,从而改变患者移民这一举动。
先建立焦虑和治疗的方程,因为焦虑指标为连续的,这里使用lm连接
med.fit <- lm(emo ~ treat + age + educ + gender + income, data = bc)
然后建立结局变量,中介变量和自变量关系方程
out.fit <- glm(cong_mesg ~ emo + treat + age + educ + gender + income,
data = bc, family = binomial("probit"))
行中介效应分析,treat填自变量,mediator填中介变量,robustSE为显示可信区间,sims为重复100次,也可以自己调整
med.out <- mediate(med.fit, out.fit, treat = "treat", mediator = "emo",
robustSE = TRUE, sims = 100)###treat填自变量,mediator填中介变量
解析结果
summary(med.out)
我们可以看到总效应等于中介效应+直接效应。直接效应P值大于0.05,表明直接效应影响不大,自变量主要是通过中介效应影响结局,也就是移民。
进一步绘图
plot(med.out)
由上图也可以看出,ADE的影响很小,主要是通过ACME来影响。
接下来我们进一步做敏感性分析
sens.out <- medsens(med.out, rho.by = 0.1, effect.type = "indirect", sims = 100)
summary(sens.out)
par(mfrow = c(1,2))
plot(sens.out, sens.par = "rho", main = "Anxiety", ylim = c(-0.2, 0.2))
Y表示中介效应值,X表示敏感度关于rho。虚线表示rho=0的时候,就是没有混杂效应的时候。红线表示混杂效应导致中介效应消失时rho的值(有点拗口,自己体会一下),因此得出rho的绝对值越高,中介效应越可靠。
我们还可以做出R方的图,R方的解释与其他模型R方的解释是一样的。
plot(sens.out, sens.par = "R2", r.type = "total", sign.prod = "positive")
总的来说mediation包行中介效应分析挺简单的。
参考文献:
Imai, Kosuke, Luke Keele and Dustin Tingley (2010) A General Approach to Causal Mediation Analysis, Psychological Methods 15(4) pp. 309-334.
Imai, Kosuke, Luke Keele and Teppei Yamamoto (2010) Identification, Inference, and Sensitivity Analysis for Causal Mediation Effects, Statistical Sciences, 25(1) pp. 51-71.
Imai, Kosuke, Luke Keele, Dustin Tingley, and Teppei Yamamoto. (2009) “Causal Mediation Analysis Using R” in Advances in Social Science Research Using R, ed. H. D. Vinod New York: Springer.
Forthcoming.