统计学（51）-结构方程模型

结构方程模型（Structural Equation Mode血g, SEM) 可用于多种实用的场景，如多因变量分析、潜变量分析、中介变量分析等。它可以看作路径分析( Path Analysis)和验证性因子分析(Confrrmatory Factor Analysis) 的组合。

1、路径分析

image.png

血压到底是自变量还是因变量？-引申出内生变量（Endogenous Variable）和外生变量（Exogenous Variables）的概念。
简单来说，内生变量就是会受到其他变量影响的变量，外生变量就是不受任何其他变量的影响、但是会影响其他变量的变量。外生变量肯定是自变量，但内生变量可能是自变量，也可能是因变量。在图10.20 中，体重就是外生变量，血压和血糖是内生变量，血压既是自变量又是因变量。

2、验证性因子分析

（1）潜变量和显变量
在传统的广义线性模型中，各自变量或因变量都是通过“直接”测量或调查而获得的，但有些变量却是难以直接测得的，如学习能力、幸福指数、抑郁状态等。这种无法直接测得的变量称为潜变量(Latent Variables), 与此对应，可以直接测得的变量称为显变量(Observed Variables)。
（2）潜变量虽然无法直接获得，但却是存在的，而且在背后支配着显变量。例如，一名学生的考试成绩是可以直接观测的显变量，它可能是由学习能力这一潜变量决定的；再如，一个人的抑郁状态是潜变量，可能决定着他的“能否很快入睡""感到沮丧”等可直接回答的问题。

3、验证性因子分析

（1）潜变量与显变量之间是有一定关系的，如＂焦虑”这一潜变量是如何支配“我睡不着觉”和＂我心里觉得烦乱”这两个显变量的？
（2）在验证性因子分析中，通过以下模型将潜变量和显变量联系起来：

image.png

其中， X1,X2, …是显变量， F1,F2,··,Fm 是潜变量。各潜变量通过系数a11 、a21 等支配显变
量X1 、X2 等，而ε等则是无法解释的误差。
（3）如潜变量“焦虑＂与显变量“我睡不着觉”和＂我心里觉得烦乱”之间的关系可以表达为

image.png

只要能求出a1、a2, 便可以知道焦虑是如何支配“我睡不着觉”和＂我心里觉得烦乱”这两个显变量的。

4、因子载荷（Factor Loading）

（1）上述公式与线性模型的公式很相似。其实a1、a2等作为系数，其含义也与线性模型中差不多，如a1表示焦虑每增加1个单位，“我睡不着觉”的预期改变量； a2表示焦虑每增加1个单位，“我心里觉得烦乱＂的预期改变量。
（2）不过与线性模型不同的是，在验证性因子分析中，该系数不叫回归系数，而被称为因子载荷(Factor Loading), 它反映了潜变量与显变量之间的关系。因子载荷越大，表明潜变量与显变量的关系越密切。
（3）在验证性因子分析中，一个很关键的问题是确定潜变量，这一点是由专业知识来决定的。
例如：

image.png

这里有两种潜变量，六种显变量。而下图则是因子载荷分析，最终确定关系密切者。

image.png

抑郁与“感到没希望”的关系较密切，焦虑与“神经紧张＂的关系较密切。

5、结构方程模型

路径分析可以探索（显）变量之间的直接和间接关系，验证性因子分析可以分析潜变量与显变量之间的（直接）关系，结构方程模型则将二者结合，可以同时分析带有潜变量的直接和间接关系。

image.png

6、结构方程的一个例子

下表是调查了100人的5个变量的协方差结构，目的是了解家庭状况对学生抑郁是否会有影响。

image.png

（1）假定家庭状况（潜变摄）用父母学历评分和家庭氛围评分（显变量）来体现，学生抑郁（潜变量）用学生情绪评分、学生认知评分和学生动机评分（显变量）来体现。并且假定路径为：家庭状况会影响学生的抑郁状态。
（2）最终我们得到的结构方程模型如下图所示。图中， f1表示潜变量家庭状况，f2表示潜变量学生抑郁。

image.png

（3）在结构方程模型中，一般用矩形表示显变量，用椭圆形表示潜变量。
（4）结构方程模型中的系数解释其实与传统线性模型类似，都可以反映某一变量增加1个单位所导致的另一变量的变化。

统计学（51）-结构方程模型

1、路径分析

2、验证性因子分析

3、验证性因子分析

4、因子载荷（Factor Loading）

5、结构方程模型

6、结构方程的一个例子

你可能感兴趣的:(统计学（51）-结构方程模型)