中介效应及其检验
本文介绍了中介效应的概念与检验方法,包括中介效应的多种定义、模型构建原则及检验步骤。
当两个变量相关时,可能的情况
- A是B的因
- B是A的因
- A和B互为因果
- 存在第三个变量同时影响A和B
- A和B只有相关关系,没有因果关系
- A是B的因,但是存在滞后效应,反之亦然
- 由上面的几种简单情况任意组合而成的复杂模型
中介效应检验的原则
- 构建模型并检验其显著性时,一定要有理论指导,而非纯数据驱动
- 当预测变量之间存在共线性时,可能性有很多种,具体是哪一种一定要看理论指导,而非拼凑数据
做模型构建相关的研究时应该注意的点
- 在收集关心的变量的数据的基础上,根据理论提前猜测可能导致关注的变量发生共变的第三变量,在收数据时注意一起收了
- 如果事后进行数据分析的事后发现缺少关键变量的数据,那么应该结合理论在讨论部分论述
Mediation: 中介;Moderation: 调节
中介效应的定义
- 文字定义:预测变量对结果变量的影响存在一条路径,即预测变量先影响中介变量,再通过中介变量来影响结果变量
- 模型定义:在模型图中,只要某变量被其它变量预测,那么该变量就会存在预测误差
- 公式定义:
为什么在上面的这个公式里面不存在常数项:因为一般情况下我们在构建模型之前都已经把数据标准化了,那么模型就一定过(预测变量平均数,结果变量平均数)这个点,因此就没有截距
术语解释
- X-M-Y:间接效应
- X-Y:直接效应
- 完全中介效应:只有一条间接效应路径存在
- 部分中介效应:除了存在一条间接效应路径,还存在直接效应、其他的间接效应或二者都有。真实情况是部分中介更常见。
- 没有中介效应:不存在任何间接效应路径
中介效应检验的步骤
- 先检验间接效应,确定是否存在中介效应
- 在存在中介效应的基础上检验直接效应,确定是部分中介还是完全中介
- 在中介模型的建立中,模型中存在多少个变量被预测,就有多少个回归模型,需要挨个检验每个模型是否显著,先检验每个模型整体的显著性,再检验模型中每个预测变量的斜率的显著性,最终得出结论
中介效应检验中的掩蔽效应
如存在“X-M-Y“和”X-Y“的大小相等,符号相反,那么直接测量X和Y之间的关系就是不相关的,但是实际上存在部分中介效应,只不过间接效应和直接效应抵消了。
为什么在中介模型中”X-Y“这条路径的系数要写成 c’ 就是因为省略了对X和Y之间的相关的检验(这条路径的系数是 c )
协方差分析的优缺点
- 优点:能够更好地控制无关变量,提高模型内部效度
- 缺点:降低统计效力,结果更难显著
中介效应检验可能存在错误累加的问题
这是因为中介效应检验至少都要进行两次检验,那么每次检验都可能犯一类错误或二类错误,所以就会存在两种错误的累加问题。
但是我们更关注二类错误累加的问题,因为我们进行中介效应检验是有研究的前提假设的,研究者一般比较确信模型是存在的,才回去收集数据并统计分析,所以对于犯一类错误而言,犯二类错误是研究者更不希望看到的。
由于二类错误累加的问题,这就会导致统计效力下降,所以中介效应检验是会导致统计效力下降的,更难检测出本应该存在的效应。
四种一次性进行中介效应检验的方法
为了实现一次性完成中介效应检验,避免统计效力降低的问题,可以直接检验间接路径上的两个斜率的乘积是否为零,若不为零则说明存在间接路径。
- \(\hat{a}\hat{b}\) 法:假设两个斜率的预测值是两个正态分布的变量的乘积,从而得到二者的抽样分布
- 马尔科夫链-蒙特卡洛法 MCMC
- Sobel 法:假设两个斜率的乘积是正态分布的,从而得到二者的抽样分布
- Bootstrap 法:一种非参数检验方法。它要求大样本,且检验结果可能不稳定