Skip to main content Jethro Vanbrook's Blog

中介效应及其检验

本文介绍了中介效应的概念与检验方法,包括中介效应的多种定义、模型构建原则及检验步骤。

当两个变量相关时,可能的情况

  • A是B的因
  • B是A的因
  • A和B互为因果
  • 存在第三个变量同时影响A和B
  • A和B只有相关关系,没有因果关系
  • A是B的因,但是存在滞后效应,反之亦然
  • 由上面的几种简单情况任意组合而成的复杂模型

中介效应检验的原则

  • 构建模型并检验其显著性时,一定要有理论指导,而非纯数据驱动
  • 当预测变量之间存在共线性时,可能性有很多种,具体是哪一种一定要看理论指导,而非拼凑数据

做模型构建相关的研究时应该注意的点

  • 在收集关心的变量的数据的基础上,根据理论提前猜测可能导致关注的变量发生共变的第三变量,在收数据时注意一起收了
  • 如果事后进行数据分析的事后发现缺少关键变量的数据,那么应该结合理论在讨论部分论述

Mediation: 中介;Moderation: 调节

中介效应的定义

  • 文字定义:预测变量对结果变量的影响存在一条路径,即预测变量先影响中介变量,再通过中介变量来影响结果变量
  • 模型定义:在模型图中,只要某变量被其它变量预测,那么该变量就会存在预测误差
  • 公式定义:

为什么在上面的这个公式里面不存在常数项:因为一般情况下我们在构建模型之前都已经把数据标准化了,那么模型就一定过(预测变量平均数,结果变量平均数)这个点,因此就没有截距

术语解释

  • X-M-Y:间接效应
  • X-Y:直接效应
  • 完全中介效应:只有一条间接效应路径存在
  • 部分中介效应:除了存在一条间接效应路径,还存在直接效应、其他的间接效应或二者都有。真实情况是部分中介更常见。
  • 没有中介效应:不存在任何间接效应路径

中介效应检验的步骤

  1. 先检验间接效应,确定是否存在中介效应
  2. 在存在中介效应的基础上检验直接效应,确定是部分中介还是完全中介
  3. 在中介模型的建立中,模型中存在多少个变量被预测,就有多少个回归模型,需要挨个检验每个模型是否显著,先检验每个模型整体的显著性,再检验模型中每个预测变量的斜率的显著性,最终得出结论

中介效应检验中的掩蔽效应

如存在“X-M-Y“和”X-Y“的大小相等,符号相反,那么直接测量X和Y之间的关系就是不相关的,但是实际上存在部分中介效应,只不过间接效应和直接效应抵消了。

为什么在中介模型中”X-Y“这条路径的系数要写成 c’ 就是因为省略了对X和Y之间的相关的检验(这条路径的系数是 c )

协方差分析的优缺点

  • 优点:能够更好地控制无关变量,提高模型内部效度
  • 缺点:降低统计效力,结果更难显著

中介效应检验可能存在错误累加的问题

这是因为中介效应检验至少都要进行两次检验,那么每次检验都可能犯一类错误或二类错误,所以就会存在两种错误的累加问题。

但是我们更关注二类错误累加的问题,因为我们进行中介效应检验是有研究的前提假设的,研究者一般比较确信模型是存在的,才回去收集数据并统计分析,所以对于犯一类错误而言,犯二类错误是研究者更不希望看到的。

由于二类错误累加的问题,这就会导致统计效力下降,所以中介效应检验是会导致统计效力下降的,更难检测出本应该存在的效应。

四种一次性进行中介效应检验的方法

为了实现一次性完成中介效应检验,避免统计效力降低的问题,可以直接检验间接路径上的两个斜率的乘积是否为零,若不为零则说明存在间接路径。

  1. \(\hat{a}\hat{b}\) 法:假设两个斜率的预测值是两个正态分布的变量的乘积,从而得到二者的抽样分布
  2. 马尔科夫链-蒙特卡洛法 MCMC
  3. Sobel 法:假设两个斜率的乘积是正态分布的,从而得到二者的抽样分布
  4. Bootstrap 法:一种非参数检验方法。它要求大样本,且检验结果可能不稳定