CNDD前沿文献速递 | 因果推断经验研究中的中介效应与调节效应

分析因果关系作用渠道的出发点是，现象之间的因果关系可能包含多个逻辑环节，原因不是直接作用于结果，因此，有必要考察原因通过因果链条中的哪个或哪些中间变量影响结果，这样的分析经常被称作中介效应( Mediating Effect) 分析。而分析因果关系作用机制的出发点是，一种因果关系可能不会同一不变地作用于所有个体和所有时点，因此，有必要考察因果关系的强度如何随着对象特征和现实条件的不同而产生差异，这样的分析经常被称作调节效应 ( Moderating Effect) 分析。中介效应分析与调节效应分析是国内经济学因果推断经验研究中被广泛采用的两种研究手段，但是存在不同程度的误用。前者的主要问题在于过度使用中介效应逐步法检验，后者的主要问题是对其在因果识别中的作用阐发不足。为此，本期分享的文章深入讨论了中介效应检验的偏误、如何正确开展中介效应分析，以及如何使用调节效应分析来强化因果关系论证，并针对当前的使用现状提出了相应的操作建议。

01 文献简介

▪ 文献来源： 江艇.因果推断经验研究中的中介效应与调节效应[J].中国工业经济,2022,No.410(05):100-120.

▪ 关键词：因果推断; 中介效应; 调节效应

▪ 内容简介：文章共八个部分，第一部分为引言，第二、三部分是预备知识，其中，第二部分简要介绍了何为因果推断以及因果识别的两种基本策略，第三部分介绍了中介效应分析的逐步法检验与调节效应分析的交互项模型; 第四至六部分是本文的主体，其中，第四部分主要讨论中介效应逐步法检验的偏误问题，第五部分着重讨论如何开展科学的中介效应分析，第六部分转向调节效应分析，讨论其与异质性分析以及因果识别的关系; 第七部分概括了这两种方法在国内经济学研究中的应用现状，并给出相应的操作建议; 第八部分作简短总结。

▪ CNDD常用中介变量数据推荐：

CNDD-0042 上市公司融资约束数据（FC、KZ、WW指数）及学术论文应用

02 因果识别的基本策略

▪ 因果识别的定义

Y 表示研究所关注的结果(Outcome) 、反应( Ｒesponse) 或被解释变量， D 表示有待考察的、导致结果发生的原因(Cause) 、处理( Treatment) 或核心解释变量。图1展示了三种基本因果模型。模型 I 刻画了基本因果关系。模型 II 表明，这种相关性可能是因为存在第三方混淆因素( Confounding Factor) 同时影响 D 和 Y。模型 III 则表明，这种相关性可能是因为 Y 对 D 的反向影响( Ｒeverse Causality) 。

如果在特定的研究情境下，变量之间满足一定的假设条件，使得一个特定的因果模型没有与之竞争的、观测上等价 ( Observationally Equivalent) 的因果模型，则称这个特定的因果模型被识别，这样的假设被称作识别假设。

▪ 因果识别的策略

因果识别有两种基本策略。第一种基本识别策略是寻找特定的研究情境。识别的基本逻辑是如果相关性不存在，则因果性不存在; 如果相关性存在且只有一种因果模型可以合理化这种相关性，则这种特定的因果性存在。

第二种基本识别策略———挖掘因果模型更丰富的、可验证的相关性含义( Testable Implications) ，即提出这样的问题: 如果从 D 到 Y 的因果关系真的存在，那么还将观测到何种现象? 不同的因果模型对新的相关性可能给出不同的预测，由此通过打破其在观测上的等价性来达到用数据验证模型的目的。

03 中介效应分析的现行做法、反思与操作建议

▪ 中介效应分析的现行做法

中介效应是指原因通过一个或几个中间变量影响结果，这种中间变量被称作中介变量（Mediating Factor，或简称 Mediator) 。一组因果关系及其作用渠道可以用如下结构模型来刻画:

其中，Y 是结果变量，D 是处理变量，M 是中介变量。(1) 式表示 D 对 Y 有因果影响; (3) 式表示 D 对 M 有因果影响; (2) 式一方面表示 M 对 Y 有因果影响，从而建立起了 D→M→Y 的因果链条，另一方面表示在 M 之外，D 还可能独立影响 Y。这组关系可以用图 3 直观展示。

Baron and Kenny(1986) 提出了一整套检验流程。他们认为，中介效应的存在需要满足四个条件: ① α1不为零; ② γ1不为零; ③ β2 不为零; ④ β1为零，或至少其绝对值小于 α1。相应地，整个检验流程由四个先后步骤组成: ① 估计(1) 式，统计上显著的 α1 意味着存在可以“被中介”的效应; ②估计 (3) 式，统计上显著的 γ1 意味着处理影响了中介; ③估计(2) 式，统计上显著的 β2 意味着中介影响了结果; ④如果 β1 在统计上不显著，则意味着 M 是 D 与 Y 关系的“完全中介”，否则意味着 M 是 “部分中介”。这一方法也被称为逐步法( Causal Steps Approach) 。

▪ 对中介效应分析的反思

假定 D 是一种随机处理，即 E( εY1D) = 0 和 E( εMD) = 0 成立，因此，(1) 式和(3) 式的普通最小二乘估计分别能够得到 α1 和 γ1 的一致估计:

在(2) 式的普通最小二乘估计中，根据 Frisch-Waugh-Lovell 定理，有:

其中，第二个等号用到 Cov( εM，D) = 0 以及 Cov( M，εM ) = Var( εM ) 。将( 3) 式代入(2) 式，有:

可知 α0 = β0 + β2γ0，α1 = β1 + β2γ1，εY1 = εY2 + β2εM。特别地，有:

因此，只有当

即不存在同时影响 M 和 Y 的不可观测因素、不存在从 Y 到 M 的反向因果，且 M 不存在测量误差时，简言之，只有当 M 也可以外生随机干预时，β1 和 β2 的普通最小二乘估计才是一致的。总之，如果处理是随机的但中介不是随机的，那么通过估计( 1) 式可以得到处理对结果的因果效应，通过估计( 3) 式可以得到处理对中介的因果效应，但(2) 式的最小二乘估计是不可靠的，无法得到处理对结果的直接因果效应( β1 ) ，也无法得到中介对结果的因果效应( β2 ) ，从而无法得到处理对结果的间接因果效应( β2γ1 ) 。

对图 3 稍作补全，就很好理解上述结论了。当进行中介效应检验时，隐含的关于数据生成过程的假设如图 7(a) 所示，但真实的数据生成过程很可能如图 7(b) 所示。Robins and Greenland( 1992) 在鲁宾因果模型( Ｒubin’s Causal Model) 框架下证明，仅有随机处理，无法识别直接效应和间接效应; 即使没有延滞效应( Carryover Effect) 的交叉试验( Crossover Trial) 是可行的，也无法识别; 只有当研究者可以对中介变量进行外生干预时，才有可能识别。

在以处理观测性数据为主的经济学因果推断研究中，研究者面临着更富有挑战性的处境: 真实的数据生成过程很可能如图 7(c) 所示。此时处理变量的生成方式不再来自于研究者外生的实验干预，而来自于研究对象的主动选择，因此，研究者在研究设计上的努力主要聚焦在如何解决处理变量的内生性问题，中介变量的内生性问题不得不成为等而次之的问题。或者说，解决处理变量的内生性并探究其对结果的影响，同解决中介变量的内生性并探究其对结果的影响，应该成为两项独立研究各自的主题，以确保每项研究都聚焦在一个核心解释变量上。除非能够从理论上证明并不存在同时影响中介变量和结果变量的混淆因素，或者能够良好地定义、充分地穷举和准确地测度这些混淆因素并且方便地将其作为控制变量放入(2) 式中，否则这种回归并不能产生任何增进我们理解 D→M→Y 这一因果链条的有益知识。

▪ 中介效应分析的操作建议

上文的讨论表明，中介效应检验的适用前提是，识别 D 对 M 和 Y 的因果关系比较容易，同时识别 M 对 Y 的因果关系也比较容易。而对于观测性数据研究，真实的数据生成过程纷繁复杂，找到合适的研究情境来研究 D 对 Y 的因果关系已属不易，研究中介效应更是困难，这就是为什么中介效应检验历来在经济学经验研究文献中很少见的主要原因。

中介效应检验不可靠，并不意味着不研究因果关系的作用渠道。一种常见的做法是，提出一个或几个中介变量 M，这些变量和 Y 的因果关系在理论上比较直观，在逻辑和时空关系上都比较接近，以至于不必采用正式的因果推断手段来研究从 M 到 Y 的因果关系; 然后仅看 D 对 M 的影响，即只考察 ( 1) 式和( 3) 式，而不考察( 2) 式，从而避免正式区分出在间接效应之外是否还有无法解释的直接效应。

关于中介效应分析，文章提出以下操作建议: 一是停止使用中介效应的逐步法检验，更不需要估计间接效应的大小并检验其统计显著性。把研究的重心重新聚焦到如何提高 D 对 Y 的因果关系的识别可信度。二是根据经济学理论，提出一个或几个能够反映 D 对 Y 的作用渠道的中介变量 M， M 对 Y 的影响应该是直接而显然的，采用和第一条中同样的方法识别 D 对 M 的因果关系。三是尽避免提出与 Y 的因果关系不明显、因果链条过长或者明显受到 Y 反向影响的中介变量。有时，考察 Y 对 M 的回归也许是有益的，但要记住这只是一条相关性证据。四是在绝大多数时候，做好前两条就足够了。如果要考察 D 对 Y 的效应在多大程度上可以被 M 这一作用渠道所捕捉，可以尝试在 Y 对 D 的回归中控制 M，但必须先弄清楚这种考察对理解 D 对 Y 的因果关系有何帮助，并审慎解释回归结果。如有可能，尽量论证这一结果受到 M 的潜在内生性的影响是有限的。当存在多个 M 时，尤其要谨慎采用这种做法。

04 调节效应分析的先行做法、认识与操作建议

▪ 调节效应分析的现行做法

调节效应是指原因对结果的影响强度会因个体特征或环境条件而异，这种特征或条件被称作调节变量 ( Moderating Factor，或简称 Moderator) ，如图 5 所示。交互项模型是对调节效应进行建模的主要方式。

调节效应存在四种常见的处理情形，具体如下：

（1）两个处理变量的情形。构成交互项的两个解释变量都是核心解释变量:

两个核心解释变量对 Y 的边际效应分别为:

此时，较少说两个核心解释变量互为调节，而是说该模型适用于考察两个变量对 Y 影响的互补性( β3 ＞ 0) 或替代性( β3 ＜ 0) 。

(2) 一个处理变量的情形。在大多数时候，一项因果推断研究只关注一个处理变量，仍记作 D，将调节变量记作 M，则有:

此时称 D 对 Y 的因果影响受到 M 的调节: 如果 β3 ＞ 0，则 D 对 Y 的正面影响随着 M 的增大增强( 或负面影响随着 M 的增大而减弱) ; 如果 β3 ＜ 0，则 D 对 Y 的正面影响随着 M 的增大而减弱 (或负面影响随着 M 的增大而增强) 。

如果 β3 在统计上显著，则称观测到了显著的调节效应。但 β1 的大小和统计显著性是否具有经济意义，要视具体的研究情境而定，因为此时 β1 的含义是当 M = 0 时 D 对 Y 的因果效应。很有可能当 M = 0 时 D 对 Y 影响不显著，才是符合理论预期的。

除了报告系数的估计结果之外，通常还会根据需要，报告因果效应的一个或几个估计值(以及标准误、置信区间、显著性检验的 p 值等) 。如图 6 所示。在这个示意图中，β1 ＜ 0，β3 ＞ 0，实线表示因果效应的估计值，虚线表示给定置信水平的置信区间。当 M ＜ m2 时，D 对 Y 的因果效应是负向的; 当 M ＜ m1 时，这种负向效应在统计上显著; 当 M ＞ m2 时，D 对 Y 的因果效应是正向的; 当 M ＞ m3 时，这种正向效应在统计上显著。

(3) 调节变量为虚拟变量的情形。当调节变量 M 为虚拟变量时，还可以把交互项模型等价地理解为分组回归:

换言之，分组回归下 D 对 Y 的因果效应的组间异质性可以通过交互项模型来检验，即表现为交互项 M × D 系数估计的统计显著性。这种检验总是有必要的，因为组间异质性不能诉诸于直观判断。例如，D 对 Y 的因果效应在 M = 0 组是不显著的，在 M = 1 组是显著的，但它们之间的差异很可能是不显著的。

有时为方便展示结果，对(8) 式进行如下等价变换:

此时 γ2 和 γ3 分别是 M = 1 组和 M = 0 组的 D 对 Y 的因果效应。

因此，当调节变量为虚拟变量时，有三种呈现结果的方式。第一种是报告( 8) 式的结果，这种方式的好处是直接显示了 D 对 Y 的因果效应的组间异质性，缺陷是 M = 1 组的因果效应没有直接显示。第二种是分组报告(12) 式的结果，这种方式的好处是直接显示了这两个组的因果效应，缺陷是因果效应的组间异质性检验还需要额外通过( 8) 式来实现。第三种是报告(13) 式的结果，这种方式的好处也是直接显示了这两个组的因果效应，因果效应的组间差异虽然没有直接显示，但是可以便地通过检验 H0 ∶ γ2 = γ3 来实现。

(4) 处理变量和调节变量均为虚拟变量的情形。当处理变量 D 和调节变量 M 均为虚拟变量时，交互项系数有一种方便的理解: 处理组( D = 1) 与控制组( D = 0) 的结果均值的组间差异之差异，简称双重差分( Difference in Differences) 。对于(8) 式，易知:

例如，Y 表示工资水平，D 表示是否上大学，M 表示是否为男性，则 β3 表示男性的上大学回报率与女性的上大学回报率的差异。特别地，当 D 为处理实施后的虚拟变量，M 为是否最终接受处理的虚拟变量，这种特殊的调节效应模型就是双重差分模型。反过来说，无论 D 和 M 是离散变量还是连续变量，无论其变动性是截面维度还是时间维度，交互项系数都应该在双重差分的意义下去理解。这里涉及的一个具体问题是，如何在双重差分的意义下表述交互项系数的经济含义。当 D 和 M 均为虚拟变量时，含义的表述比较方便: β3 表示处理的实施对结果的影响。当 M 为连续变量时，意味着所有个体都接受了处理，只是处理的强度( Treatment Intensity) 有所不同，此时含义可以表述为: 当 M 增加一个标准差 σM 时，处理的实施对结果的影响会提高 σM·β3。当 D 和 M 均为连续变量时，表述尤其需要小心。Rajan and Zingales( 1998) 使用跨国行业层面数据研究金融市场的发展是否影响产业增长。D 为反映一国金融发展水平的指标，M 为反映某一行业外部融资依存度的指标， Y 为该国该行业增加值的增长率。β3 ＞ 0，表明更加依赖于外部融资的行业，在金融市场发展水平越高的国家增长得更快。研究结果的经济含义是: 在样本中，典型的高外部融资依存行业是 M 居于 75 分位的机床业，典型的低外部融资依存行业是 M 居于 25 分位的饮料业，典型的高金融发展水平国家是 D 居于 75 分位的意大利，典型的低金融发展水平国家是 D 居于 25 分位的菲律宾，因此，相较于菲律宾，在意大利机床业的增长比饮料业要快 β ^ 3 ·( M75 －M25 )·( D75 －D25 ) ，然后将这一数字与 Y 的样本均值进行比较，表明其足够大以至不可忽略。

▪ 对调节效应分析的正确认识

1. 调节效应分析和异质性分析

调节效应分析和异质性分析这两者是一回事。最简单的理解: 当调节变量 M 是虚拟变量时，相当于把全样本分为 M = 0 和M = 1两个组，交互项 M × D 的系数就是分组进行的 Y 对 D 的回归中 D 的系数的组间异质性。当 M 是连续变量时，本质上并没有发生变化，D 对 Y 的因果效应受到 M 的调节，也就是可以理解为，D 对 Y 的因果效应在高 M 组和低 M 组之间存在异质性。

2. 通过调节效应分析论证因果关系

如果从统计上发现了 D 与 Y 的相关性，并且想要主张 D 是 Y 的原因，那么可以通过检验 D 影响 Y 的某个具体机制来对从 D 到 Y 的因果关系进行论证。论证的逻辑如下: ①提出一个 D 影响 Y 的理论 T。根据这个理论，D 通过某个机制影响 Y，并且可以识别出这一机制在某些子总体中存在，在另一些子总体中不存在，令 M = 1 表示存在这一机制，M = 0 表示不存在这一机制。在 M = 1 组，发现 D 与 Y 的相关性继续存在，而在 M = 0 组，D 与 Y 的相关性不复存在。可能导致 D 与 Y 出现相关性的竞争性解释还包括 Y 影响 D 的反向因果理论R，或者有混淆因素同时影响 D 和 Y 的遗漏变量理论 C。如果无法想象理论Ｒ或理论 C 发挥作用的机制在 M = 1 和 M = 0 组存在差异，则理论 R 或理论 C 很可能不成立。否则，应该在 M = 0 组也观察到 D 与 Y 的相关性。这样就完成了因果关系的强论证。这一逻辑的总结见表 1。

有时两组中 D 与 Y 的相关性都存在，但在 M = 1 组这种相关性更强，表现在 Y 对 D 的回归中 D 的系数估计绝对值在 M = 1 组更大，且组间差异在统计上显著。这时至少可以说，D 与 Y 的相关性不全是理论 R 或理论 C 所带来的，否则这种相关性应该在 M = 1 和 M = 0 组无差异。这样尽管没有证伪理论 R 或理论 C，但至少证实了理论 T，也在因果论证上迈出了一大步。这一弱论证的逻辑可以通过对表 1 稍作修改来总结，如表 2 所示。

举例来讲，在 Rajan and Zingales(1998) 中，金融发展水平( D) 与经济增长( Y) 强相关，试图证明金融发展是经济增长的原因，并检验了金融发展通过缓解企业的外部融资约束来促进企业成长( 理论 T) 。将行业分成两组，一组是外部融资依存度较高的行业( M = 1) ，另一组是外部融资依存度较低的行业( M = 0) ，发现在对行业增长的回归中，金融发展水平与外部融资依存度的交互项显著，表明金融发展水平与行业增长之间的相关性在外部融资依存度不同的组间存在显著差异。金融与增长之间的相关性可能是因为增长影响金融，高增长引发了融资需求从而导致金融市场发展( 理论 R) ，也可能是因为某个混淆因素( 如节俭传统) 同时影响金融发展和经济增长( 理论 C) ，那么除非理论 R 和理论 C 在外部融资依存度不同的组间发挥作用的程度不同，否则就证明了理论 T。

3. 好的调节变量

好的调节变量本身应该比较稳定，或者其变动是外生的，不受处理变量或结果变量的影响。

在 Rajan and Zingales( 1998) 中，调节变量“外部融资依存度”的定义是企业资本性支出中的外部融资占比( 再取行业中位数) 。这个变量本身是资金市场上供求均衡的结果，高外部融资占比既可能反映行业需求面的技术特征( 是否依赖外部融资) ，也可能反映金融市场发展水平的供给特征( 外部资金是否充裕) ，因此不适合用一国一行业的实际外部融资占比作为调节变量。他们的做法是，考虑到美国的金融市场发展相对完善( 资金供给具有充分弹性) ，美国企业的实际外部融资占比可能更多反映的是企业的资金需求，因此，可以用这个指标在美国各行业的取值作为其他国家相应行业的外部融资依存度指标( 同时将美国从估计样本中剔除) 。

图 10 反映了如果用各国各行业外部融资占比的实际数字作为调节变量将会产生的估计偏误。图中，圆圈内数字 1 和 2 为低外部融资依存行业，3 和 4 为高外部融资依存行业，细实线反映这两类行业在低金融发展水平国家和高金融发展水平国家间的增长差异，细虚线表示用低外部融资依存行业的实际差异所推测的高外部融资依存行业( 假若没有从金融发展中受益) 的反事实差异，因此，细实线和细虚线之间的距离就是金融影响增长的真实因果效应。如果用各国各行业的实际外部融资占比作为分组依据，行业 3 本来是高外部融资依存行业，但由于在低金融发展水平国家中实际外部融资占比较低，被错误地归为低外部融资依存行业，此时低外部融资依存行业在两类国家间的增长差异就体现为粗实线，由此推测的高外部融资依存行业的反事实差异体现为粗虚线，这样就会高估金融对增长的因果效应。

▪ 调节效应分析的操作建议

关于调节效应分析，文章提出如下操作建议: 一是将因果关系的作用机制检验视为因果识别的重要手段，尽量正式地讨论其如何有助于强化对文章主题( 从 D 到 Y 的因果关系) 的论证。二是在研究设计部分详细阐述调节变量与调节效应的理论依据，而不是等到报告实证结果时再附会解释。三是直观地展示调节效应，讨论其数值大小在经济上的重要性。四是如果以处理效应的异质性本身作为研究目的，明确说明这种异质性的经济意义———读者为什么要关心这种异质性。五是提高统计规范性，对异质性进行正式的统计检验。六是将对作用机制和作用渠道的讨论进行严格区分，不宜安排在同一章节下，明确其不同的写作目的。

往期已推送数据

CNDD 已推送数据列表及业务介绍

CNDD 全国各地区儒家文化变量数据合集

CNDD 中国上市公司创新变量数据合集（全网最全）

CNDD 中国银行业数据合集

CNDD 中国债券市场研究数据合集

1. 除中国深度数据库（CNDD）特殊声明外，CNDD对基于合法来源的数据的选择、整理和编排具有独创性。任何自然人、法人、其他组织未经CNDD授权，不得以任何目的截取、上传、下载、复制、修改、使用、编译等或者以任何方式任何媒介传播上述作品的任何部分，否则视为侵权。

2. 对于存在侵害CNDD上述权利违法行为的主体，CNDD保留依法追究其法律责任的权利。

数据授权使用说明 …

任何使用CNDD数据等产品的单位和个人，承诺只将CNDD的数据等用于学术研究，并在所得研究成果（包括但不限于学术论文、咨询报告等）中注明数据来源于CNDD。数据来源的注明方式请参考：“本研究数据来源于中国深度数据库CNDD”；英文参考：“We get the data from CNDeepData (CNDD)”。

中国深度数据库：让精品数据得以流动

CNDeepData：Let high-quality data flow without barriers

部分图片来源于网络，如涉侵权请告知，本站将第一时间删除。客服微信号：DeepData001

发表评论 取消回复

发表评论取消回复