因果关系不等于变化

经济学中的因果关系研究擅长识别变量间的特定效应,但这些效应往往只能解释结果中极小部分的变动。为了精确推断因果,研究者通过固定效应、控制变量等方法剔除了大量数据,但这导致我们对经济增长、收入差异和市场波动等宏观现象的整体理解变得片面。因此,在肯定因果推断重要性的同时,我们必须结合常识、历史事实和宏观视角,才能更全面地解答重大的经济问题。

因果关系不等于变化。这个问题应该和“相关性不等于因果关系”一样,成为我们常用的经济学格言。

“X 的变化是否导致 Y 的变化?”这个问题,并不能回答“Y 的变化最重要的原因是什么?”。许多被识别出的因果效应只能解释微不足道的变异,而人们却常常忽略了这一点。

    • 教育与工资:多读一年大学或在更好的社区长大可能会提高工资,但这只能解释个人间工资差异的极小部分。
    • 最低工资与就业:最低工资对就业的影响微乎其微,绝大部分的就业差异是由其他更重要的因素驱动的。
    • 需求冲击与股价:需求冲击确实能影响股价,但它同样只占股价日常波动的极小部分。

因果关系革命的得与失

经济学的“因果关系革命”极大地改进了实证研究,帮助我们从简单的相关性分析中摆脱出来,去探究变量之间真正的因果联系。这就像我们知道“富人开保时捷,不等于开保时捷能让你变富”一样,识别因果关系至关重要。

为了做到这一点,研究者努力寻找数据中一小部分可被视为“外生”的、类似于实验室随机实验的变化。通过分析这部分微小变化之间的关联,我们可以识别出 X 对 Y 的因果效应。这种方法非常有效,但代价是我们主动忽略了 Y 的绝大部分变化,而这些变化可能由其他更主要的因素所驱动。

如何“丢弃”数据变异

为了寻找纯净的因果关系,经济学家们使用多种方法来剔除数据中的“噪音”和“混杂”变异。

    • 固定效应 (Fixed Effects):这种方法关注一个变量在特定单位(如一个州)内部随时间的变化,或在特定时间点上跨单位的变化,从而忽略了州与州之间或时间与时间之间的整体差异。
    • 控制变量 (Controls):研究者在模型中加入其他可能影响结果的变量。例如,在研究饮酒与癌症的关系时,需要控制“吸烟”这个变量,因为饮酒者通常也吸烟。这样做实际上是在考察“不吸烟的那部分饮酒者”的效应,再次缩小了分析范围。但滥用控制变量可能破坏因果解释,比如在分析教育对工资的影响时,如果控制了“行业”,就等于排除了教育帮助人们进入高薪行业这一重要途径。
    • 工具变量 (Instruments):为了解决相关性不等于因果性的问题,研究者会找到一个与结果无关、但与原因变量相关的“工具变量”,然后只利用原因变量中能被这个工具变量所预测的部分。这同样意味着丢弃了大量与工具变量无关的数据变异

这些技术在追求因果推断的精确性上取得了巨大成功,但也让我们付出了代价:我们对现象的整体理解变得越来越狭窄。

宏观经济学与金融市场的启示

在宏观经济学和金融领域,这个问题尤为突出。

即使你可以识别出买卖压力确实会影响价格,这并不意味着大部分价格波动都源于买卖压力。

    • 股价波动:研究发现,1% 的非预期股票抛售可能导致股价下跌 1-2%。但股票价格每天都在波动,其幅度远超这种“价格压力”所能解释的范围。财报发布、市场整体下跌等因素都会导致股价剧烈变动,而这些变动背后甚至不需要任何交易行为。
    • 货币政策:宏观经济学家早已认识到,只有“意外”的加息才会构成真正的货币政策冲击。但市场通常能很好地预测利率变化,导致真正的“冲击”少之又少。因此,被识别出的货币政策冲击几乎无法解释价格、产出和就业的实际波动。

结论:超越单一因果框架

因果推断非常重要,但它不是全部。我们仍然需要回答那些关于经济增长、贫富差距、商业周期的宏大问题。仅仅依赖精确但狭隘的因果识别是远远不够的。

有时,一些宽泛的事实和基本常识,比精密的计量模型更能揭示真相。

我们需要一种更综合的分析方法,它应该包含:

    • 对历史事实的审视:例如,通过观察德国恶性通货膨胀的终结,我们可以了解无痛控制通胀的可能性,这比上千个计量模型更有说服力。
    • 对基本事实的思考:例如,罗伯特·卢卡斯提出“为什么资本不流向穷国?”,这个问题本身就激发了对增长理论的深刻反思。
    • 常识与判断力:有些结论需要通过思考和判断来得出,而不是仅仅依赖于一个可以发表的 F 检验结果。

最终,我们需要将严谨的因果识别与更广阔的视野结合起来,才能真正理解我们所生活的复杂经济世界。