非洲的情况比你想象的还要糟

用于衡量各国教育水平的现有数据，尤其是通过“拼接”不同地区考试成绩得出的国际可比分数，存在严重缺陷。这种方法显著高估了法语非洲国家的教育表现，从而误导了人们对教育与经济增长关系的判断。尽管印度的教育水平也不尽如人意，但并未差到与撒哈拉以南非洲相当。事实上，撒哈拉以南非洲的真实学习成果更低，其经济增长前景也因此更为黯淡。

衡量教育水平的难题

人们普遍认为教育对一个国家的经济前景至关重要。早期的研究，如 Mankiw, Romer, and Weil (1992) 的成果，试图将人力资本作为生产要素加入增长模型。他们发现教育能很好地解释增长，但他们使用的数据非常粗糙，仅为中学入学率。

后来的研究改用“受教育年限”，但这同样不够精确。

学校的意义在于学习知识。在校时间相同，学术成果可能天差地别。衡量一个国家技能水平的理想方法是直接测量技能本身。

统一全球考试的尝试

不幸的是，并非所有国家都参加相同的考试。经济合作与发展组织（OECD）赞助的 PISA 是国际可比测试的黄金标准，但许多国家并未参与。

印度的案例： 印度仅在 2009 年参加过一次 PISA 测试，结果惨败，排名仅高于吉尔吉斯斯坦。这次“国家尴尬”导致印度退出了此后所有的国际测试。
非洲的缺席： 几乎所有非洲国家都从未参加过 PISA。它们使用区域性测试，如法语国家的 PASEC 和英语国家的 SACHEM。

“拼接”数据的致命缺陷

为了解决数据缺失问题，研究者 Patrinos 和 Angrist (2019) 尝试构建一套“协调学习成果”（Harmonized Learning Outcomes）。其核心方法是寻找那些参加过多种不同测试的“中介国家”（doubloon countries），利用它们的相对表现来换算不同考试体系的分数。

这个过程在实践中极其复杂且不可靠。以加蓬为例，为了将其 2014 年的 PASEC 成绩与国际标准对齐：

首先通过多哥，将其分数从 2014 年换算回 2006 年。
然后通过毛里求斯，将 PASEC 成绩转换为 SACHEM 成绩。
最后通过博茨瓦纳，将其与类似于 PISA 的 TIMSS 考试关联起来。

这种方法的问题远不止是噪音。毛里求斯虽然法语通用，但教学语言是英语。如果该国学生在英语测试中的表现优于法语测试，那么所有法语非洲国家的换算分数都将被系统性地高估。

有什么可能的共同因素，会导致塞内加尔的表现超过冈比亚，布基纳法索和科特迪瓦超过加纳，喀麦隆超过尼日利亚？如果你严肃看待这个数据，你会认为加蓬的表现不仅超过了印度，甚至还超过了中国和大多数东欧国家。

这种方法的荒谬之处在于，当塞内加尔实际参加一个简化版的 PISA-D 测试时，其标准化分数为 304，比通过上述方法“换算”出的 412 分低了整整一个标准差。分数越低，测试就越无法区分学生的真实水平，接近于随机猜测。

错误的结论与悲观的前景

这种通过脆弱联系进行国别换算的方法并无用处。更好的方式是直接让同一组学生参与多种测试，从而直接比较。

这项分析揭示了一个关键事实：撒哈拉以南非洲的教育成果比你想象的要糟糕得多。印度虽然表现不佳，但撒哈拉以南非洲的情况更为严峻。这种数据扭曲通过两个渠道影响了我们对教育与经济关系的判断：

高估非洲的教育水平会人为拉低教育对经济增长影响的回归曲线斜率。
测量数据中的纯粹噪音本身也会压低普通最小二乘法回归的斜率。

这使得我们对非洲的未来不得不更加悲观。

我对撒哈拉以南非洲的增长前景持非常悲观的看法。我不认为我们可以期望它们像东亚奇迹或后苏联国家那样，实现持续的增长起飞。我认为，它们仍然受到地理的长期困扰。