优化

一位学者首次使用名为 Refine 的 AI 工具来评审其关于通货膨胀的学术草稿，发现其反馈质量极高，堪比顶尖的人类同行评审，且更加简洁、有条理。该 AI 不仅能精准总结核心论点，还能指出逻辑漏洞、数学错误和表述不清之处，显著提升了稿件质量。作者由此得出结论，AI 将彻底改变学术评审流程，大幅提高效率与准确性，并已成为日常科研工作中不可或缺的助手。

首次体验：AI评审工具Refine

作者最近试用了由 Yann Calvó López 和 Ben Golub 开发的学术文章润色 AI 工具 Refine。仅仅免费试用一次后，其结果就令人震惊。

该 AI 提供的评论质量堪比我整个学术生涯中收到的最优秀的同行评审，甚至比最好的那些还要简洁和有条理。

AI 不仅精准地总结了一篇 80 页论文的核心论点，还指出了多个关键问题，其分析能力已经超越了“魔法”般的程度。

AI指出的核心问题

Refine 针对论文草稿提出了几项深刻的批评，促使作者重新审视其论证和表述。

逻辑循环风险：论文的核心观点是，通胀始于2021年初市场意识到政府赤字不会被偿还，并终于2022年中期市场预期转变。AI 指出，这种论证有循环论证的风险，因为它用通胀的发生来反推债务“无支持”，缺乏独立的、可观测的外部证据。AI 建议将“新闻”与具体的日期、立法事件或言论挂钩，以使论证更严谨。
理论完备性声明不清晰：论文声称其理论是“完整的”，但又承认其方程式与标准的新凯恩斯（NK）模型相同。AI 指出，这里的关键分歧不在于方程式本身，而在于财政机制的假设——即价格是由财政主导（FTPL），还是未来的财政盈余由价格决定（NK）。AI 建议更清晰地阐明这一点，而不是简单地宣称 NK 模型“行不通”。
传导机制描述模糊：论文中关于加息影响的描述存在矛盾。一方面，加息通过降低现有债券的名义价值来抑制通胀；另一方面，加息又会通过贴现率或利息成本增加财政负担，从而推高通胀。AI 指出这种“踩到耙子”的效应需要被澄清，并明确区分央行单独行动的效果和需要财政配合的情况。
对货币主义的论证不足：论文试图通过对比量化宽松（QE）和直升机撒钱的效果来反驳货币主义。但 AI 指出，作者忽略了“准备金利息”（IOR）存在下的一个更复杂的货币主义观点——即在这种情况下，准备金和短期国债几乎是完美的替代品，使得 QE 变得中性。AI 认为，要让论证有说服力，必须反驳最强的版本，而不仅仅是一个简化的版本。

此外，该程序还发现了一些代数错误，例如一个微分方程解中的负号错误。

AI对学术评审的颠覆性影响

这次经历让作者确信，AI 将从根本上改变学术界。

评审质量大幅提升：AI 提供的报告质量远超多数人类审稿人，能准确抓住论文要点并评估论证的有效性。
效率显著提高：过去耗时且令人不快的审稿工作将变得更快、更准确。作者认为，期刊编辑未来应要求作者提交 AI 的评审报告，这将节省所有人的时间。

在我给别人评论论文之前，我会先问：“你用 refine 跑过了吗？”

稿件质量改善：AI 的辅助将帮助作者写出更严谨、更清晰的论文，从而节省读者的时间。

另一个AI助手：Claude

作者还尝试使用另一个 AI 工具 Claude 来自动生成数据图表。通过详细的文字描述，Claude 编写的程序可以直接运行，并在 5 分钟内完成了原本需要一小时的工作，甚至还主动提供了摘要统计数据。

这表明，AI 已经成为日常科研工作中强大的助手。如果你还没有开始使用这些工具，现在就是最好的时机。