Synth Daily

优化

一位学者首次使用名为 Refine 的 AI 工具来评审其关于通货膨胀的学术草稿,发现其反馈质量极高,堪比顶尖的人类同行评审,且更加简洁、有条理。该 AI 不仅能精准总结核心论点,还能指出逻辑漏洞、数学错误和表述不清之处,显著提升了稿件质量。作者由此得出结论,AI 将彻底改变学术评审流程,大幅提高效率与准确性,并已成为日常科研工作中不可或缺的助手。

首次体验:AI评审工具Refine

作者最近试用了由 Yann Calvó López 和 Ben Golub 开发的学术文章润色 AI 工具 Refine。仅仅免费试用一次后,其结果就令人震惊。

该 AI 提供的评论质量堪比我整个学术生涯中收到的最优秀的同行评审,甚至比最好的那些还要简洁和有条理。

AI 不仅精准地总结了一篇 80 页论文的核心论点,还指出了多个关键问题,其分析能力已经超越了“魔法”般的程度。

AI指出的核心问题

Refine 针对论文草稿提出了几项深刻的批评,促使作者重新审视其论证和表述。

  • 逻辑循环风险:论文的核心观点是,通胀始于2021年初市场意识到政府赤字不会被偿还,并终于2022年中期市场预期转变。AI 指出,这种论证有循环论证的风险,因为它用通胀的发生来反推债务“无支持”,缺乏独立的、可观测的外部证据。AI 建议将“新闻”与具体的日期、立法事件或言论挂钩,以使论证更严谨。

  • 理论完备性声明不清晰:论文声称其理论是“完整的”,但又承认其方程式与标准的新凯恩斯(NK)模型相同。AI 指出,这里的关键分歧不在于方程式本身,而在于财政机制的假设——即价格是由财政主导(FTPL),还是未来的财政盈余由价格决定(NK)。AI 建议更清晰地阐明这一点,而不是简单地宣称 NK 模型“行不通”。

  • 传导机制描述模糊:论文中关于加息影响的描述存在矛盾。一方面,加息通过降低现有债券的名义价值来抑制通胀;另一方面,加息又会通过贴现率或利息成本增加财政负担,从而推高通胀。AI 指出这种“踩到耙子”的效应需要被澄清,并明确区分央行单独行动的效果和需要财政配合的情况。

  • 对货币主义的论证不足:论文试图通过对比量化宽松(QE)和直升机撒钱的效果来反驳货币主义。但 AI 指出,作者忽略了“准备金利息”(IOR)存在下的一个更复杂的货币主义观点——即在这种情况下,准备金和短期国债几乎是完美的替代品,使得 QE 变得中性。AI 认为,要让论证有说服力,必须反驳最强的版本,而不仅仅是一个简化的版本。

此外,该程序还发现了一些代数错误,例如一个微分方程解中的负号错误。

AI对学术评审的颠覆性影响

这次经历让作者确信,AI 将从根本上改变学术界。

  • 评审质量大幅提升:AI 提供的报告质量远超多数人类审稿人,能准确抓住论文要点并评估论证的有效性。
  • 效率显著提高:过去耗时且令人不快的审稿工作将变得更快、更准确。作者认为,期刊编辑未来应要求作者提交 AI 的评审报告,这将节省所有人的时间。

在我给别人评论论文之前,我会先问:“你用 refine 跑过了吗?”

  • 稿件质量改善:AI 的辅助将帮助作者写出更严谨、更清晰的论文,从而节省读者的时间。

另一个AI助手:Claude

作者还尝试使用另一个 AI 工具 Claude 来自动生成数据图表。通过详细的文字描述,Claude 编写的程序可以直接运行,并在 5 分钟内完成了原本需要一小时的工作,甚至还主动提供了摘要统计数据。

这表明,AI 已经成为日常科研工作中强大的助手。如果你还没有开始使用这些工具,现在就是最好的时机