Synth Daily

GPT-5“研究小精灵”:搜索能力超强

GPT-5 可被用作一个强大且“胜任”的个人“研究小精灵”,它通过调用搜索工具和链式思考,能高效处理从简单好奇到复杂研究的各类任务。尤其在移动设备上,它能快速执行多步搜索、评估结果并提供深入的分析,其表现远超手动搜索。尽管功能强大,但使用者仍需保持批判性思维,理解其工作方式,才能最好地利用这个工具。

“研究小精灵”实战案例

以下是一些在手机上通过语音口述完成的实际搜索案例,展示了其多样化的能力。

希思罗机场的“弹性”传送带

希思罗机场曾经有那种很好玩的弹性橡胶传送带,现在是不是都换成金属的了?如果是,是什么时候换的?

在机场时,一个随口想到的问题。GPT-5 迅速展开研究,并将更换时间锁定在 2014-2018 年之间。更重要的是,它还找到了一篇关于旧金山国际机场类似弹性步道历史的有趣文章。

识别雷丁的建筑

识别这张在雷丁拍摄的建筑照片。

这是一个在火车上随手拍下的建筑。经过 1 分 04 秒的思考,它正确识别出这是“The Blade”大厦

英国星巴克的蛋糕棒

英国的星巴克不卖蛋糕棒!请深入调查一下。

起因是在一家车站星巴克买不到蛋糕棒。研究结果发现:

  • 星巴克确实于 2023 年 9 月在英国推出了蛋糕棒。
  • 但并非所有门店都有售,特别是像车站这样的特许经营地点
  • 它通过查阅星巴克官网上的营养与过敏原指南 PDF 文件,找到了蛋糕棒确实存在的确凿证据

维基百科与大英百科全书

有人说维基百科的成功是因为它复制了大英百科全书的内容。这是怎么回事?

这个说法源于一个网络论坛的讨论。AI 的调查澄清了事实:

  • 维基百科确实使用了 1911 年版《大英百科全书》(当时已不受版权保护)的内容。
  • 但这个内容填充项目发生在 2006 年,也就是维基百科在 2001 年启动五年之后,并非其“起步”的基础。

埃克塞特码头的洞穴历史

埃克塞特“On the waterfront”餐厅是不是挖在悬崖里的?研究一下这座建筑的历史,谁建的,为什么建,以及怎么建的。

在餐厅就餐时,注意到其内部结构像是嵌入了悬崖,由此产生了好奇。这次搜索充分体现了“研究小精灵”的执着。

  • 初步调查: AI 花了 2 分 40 秒确认,这些建筑确实是在 19 世纪 20-30 年代挖入红色砂岩悬崖而建成的。
  • 主动提议: AI 主动提出可以查找相关的历史英格兰条目,并将其“叠加在金库地图上”。
  • 深入挖掘与失败尝试: 它进行了大量额外搜索,找到了餐厅和仓库的经纬度坐标,并尝试用 Python 渲染地图,但结果并不理想。然而,这个过程揭示了它搜索了“埃克塞特码头金库地图 PDF”,这启发了下一个问题。
  • “阅读”PDF: 当被问及是否找到任何 PDF 图表时,它找到了两份 PDF 文件(一份规划文件和一份租赁手册),并指出其中没有想要的图表。这表明它能够理解 PDF 内部的文本和图像内容。
  • 最终建议: 它最终指出,详细的规划图可能存在于一份未在线发布的考古报告中,并建议联系德文郡遗产中心。

最令人印象深刻的是,它甚至主动提出可以代为起草一封请求档案的电子邮件。

主题:埃克塞特码头悬崖金库 – 请求提供平面/剖面图纸

你好,
我正在研究码头后面的悬崖开凿金库(On The Waterfront / Kings Wharf)。
能否提供这些金库的任何平面图/剖面图/图表的扫描件或副本...

Aldi 与 Lidl 的对比

在英国超市中,比较一下 Lidl 和 Aldi。

最初,AI 提供了长达十段的详细分析,包括市场份额、价格调查和会员计划。但这有些过于复杂。

当追问“我只想知道它们的基本感觉,比如哪个更高档一些?”时,它在 6 秒内给出了一个更直接的答案:

简而言之:两者都不是“高档”超市——都是平价折扣店——但 Lidl 感觉上稍微精致一点,而 Aldi 则更偏向于朴实无华。

GPT-5 搜索:一种胜任的感觉

使用 GPT-5 进行搜索,最贴切的感受是胜任。它处理各种问题的能力很少让人失望,而且效率远高于手动搜索,因为它能更快地执行和评估搜索结果。

  • 移动端优势: 在手机上就能完成深度研究,极大地扩展了随时满足好奇心的能力。
  • 核心技术: 它的强大之处在于将 工具调用 (tool calling)链式思考 (chain-of-thought) 完美结合。它能执行一次搜索,对结果进行推理,然后根据推理结果执行后续搜索。
  • 交错式思考: 这种在推理过程中穿插工具使用的能力,被称为 交错式思考 (interleaved thinking),是其高效的关键。

如何更好地使用搜索功能

  • 大胆尝试: 每当有好奇的想法时,就把它抛给 AI。即使是那些你认为它无法处理的问题,观察它的失败过程也能学到很多。
  • 使用提示词: 尝试加入“深入研究”之类的词语,这似乎能触发更彻底的搜索工作。
  • 提出开放性问题: 相比有唯一正确答案的问题,那些更宽泛、没有标准答案的问题(如超市排名)往往能带来更有趣的结果。

把它想象成一个“小精灵”:它非常勤奋,但并不完全值得信赖。你需要能够比它更聪明,才能有效地驾驭它。