Synth Daily

AI助力OldNYC新增1万张照片

历史照片浏览器 OldNYC 迎来重大更新:通过引入 OpenAI 的 GPT 模型OpenStreetMap 开源生态,该项目在过去两年内成功增补了 1 万张历史照片,并大幅提升了地理定位与文字识别的准确性。这次重建不仅解决了许多历史地标因街道更名或消失而难以定位的难题,还通过技术迁移降低了运营成本,为公众提供了一个更精准、更流畅的纽约历史影像库。

AI 解决“消失的地标”定位难题

过去,OldNYC 主要依靠 Google Maps API 转换照片标题中的交叉路口信息。但许多 1930 年代的街道和路口在现代地图上早已消失,导致大量照片无法标注。

  • GPT-4o 深度解析: 现在的系统利用 AI 从照片的详细描述中提取地理线索。即使学校已经拆除、路口不再对应,AI 也能理解“某街道南侧”这类模糊描述,并提取出有效位置。
  • 整合历史街道数据: 结合纽约公共图书馆(NYPL)的历史地图数据,OldNYC 现在能准确定位 87% 的照片,其中 96% 的照片出现在了完全正确的历史位置上
  • 成果显著: 仅靠 GPT 的解析就找回了约 6,000 张此前无法定位的照片。

“AI 能够理解‘North 6th’指的是‘North 6th Street’,并能在忽略无关干扰词的同时提取关键路口。这种任务在以前极难处理,但现在的 AI 模型做得非常出色。”

识别精度大幅提升的 AI OCR

OldNYC 的照片背面通常带有打字机记录的文字描述。2015 年项目启动时,文字识别(OCR)是最难的技术环节,而现在 AI 让这一切变得简单。

  • 系统升级: 采用 gpt-4o-mini 重建了 OCR 系统。文字覆盖范围从 2.5 万张图片增加到了 3.2 万张
  • 更强的鲁棒性: 在处理特殊字体和低质量扫描件时,新系统的表现远超旧有的 OCR 方案。
  • 实践心得: 开发发现,直接给 AI 提供原始图像的效果最好;如果提供照片标题作为上下文,AI 反而容易产生“幻觉”去编造文字。

摆脱商业地图,转向开源生态

为了降低维护成本并提升自主性,OldNYC 将地图底层从 Google Maps 迁移到了 OpenStreetMap (OSM) 和 MapLibre。

  • 告别高额费用: 随着 Google Maps 计费模式的改变,作为一个兴趣项目,继续支付费用已不划算。转向开源架构让网站运行更省钱。
  • 更自由的定制: 现在的地图加载更流畅,缩放更顺滑。最重要的是,开发者可以自定义地图样式,剔除那些在 1930 年代尚不存在的高速公路和隧道,避免视觉上的违和感。

核心洞见与未来展望

  • 技术红利: 现代 AI 工具(如 OpenAI API)让曾经困扰开发者数年的技术瓶颈(如复杂的文本提取和模糊位置匹配)变得触手可及。
  • 数据挖掘: 未来计划利用 AI 进一步识别照片中的人物、建筑类型,并区分室内与室外场景。
  • 历史地图完善: 开发者正在向 OpenHistoricalMap 贡献数据,目标是构建一个完整的纽约历史街道网格,让历史影像的定位更加自动化。

对于普通用户而言,这意味着你现在可以在地图上看到更多曾经“失踪”的历史瞬间,且位置比以往任何时候都要精准。