Synth Daily

互联网正在为机器重建

传统的云基础设施是为行为稳定、可预测的人类用户设计的,但随着人工智能(AI)代理的兴起,这一切正在改变。AI代理的工作模式是瞬时、爆发性的,这要求基础设施能够快速响应并按需伸缩。为此,行业正在进行一场重构,核心思路是将计算与存储分离,允许系统在任务激增时瞬间扩容,在闲置时缩减至零,从而大幅降低成本。这不仅是AWS等巨头的技术更新,更预示着整个互联网的底层逻辑正转向优先适配机器流量。

为何需要变革:人类与机器的根本差异

云基础设施长期以来都是围绕人类的稳定使用模式构建的,例如搜索、点击和观看流媒体。但AI代理的行为模式完全不同。

  • 爆发性活动: AI代理可以在几秒钟内激活数百个子任务,同时查询数据库、搜索文档和调用API。
  • 瞬时性: 它们来得快,去得也快,活动呈现出极端的波峰和波谷。
  • 不可预测性: 传统的系统无法预知代理任务何时会突然涌入。

“它们(AI代理)会在毫无征兆的情况下流量激增,也会在不经意间转入闲置。企业需要的是一种能够跟上节奏,又不必为闲置计算资源付费的搜索服务。”

现有的基础设施并非为此类工作负载而设计,强行使用会导致效率低下和成本高昂,因为企业必须时刻为可能出现的流量高峰预留并支付计算资源,即使这些资源在大部分时间里都是空闲的。

解决方案:解耦计算与存储

为了应对这一挑战,AWS 推出了新一代的 OpenSearch Serverless 服务,其核心技术变革在于 将计算与存储解耦

这个改变带来了关键优势:

  • 即时扩容: 当AI代理触发任务时,计算资源可以在几秒钟内迅速扩展,以应对流量爆发。
  • 缩减至零: 当代理闲置时,计算资源可以完全缩减到零。
  • 成本效益: 用户只需为实际使用的计算资源付费,彻底告别了为闲置资源买单的模式。

这就像过去你总要为一个固定的停车位付费,无论你是否停车。而现在,你只需在你停车时按时计费。

一场全行业的重构

亚马逊的举动并非个例,这反映了整个科技行业正在发生的深刻转变。越来越多的公司意识到,为人类设计的互联网基础设施在AI代理日益增多的世界里已力不从心。

  • Databricks 和 Snowflake: 正在将自己重新定位为面向企业数据的AI记忆和检索系统。
  • 微软 Azure: 推出了旨在处理AI代理流量爆发的更新。
  • Cloudflare: 也在近期推出了旨在为AI代理提供持久化环境和即时可扩展性的基础设施。

未来展望:机器流量将超越人类

目前,AI代理产生的流量占比仍然较小,但机器生成的总流量已相当可观,并注定会继续增长。Cloudflare 的数据显示,在过去六个月中,机器人流量占总 HTTP 流量的 31%。

行业预测指出:“非人类流量将在 2027年上半年 的某个时候超过人类流量。”

随着谷歌等公司允许用户将更多日常任务(如购物研究、预订旅行)委托给AI,以及企业在内部和面向客户部署更多代理,机器之间的自主通信将成为常态。这场围绕AI代理的基础设施重构,将使代理的部署和运行变得更便宜、更容易,从而进一步加速一个由机器主导的互联网时代的到来。