AI模型离不开虚拟机

为了应对当前 AI 应用在安全性、隐私性、可扩展性和可移植性方面日益增长的挑战，有必要为 AI 模型与软件系统之间的交互定义一个标准化的“AI 模型虚拟机”（MVM）规范。该规范借鉴了 Java 虚拟机（JVM）的成功经验，旨在将模型开发与系统集成逻辑解耦。通过提供内置的安全控制、资源管理和可验证的模型输出，MVM 有望实现 AI 模型的“一次编写，随处运行”，从而推动一个更安全、可靠且可互操作的 AI 生态系统。

为何需要 AI 模型虚拟机？

随着大型语言模型（LLM）能力的进化，调用模型的控制软件也变得越来越复杂。如今的 AI 软件系统需要具备操作系统级别的特性，包括 安全性、隔离性、可扩展性和可移植性。例如，当一个 AI 模型需要访问某个文件作为上下文时，必须有访问控制机制来判断模型是否有权查看该文件。

我们认为，现在是时候将 AI 模型嵌入软件的方式进行标准化，并将这层控制软件视为一种虚拟机。在这个虚拟机中，调用大语言模型本身就是一条核心指令。这种方法可以将模型开发与集成逻辑 彻底解耦，让任何模型都能“即插即用”到一个包含工具、安全控制和内存管理的丰富生态系统中。

MVM 的工作原理：一个实例

我们可以通过一个简单的交互流程来理解 MVM 的角色：

用户输入一个提示 (Prompt)。
MVM 将提示（通常会附加上下文、系统提示和聊天历史）发送给 AI 模型。
AI 模型生成一个需要调用特定工具的响应。这个响应遵循模型与 MVM 之间预先商定的格式，例如 模型上下文协议 (MCP)。
在执行之前，MVM 会首先 核对允许使用的工具列表，以进行安全检查。
只有在授权通过后，MVM 才会调用模型请求的工具。

这个检查步骤确保了模型不会进行未经授权的工具调用。本质上，MVM 在模型与外部世界之间扮演了一个 安全中介 的角色。

MVM 可能包含的指令集

一个标准化的 MVM 将支持一系列明确定义的操作，例如：

认证、加载、初始化和卸载 AI 模型。
在特定上下文中调用模型。
解析模型的输出。
认证、加载、初始化和卸载工具。
调用工具并解析其返回结果。
管理历史记录和内存。
向用户请求输入。

现有工作为 MVM 提供了基础

构建 MVM 并非从零开始，许多新兴的技术和协议已经为其关键组件奠定了基础：

结构化工具调用协议： OpenAI 的 JSON 函数调用 API 和插件系统展示了如何通过结构化协议来简化模型与代码的集成，减少模糊性。
模型上下文协议 (MCP)： 由 Anthropic 提出的 MCP 旨在成为连接 AI 助手与外部数据和工具的通用接口。

MCP 就像是 AI 应用的 USB-C 端口。它提供了一个通用的模式，而不是让每个服务都定制一套 AI 集成方案。
安全编排器 (FIDES & AC4A)： 这些研究项目展示了如何在运行时强制执行安全策略。例如，AC4A 采取了类似操作系统的访问控制方法，要求代理对所有资源（如文件和工具）明确请求读写权限，从而强制执行 最小权限原则。
开源代理运行时： LangChain、Semantic Kernel 等项目提供了通用的运行时服务，简化了 AI 应用的开发。而 AI 控制器接口 (AICI) 则允许开发者在更低的层级（例如逐个令牌）对模型行为进行脚本化和约束。

建立 MVM 规范的核心优势

一个定义明确的 MVM 规范将带来多重好处，解决当前 AI 软件工程面临的挑战。

关注点分离： MVM 强制将 模型逻辑 与 集成逻辑 分开。这意味着模型可以成为可互换的组件，开发者可以轻松替换新模型，而无需重构整个系统。
内置安全与治理： 通过将所有工具使用和外部访问都路由到一个标准接口，MVM 可以轻松地实施权限检查、审计日志和安全防护。即使模型行为不可预测，MVM 层也能 限制其潜在影响，为部署强大的 AI 系统提供一个更安全的环境。
透明的性能与资源追踪： MVM 规范可以提供运行时的诊断信息，例如模型性能、资源消耗和数据访问情况，帮助开发者评估系统的整体效率。
模型输出的可验证性： 基于 MVM 规范，可以探索使用零知识证明等形式化方法来验证模型行为的完整性，从而在 AI 系统中建立更高水平的信任和问责制。

结论

我们主张，行业需要一个定义明确的 AI 模型虚拟机规范。当前来自科技公司、初创企业和学术界的多项进展都表明，让 AI 模型安全、无缝地与外部世界互动的需求日益迫切。从简化开发、实现模块化升级到增强安全性和建立跨平台的 AI 生态系统，MVM 的潜在收益是巨大的。借鉴软件虚拟化的历史经验，一个标准的 MVM 规范将显著提升 AI 系统的 可移植性、互操作性、安全性和可靠性。