尽管在性能上不及 OpenAI 的 GPT-5 等顶尖模型,但由阿里巴巴开发的开源大语言模型 Qwen 凭借其开放性和易于定制的特点,正获得全球范围的广泛应用。与美国公司日益封闭的做法不同,中国企业积极分享技术细节,推动了 Qwen 在学术界和商业界的普及,吸引了从比亚迪到 Meta 的众多用户。这表明,一个 AI 模型的真正影响力,更多地体现在其现实世界的应用和生态系统的建设上,而非仅仅是狭隘的性能基准分数。
应用落地:Qwen 赋能智能设备
中国初创公司 Rokid 正在其开发的智能眼镜中集成 Qwen 模型。这项技术可以实现将中文实时翻译成英文,并直接显示在用户眼前的微型屏幕上。
除了实时翻译,Qwen 还能帮助 Rokid 眼镜的用户实现多种功能:
- 识别内置摄像头拍摄的产品
- 提供地图导航
- 起草消息和搜索网页
由于 Qwen 是一个开源且易于修改的模型,Rokid 可以下载并托管一个经过微调的版本,使其更适合自身产品的特定需求。此外,Qwen 的轻量版本甚至可以在智能手机等设备上离线运行,以备网络中断之需。
性能并非唯一标准
Qwen (通义千问) 并不是目前性能最强的 AI 模型。在衡量机器智能的各项基准测试中,OpenAI 的 GPT-5、谷歌的 Gemini 和 Anthropic 的 Claude 通常得分更高。然而,Qwen 和其他中国模型(如 DeepSeek、Moonshot AI 等)因其足够优秀且易于使用而日益普及。
根据 HuggingFace 平台的数据,中国开源模型的下载量已超过美国模型。Qwen 也迅速成为全球第二受欢迎的开源模型。这表明,对于许多实际应用场景而言,像 Qwen 这样规模适中的开源模型,其效果与托管在大型数据中心的“巨无霸”模型同样出色。
开放性:中国模式的核心优势
中国 AI 公司采取的开放策略与美国大型科技公司日益封闭的态度形成了鲜明对比。
- 中国模式: 倾向于公开发布论文,详细介绍新的工程技术和训练技巧,积极构建开放的生态系统。例如,Qwen 团队的一篇关于提升模型训练效率的论文在顶级 AI 会议 NeurIPS 上获得了奖项。
- 美国模式: 越来越倾向于保密,担心泄露知识产权。Meta 的 Llama 4 和 OpenAI 的 GPT-5 在发布后都曾因性能未达预期而让部分开发者失望,促使他们寻找其他替代方案。
“很多科学家正在使用 Qwen,因为它是最好的开源模型。” — Andy Konwinski, Laude Institute 联合创始人
全球采纳与真正的影响力
Qwen 的影响力已经超越了国界,被全球多家知名企业用于产品原型设计和功能开发,其中包括:
- 比亚迪 (BYD): 将 Qwen 集成到其新款电动汽车的仪表盘助手中。
- 美国公司: Airbnb、Perplexity 和英伟达 (Nvidia) 都在使用 Qwen。
- Meta: 据报道,这家曾经的开源模型先驱也在利用 Qwen 帮助开发其新模型。
美国一些 AI 公司过于专注于在数学、编码等狭窄的基准上获得微弱优势,而忽视了模型的实际影响力。
当基准测试不能代表真实世界的使用场景或正在解决的问题时,你最终会陷入一种疲惫且错位的模式。
最终,衡量一个 AI 模型成功与否的关键指标,除了它的“聪明”程度,更应是它被用于构建其他事物的广泛程度。按照这个标准,Qwen 和其他中国开源模型正在强势崛起。