Synth Daily

DeepSeek:关于这款AI聊天机器人应用你需要知道的一切

一家名为 DeepSeek 的中国人工智能实验室凭借其高效的 AI 模型迅速崛起,其聊天机器人应用一度登顶应用商店榜首。这一成功不仅引发了外界对美国在 AI 领域领先地位的质疑,也动摇了对 AI 芯片持续需求的预期。DeepSeek 由一家量化对冲基金创立,尽管面临硬件限制,但它通过创新的技术和颠覆性的低价策略,在行业内引发了巨大震动,并招致了来自竞争对手和美国政府的严格审查。

起源与背景

DeepSeek 的背后是一家名为 High-Flyer Capital Management 的中国量化对冲基金,该基金利用 AI 进行交易决策。

  • 创立背景: High-Flyer 于 2023 年成立了 DeepSeek 实验室,专注于 AI 工具的研究,随后该实验室独立为公司。
  • 硬件挑战: 尽管 DeepSeek 自建了数据中心,但受到了美国硬件出口禁令的影响,不得不使用性能较弱的 Nvidia H800 芯片进行模型训练。
  • 团队构成: 团队以年轻人才为主,积极从中国顶尖大学招募博士研究员,并聘请非计算机背景的人员以拓宽模型的知识范围。

强大的AI模型

DeepSeek 通过一系列高性能模型迅速在行业内建立声誉,尤其是在效率和成本方面表现突出。

  • DeepSeek-V2: 该模型因其在基准测试中的优异表现和 极低的运行成本 而备受关注,迫使字节跳动和阿里巴巴等国内竞争对手降价甚至免费提供其模型。
  • DeepSeek-V3: 根据其内部测试,V3 模型的性能优于 Meta 的 Llama 甚至是 OpenAI 的 GPT-4o
  • R1 “推理”模型: 这是一个关键创新,该模型能进行事实核查,从而在物理、科学和数学等领域提供更可靠的答案,尽管响应速度稍慢。

值得注意的是,作为在中国开发的 AI,其模型内容受到监管,会回避有关天安门广场或台湾自治等敏感问题。

颠覆性的商业模式

DeepSeek 的商业模式尚不明确,其策略对市场造成了巨大冲击。

  • 定价策略: 公司以 远低于市场价甚至免费 的方式提供其产品和服务。DeepSeek 声称这是通过技术效率突破实现的,但一些专家对此表示怀疑。
  • 开发者友好: 尽管其模型并非完全开源,但提供了 宽松的商业使用许可,这使其在开发者社区中广受欢迎。Hugging Face 首席执行官透露,开发者已基于 R1 模型创建了超过 500 个衍生模型。

行业震动与未来展望

DeepSeek 的成功引发了行业巨头的警惕和政府的审查,其未来充满不确定性。

  • 市场影响: 它的崛起被认为是导致 英伟达股价下跌 的部分原因,并引起了 OpenAI 首席执行官 Sam Altman 的公开回应。
  • 竞争与审查:
    • OpenAI 将 DeepSeek 描述为 “国家补贴”和“国家控制” 的产物,并建议美国政府考虑禁用其模型。
    • 微软总裁 Brad Smith 表示,出于数据安全和宣传方面的担忧,微软员工不被允许使用 DeepSeek。
  • 政府禁令: 美国商务部、韩国及纽约州政府已禁止在政府设备上使用 DeepSeek。

尽管 DeepSeek 仍在不断改进其模型,但它正面临来自美国政府日益增长的警惕和审查。其未来的发展道路,将在技术创新和地缘政治的博弈中展开。