Mistral发布大模型环境影响报告
Mistral AI 发布了一项全面的研究,首次量化了其大型语言模型的环境足迹,涵盖了温室气体排放、水消耗和资源枯竭。该研究旨在提升人工智能行业的透明度,并呼吁建立全球环境标准,以帮助用户和政策制定者在选择和使用AI时做出更明智的决策,从而共同减轻这项技术对环境的影响。
为何要关注AI的环境足迹?
随着人工智能日益融入经济的各个层面,开发者、政策制定者、企业和普通公民都迫切需要了解这项变革性技术的环境成本。然而,目前行业缺乏透明度,导致用户和机构无法有效比较不同模型、做出明智的采购决策或履行企业的环境责任。
如果没有更高的透明度,公共机构、企业乃至用户将无法比较模型、做出明智的购买决策、履行企业的额外财务义务,或减少因使用人工智能而产生的影响。
Mistral AI 认为,价值链中的每一个参与者都应共同承担责任,以应对和减轻技术创新带来的环境影响。
首次全面的AI模型生命周期分析
Mistral AI 与可持续发展领域的领先咨询公司 Carbone 4 以及法国生态转型机构 (ADEME) 合作,对其AI模型进行了首次全面的生命周期分析 (LCA)。为确保研究的严谨性,该分析还经过了 Resilio 和 Hubblo 两家专业环境审计咨询公司的同行评审。
这项分析旨在量化开发和使用大型语言模型过程中的三类核心环境影响:
- 温室气体排放 (GHG)
- 水资源消耗
- 资源枯竭
关键数据披露
研究公布了两个对行业具有长期意义的重要指标,这些数据反映了生成式AI所涉及的巨大计算规模,包括在碳密集型电力地区和水资源紧张地区使用大量GPU,以及服务器制造等“上游排放”的影响。
模型训练的影响:以 Mistral Large 2 模型为例,截至2025年1月,经过18个月的使用,其训练阶段产生的总环境影响为:
- 温室气体排放:20,400 吨二氧化碳当量 (tCO₂e)
- 水资源消耗:281,000 立方米
- 资源枯竭:660 千克锑当量 (kg Sb eq)
模型推理的边际影响:以其AI助手 Le Chat 生成一个400词元(token)的回答为例,其边际影响(不含用户终端设备)为:
- 温室气体排放:1.14 克二氧化碳当量 (gCO₂e)
- 水资源消耗:45 毫升
- 资源枯竭:0.16 毫克锑当量 (mg Sb eq)
研究的启示与局限
这项研究的一个重要发现是,模型的规模与其环境足迹之间存在很强的相关性。基准测试表明,一个规模大10倍的模型,在生成相同数量的词元时,其产生的环境影响也会大一个数量级。这凸显了为特定用例选择合适规模模型的重要性。
Mistral 认为,为了全面理解和管理大型语言模型的环境影响,以下三个指标至关重要:
- 模型训练的绝对影响
- 模型推理的边际影响
- 总推理影响与总生命周期影响的比率
同时,研究也承认其局限性,例如在缺乏行业标准和公开可用影响因子的情况下,精确计算存在困难。特别是GPU的生命周期清单尚待建立,其隐含影响在总影响中占有重要部分,但目前只能进行估算。
迈向全球AI环境标准
研究结果指出了两个减少大型语言模型环境影响的关键方向:
提升透明度与可比性:AI公司应使用标准化的国际公认框架来公布其模型的环境影响。这可以促成一个评分系统的建立,帮助用户识别碳、水和材料密集度最低的模型。
鼓励用户侧的效率实践:
- 提升AI素养:帮助人们以最优化的方式使用生成式AI。
- 选择合适的模型:根据实际需求选择最适配的模型大小,避免“杀鸡用牛刀”。
- 整合查询:将多个请求分组处理,以限制不必要的计算。
对于公共机构而言,将模型规模和效率纳入采购标准,可以向市场发出一个强有力的积极信号。
最终,通过鼓励节制和高效的实践,并发布标准化的环境影响报告,整个行业可以共同努力,使AI的发展与全球气候目标保持一致。