FLUX.2 [Klein]：迈向交互式视觉智能

FLUX.2 [klein] 是一系列高速、紧凑的图像模型，能够在一个统一的架构中完成图像的生成与编辑。其核心优势在于低于 0.5 秒的推理速度，并且能在拥有 13GB 显存的消费级 GPU 上运行，旨在实现实时交互式的视觉智能。该系列包含不同规模和授权方式的模型，包括高性能的 9B 版本和完全开源的 4B 版本，以满足从专业开发到本地部署的各种需求。

核心特性

FLUX.2 [klein] 的设计目标是让视觉生成能够跟上 AI 智能体的步伐，实现实时响应、快速迭代和高效运行。

亚秒级推理： 在现代硬件上，生成或编辑一张图片的时间低于 0.5 秒。
统一架构： 在单个模型中集成了文本生成图像 (T2I)、图像编辑 (I2I) 和多图像参考功能。
消费级硬件支持： 4B 模型仅需约 13GB 显存即可运行，适配 RTX 3090/4070 及以上级别的显卡。
高质量输出： 能够生成照片级真实感和高多样性的图像，性能媲美尺寸远大于它的模型。
开发者友好： 提供 API 接口和完整的模型权重，4B 模型采用 Apache 2.0 开源协议，便于定制和微调。

这些模型在文本到图像生成、图像编辑和多参考生成方面提供了卓越的性能，而这些功能通常是为更大的模型保留的。

模型系列详解

FLUX.2 [klein] 提供多种版本以适应不同场景。

FLUX.2 [klein] 9B

这是该系列中的旗舰小型模型，在质量和延迟之间取得了极佳的平衡。

性能强大： 效果媲美或超越尺寸为其 5 倍的模型。
功能全面： 支持文本生成、单图编辑和多图参考，可用于混合概念或迭代复杂构图。
授权方式： FLUX Non-Commercial License。

FLUX.2 [klein] 4B

这是最易于上手的模型，专为本地开发和边缘部署而设计。

完全开源： 采用 Apache 2.0 协议。
硬件友好： 可在 RTX 3090/4070 等消费级 GPU 上流畅运行。
功能不减： 支持 T2I、I2I 和多参考生成，性能远超其尺寸。

Base 基础模型 (9B / 4B)

这些是未经蒸馏的原始模型，保留了完整的训练信号，提供了最大的灵活性。

用途： 非常适合微调、LoRA 训练、研究以及需要更多控制的自定义流程。
特点： 输出的多样性高于经过蒸馏的版本。
授权方式： 4B Base 采用 Apache 2.0，9B Base 采用 FLUX NCL。

量化版本：更小、更快

为了进一步降低硬件门槛，所有 [klein] 模型都提供了与英伟达合作开发的量化版本，可在 RTX GPU 上实现优化推理。

FP8 量化： 速度提升最高 1.6 倍，显存占用减少最高 40%。
NVFP4 量化： 速度提升最高 2.7 倍，显存占用减少最高 55%。

迈向交互式视觉智能

FLUX.2 [klein] 不仅仅是一个更快的模型，它代表了迈向交互式视觉智能愿景的一步。未来属于那些拥有能够实时观察、创造和迭代的 AI 工具的创作者和开发者。

这类系统将催生全新的应用类别：实时设计工具、智能体视觉推理、交互式内容创作等。