FLUX.2 [klein] 是一系列高速、紧凑的图像模型,能够在一个统一的架构中完成图像的生成与编辑。其核心优势在于低于 0.5 秒的推理速度,并且能在拥有 13GB 显存的消费级 GPU 上运行,旨在实现实时交互式的视觉智能。该系列包含不同规模和授权方式的模型,包括高性能的 9B 版本和完全开源的 4B 版本,以满足从专业开发到本地部署的各种需求。
核心特性
FLUX.2 [klein] 的设计目标是让视觉生成能够跟上 AI 智能体的步伐,实现实时响应、快速迭代和高效运行。
- 亚秒级推理: 在现代硬件上,生成或编辑一张图片的时间低于 0.5 秒。
- 统一架构: 在单个模型中集成了文本生成图像 (T2I)、图像编辑 (I2I) 和多图像参考功能。
- 消费级硬件支持: 4B 模型仅需约 13GB 显存即可运行,适配 RTX 3090/4070 及以上级别的显卡。
- 高质量输出: 能够生成照片级真实感和高多样性的图像,性能媲美尺寸远大于它的模型。
- 开发者友好: 提供 API 接口和完整的模型权重,4B 模型采用 Apache 2.0 开源协议,便于定制和微调。
这些模型在文本到图像生成、图像编辑和多参考生成方面提供了卓越的性能,而这些功能通常是为更大的模型保留的。
模型系列详解
FLUX.2 [klein] 提供多种版本以适应不同场景。
FLUX.2 [klein] 9B
这是该系列中的旗舰小型模型,在质量和延迟之间取得了极佳的平衡。
- 性能强大: 效果媲美或超越尺寸为其 5 倍的模型。
- 功能全面: 支持文本生成、单图编辑和多图参考,可用于混合概念或迭代复杂构图。
- 授权方式: FLUX Non-Commercial License。
FLUX.2 [klein] 4B
这是最易于上手的模型,专为本地开发和边缘部署而设计。
- 完全开源: 采用 Apache 2.0 协议。
- 硬件友好: 可在 RTX 3090/4070 等消费级 GPU 上流畅运行。
- 功能不减: 支持 T2I、I2I 和多参考生成,性能远超其尺寸。
Base 基础模型 (9B / 4B)
这些是未经蒸馏的原始模型,保留了完整的训练信号,提供了最大的灵活性。
- 用途: 非常适合微调、LoRA 训练、研究以及需要更多控制的自定义流程。
- 特点: 输出的多样性高于经过蒸馏的版本。
- 授权方式: 4B Base 采用 Apache 2.0,9B Base 采用 FLUX NCL。
量化版本:更小、更快
为了进一步降低硬件门槛,所有 [klein] 模型都提供了与英伟达合作开发的量化版本,可在 RTX GPU 上实现优化推理。
- FP8 量化: 速度提升最高 1.6 倍,显存占用减少最高 40%。
- NVFP4 量化: 速度提升最高 2.7 倍,显存占用减少最高 55%。
迈向交互式视觉智能
FLUX.2 [klein] 不仅仅是一个更快的模型,它代表了迈向交互式视觉智能愿景的一步。未来属于那些拥有能够实时观察、创造和迭代的 AI 工具的创作者和开发者。
这类系统将催生全新的应用类别:实时设计工具、智能体视觉推理、交互式内容创作等。