OpenAI 发布了全新的 ChatGPT 图像功能,由旗舰模型 GPT Image 1.5 提供支持。此次更新的核心是实现了更精准的图片编辑能力和高达 4倍 的生成速度提升。新模型能够仅修改用户指定的区域,同时完好地保留原图的构图、光影等核心细节。此外,ChatGPT 还推出了一个专属的图像创作空间,内置多种滤镜和灵感提示,方便用户快速上手。该功能现已向所有用户和 API 开发者开放,尤其适用于营销、品牌设计和电商等领域。
精准编辑,保留细节
新模型在编辑图片时,能更可靠地理解并执行用户的意图。它只会修改你要求改变的部分,同时保持其他元素的连贯性,例如:
- 光线和构图: 保持整体氛围和结构不变。
- 人物外观: 在多次编辑中维持人物的一致性。
- 核心精髓: 无论是照片修复还是风格转换,都能保留原始图像的本质。
这项改进意味着 ChatGPT 可以成为你口袋里的创意工作室,既能完成实用的图片编辑,也能进行富有表现力的艺术再创作。
模型擅长执行多种编辑操作,确保你获得想要的效果,而不会丢失图像的特有魅力:
- 添加元素
- 移除元素
- 组合与融合
- 调换位置
更可靠的指令执行与创意转化
与旧版本相比,新模型能更准确地遵循指令。这使得用户可以进行更精细的修改,或创作出元素关系更复杂的原始构图。
在创意转化方面,模型同样表现出色。它可以为图片添加 文字和新的布局,将抽象想法变为现实,同时保留重要的图像细节。这些功能无需复杂的文字提示,通过新的创作空间内置的预设样式就能轻松尝试。
文本渲染能力升级
新模型在文本渲染方面也取得了进步,现在能够更好地处理 更密集、更小的文字。同时,它在其他方面也有所改善,例如可以更清晰地渲染画面中的多个小尺寸人脸,并让整体输出效果看起来更加自然。
专属的图像创作空间
除了通过文字描述生成图片,ChatGPT 还在侧边栏推出了一个全新的 专属图像创作空间。这个空间旨在让图像探索和创作变得更快速、更简单。
- 内置灵感: 提供数十种预设的滤镜和提示词,帮助用户快速启动创作。
- 持续更新: 内置的灵感库会定期更新,以反映最新的创作趋势。
商业应用与 API 接入
开发者现在可以通过 API 使用 GPT Image 1.5。它在商业应用中表现出色,尤其是在需要保持品牌视觉一致性的场景中:
- 营销与品牌工作: 在多次编辑中能更好地保留品牌 Logo 和关键视觉元素。
- 电商产品图: 电商团队可以基于一张源图,快速生成完整的产品图库,包括不同款式、场景和角度的图片。
这项新功能现已向全球所有 ChatGPT 用户和 API 用户推出,无需专门选择模型即可使用。