速度与创意的完美结合:Gemini 2.5 Flash Image 登场
Gemini 2.5 Flash Image(又称 Nano Banana)现已在 Gemini API 中提供!这款原生图片生成模型在速度、灵活性和上下文理解方面经过专门优化,为快速创意工作流程而生。作为预览版模型,它可能会在稳定前发生变化,并且有更严格的速率限制。
性价比与性能的黄金平衡
Gemini 2.5 Flash Image 提供了价格、性能和广泛功能的完美平衡。标准版本适用于需要快速、经济高效且推理能力强的通用任务,而图像预览版本则专为创意工作流程升级,具备图像生成和对话式多轮编辑功能。
从文字到视觉的魔法转换
Gemini 可以通过对话方式生成和处理图片,提供前所未有的视觉内容控制力。其核心功能包括:根据文本描述生成高质量图片、使用文本提示编辑现有图片、多图合成和风格迁移、通过对话逐步优化图片,以及高保真文本渲染能力,特别适合徽标、图表和海报设计。
DeepMind 团队的又一力作
这款火爆全网的 Nano Banana 来自 Google DeepMind 团队,标志着图片编辑领域的新王者诞生。作为科技巨头 Google 旗下的 AI 研究机构,DeepMind 再次展示了其在生成式 AI 领域的领先实力。
专业提示指南:释放创意潜能
使用 Gemini 2.5 Flash Image 时,描述场景比简单列出关键词效果更好。对于逼真场景,使用摄影术语;风格化插图需明确风格和调色板;产品摄影适用于电商需求;而简约设计则适合营销材料背景。编辑图像时,明确修改意图和区域是关键。
透明定价:按需付费
Gemini 2.5 Flash Image 的定价策略清晰透明:免费层级不可用,付费层级输入价格为每 100 万个令牌$0.30(文本/图片),输出价格为每张图片$0.039。最大输出图片尺寸为 1024x1024 像素,每张消耗 1290 个 token。
"数智朋克" 点评
Gemini 2.5 Flash Image 代表了 Google 在生成式 AI 领域的重要布局,特别是在图像生成和编辑方面。其突出的速度优势和经济高效的定价策略,使其成为创意专业人士和开发者的有力工具。多轮对话编辑功能展现了 AI 理解复杂创意需求的能力,而高保真文本渲染则解决了行业痛点。作为预览版,虽然存在一定限制,但其技术路线已显示出巨大潜力。Google DeepMind 团队再次证明了自己在 AI 创新方面的领先地位,Nano Banana 有望成为 AI 图像生成领域的新标杆。