DIGIPUNK
去投稿
海外按需付费

Gemini 2.5 Flash Image(又称Nano Banana):Google DeepMind 的 AI 图像生成新王者



速度与创意的完美结合:Gemini 2.5 Flash Image 登场

Gemini 2.5 Flash Image(又称 Nano Banana)现已在 Gemini API 中提供!这款原生图片生成模型在速度、灵活性和上下文理解方面经过专门优化,为快速创意工作流程而生。作为预览版模型,它可能会在稳定前发生变化,并且有更严格的速率限制。

性价比与性能的黄金平衡

Gemini 2.5 Flash Image 提供了价格、性能和广泛功能的完美平衡。标准版本适用于需要快速、经济高效且推理能力强的通用任务,而图像预览版本则专为创意工作流程升级,具备图像生成和对话式多轮编辑功能。

从文字到视觉的魔法转换

Gemini 可以通过对话方式生成和处理图片,提供前所未有的视觉内容控制力。其核心功能包括:根据文本描述生成高质量图片、使用文本提示编辑现有图片、多图合成和风格迁移、通过对话逐步优化图片,以及高保真文本渲染能力,特别适合徽标、图表和海报设计。

DeepMind 团队的又一力作

这款火爆全网的 Nano Banana 来自 Google DeepMind 团队,标志着图片编辑领域的新王者诞生。作为科技巨头 Google 旗下的 AI 研究机构,DeepMind 再次展示了其在生成式 AI 领域的领先实力。

专业提示指南:释放创意潜能

使用 Gemini 2.5 Flash Image 时,描述场景比简单列出关键词效果更好。对于逼真场景,使用摄影术语;风格化插图需明确风格和调色板;产品摄影适用于电商需求;而简约设计则适合营销材料背景。编辑图像时,明确修改意图和区域是关键。

透明定价:按需付费

Gemini 2.5 Flash Image 的定价策略清晰透明:免费层级不可用,付费层级输入价格为每 100 万个令牌$0.30(文本/图片),输出价格为每张图片$0.039。最大输出图片尺寸为 1024x1024 像素,每张消耗 1290 个 token。

"数智朋克" 点评

Gemini 2.5 Flash Image 代表了 Google 在生成式 AI 领域的重要布局,特别是在图像生成和编辑方面。其突出的速度优势和经济高效的定价策略,使其成为创意专业人士和开发者的有力工具。多轮对话编辑功能展现了 AI 理解复杂创意需求的能力,而高保真文本渲染则解决了行业痛点。作为预览版,虽然存在一定限制,但其技术路线已显示出巨大潜力。Google DeepMind 团队再次证明了自己在 AI 创新方面的领先地位,Nano Banana 有望成为 AI 图像生成领域的新标杆。

由数智朋克团队策划
发表于 19 hours ago

所属标签
NanoBanana
Gemini2.5FlashImage

本文链接: https://www.shuzhipunk.com/articles/seWJULLhSS7
转载请注明文章出处

Nano Banana
Google DeepMind 团队推出的 Gemini 2.5 Flash Image(Nano Banana)是一款快速、经济高效的 AI 图像生成模型,具备文本到图像生成、多轮对话编辑、风格迁移等强大功能,专为创意工作流程优化,定价透明。
1
篇内容持续更新