OpenAI正在测试代号Hazelnut和Chestnut的AI图像模型,显示出加速视觉生成技术迭代进程。新模型在代码渲染和场景理解上有显著提升,但面部皮肤质感处理仍存在局限性。
谷歌推出全新图像生成模型Nano Banana Pro,具备突破性生成控制力和文字渲染能力。百度秒哒在模型发布当天完成集成,用户无需API密钥即可直接调用该AI图像解决方案。
谷歌发布Nano Banana Pro文生图模型升级版本,无缝整合Gemini 3 Pro多模态能力和Veo 3视频技术,实现复杂场景图像生成与跨语言文本渲染。新模型覆盖多层级用户生态,支持第三方工具集成,并通过SynthID水印技术强化安全验证。
Adobe推出新一代Firefly Image 5模型实现原生400万像素图像生成,大幅提升细节还原精度。Photoshop、Premiere Pro等全线工具新增AI功能,涵盖多模型切换、智能遮罩及多模态创作能力。
谷歌DeepMind正式推出Gemini 2.5 Flash Image图像模型,优化了速度与上下文理解,支持基于文本提示的精准编辑。该模型在LMArena基准测试中表现领先,提供安全机制,开发者可通过Gemini API等访问,输出定价为每百万token 30美元。
社交媒体巨头Meta宣布与生成式AI实验室Midjourney签署合作协议,获得其美学技术授权以增强图像生成能力。此次合作旨在应对OpenAI和Google等竞争对手的挑战,同时推动Meta从封闭自研转向开放合作的战略转型。
昆仑万维正式开源多模态统一预训练模型Skywork UniPic,在单一架构中融合图像理解、文本生成与图像编辑三大功能。该模型以1.5B参数实现多项SOTA性能,显著降低AI应用门槛。
谷歌推出了Veo 2视频生成模型和Imagen 3图像生成模型,均达到了当前领域的最先进水平,为创作者提供了更高质量的创作体验。Veo 2的4K视频生成和精准艺术控制,以及Imagen 3在图像创作上的突破,标志着谷歌在AI创作工具领域的领导地位进一步巩固。