DIGIPUNK
去投稿

OpenAI内部测试两款新AI图像生成模型Hazelnut和Chestnut

OpenAI正在测试代号Hazelnut和Chestnut的AI图像模型,显示出加速视觉生成技术迭代进程。新模型在代码渲染和场景理解上有显著提升,但面部皮肤质感处理仍存在局限性。

2025年12月10日
百度秒哒集成谷歌Nano Banana Pro图像生成模型,提供零门槛调用

谷歌推出全新图像生成模型Nano Banana Pro,具备突破性生成控制力和文字渲染能力。百度秒哒在模型发布当天完成集成,用户无需API密钥即可直接调用该AI图像解决方案。

2025年11月25日
谷歌推出Nano Banana Pro文生图模型升级版,集成多模态与视频生成技术

谷歌发布Nano Banana Pro文生图模型升级版本,无缝整合Gemini 3 Pro多模态能力和Veo 3视频技术,实现复杂场景图像生成与跨语言文本渲染。新模型覆盖多层级用户生态,支持第三方工具集成,并通过SynthID水印技术强化安全验证。

2025年11月21日
Adobe MAX 2025发布Firefly Image 5等多款AI工具升级

Adobe推出新一代Firefly Image 5模型实现原生400万像素图像生成,大幅提升细节还原精度。Photoshop、Premiere Pro等全线工具新增AI功能,涵盖多模型切换、智能遮罩及多模态创作能力。

2025年10月29日
谷歌DeepMind推出Gemini 2.5 Flash Image图像模型

谷歌DeepMind正式推出Gemini 2.5 Flash Image图像模型,优化了速度与上下文理解,支持基于文本提示的精准编辑。该模型在LMArena基准测试中表现领先,提供安全机制,开发者可通过Gemini API等访问,输出定价为每百万token 30美元。

2025年08月27日
Meta与Midjourney达成合作,整合美学技术提升AI图像生成能力

社交媒体巨头Meta宣布与生成式AI实验室Midjourney签署合作协议,获得其美学技术授权以增强图像生成能力。此次合作旨在应对OpenAI和Google等竞争对手的挑战,同时推动Meta从封闭自研转向开放合作的战略转型。

2025年08月26日
昆仑万维开源多模态统一预训练模型Skywork UniPic

昆仑万维正式开源多模态统一预训练模型Skywork UniPic,在单一架构中融合图像理解、文本生成与图像编辑三大功能。该模型以1.5B参数实现多项SOTA性能,显著降低AI应用门槛。

2025年07月30日
谷歌发布Veo 2和Imagen 3,革新AI创作工具体验

谷歌推出了Veo 2视频生成模型和Imagen 3图像生成模型,均达到了当前领域的最先进水平,为创作者提供了更高质量的创作体验。Veo 2的4K视频生成和精准艺术控制,以及Imagen 3在图像创作上的突破,标志着谷歌在AI创作工具领域的领导地位进一步巩固。

2024年12月19日