DIGIPUNK
去投稿

谷歌DeepMind推出Gemini 2.5 Flash Image图像模型

谷歌DeepMind正式推出Gemini 2.5 Flash Image图像模型,优化了速度与上下文理解,支持基于文本提示的精准编辑。该模型在LMArena基准测试中表现领先,提供安全机制,开发者可通过Gemini API等访问,输出定价为每百万token 30美元。

2025年08月27日
阿里通义千问推出图像编辑模型Qwen-Image-Edit,实现像素级精准控制

阿里通义千问团队推出基于20B参数的Qwen-Image-Edit模型,通过双通道架构实现语义与外观双重控制,在公开基准测试中展现当前最优性能。尽管国内厂商加速布局多模态领域,但技术仍面临表征复杂度与空间推理能力等关键挑战。

2025年08月20日
Midjourney即将推出7.0版本,并开发新图像编辑器与3D系统

Midjourney创始人David Holz近日在Discord活动中透露,7.0版本将在未来1-2个月内发布,此外公司正在开发新图像编辑器与3D系统。Holz还表示,Midjourney正致力于提升现有技术的易用性,并计划涉足视频生成领域。

2024年09月13日