DIGIPUNK
去投稿
发表于:2 days ago

阶跃星辰推出 19B 参数 Step1X-Edit 图像编辑模型,实现多模态技术突破

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
核心要点👉
  • 💡 19B参数量突破多模态图像处理技术
  • 🔍 三项核心技术:语义解析、身份保持、区域控制
  • 🚀 GEdit-Bench测试显示性能达SOTA水平
  • 🛠️ 支持电商人像处理与工业设计预览等场景
  • ⚙️ 建议企业用户采用80GB显存GPU部署

数智朋克获悉,阶跃星辰正式推出通用图像编辑模型Step1X-Edit,以19B参数量实现多模态图像处理技术的突破性迭代。该模型通过语义精准解析身份特征保持区域级控制三项核心技术,支持用户完成文字替换、人像精修、风格迁移等11类高频编辑任务,现已在阶跃AI应用端及网页平台开放免费使用。

基于自研GEdit-Bench测试集的验证数据显示,Step1X-Edit在语义一致性图像重构质量等维度超越当前主流开源方案,其综合性能指标达到SOTA水平,与GPT-4o及Gemini 2.0 Flash形成技术对标。开发者可通过主流技术社区获取开源代码,企业级用户建议采用80GB显存GPU进行云端部署以释放最佳生成效果。

区别于传统图像编辑工具,该模型支持自然语言驱动的多任务协同处理,无需预设模板即可解析复杂组合指令。在电商人像处理场景中,系统可保持主体身份特征稳定性,同时实现局部区域的材质替换与色彩调整。对于跨模态的文字重构需求,引擎通过像素级控制确保修改区域与整体视觉风格的融合度,在工业设计预览、动态海报生成等领域展现独特优势。

本文链接: https://www.shuzhipunk.com/articles/RR0uglfZHcr
转载请注明文章出处

文章所属标签
Step1X-Edit
多模态图像处理
GEdit-Bench