DIGIPUNK
去投稿
发表于:5 hours ago

智象未来荣获ACM国际多媒体会议最佳演示奖

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
核心要点👉
  • 🏆 智象未来荣获ACM国际多媒体会议最佳演示奖,成为首个中国团队获此殊荣
  • 💡 "灵感智能体"技术突破行业瓶颈,整合文本生成图像、图像编辑和视频生成功能
  • 🧠 核心170亿参数HiDream-I1模型采用DiT与MoE架构,国际基准测试表现卓越
  • 🚀 重新定义创作范式,将传统多工具协作压缩为"一次会话"闭环
  • 🌍 主办Identity-Preserving Video Generation挑战赛,吸引顶尖团队参与,体现全球影响力

数智朋克讯,爱尔兰都柏林会场掌声雷动,第33届ACM国际多媒体会议揭晓最佳演示奖得主——中国初创企业智象未来凭借多模态生成式AI技术首度摘得该奖项,成为首个获此殊荣的中国团队。ACM MM作为全球多媒体领域权威学术盛会,其最佳演示奖代表学界对技术创新性、实用性及展示效果的最高认证。

智象未来研发的"灵感智能体"(Chat Generation)以革命性架构突破行业瓶颈。该智能体在单一对话界面无缝整合文本生成图像、指令式图像编辑及跨模态视频生成功能,彻底解决多模态语义对齐难题。其核心依托170亿参数HiDream-I1模型,采用稀疏扩散Transformer(DiT)与动态混合专家(MoE)架构,在HPS、GenEval等国际基准测试中表现卓越。特别在图像编辑任务中,通过上下文视觉条件优化技术,实现像素级精准修改。

这项技术重新定义创作范式:用户通过自然对话即可完成从创意构思到视觉产出的全流程,将传统需多工具协作的创作周期压缩为"一次会话"闭环。目前技术原型已集成至智象未来旗舰产品vivago.ai,显著降低专业级视觉内容创作门槛。现场演示中,研究者仅用三句对话指令便生成并修改了符合工业标准的宣传视频,引得评审团驻足。

同期举办的Identity-Preserving Video Generation挑战赛印证其行业影响力。由智象未来主办的赛事吸引北大、上海交大、腾讯等顶尖团队参与,要求参赛模型在视频生成中保持特定身份特征一致性。该赛事设立成为国际顶会对其实力背书的直接体现。

这家由加拿大工程院外籍院士梅涛创立于2023年的企业,坚持"学术-产品"双轨创新策略。其自主研发的开源模型曾登顶国际权威榜单,此次获奖印证团队在基础模型研发与产业化落地的双重优势。随着多模态生成式AI进入应用爆发期,智象未来正推动中国技术深度融入全球创新生态。

本文链接: https://www.shuzhipunk.com/articles/2VG7KK8WVBs
转载请注明文章出处

文章所属标签
多模态生成式AI
ACM MM
智象未来
灵感智能体
HiDream-I1