智象未来荣获ACM国际多媒体会议最佳演示奖

核心要点👉

🏆 智象未来荣获ACM国际多媒体会议最佳演示奖，成为首个中国团队获此殊荣
💡 "灵感智能体"技术突破行业瓶颈，整合文本生成图像、图像编辑和视频生成功能
🧠 核心170亿参数HiDream-I1模型采用DiT与MoE架构，国际基准测试表现卓越
🚀 重新定义创作范式，将传统多工具协作压缩为"一次会话"闭环
🌍 主办Identity-Preserving Video Generation挑战赛，吸引顶尖团队参与，体现全球影响力

数智朋克讯，爱尔兰都柏林会场掌声雷动，第33届ACM国际多媒体会议揭晓最佳演示奖得主——中国初创企业智象未来凭借多模态生成式AI技术首度摘得该奖项，成为首个获此殊荣的中国团队。ACM MM作为全球多媒体领域权威学术盛会，其最佳演示奖代表学界对技术创新性、实用性及展示效果的最高认证。

智象未来研发的"灵感智能体"（Chat Generation）以革命性架构突破行业瓶颈。该智能体在单一对话界面无缝整合文本生成图像、指令式图像编辑及跨模态视频生成功能，彻底解决多模态语义对齐难题。其核心依托170亿参数HiDream-I1模型，采用稀疏扩散Transformer（DiT）与动态混合专家（MoE）架构，在HPS、GenEval等国际基准测试中表现卓越。特别在图像编辑任务中，通过上下文视觉条件优化技术，实现像素级精准修改。

这项技术重新定义创作范式：用户通过自然对话即可完成从创意构思到视觉产出的全流程，将传统需多工具协作的创作周期压缩为"一次会话"闭环。目前技术原型已集成至智象未来旗舰产品vivago.ai，显著降低专业级视觉内容创作门槛。现场演示中，研究者仅用三句对话指令便生成并修改了符合工业标准的宣传视频，引得评审团驻足。

同期举办的Identity-Preserving Video Generation挑战赛印证其行业影响力。由智象未来主办的赛事吸引北大、上海交大、腾讯等顶尖团队参与，要求参赛模型在视频生成中保持特定身份特征一致性。该赛事设立成为国际顶会对其实力背书的直接体现。

这家由加拿大工程院外籍院士梅涛创立于2023年的企业，坚持"学术-产品"双轨创新策略。其自主研发的开源模型曾登顶国际权威榜单，此次获奖印证团队在基础模型研发与产业化落地的双重优势。随着多模态生成式AI进入应用爆发期，智象未来正推动中国技术深度融入全球创新生态。

智象未来荣获ACM国际多媒体会议最佳演示奖

数智资讯订阅