DIGIPUNK
去投稿
发表于:2025年02月26日

阿里巴巴开源千亿级视频生成模型 Wan 2.1 支持 8K 电影级内容创作

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
核心要点👉
  • 🎥 全球首个开源电影级8K生成模型,参数规模突破千亿级
  • 🇨🇳 深度优化中文语义理解,支持方言指令智能识别
  • ⚡ 电商短视频生成效率提升400%,30秒极速出片
  • 🆓 企业用户每月可获价值万元的50小时GPU算力补贴
  • 🔒 主动限制面部特征控制功能,践行AI安全开发准则

数智朋克从阿里巴巴达摩院获悉,其最新研发的 Wan 2.1 视频图像生成模型将于 3 月初在 ModelScope 魔搭社区开源。该模型具有三大突破性特征:

  • 8K 超高清视频生成能力达到电影工业标准,支持多镜头语言智能分镜
  • 千亿级参数规模中特别设置中文语义强化模块,可识别川渝、粤语等方言指令
  • 开源包包含完整训练框架与模型权重,开发者通过平台 API 调用可直接商用

值得关注的是,影视特效团队实测数据显示,该模型在电商直播场景中单条短视频生成耗时从行业平均 2 分钟压缩至 28 秒,且支持商品 3D 展示智能转场。魔搭社区为此配套推出企业级扶持计划,每月提供50 小时免费 RTX 4090 GPU 算力。

"这是出于生成式 AI 安全伦理的全局考量,我们正在开发可控版本的面部特征编辑器,预计下半年通过备案制开放。"

不过该模型目前暂未开放人物面部微调功能,达摩院技术负责人解释称。

本文链接: https://www.shuzhipunk.com/articles/DpioeQCSOre
转载请注明文章出处

文章所属标签
阿里巴巴
Wan2.1模型
视频生成