DIGIPUNK
去投稿
发表于:2025年03月06日

字节跳动 AI 平台推出全新动态视频生成模块 实现像素级表情迁移

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
核心要点👉
  • 🔧 双模态输入机制实现动作与表情同步迁移
  • 🚀 face motion tokenizer技术量化43种表情单元,生动性提升62%
  • 🎨 开放本地素材通道支持舞蹈编排与肢体语言定制
  • 🔒 三重版权校验+加密水印+云端审核保障合规性
  • ⏱️ 零代码交互5分钟完成静态到动态创作全流程

数智朋克讯,字节跳动旗下AI内容平台近日推出全新动态视频生成模块,该功能通过双模态输入机制实现角色动作与情感状态的精准迁移。用户从数字人创作入口上传静态人物图像及动作参考视频后,系统即可生成与驱动源保持高度同步的30秒动态影像,其面部微表情还原度达到像素级精度

技术架构层面,研发团队在原有X-Portrait2框架基础上创新引入混合特征驱动引擎,结合显式运动轨迹分析与隐式语义理解算法,成功突破不同画幅比例下的动作适配难题。针对面部表情迁移,自主研发的face motion tokenizer技术通过离散化编码策略,将参考视频中的眼部微动、嘴角弧度等43种表情单元进行量化提取,相较传统方案生动性提升62%。

创作自由度方面,系统预设三种基础动作范式,同时开放本地视频素材接入通道,支持用户将个性化舞蹈编排或特定肢体语言融入生成流程。为确保数字内容合规性,平台内置三重版权校验机制,所有输出内容均携带不可篡改的加密水印,并实时接入云端内容审核系统进行多维度安全筛查。

实测数据显示,该功能对卡通形象与真人肖像均展现出良好适配性,尤其在情绪传达维度实现突破性进展。操作流程采用零代码交互设计,用户通过"生成-预览-迭代"的闭环工作流,可在5分钟内完成从静态图像到动态演绎的完整创作过程。目前该模块已完成全终端覆盖,创作者社区已涌现出大量结合经典影视桥段与网络热梗的二创作品。

本文链接: https://www.shuzhipunk.com/articles/tx2IUopvqiW
转载请注明文章出处

文章所属标签
动态视频生成
数字人技术