DIGIPUNK
去投稿

腾讯混元开源 HunyuanVideo-Avatar 模型,推动多模态生成技术发展

腾讯混元开放 HunyuanVideo-Avatar 语音数字人模型源代码,该技术整合视觉分析与声纹识别,实现音画同步精度达像素级。测试显示视频产能提升 5 倍,制作成本降至传统方式 20%。

2025年05月30日