DIGIPUNK
去投稿

腾讯混元开源视频音效生成模型Hunyuan-Foley

腾讯混元开源其端到端视频音效生成模型Hunyuan-Foley,该模型通过输入视频片段和文本描述自动生成电影级音效,解决了AI视频无声问题并实现音画精准同步。模型基于多模态处理能力和大规模数据集,适用于创意领域,并已开源推动技术协作。

2025年08月29日
可灵2.1视频生成模型启动首尾帧功能内测,提升视频流畅度与控制精度

快手可灵2.1视频生成模型推出首尾帧功能内测,聚焦提升视觉流畅度和控制精度,解决AI视频转场生硬问题。新功能实现电影级运镜控制,高效输出模式适用于产品宣传片等专业场景,用户规模超4500万。

2025年08月18日