DIGIPUNK
去投稿

谷歌正式发布Veo 3.1视频生成模型,实现音频输出与编辑控制突破

谷歌推出Veo 3.1视频生成模型升级版,在音频输出、图像转视频效果及编辑控制方面取得显著突破。新版本支持60秒连续视频生成、1080p高清输出及多场景提示功能,显著提升视觉叙事能力。

2025年10月16日
腾讯混元开源视频音效生成模型Hunyuan-Foley

腾讯混元开源其端到端视频音效生成模型Hunyuan-Foley,该模型通过输入视频片段和文本描述自动生成电影级音效,解决了AI视频无声问题并实现音画精准同步。模型基于多模态处理能力和大规模数据集,适用于创意领域,并已开源推动技术协作。

2025年08月29日
可灵2.1视频生成模型启动首尾帧功能内测,提升视频流畅度与控制精度

快手可灵2.1视频生成模型推出首尾帧功能内测,聚焦提升视觉流畅度和控制精度,解决AI视频转场生硬问题。新功能实现电影级运镜控制,高效输出模式适用于产品宣传片等专业场景,用户规模超4500万。

2025年08月18日