谷歌推出Veo 3.1视频生成模型升级版,在音频输出、图像转视频效果及编辑控制方面取得显著突破。新版本支持60秒连续视频生成、1080p高清输出及多场景提示功能,显著提升视觉叙事能力。
腾讯混元开源其端到端视频音效生成模型Hunyuan-Foley,该模型通过输入视频片段和文本描述自动生成电影级音效,解决了AI视频无声问题并实现音画精准同步。模型基于多模态处理能力和大规模数据集,适用于创意领域,并已开源推动技术协作。
快手可灵2.1视频生成模型推出首尾帧功能内测,聚焦提升视觉流畅度和控制精度,解决AI视频转场生硬问题。新功能实现电影级运镜控制,高效输出模式适用于产品宣传片等专业场景,用户规模超4500万。