谷歌在 2025 年 I/O 大会推出第三代视频生成系统 Veo 3,通过 V2A 模块实现视觉听觉模态协同生成,其事件推理模块支持复合指令的分层解码处理。该系统现阶段主要面向影视创作领域,通过 8 秒片段拼接技术构建完整叙事单元。
谷歌 DeepMind 正式向全球开发者及订阅用户开放新一代视频生成模型 Veo2,支持文本或图像输入生成 8 秒 720P 影视级动态内容。该模型在跨模态指令解析、物理引擎仿真及用户偏好度等关键指标上超越主流竞品。
谷歌旗下 Veo 2 视频生成模型公布 0.5 美元 / 秒计费标准,影视级短视频创作成本较传统模式锐减。OpenAI Sora 以订阅制入局,生成式视频领域现商业模式分野。
谷歌推出了Veo 2视频生成模型和Imagen 3图像生成模型,均达到了当前领域的最先进水平,为创作者提供了更高质量的创作体验。Veo 2的4K视频生成和精准艺术控制,以及Imagen 3在图像创作上的突破,标志着谷歌在AI创作工具领域的领导地位进一步巩固。
ouTube在纽约举办的“Made On YouTube”活动中宣布,将谷歌DeepMind的AI视频生成模型Veo集成到Shorts中,帮助创作者生成高质量视频背景与短片段。此外,还推出了一系列增强互动的功能,旨在提升创作者与粉丝的互动体验。
谷歌最近宣布推出Veo模型,一种新型AI视频生成工具,目前仍处于内部测试阶段。Veo模型结合视觉语义和自然语言理解,可生成超过一分钟的1080p视频,超越现有技术限制,为视频创作提供全新可能。