Google DeepMind推出Genie 3模型：可依据文字提示生成高度互动虚拟环境

核心要点👉

数智朋克讯，Google DeepMind 正式推出 Genie 3 模型，这款通用型世界模型作为 Genie 2 的后继版本，能够依据简单文字提示生成高度互动的虚拟环境。用户可实时探索这些 AI 生成的空间，体验每秒 24 帧、720p 解析度的流畅视觉表现。

该模型高度真实地模拟自然现象，包括水流动态和光影效果，同时生成逼真的生态系统，精准捕捉动物行为细节与植物生长模式。富有表现力的动画角色支持更具想象力的世界构建，高保真度再现遥远地点或历史时代的沉浸式场景。

实现如此可控性与实时互动性，源于多项技术突破：每个画面生成时整合预先生成的轨迹，该轨迹随时间推进而演化；环境一致性维持数分钟之久，视觉记忆甚至追溯至一分钟前。

尽管功能强大，Genie 3 仍面临已知限制：动作空间有限，模拟多个独立代理间的复杂互动存在挑战，无法完全精确呈现真实世界地点，清晰文字生成通常依赖输入描述，连续互动时间仅限于数分钟。目前仅向部分创作者和学术界开放，Google 正探索扩大测试范围的可能性。

数智资讯订阅