核心要点👉
- 🚀 Google DeepMind推出Genie 3模型,作为Genie 2的后继版本
- 🎮 依据文字提示生成高度互动虚拟环境,实时探索,24fps/720p
- 🌍 高度真实模拟自然现象和生态系统,构建沉浸式历史或遥远地点场景
- ⚙️ 技术突破:预生成轨迹整合、环境一致性维持数分钟、视觉记忆追溯一分钟
- ⚠️ 限制:动作空间有限、复杂互动困难、无法精确呈现真实地点、文字生成依赖输入、互动时间仅数分钟、目前仅部分开放
数智朋克讯,Google DeepMind 正式推出 Genie 3 模型,这款通用型世界模型作为 Genie 2 的后继版本,能够依据简单文字提示生成高度互动的虚拟环境。用户可实时探索这些 AI 生成的空间,体验每秒 24 帧、720p 解析度的流畅视觉表现。
该模型高度真实地模拟自然现象,包括水流动态和光影效果,同时生成逼真的生态系统,精准捕捉动物行为细节与植物生长模式。富有表现力的动画角色支持更具想象力的世界构建,高保真度再现遥远地点或历史时代的沉浸式场景。
实现如此可控性与实时互动性,源于多项技术突破:每个画面生成时整合预先生成的轨迹,该轨迹随时间推进而演化;环境一致性维持数分钟之久,视觉记忆甚至追溯至一分钟前。
尽管功能强大,Genie 3 仍面临已知限制:动作空间有限,模拟多个独立代理间的复杂互动存在挑战,无法完全精确呈现真实世界地点,清晰文字生成通常依赖输入描述,连续互动时间仅限于数分钟。目前仅向部分创作者和学术界开放,Google 正探索扩大测试范围的可能性。