DIGIPUNK
去投稿
发表于:18 hours ago

Google DeepMind推出Genie 3模型:可依据文字提示生成高度互动虚拟环境

数智朋克
发布者:数智朋克
阅读:1 分钟
我要投稿
核心要点👉
  • 🚀 Google DeepMind推出Genie 3模型,作为Genie 2的后继版本
  • 🎮 依据文字提示生成高度互动虚拟环境,实时探索,24fps/720p
  • 🌍 高度真实模拟自然现象和生态系统,构建沉浸式历史或遥远地点场景
  • ⚙️ 技术突破:预生成轨迹整合、环境一致性维持数分钟、视觉记忆追溯一分钟
  • ⚠️ 限制:动作空间有限、复杂互动困难、无法精确呈现真实地点、文字生成依赖输入、互动时间仅数分钟、目前仅部分开放

数智朋克讯,Google DeepMind 正式推出 Genie 3 模型,这款通用型世界模型作为 Genie 2 的后继版本,能够依据简单文字提示生成高度互动的虚拟环境。用户可实时探索这些 AI 生成的空间,体验每秒 24 帧、720p 解析度的流畅视觉表现

该模型高度真实地模拟自然现象,包括水流动态和光影效果,同时生成逼真的生态系统,精准捕捉动物行为细节与植物生长模式富有表现力的动画角色支持更具想象力的世界构建,高保真度再现遥远地点或历史时代的沉浸式场景

实现如此可控性与实时互动性,源于多项技术突破:每个画面生成时整合预先生成的轨迹,该轨迹随时间推进而演化;环境一致性维持数分钟之久,视觉记忆甚至追溯至一分钟前

尽管功能强大,Genie 3 仍面临已知限制:动作空间有限,模拟多个独立代理间的复杂互动存在挑战,无法完全精确呈现真实世界地点,清晰文字生成通常依赖输入描述,连续互动时间仅限于数分钟。目前仅向部分创作者和学术界开放,Google 正探索扩大测试范围的可能性。

本文链接: https://www.shuzhipunk.com/articles/VMNJa4tliZ3
转载请注明文章出处

文章所属标签
Genie 3
世界模型
文字提示生成
虚拟环境
实时互动