新人工智能模型实时创建电子游戏世界 - AI News
新人工智能模型实时创建电子游戏世界

新人工智能模型实时创建电子游戏世界

2025-08-05

新闻要点

Google DeepMind 发布能实时生成游戏世界的 AI 模型 Genie 3。它可生成 3D 环境,用户及 AI 能实时交互,交互时长提升,还能记住物体位置。此次以“有限研究预览”形式推出,供小部分人测试。

- Genie 3 能实时生成可交互 3D 游戏环境

- 交互时长从 Genie 2 的 10 - 20 秒提升至“几分钟”

- Genie 3 能将空间保留在视觉记忆约 1 分钟

- 以“有限研究预览”提供给小部分人测试

主要内容

谷歌 DeepMind 即将发布其 AI“世界”模型的新版本,名为 Genie 3,该版本能够生成 3D 环境,用户和 AI 代理可实时交互。公司还承诺,用户与这些世界的交互时间将比以往更长,且当用户移开视线时,模型实际上能记住物体的位置。

世界模型是一种 AI 系统,可用于教育、娱乐等目的,或帮助训练机器人或 AI 代理。使用世界模型时,只需给出提示,它们就能生成一个可在其中移动的空间,就像在视频游戏中一样,但这个世界不是用 3D 资产手工制作的,而是全部由 AI 生成。谷歌在这方面投入了大量精力,12 月曾展示过 Genie 2,它能根据图像创建交互式世界,并组建了一个由 OpenAI 的 Sora 视频生成工具前联合负责人领导的世界模型团队。

然而,目前这些模型仍有很多缺陷,例如 Genie 2 世界只能玩一分钟。我最近尝试了一家由皮克斯联合创始人支持的公司的“互动视频”,感觉就像在模糊版的谷歌街景中行走,周围的事物会在我环顾四周时以意想不到的方式变形和变化。

Genie 3 似乎是一个显著的进步。据一篇博客文章称,用户将能够通过提示生成可连续交互几分钟的世界,比 Genie 2 的 10 - 20 秒交互时间有所增加。谷歌表示,Genie 3 能在视觉记忆中保持空间约一分钟,即如果你从世界中的某物移开视线然后再转回来,墙上的油漆或黑板上的字迹等东西将在原来的位置。这些世界还将具有 720p 分辨率和 24fps 的帧率。

DeepMind 还在 Genie 3 中添加了所谓的“可提示世界事件”,通过提示,你可以改变世界中的天气条件或添加新角色。但可能你无法亲自尝试这个模型,它将作为“有限的研究预览”提供给“一小部分学者和创作者”,以便其开发者更好地了解风险并如何适当减轻风险。同时还有很多限制,如用户与生成世界的交互方式有限,以及清晰的文本“通常只有在输入世界描述中提供时才会生成”。谷歌表示正在“探索”如何将 Genie 3 带给“其他测试人员”。