新人工智能模型实时创建电子游戏世界

2025-08-05

新闻要点

Google DeepMind 发布能实时生成游戏世界的 AI 模型 Genie 3。它可生成 3D 环境，用户及 AI 能实时交互，交互时长提升，还能记住物体位置。此次以“有限研究预览”形式推出，供小部分人测试。

- Genie 3 能实时生成可交互 3D 游戏环境

- 交互时长从 Genie 2 的 10 - 20 秒提升至“几分钟”

- Genie 3 能将空间保留在视觉记忆约 1 分钟

- 以“有限研究预览”提供给小部分人测试

主要内容

谷歌 DeepMind 即将发布其 AI“世界”模型的新版本，名为 Genie 3，该版本能够生成 3D 环境，用户和 AI 代理可实时交互。公司还承诺，用户与这些世界的交互时间将比以往更长，且当用户移开视线时，模型实际上能记住物体的位置。

世界模型是一种 AI 系统，可用于教育、娱乐等目的，或帮助训练机器人或 AI 代理。使用世界模型时，只需给出提示，它们就能生成一个可在其中移动的空间，就像在视频游戏中一样，但这个世界不是用 3D 资产手工制作的，而是全部由 AI 生成。谷歌在这方面投入了大量精力，12 月曾展示过 Genie 2，它能根据图像创建交互式世界，并组建了一个由 OpenAI 的 Sora 视频生成工具前联合负责人领导的世界模型团队。

然而，目前这些模型仍有很多缺陷，例如 Genie 2 世界只能玩一分钟。我最近尝试了一家由皮克斯联合创始人支持的公司的“互动视频”，感觉就像在模糊版的谷歌街景中行走，周围的事物会在我环顾四周时以意想不到的方式变形和变化。

Genie 3 似乎是一个显著的进步。据一篇博客文章称，用户将能够通过提示生成可连续交互几分钟的世界，比 Genie 2 的 10 - 20 秒交互时间有所增加。谷歌表示，Genie 3 能在视觉记忆中保持空间约一分钟，即如果你从世界中的某物移开视线然后再转回来，墙上的油漆或黑板上的字迹等东西将在原来的位置。这些世界还将具有 720p 分辨率和 24fps 的帧率。

DeepMind 还在 Genie 3 中添加了所谓的“可提示世界事件”，通过提示，你可以改变世界中的天气条件或添加新角色。但可能你无法亲自尝试这个模型，它将作为“有限的研究预览”提供给“一小部分学者和创作者”，以便其开发者更好地了解风险并如何适当减轻风险。同时还有很多限制，如用户与生成世界的交互方式有限，以及清晰的文本“通常只有在输入世界描述中提供时才会生成”。谷歌表示正在“探索”如何将 Genie 3 带给“其他测试人员”。

新人工智能模型实时创建电子游戏世界

新闻要点

主要内容

关于我们