05.12.2024

谷歌推出了Genie 2人工智能工具,可以从一张提示图像创造出一个完全可玩三维环境

Genie 2: 大规模基础世界模型
图片来源: Google

Genie 2 是由谷歌开发的一款人工智能模型,被称为“大规模基础世界模型”,能够将单一图像提示转换为无限制、可控制动作的三维环境。

这个工具可以生成多种视角,如第一人称、等距视图或第三人称驾驶场景,同时还可以创建带有互动功能的复杂三维视觉效果,包括门和爆炸桶。

物理效果,如烟雾、重力、灯光和反射,可以轻松进行原型制作,并可以通过键盘和鼠标与人类或 AI 代理进行交互。根据一份报告,这些功能帮助艺术家和设计师快速制作原型,提升环境设计的创造流程,加快研究进程。

报告进一步指出,由于 Genie 2 的泛化能力,可将概念艺术和草图转化为功能齐全的环境,帮助快速原型制作和增强环境设计中的创意工作流程。

尽管当前仍处于早期阶段,在代理和环境生成方面还有很大提升空间,但人们相信 Genie 2 可以解决安全训练具体现代理的结构性挑战,同时实现 AI 开发所需的广度。

详细内容和插图可以在完整报告中找到,可通过谷歌的 Deepmind 页面访问。

相关新闻中,一家总部位于英国的媒体出版商Future 宣布与 OpenAI 签署战略合作,将在销售、市场和编辑部门部署其 ChatGPT 技术。

gamesindustry.biz
评论
写评论...
Related news