Google представила инструмент Genie 2 на базе искусственного интеллекта, способный создавать полностью играбельную 3D-среду из всего лишь одного изображения-запроса

Genie 2: A large-scale foundation world model — Источник изображения: Google

Genie 2, модель искусственного интеллекта от Google, описывается как "крупномасштабная основополагающая модель мира", превращающая одиночный графический запрос в неограниченные, управляемые действиями 3D окружающие среды.

Этот инструмент может создавать различные перспективы, такие как вид от первого лица, изометрические виды или сцены вождения от третьего лица, а также создавать сложные 3D визуализации с интерактивными функциями, включая двери и взрывоопасные бочки.

Эффекты физики, такие как дым, гравитация, освещение и отражения, легко прототипируются и могут взаимодействовать как с людьми, так и с агентами ИИ, используя клавиатуру и мышь. Согласно отчету, эти функции помогают художникам и дизайнерам быстро создавать прототипы, улучшая творческий процесс в проектировании окружающей среды и ускоряя исследования.

В отчете также отмечается, что Genie 2, благодаря своим способностям обобщения, позволяет преобразовывать концептуальное искусство и наброски в полностью функциональные среды, что способствует быстрому созданию прототипов и укрепляет творческие рабочие процессы в проектировании окружения.

Хотя проект еще находится на ранней стадии, с множеством задач по совершенствованию генерации агентов и окружающей среды, существует вера в потенциал Genie 2, который может решить структурные проблемы безопасной подготовки воплощенных агентов, достигая при этом широты, необходимой для прогресса в разработке ИИ.

Полные подробности и иллюстрации можно найти в полном отчете, доступном на странице Google Deepmind.

В связанных новостях, Future, медийный издатель из Великобритании, объявил о стратегическом партнерстве с OpenAI, чтобы внедрить технологию ChatGPT в отделы продаж, маркетинга и редакции.