Google представила инструмент Genie 2 на базе искусственного интеллекта, способный создавать полностью играбельную 3D-среду из всего лишь одного изображения-запроса
Genie 2, модель искусственного интеллекта от Google, описывается как "крупномасштабная основополагающая модель мира", превращающая одиночный графический запрос в неограниченные, управляемые действиями 3D окружающие среды.
Этот инструмент может создавать различные перспективы, такие как вид от первого лица, изометрические виды или сцены вождения от третьего лица, а также создавать сложные 3D визуализации с интерактивными функциями, включая двери и взрывоопасные бочки.
Эффекты физики, такие как дым, гравитация, освещение и отражения, легко прототипируются и могут взаимодействовать как с людьми, так и с агентами ИИ, используя клавиатуру и мышь. Согласно отчету, эти функции помогают художникам и дизайнерам быстро создавать прототипы, улучшая творческий процесс в проектировании окружающей среды и ускоряя исследования.
В отчете также отмечается, что Genie 2, благодаря своим способностям обобщения, позволяет преобразовывать концептуальное искусство и наброски в полностью функциональные среды, что способствует быстрому созданию прототипов и укрепляет творческие рабочие процессы в проектировании окружения.
Хотя проект еще находится на ранней стадии, с множеством задач по совершенствованию генерации агентов и окружающей среды, существует вера в потенциал Genie 2, который может решить структурные проблемы безопасной подготовки воплощенных агентов, достигая при этом широты, необходимой для прогресса в разработке ИИ.
Полные подробности и иллюстрации можно найти в полном отчете, доступном на странице Google Deepmind.
В связанных новостях, Future, медийный издатель из Великобритании, объявил о стратегическом партнерстве с OpenAI, чтобы внедрить технологию ChatGPT в отделы продаж, маркетинга и редакции.