Круглый стол: Sora в игровой разработке — какие перспективы у нового инструмента OpenAI?

В середине февраля OpenAI представила новую генеративную сеть, которая способна формировать видео очень высокого качества по текстовому промту. Она называется Sora. О ее перспективах в игровой индустрии мы говорили с командами, уже внедрившими другие нейросети в свой пайплайн. Среди наших экспертов — представители Charisma, Playkot, Lost Lore, Skywaylab и ZiMAD.

Пока OpenAI только показала возможности Sora. Какие впечатления у вас от опубликованных примеров?

Гай Гадни (Guy Gadney) — генеральный директор и сооснователь Charisma

Выглядит так, что в рамках Sora решили одну из самых сложных задач в сфере генерации изображений — согласованность кадров. Где большинство других ИИ искажают или галлюцинируют, Sora реалистично отображает движения человека и сохраняет форму зданий. Это поворотный момент в истории генеративного ИИ, который окажет глубокое влияние на создание коротких видео.

Конечно, после запуска стоит ждать тонны сообщений в духе «Я ввел [xxx] в Sora и, вы только посмотрите, что она создала». Но, как и в случае с ChartGPT, это продлится недолго. Пена осядет как только сервис освоят творческие люди, которые начнут использовать его для решения конкретных художественных задач.

Как бы то ни было, по степени значимости появление Sora можно будет сравнить с изобретением домашней видеокамеры.

Евгений Смирнов, Casual CPO Playkot

То, что пока OpenAI рассказала о возможности Sora, выглядит как очень большой прорыв для ИИ. Причем не только с точки зрения генерации видео. У этой технологии виден внушительный практический потенциал как для симуляции реальных, так и виртуальных миров. А моделирование сценариев будущего — очень важный этап в разработке AGI.

Евгений Киткин, основатель и генеральный директор студии Lost Lore

Каждый раз, когда я вижу новый продукт от OpenAI, то думаю, что нужно опять переучиваться, снова эволюционировать компанию, выстраивать заново процессы. В случае с Sora — та же история. Более гибкие компании смогут обойти крупные — в рекламе, в прототипировании, в привлечении внимания во всех сферах, не только в геймдеве. Мир снова изменится.

Алексей Емельянов, один из основателей Skywaylab

С возможностями, которые предоставляет OpenAI в их новейшей разработкой Sora, перед нами открывается уникальное будущее видеоиндустрии. Sora не просто демонстрирует способность генерировать видеоконтент на основе текстовых описаний, но и предоставляет нам взгляд на перспективы, где каждый зритель сможет влиять на сюжетное развитие и детали видео, делая их уникальными и персонализированными. Это может означать революционные изменения не только в способах потребления развлекательного контента, но и в рекламной индустрии.

Я вижу в будущем мир, в котором каждый зритель может в реальном времени изменять фильм самостоятельно, например, сделать концовку фильма счастливой, вместо драматической, или изменить сюжетную линию в соответствии со своими предпочтениями. Скорее всего, это усилит эмоциональное вовлечение и откроет новые горизонты интерактивности.

В сфере рекламы, благодаря Sora, мы можем ожидать появление полностью индивидуализированных рекламных роликов, точно нацеленных на интересы и предпочтения конкретного пользователя. Это, безусловно, снизит CPI и увеличит эффективность рекламных кампаний.

Если посмотреть еще шире, то Sora определенно окажет сильное влияние на образовательные проекты. В будущем мы можем ожидать появление обучающих видео, автоматически адаптируемых под уровень знаний и интересы учащегося, делая обучение более интересным и личностно-ориентированным.

Я считаю, что сейчас — время больших возможностей. Мы с нетерпением ожидаем доступа к этому инструменту, чтобы исследовать все на практике.

Кирилл Жуковский, CPO ZiMAD

Sora впечатлила качеством примеров видеороликов, но это не единственное решение в своем роде. У сервиса есть ряд конкурентов. Все вместе они создают революцию в видеопроизводстве. Прямо сейчас они могут заменить стоковые видеоролики, в какой-то степени обесценив труд независимых видеографов, которые выставляют короткие видео на продажу.

В какой сфере, связанной с геймдевом, Sora сможет найти применение?

Евгений Смирнов, Casual CPO Playkot

Если смотреть на «здесь и сейчас», то Sora может быть полезна в таких use cases, как помощь с поиском маркетабилити новых проектов и разработкой рекламных креативов. Также подобные ИИ-инструменты могут стать хорошим подспорьем в задачах, связанных с автоматизацией и оптимизацией. Это важно, поскольку аудитория все еще ждет игры с крутым production value, но при этом ситуация на мобильном рынке усложняется, и компании все меньше готовы идти на риск и делать высокобюджетные проекты.

Если говорить про будущее, то мы можем прийти к совершенно другим пайплайнам. Например, перейти на ИИ-рендеринг, когда все происходящее конструируется через упрощенную lowres-графику и далее генерируется в более крутую, детальную и яркую графику, попутно добавляя симуляцию более сложных процессов внутри игры. Другой пример — такие технологии могут значительно автоматизировать работу художников: на основе их минимальных драфтов достраивать концепт-арты, 3D-модели и анимацию. Также такой ИИ может помочь с генерацией прототипов игр через каскад нейросетей разной специализации.

Евгений Киткин, основатель и генеральный директор студии Lost Lore

Представьте, что мы сможем тестировать геймплей без разработки прототипа, при помощи играбельной и видеорекламы Создавать больше контента, быстрее, дешевле. Choose-Your-Own-Adventure игры выйдут на совершенно новый уровень погружения — они смогут в режиме реального времени создавать целые локации. А что станет с игровыми стриминговыми сервисами, если подобная технология начнет генерировать игровой процесс или пролет камеры над локацией в режиме реального времени в зависимости от действий игроков!

Алексей Емельянов, один из основателей Skywaylab

В геймдеве Sora определенно повлияет как и на разработку, так а на маркетинг. Вот направления, которые приходят в голову в первую очередь.

  • Создание контента на лету: Sora может использоваться для генерации динамичных сцен, персонажей и даже целых миров на основе текстовых описаний в реальном времени. Это позволит разработчикам быстро экспериментировать с различными сюжетными линиями и визуальными стилями, значительно сокращая время и затраты на производство.
  • Персонализированный геймплей: игры могут стать более гибкими, предлагая каждому игроку уникальную сюжетную линию, персонализированные задания или даже уникальные миры для исследования. Появится такая штука, как уникальный игровой опыт, который будет недоступен другим людям. В связи с этим должно увеличится вовлечение, а стримеры игр могут стать еще более популярными.
  • Маркетинг игр: это наша сфера и мы полностью осознаем, что появление и возможность использования подобных инструментов — большой подарок всему геймдеву. Нужно просто научиться правильно это делать и у всех разработчиков игр быстрее получится выйти из кризиса и заметно увеличится ROAS. Особенно это даст хорошие шансы вырасти небольшим игровым студиям (благодаря их большей гибкости и дерзости в экспериментах).

Кирилл Жуковский, CPO ZiMAD

В геймдеве Sora сможет найти применение в создании рекламных креативов. Может стать подарком для инди-разработчиков, у которых нет средств и навыков для видеопродашкна. Теоретически возможно, что Sora позволит делать кат-сцены, но на текущей стадии развития собрать таким образом качественную игру вряд ли получится. А вот создать презентацию для инвесторов — вполне реально.

Вы уже примеряете, будет ли место для Sora у вас в пайплайне?

Евгений Смирнов, Casual CPO Playkot

Мы внимательно следим за всеми инновациями. И мы определенно видим несколько потенциальных use cases — таких как разработка геймплейных роликов для креативов из фейкшотов, разработка рекламных креативов, оптимизация разработки синематиков и автоматизация разработки анимаций.

Евгений Киткин, основатель и генеральный директор студии Lost Lore

Lost Lore с 2022 года применяет нейросети. В 2023 году мы разработали уже три игры с применением Midjourney, Stable Diffusion, Stable Video Diffusion (его мы используем для создания анимаций у персонажей и окружения),  и нескольких аудио-ИИ (в том числе для озвучки), а также активно использовали ChatGPT4 для нарратива и в гейм-дизайне.

Мы одна из немногих ИИ-студий, которая еженедельно исследует сайт TheresAnAIForThat и пробует применять новые нейронки в ежедневных задачах студии. В результате делаем больше контента быстрее и получаям конечный результат более качественным.

Так что, в нашем пайплайне точно будет место Sora. Будем пытаться стать его пользователями на этапе закрытого теста, если такой будет.

Алексей Емельянов, один из основателей Skywaylab

В Skywaylab мы тестируем все инструменты, которые появляются на рынке и, несмотря на то, что мы пока не получили доступа к Sora, проведенные нами митапы с командой показали, что инструмент обладает хорошим потенциалом для ускорения и удешевления тестирования маркетинговых гипотез, а это является ключевым аспектом в создании рекламных кампаний.

Однако наш интерес к Sora не ограничен креативами для закупки трафика. Мы видим большие перспективы в направлении вирального контента для привлечения трафика в социальных сетях, таких как YouTube, TikTok и Instagram. Несмотря на сложности с контролем качества трафика, по нашему мнению, этот канал будет чрезвычайно важным для геймдева, так как предлагает доступ к большой аудитории по сравнительно низкой стоимости. Использование Sora позволит нам значительно ускорить и упростить процесс создания вирусного игрового контента, делая его более доступным и эффективным для наших клиентов.

Мы видим в Sora не просто инструмент для автоматизации создания видео, но и возможность для экспериментов с новыми форматами и подходами к рекламе. Это может включать создание персонализированных рекламных роликов, которые затрагиваю непосредственно интересы и предпочтения целевой аудитории, а также разработку динамичного контента, который может адаптироваться к текущим трендам и интересам зрителей в реальном времени.

В итоге технология открывает двери к созданию более глубокого и вовлекающего контента, который может привлекать огромное количество игроков и поддерживать их интерес на протяжении долгого времени, что в конечном итоге снижает стоимость привлечения и повышает общую эффективность наших кампаний.

Кирилл Жуковский, CPO ZiMAD

Конкретно мы прямо сейчаc не примеряем Sora к нашим процессам, но присматриваемся к этому и другим подобным решениям.

Какие подводные камни/ограничения в плане использования в разработке вы видите у Sora?

Евгений Смирнов, Casual CPO Playkot

Пока неизвестно, какой уровень контроля будет у пользователей Sora над результатами генерации, и от этого зависит, как мы могли бы использовать технологию в работе. Также пока неясно, как будет происходить дообучение Sora для адаптации к задачам конкретных пользователей и команд.

Евгений Киткин, основатель и генеральный директор студии Lost Lore

На серверах OpenAI будет ограничение на длину созданного видео, а на собственные сервера вряд ли разрешат ставить по причине проприетарности архитектуры (скорее всего, у Sora несколько слоев нейронок). Время создания видео будет долгим, не подходящим для регулярного пользования в первое время.

Я бы еще поднял вопрос безопасности этой технологии. По этой причине продукт до сих пор не в публичном доступе.

Алексей Емельянов, один из основателей Skywaylab

Подводных камней мы видим пока не очень много, но они достаточно существенные. Внедрение инновационных технологий всегда сопряжено с определенными вызовами и ограничениями.

  • Юридические и этические вопросы: одним из ключевых подводных камней использования технологии, основанной на генерации контента ИИ, являются вопросы авторских прав и интеллектуальной собственности. Определение, кому принадлежат права на контент, созданный с помощью ИИ, может быть сложным, а также могут возникнуть споры о использовании защищенных материалов без разрешения.
  • Контроль качества: при генерации видеоконтента с помощью Sora могут возникнуть проблема с обеспечением стабильного и предсказуемого качества. Алгоритмы ИИ могут интерпретировать текстовые описания по-разному, что будет приводить к неоднозначным результатам. Необходимо разработать механизмы контроля и коррекции, чтобы гарантировать соответствие сгенерированного контента заявленным стандартам качества и ожиданиям.
  • Зависимость от данных: качество и разнообразие генерируемого контента напрямую зависят от обучающих данных, на которых была обучена модель. Существует риск, что модель может воспроизводить существующие предвзятости или не иметь достаточного разнообразия в данных для создания контента задуманного креативным продюсером.

В заключение, хочется добавить, что, несмотря на все потенциальные подводные камни и сложности по внедрению новых технологий в существующие пайплайны и процессы, это необходимо делать, иначе есть шанс оказаться за бортом корабля, плывущего к успеху.

Кирилл Жуковский, CPO ZiMAD

Подводные камни, конечно, есть. Самая главная проблема — это часто непредсказуемый результат и небольшое количество настроек. Некоторые сцены, скорее всего, будет трудно склеить нужным образом из-за сильных отличий в ракурсах, динамике, освещении и внешнем виде персонажей. Со временем настроек будет больше, но из-за рандомных результатов для полноценнного профессионального использования инструмент еще не скоро будет готов.

Комментарии
Добавить комментарий
Новости по теме