圆桌会议:Sora在游戏开发中的前景——OpenAI的新工具有哪些潜力?
在二月中旬,OpenAI推出了一款新的生成网络,能够根据文本提示生成高质量视频。它被称为Sora。我们与已经将其他神经网络整合到工作流程中的团队讨论了它在游戏行业的前景。我们的专家包括Charisma、Playkot、Lost Lore、Skywaylab和ZiMAD的代表。
目前OpenAI只是展示了Sora的能力。您对发布的示例有什么印象?
盖伊·戈德尼(Guy Gadney) — Charisma的首席执行官和联合创始人
看起来在Sora的框架下,解决了图像生成领域最复杂的问题之一——帧与帧之间的一致性。在大多数其他AI发生扭曲或幻觉的地方,Sora能够真实地表现人类的动作,并保持建筑的形状。这是生成AI历史上的一个转折点,将对短视频制作产生深远影响。
当然,推出后会有大量“我在Sora中输入了[xxx],你看她创造了什么”的消息。但就像ChartGPT一样,这种情况不会持续太久。当创造性的人们开始将其用于特定的艺术任务时,泡沫将会消退。
不管怎样,Sora的出现的重要性可以与家用摄像机的发明相提并论。
叶甫根尼·斯米尔诺夫,Playkot的休闲CPO
OpenAI目前关于Sora的功能介绍,看起来是对AI的一次重大突破。而且不仅仅是从视频生成的角度来看。这项技术显示出巨大的实际潜力,既可以模拟真实世界,也可以模拟虚拟世界。而模拟未来的情境是AGI开发中的一个非常重要的阶段。
叶甫根尼·基特金,Lost Lore工作室的创始人和首席执行官
每当我看到OpenAI推出的新产品时,我都会想,我们需要再次重新学习,再次让公司进化,重新构建流程。在Sora的情况下也是如此。更灵活的公司将能够在广告、原型制作和各个领域引起关注方面超越大型公司,而不仅仅是在游戏开发中。世界将再次改变。
阿列克谢·耶梅利亚诺夫,Skywaylab的联合创始人之一
随着OpenAI在他们最新开发的Sora中提供的能力,我们面前展现出视频行业独特的未来。Sora不仅展示了基于文本描述生成视频内容的能力,还为我们提供了一个前景,即每位观众都能够影响故事的发展和视频的细节,使其变得独特和个性化。这可能意味着娱乐内容消费方式和广告行业的革命性变化。
我设想未来的世界中,每位观众都能实时改变电影的情节,例如使电影的结局变得快乐而不是悲剧,或根据自己的偏好改变情节线。很可能这将增强情感投入,并开启互动的新视野。
在广告领域,借助Sora,我们可以期待出现完全个性化的广告,准确针对具体用户的兴趣和偏好。无疑,这将降低每次安装成本(CPI),提高广告活动的有效性。
更广泛地看,Sora无疑会对教育项目产生重要影响。未来我们可以期待教育视频的出现,它们会自动根据学生的知识水平和兴趣进行调整,使学习更加有趣和个性化。
我认为现在是一个充满机会的时代。我们迫不及待地想要获取这个工具,以便在实践中探索一切。
基里尔·朱科夫斯基,ZiMAD的CPO
Sora以高质量的视频示例令人印象深刻,但这并不是唯一的一种解决方案。该服务有许多竞争对手。它们共同正在引发视频制作的革命。现在它们可能会取代库存视频,从某种程度上贬低独立摄影师的劳动,这些摄影师为短视频出售作品。
Sora可以在哪个游戏开发相关领域找到应用?
叶甫根尼·斯米尔诺夫,Playkot的休闲CPO
如果从“现在”来看,Sora可以在诸如帮助寻找新项目的市场潜力和开发广告创意等用例中发挥作用。此外,这类AI工具在自动化和优化相关任务方面也可以成为很好的支持。这一点很重要,因为观众仍在期待高制作价值的游戏,但移动市场的形势越来越复杂,企业也越来越不愿冒险制定高预算项目。
谈到未来,我们可能会进入完全不同的工作流程。例如,转向AI渲染,当所有发生的事情都是通过简化的低分辨率图形构建的,并进一步生成更酷、更详细和更丰富的图像,同时增加了模拟游戏内更复杂过程的功能。另一个例子是,这类技术可能会显著自动化艺术家的工作:基于他们的初步草图完成概念艺术、3D模型和动画。此外,这种AI可能帮助通过多层神经网络生成游戏原型。
叶甫根尼·基特金,Lost Lore工作室的创始人和首席执行官
想象一下,我们可以在不开发原型的情况下测试游戏玩法,通过可玩和视频广告创建更多内容,更快,更便宜。选择你自己的冒险(Choose-Your-Own-Adventure)游戏将进入一个全新的沉浸水平——它们将能够实时创建整个场景。如果类似的技术开始根据玩家的动作实时生成游戏过程或在场景上方的摄像镜头,那么游戏流媒体服务会发生什么呢?
阿列克谢·耶梅利亚诺夫,Skywaylab的联合创始人之一
在游戏开发中,Sora无疑会对开发和营销产生影响。以下是我的一些想法。
- 即时创建内容:Sora可用于实时生成动态场景、角色甚至完整的世界,基于文本描述。这将使开发者能够快速实验不同的情节线和视觉风格,显著缩短生产时间和成本。
- 个性化游戏体验:游戏将变得更加灵活,为每位玩家提供独特的故事情节、个性化任务或甚至可探索的独特世界。将出现独特的游戏体验,其他人无法获得。与此相关,玩家的参与度将增加,游戏直播者的受欢迎程度可能更高。
- 游戏营销:这是我们的领域,我们完全意识到类似工具的出现和使用的可能性对整个游戏开发来说是一份巨大的礼物。只需学习如何正确使用,它将使开发者更快地走出危机,显著提高投资回报率(ROAS)。这特别给小型游戏工作室提供了良好的成长机会(由于它们在实验中的更大灵活性和大胆性)。
基里尔·朱科夫斯基,ZiMAD的CPO
在游戏开发中,Sora能够在创建广告创意方面找到应用。它可能成为独立开发者的一份礼物,他们没有资源和技能进行视频推广。从理论上讲,Sora可能使得制作插曲成为可能,但在当前发展阶段,要以这种方式制作出高质量的游戏可能不太现实。然而,制作投资者展示的演示非常自然。
您是否正在考虑将Sora纳入你的工作流程中?
叶甫根尼·斯米尔诺夫,Playkot的休闲CPO
我们密切关注所有创新。我们确实看到了几个潜在的用例——如开发游戏玩法视频用于创意、开发广告创意、优化动画的开发和动画制作的自动化。
叶甫根尼·基特金,Lost Lore工作室的创始人和首席执行官
自2022年以来,Lost Lore已经开始应用神经网络。到2023年,我们已经开发了三款运用Midjourney、Stable Diffusion、Stable Video Diffusion(我们用于角色和环境的动画创建)以及多种音频AI(包括配音),并积极使用ChatGPT4进行叙事和游戏设计。
我们是少数每周研究TheresAnAIForThat网站并尝试将新神经网络应用于工作室日常任务的AI工作室之一。通过这样做,我们能够更快地制作更多内容,同时提高最终结果的质量。
因此,在我们的工作流程中,Sora肯定会有一席之地。如果有封闭测试阶段,我们将努力成为其用户。
阿列克谢·耶梅利亚诺夫,Skywaylab的联合创始人之一
在Skywaylab,我们测试市场上出现的所有工具,尽管我们尚未获得Sora的使用权,但与团队进行的会议表明,该工具在加速和降低营销假设测试成本方面具有良好的潜力,而这正是创建广告活动的关键方面。
然而,我们对Sora的兴趣并不仅限于购买流量的创意。我们在社交网络(如YouTube、TikTok和Instagram)上获取流量的病毒内容方向视角中看到巨大的前景。尽管在流量质量控制方面存在困难,但我们认为这一渠道对于游戏开发至关重要,因为它能以相对较低的成本接触到庞大的受众。使用Sora将极大地加快和简化我们制作病毒游戏内容的过程,使其更便宜有效。
我们在Sora中看到的不仅仅是自动化生成视频的工具,还有进行新格式和广告方法实验的机会。这可能包括创建个人化的广告视频,直接涉及目标受众的兴趣和偏好,以及开发能够实时适应当前趋势和观众兴趣的动态内容。
最终,这项技术为创造更深刻、更具吸引力的内容打开了大门,这些内容可以吸引大量玩家并保持他们长时间的兴趣,最终降低获取成本并提高我们活动的整体效率。
基里尔·朱科夫斯基,ZiMAD的CPO
目前,我们没有将Sora纳入我们的流程,但正在关注这个和其他类似的解决方案。
您认为Sora在开发中使用时会出现哪些隐患/限制?
叶甫根尼·斯米尔诺夫,Playkot的休闲CPO
目前尚不清楚用户对Sora生成结果的控制程度,这影响了我们如何在工作中利用这项技术。此外,目前也不明确如何对Sora进行再培训,以便适应特定用户和团队的任务。
叶甫根尼·基特金,Lost Lore工作室的创始人和首席执行官
OpenAI的服务器会对生成视频的长度有所限制,而且由于架构的专有性,自己的服务器可能不会允许安装(Sora很可能有多个神经网络层)。视频创建的时间很可能会长,不适合在初期频繁使用。
我还想提到该技术的安全性问题。因此,产品至今尚未公开。
阿列克谢·耶梅利亚诺夫,Skywaylab的联合创始人之一
我们目前看到的隐患不算多,但都相当重要。采用创新技术总是伴随着特定的挑战和限制。
- 法律和伦理问题:使用基于AI生成内容的技术的一个关键隐患是关于版权和知识产权的问题。确定使用AI生成的内容的权利归属可能很复杂,也可能会因未获得授权使用受保护材料而产生争议。
- 质量控制:通过Sora生成视频内容时,可能会出现确保稳定和可预测质量的问题。AI算法可能会以不同的方式解释文本描述,从而导致结果的不确定性。需要开发控制和修正机制,以确保生成内容符合规定的质量标准和预期。
- 对数据的依赖性:生成内容的质量和多样性直接取决于训练模型所用的训练数据。存在模型可能重现现有偏见或在数据多样性不足的情况下无法产生满足创意制作人构想的内容的风险。
最后,我想补充的是,尽管新技术在现有工作流程和过程中的实施面临诸多潜在挑战和困难,但我们必须这样做,否则将有失去与成功同行的机会。
基里尔·朱科夫斯基,ZiMAD的CPO
当然,隐患是存在的。最大的问题是结果常常不可预测,并且设置选项较少。出于视角、动态、照明及角色外观的强烈差异,一些场景可能难以以所需方式拼接在一起。随着时间的推移,设置选项将增多,但由于随机结果,该工具在完整的专业使用方面还需时日才能准备好。