27.03.2018

在已经发行的游戏中引入新功能:方法和解决方案

今天不可缺少更新。无论是关于高端项目的开发还是免费游戏,玩家们总是期待增补内容。但并不是每个更新都能带来好处。如果更新未能被玩家接受,你将失去金钱和受众。因此,在发布之前必须对其进行测试。我们将在本文中介绍如何进行测试。

为了不失去金钱和用户,必须测试新功能

发布游戏更新是一种普遍的做法。当涉及到内容更新时,通常不会有太多疑问。这一切都归结为“同样的汤,再加点儿料”的口号。

然而,对于新功能,出现后会如何影响游戏是无法预料的。

爱沙尼亚Creative Mobile的制作人阿琳娜·布拉兹代肯认为,更新后有三种可能的结果。第一种是积极的:指标会上升。替代方案则是保持原有的参数或变得更糟。

“后两种情况都是消极的。保持相同的指标不好,因为明显在新功能上投入了资源。如果失去这些资源是不可接受的,除非你尝试验证某种基本理论,而得到这个答案比你投入在功能上的资源更重要。在第二种情况下,可能会失去目标受众,”阿琳娜指出。

阿琳娜·布拉兹代肯目前正为Creative Mobile开发隐藏玩法X-Files: Deep State

因此,今天预先测试变得普遍。问题在于,如何正确实施这一过程,是否存在能准确了解用户如何响应新功能的方法。

增加新功能的第一步是分析

测试始于对现有项目版本的分析。

“我们总是尽量在项目启动后稍作等待,收集数据(分析和反馈),然后再决定是否引入新的内容,”DevGame的首席执行官马克西姆·科楚林说道。

这种方法有两个原因。第一,收集的数据形成控制组。根据这个控制组评估未来更新的有效性。第二,思考新功能时有依据可依。

“如果你已经提前知道什么影响你的用户,那么在未来做出关于即将改变的决定时将更为方便:部分假设会得到更大的权重,而部分会自然消失,”devtodev的首席分析师瓦西里·萨比罗夫谈到分析的必要性时说。

同样认为需要从分析开始的还有Playtestix的研究领导者亚历山德拉·拉琴科。但她是从另一个前提出发。萨莎将分析视为测试的一种方式。

“重要的是分析统计数据和玩家的意见,他们的游戏经历。做所有能帮助找到游戏关键点的事情。然后看看我们即将进行的改变。是否存在问题和更新的交集?如果是,则降低了指标下降的风险;如果不是,旧问题和新问题可能会交织,导致受众流失。”

简单来说,她建议检查新功能的清单是否与玩家的愿望清单相对应。

当没有机会进行充分的更新测试时,仅此方法也可以解决问题。然而,拉琴科指出,最好将其与其他分析和验证方法结合起来。

分析的第三种方法由Alternativa Games的制作人萨姆·斯特日亚克提出。他建议进行预测,看看新功能将如何影响项目本身。

“分析的结果应该给出项目上的机械联系的清晰图景和后果的预测。利用这信息可以根据项目的具体需求做出更有意义的功能决策,”斯特日亚克指出。

Alternativa Games目前专注于其新的在线战斗游戏Tanki X

分析通常归结为提出问题和回答。

“我们首先回答以下几个问题:哪些指标在我们看来对应用收入影响最大,哪些指标我们可以改善以及我们将花费多少精力和资金来解决这些问题?”科楚林解释道。

拉琴科也建议在问题清单的基础上进行测试。“最初需要分析我们变化的目标并与受众相结合,”她写道。

与此同时,拉琴科进一步提出。她建议根据计划的变化类型(全球性和局部性)和目标受众来进行不同的分析。根据这一点,她构建了“目标和焦点交叉矩阵”。该矩阵应为开发团队提供现有版本的最佳分析类型的答案。

主要问题在于,分析推迟了新功能的直接开发和测试阶段,因为需要进行多次研究。

这意味着需要首先研究与转化率、退单率、客户流失等相关的内容,然后才能开始最有趣的部分——整合新功能。

测试类型

假设分析已经完成,新酷功能也开发好了。接下来,假如没有人着急,就进入测试阶段。

完成功能给开发者带来了一个主要问题:如何进行测试。有很多工具,但并非所有工具都适合于特定的功能验证。

对于某些实现简单且成本低但有效的功能,阿琳娜·布拉兹代肯建议两种可能的情景。

“第一种——在构建中添加A/B测试工具(这是一个很好的投资,将来也会多次派上用场),仔细测试功能,发布更新并测量结果。”

“第二种——做出期望的功能,创建一个新应用。然后将其发布在有限的国家范围内,购买用户,将他们引入游戏并查看结果。”

然而,阿琳娜指出,该方法“仅适用于无法进行A/B测试的情况下[我们稍后将讨论],而且类似PlaytestCloud*的服务不适合做实验(尤其是当实验需要在长期内提高货币化/用户留存时)。”

*PlaytestCloud是一个在目标受众中进行游戏现场测试的服务。

重复测试的一个潜在问题是,平台通常存在某些重复的限制,因此开发团队必须使新的构建尽可能不同。同时,差异的引入也不应影响实验的纯洁性。

“与此相比,在产品中实现A/B测试功能似乎已经简单而便宜,”阿琳娜指出。

亚历山德拉·拉琴科也认为,被称为新的版本的“软启动”方法不太方便。在她看来,这不仅比用户样本测试的成本高,而且风险也很大,因为更新在真正的市场和测试中的接受程度可能不同。

她对封闭测试的实践给予了积极的评价。“这是一种众所周知的方法,”亚历山德拉保证道。“在目标受众中,我们招募了一群热爱探索新体验的热心人。邀请他们参与一场令人兴奋的游戏之旅,但别有风味。比较变更前后的数据,收集对变化的意见。”

DevGame对功能测试的方法略有不同。其主要区别在于没有邀请,而是直接针对有限的受众发布。

DevGame以其基于受欢迎特许经营权的儿童项目而闻名

“我们在5-10%的用户中(根据当前受众的规模)发布新版本,”马克西姆·科楚林说道。“然后我们收集数据,分析新功能如何影响主要指标和受众对产品的反馈。如果这些变化导致我们希望通过新功能改善的指标在10%的用户中增加,我们将版本推广到100%。就这样,我们逐步引入新功能。”

对于DevGame来说,主要指标是收入。因此,决定引入功能的主要“向量”很简单:如果假设增加收入,就会实施。

不同公司在测试工具和方法上有所不同,但A/B方法是所有公司的核心。通过我交谈的五个团队中,有四个使用了这一方法。

如何进行测试(建议与案例)

A/B测试

萨比罗夫无疑是A/B测试的积极倡导者。“如果有可能进行A/B测试,最好进行测试,”瓦西里说道。

他认为,应该这样做:

  • 形成用户组(需要确保他们在此之前没有与新功能互动,并且在实验中首次看到该功能);
  • 随机将他们分为两个或更多小组;
  • 将一个小组标记为对照组,并对其他小组进行修改/变更;
  • 进行实验并总结结果。

在进行实验之前,需先“正确设置最终指标”。瓦西里建议包括财务指标,例如,ARPDAU和第七天的累积ARPU。

不过,并不总是能凭借所获得的结果作出判断。例如,在测试《X档案:深度状态》(The X-Files: Deep State)时出现了意外。在对三种对话风格(讽刺、角色扮演和中立)的A/B测试中,没有一种风格的结果有显著的优势。

最终,Creative Mobile的团队决定依赖视频测试的反馈。“我们看到了对讽刺文本的非常积极的反应,决定保留它们,”阿琳娜·布拉兹代肯说。

与假设的工作

DevGame早已积极推动自己的数据处理方法。它没有特定的名称。其核心在于,公司的开发者始终从形成假设开始。

在开发《三只猫:商店》这款游戏时,他们采取了这种做法。这是该工作室推出的第二个“三只猫”品牌项目。

“问题在于,与第一个项目相比,它在一些基本指标上具有很低的值,——马克西姆·科楚林说道。“收入也不高。”

那么,他们接下来的工作是怎样的呢?

确定问题:短时间会话大量存在。

形成假设:在玩家选择角色的屏幕上,孩子们点击“开始”按钮,而不是角色本身(进入主要游戏玩法)。因此他们转而玩额外的玩法(装饰圣诞树)。玩家感到无聊,因此完全离开了游戏,没见过主要游戏玩法。

提供假设解决方案:在首次进入时,完全跳过角色选择屏幕,直接从主屏幕进入主要游戏玩法,点击“开始”按钮。

进行测试:在10%的用户中。

然后,DevGame将新版本的数据与基线数据进行比较。

从而工作室发现假设是正确的,因为新版本的第一天留存率高出10%,会话长度增加了两倍。

***

祝你在测试新功能时一切顺利!

如有任何额外问题,请务必告诉我们。

你想要更多关于测试的文章吗?
© Kama
评论
写评论...
Related news