为什么游戏中需要预测分析?
在制作免费游戏热门作品的过程中,新的分析方向——预测分析——可以如何提供帮助,devtodev的专家们对此进行了讲解。
本文由devtodev的分析师维拉·卡尔波娃撰写,参与者包括公司首席分析师瓦西里·萨比罗夫。
维拉·卡尔波娃
如今,产品分析是经营免费游戏的必要组成部分。大多数开发者无法想象在没有用户在应用中行为数据的支持下继续进行项目:用户何时购买、居住位置、对公司成本的影响以及何时流失。
但是,仅有这些数据通常不足以成功进行项目管理,因为不仅需要事后获取数据,还需要基于这些数据对未来结果有足够的准确性进行预测。因此,当前新的数据分析方法——预测分析(predictive analytics)正在积极发展。
预测分析——基于大量数据的预测
如果您每天甚至每小时都在关注指标,您可能对预测分析有所了解。
例如,您知道在您的游戏中,通常在12:00有约20,000名用户,而今天这一数字显著低于15,000。
在特定时间内在线游戏用户数量的报告,与前一天的指标进行比较。
看看这个图表,您推测到一个小时后,与昨天的数值差异会变得更大,尽管这还没有发生。
这个预测本身就是预测分析。
这种分析是必要的,因为它可以在问题的初期迹象中就帮助您识别其规模,并着手解决该问题。
预测分析基于长期收集的大量用户数据,以及更复杂和更精确的计算。
预测分析的基础是根据已有的信息构建预测,这种模型正是显示当前动态下产品将面临的结果。
预测过程主要归结于创建模型。
预测过程是如何进行的?
预测过程的第一阶段——数据收集
第一个阶段是数据收集。这通常是对应用中事件进行追踪,并且大多数情况下这一功能已经实现,因为它用于计算和控制基本指标、A/B测试、细分和产品分析。基于这些长期收集的数据,随后将创建模型。
预测过程的第二阶段——选择决定性指标
在下一个阶段,确定哪些参数更有可能影响预测事件。通过机器学习算法识别数据中的规律(模式)。与此同时,不必要的事件和异常值被筛除。
这是最复杂的阶段,因为应用中数据越多(例如,游戏进度、游戏货币数量、玩家水平、注册方式、游戏天数、购买次数、第一次购买时间等),就越难以确定哪些参数会影响到最终事件。
在这里,重要的是不要过度筛选:选择用于预测的因素越少,模型的准确性就越低。
预测过程的第三阶段——创建预测模型
基于模式和之前收集的历史数据,创建一个预测模型,显示特定用户发生某事件的可能性。
上述所有操作的结果(而我们还记得,任何分析的目标都是得出结论)可能是这样的声明:
一名来自美国的iPhone 7用户,2天前安装了游戏,进行了3美元的一次购买并完成了4个关卡,将在8天后退出游戏。
预测过程的第四阶段——验证预测
接下来,需要确定获得的模型的准确性。一个方法是计算预测值与实际值之间的比例。100%的准确度是理想模型的指标,而接近0%则不幸地意味着一次随机猜测。
要评估这一指标,需要选择一组用户,为他们做出预测,并观察这一细分市场的实际行为与预测的行为之间的匹配程度。
假设,您预测特定细分市场的第七天“留存率”(在安装后的第七天登录应用程序的用户比例)为“留存率”第七天(预测)= 14.4%。
在7天后,您获得实际数据,计算该指标的实际值:“留存率”第七天(实际)= 15.1%。
为评估预测的准确性,我们将预测的数据除以实际数据,得到95.4%,这将是模型的准确性指标。
另一个评估准确性的方法是计算预测值与实际值之间的百分比差异,并将绝对值差异从1中减去。
1 - |((15.1% - 14.4%) / 15.1%)| = 95.4%。
如果现实重现了预测,或者至少相符达95%,那么模型可以应用于新数据;如果没有,就应再次审视并校正影响预测事件的因素。
当您对模型的准确性感到满意时,可以开始与用户互动,根据获得的数据改变他们的行为。
了解忠实用户在应用中采取的哪些行动能够促成付款并长期留在游戏中,可以尝试“鼓励”另一个较少购买意愿并倾向于离开的用户群体,通过同样的方式采取相同的行动,培养他们的忠诚度和参与度。
预测的一个主要优点是,您可以提前数天知晓结果,也就是目标事件发生之前。这意味着您有时间使用户留在游戏中,刺激他们购买,或者增强他们对游戏过程的参与感。
重要的是:在构建模型时不要忘记细分,因为在同一用户群体(例如新手和刚安装应用的用户)中,必然会存在具有不同社会和人口特征及不同行为的用户。
预测分析解决哪些问题?
任何公司的目标都是为了让玩家满意并尽可能长时间留在项目中。这意味着使用模型的结果应该是提高用户的LTV(每用户生命周期价值)。
LTV受一系列指标的影响,这些指标的行为可以通过预测分析进行预测。这包括“流失率”、“购买转化率”和参与程度。
预测分析帮助确定用户何时将离开游戏
目前,最受欢迎的用于预测的指标是“流失率”(反映在特定时间段内有多少用户离开产品的比例)。该指标直接影响收入——用户在游戏中停留的时间越长,他们带来的收入就越大。
用户LT和LTV变化的图表,在使用模型后相对于当前情况。
“流失率”预测可以显示:
- 玩家在离开前将进行多少次游戏会话;
- 有多少用户将以何种概率离开游戏;
- 哪些行动是打算留在游戏中的用户和可能会离开的用户所采取的。
为了构建“流失率”参数的预测模型,需要确定哪些指标可能会影响玩家离开应用。例如:
- 用户在游戏中的会话数量及其频率;
- 会话持续时间;
- 游戏进度(已完成的关卡数、任务数量);
- 第一次购买相对于第一次会话的时间;
- 玩家进行了多少次支付;
- 社会活动(例如,参与聊天);
- 距离订阅到期的天数;
- 自第一次会话以来玩家达到的水平。
影响感兴趣事件的指标及其数量因游戏而异。
当您确定了影响结果的因素后,即可基于这些因素构建一个准确的模型,找出用户何时会离开游戏,同时也可以开始进行实验,以提高预测指标。
在这种分析过程中,可以发现,例如,只有一次在应用中使用搜索的用户,75%的概率在接下来的14天内会离开游戏。
而那些进行了1-2次支付并完成了2-5个关卡的玩家离开的概率仅为35%。
而那些进行了5-10次支付并完成了5-10个关卡的用户则以仅15%的概率离开应用程序。
预测分析帮助确定玩家何时会付款
下一个影响收入的重要指标是购买转化率,尤其是首次购买。
这些可能受到以下因素的影响:
- 用户完成了教程;
- 完成了第一关;
- 第一次接触到购买;
- 玩家的年龄、性别等人口统计特征;
- 设备的技术规格;
- 游戏的设计。
通过建立模型,您可以确定:
- 是什么促使用户开始付款;
- 谁完全不打算购买;
- 哪些具有特定特征的用户(相关属性)更倾向于购买(使用的设备、操作系统、国家来源)。
凭借收集到的数据,您能够将有较高购买倾向的用户与那些不打算购买的用户进行对比。
与用户流失分析类似,您可以发现,例如,首次会话持续超过15分钟的玩家有70%的概率会进行支付。
或者说,对于使用iPhone 6来自德国的用户,进行支付的概率为25%。
预测分析帮助计算未来用户对项目的参与度
用户的参与程度也会影响LTV。这是与转化率相同的,只不过这是与您认为的重要行动有关,以便“吸引”用户继续玩游戏,并提高“粘性因素”(DAU/MAU)。
在这方面,一切都相当个性化。对于一款游戏,这一指标可能是完成的第一关,而对于另一款游戏,则可能是注册转化率或达到一定分数的数量。对于组织类应用——创建任务,对于词典——找到的单词,对于消息应用——添加联系人和发送消息。
在这种情况下,您可以创建一个模型,显示哪些用户倾向于转化为这一目标行为。因此,推动提高指标的方式也将会有所不同。
如果您的应用中有广告,那么为了确定最佳展示时机,可以建立一个辅助模型,将用户根据对广告的反应概率进行分段。同时,此模型还可以计算出显示广告的最佳时机。
总体而言,了解某个用户在游戏中的举动,您可以改变他们的路径,提高他们的游戏满意度,并进而影响他们的LTV,增加收入。
预测分析的实施案例
来自Innova公司的开发者为两类用户启动了玩家流失预测模型。
针对“新手”用户的流失预测基于他们在前几天的行为进行构建,而关于已经在游戏中几个月的用户< a href="https://habrahabr.ru/post/149405/" target="_blank">流失预测则是通过对多种行动进行分析,提前2-3周获知,即将发生流失的情况。
电子艺界公司使用预测分析来寻找游戏中的“薄弱”环节、预测玩家流失并判断某个功能释放后是否会受欢迎,基于每天收集的50TB数据。
在游戏《外星儿童》中,通过机器学习(预测分析的一部分),游戏的主角已经与用户进行对话,积累数据并完善回答。
预测分析工具
越来越多的分析服务在其产品中嵌入和发展预测工具。
例如,Mixpanel根据用户进行目标事件的概率将其划分为不同细分,并允许向选定细分发送有针对性的通知。
Localytics也以类似方式预测用户流失或其转化率。此工具还显示处于不同细分的用户拥有什么样的特征,哪种行为是他们最常采取的。
而Infer公司则分析用户信息以评估其转化概率并预测销售情况。
我们在devtodev推出了基于用户在使用产品初期的支付预测的LTV预测机制。我们可以计算用户在首次使用产品的第一天、前两天、前三天等所带来的平均收益。基于这些初始支付信息,我们进行LTV预测。获取到后续几天的数据后,我们会调整预测。
在我们的服务中,还能预测:
- 他们将在第几天实现首次、第二次、第三次付款;
- 他们将在什么关卡转化为付费用户/进行重复支付;
- 他们在首次/第二次/后续支付中支付的金额;
- 他们在游戏的每个关卡内购买的真实或虚拟货币;
- 他们在游戏中如何从一个地点移动到另一个地点以及遇到了哪些问题;
- 等。
了解这些模式后,您可以在游戏中做出改动,让游戏对用户更加友好,从而提高他们的忠诚度。
假设您发现用户在游戏的第二天会在第六关进行第一次付款,购买星尘宝箱。如果您向达到这一位置的用户发送推送通知,并给他们提供购买宝箱的折扣,那么用户更有可能响应此提议,从而提高转化率。
预测分析的特点
尽管预测模型可以高精度预测用户行为,但这种方法在使用预测模型时存在一些必须考虑的特点。
首先,无法预见所有可能发生的外部因素和事件,这些因素和事件可能会影响您的用户及其行为。
例如,iTunes可能会针对某一特定国家重新编制价格,从而改变该地区的购买活跃度。
其次,用户行为还可能受到外部经济事件以及您自己实验的影响。因此需要注意,如果您持续进行实验,任何与价格、货币和商品相关的测试都可能严重影响玩家行为,从而使基于旧数据的预测失去有效性。
预计预测分析的发展方向是什么?
在构建预测模型时,当前最重要的任务是确定对预测事件影响最大的参数。
最有经验的人,尤其是在特定产品有经验的人,能够最好地完成这项任务。只有这样的人,了解自己的用户,才能更好地调整设定的参数,提高预测的准确性。
因此,人为因素在预测中发挥着重要作用。因此,预测分析所期待的下一个步骤应该是更大程度的自动化——使机器算法自动确定影响结果的参数,并找出需要改变用户路径上的哪个事件,以有效改变结果事件。
根据专家的观点,预测分析的另一个预计发展方向是个性化游戏,为每个玩家选择最优的游戏过程参数(难度等级、奖励系统、地图位置等)和货币化策略。
现在,用户在游戏中的行为数据都可以被收集,各种接触将可能增加或减少收入,并可能改善或破坏其后续行为。因此,从长远来看,机器学习将可能导致游戏能够适应个别玩家,调整其路径,从而最大化收入。
目前公司致力于关注用户过去的行为,而更希望预测他们未来的行为。预测分析是一个新工具,它不仅能预测未来,还能控制和调整未来。
“过去和现在是我们的手段,只有未来才是我们的目标。”
布莱兹·帕斯卡尔