人工智能如何成为游戏测试中的秘密武器——SunStrike案例分析

团队SunStrike与App2Top编辑部分享了在游戏项目测试流程中引入AI的案例。

作者 — SunStrike QA部门团队

引言

如果你负责游戏开发或质量保障,那么你一定了解测试人员的一天:功能测试、处理文档、更新测试案例、修复bug、设计更改同时进行。日常任务占据了20-40%的时间,有时甚至更多。

但实际上,QA的责任范围更为广泛。测试人员还需负责:

  • 新功能的基本检查;
  • 发布前的回归测试;
  • bug修复后的验证(确保其他功能未受影响);
  • 探索性测试(例如,如果玩家在Y时做X会如何?);
  • 游戏内分析的验证;
  • 性能和稳定性测试;
  • 跨平台和跨浏览器测试。

这只是工作的冰山一角。每个团队还需处理内部工具、构建、迁移、SDK等。这些工作往往需要同时进行。QA的工作范围常常比预期要广得多。

负担之重:从AAA到独立游戏

在大型项目中,通常同时处理几十个特性,GDD(游戏设计文档)可达数百页,还有不断的修订和在数千用户上的A/B测试。在这样的环境下,QA部门常常不堪重负:手动更新案例和阅读文档占用大量时间。

在小型团队中,情况更加困难:一个QA就承担整个部门的角色。他撰写文档、测试构建,并每天适应设计变化。在这样的任务密度下,没有自动化工具,专业人员很快会感到倦怠。

问题所在:手动处理文档

通常测试周期从文档开始。过程如下:

  1. 阅读GDD;
  2. 功能分解;
  3. 撰写初步测试案例;
  4. 识别边界场景;
  5. 修订和更新案例。

手动模式下测试文档开发的流程

哪一步最耗费时间?当然是编写测试案例。在这方面,AI已经可以成为一个很好的助手。

解决方案:AI作为GDD的首位阅读者

如果可以将GDD的初步工作(阅读、分析、案例编写)交给AI,而测试人员则专注于AI尚无法完成的工作:创意场景、逻辑检查和分析呢?

首先需要准备:

  • AI助手(如ChatGPT、Claude或Gemini);
  • 提示模板;
  • GDD(格式为.docx或.pdf);
  • CSV文件模板。

看似简单,实则有细节。我们用一个例子来说明。

运作原理:步骤详解

1. 上传文档

上传GDD的具体页面,比如选定的“制作系统”描述页面。

2. GDD分析:提示

在生成测试案例前,AI需了解分析内容。请求示例:

“分析附件文件 CW_2.0.docx(第5页:‘制作系统’)。请提取:

  • 主要功能(例如“资源创建道具”);
  • 硬性规则;
  • 限制条件;
  • 特殊条件。

在生成测试案例前请确认功能列表。”

3. 生成案例:严格的需求

确认后可以请求生成CSV格式的测试案例:

“为‘制作系统’功能生成CSV格式的测试案例,如示例test.csv。

只要CSV格式的文本,无需Markdown、标题或解释。

每个案例包括名称、步骤、预期结果。

示例:

“正向:用A+B制作道具C”,“1. 打开菜单…”,“道具C出现在库存中””。

注意:最好限制文本输出,每次生成几个部分的案例,而不是整个GDD;模型在处理紧凑上下文时更高效。

4. 导出至TMS

将完成的文本复制并保存为.csv格式,随后导入至测试管理系统(TestRail、Qase、Jira等)。

最终得到的是可以在最小修订后立即使用的完整测试案例草稿。

接下来呢?手动检查!

即使使用优质模型,草稿仍需手动完善。AI不了解项目的所有细节,不能看到当前构建,也不能预测玩家的非标准行为。

因此,QA的角色仍至关重要:

  • 删除重复和过时的案例;
  • 添加非标准和创意场景;
  • 检查案例是否符合游戏的真实构建。

使用AI的测试文档开发流程

AI常见错误:典型问题

以下是我们发现的一些常见问题:

  • 幻觉:模型生成了关于“墙体穿透系统”的案例,尽管GDD中只略提到了物体破坏;
  • 重复:约20%的案例以不同表述重复出现;
  • 缺乏创意:在生成过程中未提议描述跳跃时制作系统行为的案例,bug在稍后手动找到。

AI擅长“阅读”和“结构化”,但却无法像人类一样“想象”。

在AI引入前后

手动工作时:

  • 阅读GDD和编写案例耗时最多30小时;
  • 其中约70%是例行事务。

引入AI后:

  • 生成案例草稿 — 30-40分钟;
  • 检查并完善 — 6-8小时。

最终节约时间 — 每个大型特性最多节约20小时。

QA专业人员将节省下来的时间用于探索性测试、创意场景和复杂案例的手动检查。

结论:AI不是魔法师,而是一种有效工具

人工智能不取代测试人员,而是将工作重心从例行事务转移到分析、非标准场景和质量上。

优点:

  • 加速测试案例准备;
  • 扩大基本覆盖范围;
  • 减轻团队负担。

需要注意:

  • 结果需要手动检查和调整;
  • 创意场景留给人类;
  • 可能出现重复和逻辑错误。

总结

AI是一个工具。它快速将GDD转变为工作草稿,但最终质量取决于专业人员:只有他们能将草稿打造成璀璨的钻石。

我们在活跃项目中应用这一方法,并持续发展。如果你遇到类似任务,欢迎分享经验。

评论
写评论...
Related news