在AI辅助的QA(软件质量保证)工作中,存在一个大多数工具讨论都完全忽略的特定失效模式,而在你单枪匹马承接真实项目时,这一问题会暴露得最早也最彻底。
那就是:每一个新的Chat会话都是无状态的。你需要粘贴Ticket(工作票)、描述功能特性、解释你的严重性逻辑、设置上下文。等AI终于能派上用场时,你本周已经是从零开始第三次重建你的方法论了。这并不是一个通过优化Prompt(提示词)就能解决的工作流问题,而是一个架构问题,而解决方案就是“Skill File(技能文件)”。
根据QAJourney的拆解,Skill File是一个作为系统提示词(System Prompt)加载的上下文文档。它承载了你的测试覆盖层级、三路径测试框架、缺陷报告格式、严重性和优先级逻辑、Playwright规范,以及对AI可行使权限的明确界定。每个会话只需加载一次,AI就能从第一条消息开始在你的方法论框架内运行,而不是面对一张白纸。
本地LLM层则解决了另一个痛点:数据隐私。在自由职业或顾问服务中,Ticket包含真实的业务逻辑和客户数据。每次会话都将其发送到云端API存在数据泄露风险。通过在本地运行Ollama,并加载相同的Skill File作为系统上下文,可以确保项目数据不出本地机器。对于QA任务所需的输出质量,目前7B到14B的模型已足够优秀,且零边际Token成本使其成为可控的基础设施,而非按次付费的服务。
该工作流采用三角色设定:工程师作为决策和评判层;加载了Skill File的云端AI用于复杂推理和活动会话输出;本地LLM则用于轻量级任务和客户敏感数据的处理。Skill File是贯穿这三者的核心纽带。
而最需要时间去内化的一点是:现代AI开发团队本身就已经运行着自己的QA层(如静态代码检查、自动单元测试、PR前的Agent生成Playwright脚本)。当你看到一个待评审的Ticket时,那些显而易见的路径早已被测试过了。你的工作始于AI Agent测试的终点:根据真实用户的期望去测试它构建的产品,而不是仅仅对比产品规格说明书。这两者完全不是一回事。
文章中提到的计费功能案例就是最清晰的证明。所有验收标准均已通过,代码技术上完全正确。但页面上没有账单历史,也没有续费指示。真实用户首次进入该页面时,根本不知道自己的钱花在了哪里。Agent完全按照Ticket的规格构建了功能,但Ticket并没有规定用户在计费场景中定位自己所需的交互细节。这就是人类QA无可替代的价值所在。
【AgentUpdate 深度解析】
本文揭示了AI Agent在垂直行业落地时的一个核心演进趋势:从“临时提示词工程”向“结构化知识系统(Skill File)”的范式转变。在软件测试这一高度依赖上下文和工程规范的领域,无状态的对话极大地限制了生产力。Skill File本质上是为Agent注入了标准作业程序(SOP)的“软固件”,使其具备了工程化的行为边界。结合本地LLM(如Ollama)和混合云架构,不仅解决了企业级交付中最敏感的数据合规性痛点,还实现了成本与算力的最优解。随着MCP(模型上下文协议)等标准的普及,这种“Skill File + 本地安全沙箱 + 云端强推理”的混合Agent工作流,将成为未来AI辅助研发与测试的行业事实标准。