单枪匹马！我用Skill File与本地LLM打造了AI测试工作室

在AI辅助的QA（软件质量保证）工作中，存在一个大多数工具讨论都完全忽略的特定失效模式，而在你单枪匹马承接真实项目时，这一问题会暴露得最早也最彻底。

那就是：每一个新的Chat会话都是无状态的。你需要粘贴Ticket（工作票）、描述功能特性、解释你的严重性逻辑、设置上下文。等AI终于能派上用场时，你本周已经是从零开始第三次重建你的方法论了。这并不是一个通过优化Prompt（提示词）就能解决的工作流问题，而是一个架构问题，而解决方案就是“Skill File（技能文件）”。

根据QAJourney的拆解，Skill File是一个作为系统提示词（System Prompt）加载的上下文文档。它承载了你的测试覆盖层级、三路径测试框架、缺陷报告格式、严重性和优先级逻辑、Playwright规范，以及对AI可行使权限的明确界定。每个会话只需加载一次，AI就能从第一条消息开始在你的方法论框架内运行，而不是面对一张白纸。

本地LLM层则解决了另一个痛点：数据隐私。在自由职业或顾问服务中，Ticket包含真实的业务逻辑和客户数据。每次会话都将其发送到云端API存在数据泄露风险。通过在本地运行Ollama，并加载相同的Skill File作为系统上下文，可以确保项目数据不出本地机器。对于QA任务所需的输出质量，目前7B到14B的模型已足够优秀，且零边际Token成本使其成为可控的基础设施，而非按次付费的服务。

该工作流采用三角色设定：工程师作为决策和评判层；加载了Skill File的云端AI用于复杂推理和活动会话输出；本地LLM则用于轻量级任务和客户敏感数据的处理。Skill File是贯穿这三者的核心纽带。

而最需要时间去内化的一点是：现代AI开发团队本身就已经运行着自己的QA层（如静态代码检查、自动单元测试、PR前的Agent生成Playwright脚本）。当你看到一个待评审的Ticket时，那些显而易见的路径早已被测试过了。你的工作始于AI Agent测试的终点：根据真实用户的期望去测试它构建的产品，而不是仅仅对比产品规格说明书。这两者完全不是一回事。

文章中提到的计费功能案例就是最清晰的证明。所有验收标准均已通过，代码技术上完全正确。但页面上没有账单历史，也没有续费指示。真实用户首次进入该页面时，根本不知道自己的钱花在了哪里。Agent完全按照Ticket的规格构建了功能，但Ticket并没有规定用户在计费场景中定位自己所需的交互细节。这就是人类QA无可替代的价值所在。

【AgentUpdate 深度解析】

本文揭示了AI Agent在垂直行业落地时的一个核心演进趋势：从“临时提示词工程”向“结构化知识系统（Skill File）”的范式转变。在软件测试这一高度依赖上下文和工程规范的领域，无状态的对话极大地限制了生产力。Skill File本质上是为Agent注入了标准作业程序（SOP）的“软固件”，使其具备了工程化的行为边界。结合本地LLM（如Ollama）和混合云架构，不仅解决了企业级交付中最敏感的数据合规性痛点，还实现了成本与算力的最优解。随着MCP（模型上下文协议）等标准的普及，这种“Skill File + 本地安全沙箱 + 云端强推理”的混合Agent工作流，将成为未来AI辅助研发与测试的行业事实标准。

单枪匹马！我用Skill File与本地LLM打造了AI测试工作室

推荐阅读

Anthropic提示词缓存5大模式，API账单暴跌70%

2026年AI工具选择指南：四大顶流终极对比

独行96小时：我让AI Agent自主扫荡GitHub悬赏，净赚800刀

相关工具与资源推荐

相关技能市场

Anthropic Agent Skills

TokRepo

Skill Atlas