Browser-Use 是一款强大的 AI 驱动浏览器自动化工具,通过自然语言或 Python 代码,帮助用户实现网页交互、数据抓取及复杂任务自动化。它提供开源 Agent 供本地部署,并有功能更强的云 Agent 服务,支持隐身浏览、代理轮换和高级集成,显著提升自动化效率与准确性。
notebooklm-skill 是专为本地 Claude Code 设计的增强插件,通过 Patchright 自动化技术使 Claude 能直接检索并分析用户在 Google NotebookLM 中托管的文档。它解决了本地 RAG 配置复杂、长文本 Token 消耗高以及模型幻觉等痛点。开发者只需将文档上传至 NotebookLM,Claude 即可在 CLI 中获取基于原始来源的、带引用的精准答案,实现无缝的知识库查询与代码编写协作。
Playwright CLI 是一个由 Microsoft 开发的命令行工具,专为 AI 编码 Agent 设计,用于浏览器自动化。它通过精简的 CLI 命令和可安装的技能,实现了比传统 Playwright MCP 更高的 Token 效率,避免了将大量工具模式和冗长的可访问性树加载到模型上下文中。这使其更适合高吞吐量的编码 Agent,能在有限的上下文窗口中平衡浏览器自动化与大型代码库、测试和推理。它支持多种浏览器,提供会话管理和可视化监控仪表板。
GenericAgent是一个极简、可自我进化的自主Agent框架,核心代码仅约3K行。通过9个原子工具和约100行的Agent Loop,赋予任意LLM对本地计算机的系统级控制能力,覆盖浏览器、终端、文件系统、键鼠输入、屏幕视觉及移动设备。它不预设技能,而是通过每次任务执行自动固化技能,形成专属技能树,能力随使用持续增长,同时具有极致的Token效率。
CloakBrowser 是由 CloakHQ 开发的深度定制版 Chromium,专为绕过高级机器人检测而生。不同于传统的 JavaScript 注入或配置修补,它在 C++ 源码层面修改了 49 项底层指纹(如 WebGL、Canvas、WebRTC 等),使检测系统将其识别为真实的正常浏览器。它支持 Humanize 行为模拟,能产生真实的鼠标轨迹和点击频率,并能直接作为 Playwright 或 Puppeteer 的替代方案。在 OpenClaw 生态中,它常被用作 AI Agent 执行复杂网页任务的隐身浏览器环境。
Browser Harness 是一个轻量级、可自我修复的原生 CDP(Chrome 开发工具协议)工具,旨在将 LLM 直接连接到真实浏览器。它摒弃了僵化的中间件框架,让 Agent 拥有完全的控制自由。其核心特点是“自我完善”:Agent 会在执行任务过程中自动编写和扩展缺失的辅助代码,并动态生成特定网站的专属 Domain Skills。支持本地调试与无头部署,并无缝集成 Browser Use 云端服务。