v

voicebox

由 jamiepine 研发
开源项目 TypeScript 全球 free #ai#cuda#mlx#qwen3-tts#qwen3-tts-ui

Voicebox 是由 jamiepine 开发的开源本地化 AI 语音工作室,被视为 ElevenLabs 和 WisprFlow 的私有化替代方案。它集成了语音克隆、多引擎文本转语音(TTS)及基于 Whisper 的全局听写功能。其核心特点是 100% 本地运行,通过内置的 MCP 服务器,它可以让 Claude Code、Cursor 等 AI Agent 直接调用并以用户克隆的声音进行对话,打通了 Agent 语音交互的输入输出闭环。

  • 跨引擎零样本语音克隆
  • 内置 MCP 服务器支持 Agent 调用
  • 23 种语言与 7 大 TTS 引擎集成
  • 全局热键听写与文本注入
  • 100% 本地推理与隐私保护
desktop