v

voice-pro

由 abus-aikorea 研发
开源项目 Python 全球 free #audiobook#faster-whisper#gradio#karaoke#podcasts

Voice-Pro 是由 ABUS-AIKOREA 开发的一款强大的 AI 驱动的桌面级 Web 应用程序,专注于多媒体内容的创建和处理。它集成了 YouTube 视频下载、语音分离、高级语音识别、多语言翻译和文本到语音转换等功能。该工具支持零样本语音克隆和多语言文本转语音,旨在为内容创作者、研究人员和多语言专业人士提供一站式解决方案。其核心技术包括 Whisper 系列、F5-TTS、E2-TTS、CosyVoice 等,提供高质量的语音识别、克隆和翻译服务。

  • AI驱动的语音识别与字幕生成
  • 多语言翻译与配音
  • 零样本语音克隆与文本转语音
  • YouTube视频处理与音频提取
  • 桌面应用提供本地Web界面
webdesktop