PRODUCTS // 关联产品 TOTAL: 02
voice-pro
开源社区
Voice-Pro 是由 ABUS-AIKOREA 开发的一款强大的 AI 驱动的桌面级 Web 应用程序,专注于多媒体内容的创建和处理。它集成了 YouTube 视频下载、语音分离、高级语音识别、多语言翻译和文本到语音转换等功能。该工具支持零样本语音克隆和多语言文本转语音,旨在为内容创作者、研究人员和多语言专业人士提供一站式解决方案。其核心技术包括 Whisper 系列、F5-TTS、E2-TTS、CosyVoice 等,提供高质量的语音识别、克隆和翻译服务。
pyvideotrans
开源社区
pyVideoTrans 是一款开源的全自动视频翻译与AI配音工具,可实现音视频到多语言的无缝转换。其工作流完整涵盖语音识别(ASR)、大模型字幕翻译、多角色语音合成(TTS)及音视频自动同步。特点是支持说话人分离与零样本声音克隆,兼容本地离线模型(如Faster-Whisper、Ollama)和众多主流云端API。提供带暂停校对的GUI图形界面以及方便批量处理的CLI命令行模式,是一款高效的多媒体本地化利器。