speech-to-speech,一个语音到语音转换系统,speech-to-speech支持将一种语言的语音转换为另一种语言语音,该项目使用GPT4-o作为语言模型,整合了语音活动检测 (VAD)、语音转文字 (STT)、、文字转语音 (TTS) 等模块,实现了完整的语音交互流程。

Speech-To-Speech:一个语音到语音转换系统(图1)

speech-to-speech特点:

  • 多语言支持: 支持多种语言间的语音转换,英语、法语、德语、西班牙语等

  • 模块化: 语音交互流程拆分成了多个独立模块,方便定制和扩展

speech-to-speech适用于跨语言交流、语音合成、语音识别等场景。


Speech-To-Speech:一个语音到语音转换系统