CosyVoice /F5-TTS /GPT-SoVITS /Fish-Speech 开源语音克隆与文本转语音(TTS)项目的对比整理
四个主流开源语音克隆与文本转语音(TTS)项目的对比整理,基于公开资料与实测反馈总结:项目CosyVoiceF5-TTSGPT-SoVITSFish-Speech核心技术双向流式语音合成,支持离线与流式一体化建模基于流匹配的ConvNeXt文本表示,SwaySampling采样策略零样本/少样本语音克隆,结合GPT与SoVITS架构多语言TTS模型,支持无音素依赖的跨语言合成克隆效果音色一致性高(