GPT-SoVITS-v2pro-20250604最新整合包下载即用,本地部署
特色:
- 零发TTS:输入一段5秒的人声样本,即可体验即时的文本转语音转换。
- 少量TTS:只需1分钟的训练数据即可微调模型,以提升声音相似度和真实度。
- 跨语言支持:推断语言与训练数据集不同,目前支持英语、日语、韩语、粤语和中文。
- WebUI 工具:集成工具包括语音伴随分离、自动训练集分割、中文ASR和文本标注,帮助初学者创建训练数据集和GPT/SoVITS模型。
GPT-SoVITS v2 ProPlus 的推理速度(RTF): 0.028 在 4060Ti 上测试,0.014 在 4090 中测试(1400 字~=4分钟,推理时间为 3.36 秒)
V2Pro 发布说明新功能:
- 显存使用率略高于v2,超过v4的性能,硬件成本和速度都比v2高。
2.v1/v2 和 v2Pro 系列有相同的特性,而 v3/v4 则有类似的功能。对于音频质量一般的训练套装,v1/v2/v2Pro 能带来不错的效果,但 v3/v4 不行。此外,v3/v4的合成音色和时间更偏向参考音频,而非整体训练集。













