GPT-SoVITS

一个声音克隆和文本到语音转换的开源 Python RAG框架，只需1分钟语音即可训练一个自己的TTS模型。

# Ai开源项目

访问 GPT-SoVITS 直接访问手机查看

GPT-SoVITS，一个声音克隆和文本到语音转换的开源 Python RAG框架，只需1分钟语音即可训练一个自己的TTS模型。完美克隆你的声音！GPT-SoVITS完美适配中文，应该是目前中文支持比较好的模型。

github发布地址：https://github.com/RVC-Boss/GPT-SoVITS

GPT-SoVITS主要特点：

1、零样本TTS：输入5 秒的声音样本即可体验即时的文本到语音转换。

2、小样本 TTS：只需 1 分钟的训练数据即可微调模型，以提高语音相似度和真实感。模仿出来的声音会更加接近原声，听起来更自然。

跨语言支持：使用与训练数据集不同的语言进行推理，目前支持英语、日语和中文。

3、WebUI工具：集成工具包括语音伴奏分离、自动训练集分割、中文 ASR 和文本标注，帮助初学者创建训练数据集和 GPT/SoVITS 模型。

4、适用于不同操作系统：项目可以在不同的操作系统上安装和运行，包括 Windows。

5、预训练模型：项目提供了一些已经训练好的模型，你可以直接下载使用。

如何使用GPT-SoVITS？

如果您是 Windows 用户（使用 win>=10 进行测试），您可以直接通过预压缩进行安装。只需下载预压缩，解压并双击 go-webui.bat 即可启动 GPT-SoVITS-WebUI。

GPT-SoVITS是一款强大的语音克隆和文本到语音转换工具，它可以实现零样本和少样本的语音克隆，以及跨语言的文本到语音转换。它具有数据量少、质量高、灵活性强、易用性高等优点，可以应用于多种场景。如果你对GPT-SoVITS感兴趣，具体详细步骤，可以去项目开源网址上查看，哔哩哔哩上也有相应的教程。

GPT-SoVITS简介