开源AI声音克隆程序GPT-SoVITS本地运行教程 | AI声音克隆教程

GPT-SoVITS是目前为止我亲测过的效果最好的 AI声音克隆程序,我甚至已经用这个程序克隆的声音做了一期完整的视频!相比较于《VALL-E X多语言文本到语音合成与语音克隆windows10本地部署教程》,GPT-SoVITS克隆的声音更加稳定,连贯性更好,下面我就来具体讲解下GPT-SoVITS在本地部署和运行的详细步骤!

Table of Contents

GPT-SoVITS功能
效果展示
安装方法
使用方法
训练模型
人声伴奏分离&去混响(可选)
人声分离步骤
效果展示
语音切割(必选)
语音文本校对标注(可选)
训练集格式化(必选)
微调训练(必选)
推理
效果展示
GPT-SoVITS功能
零样本文本到语音( TTS): 输入 5 秒的声音样本,即刻体验文本到语音转换。

少样本 TTS: 仅需 1 分钟的训练数据即可微调模型,提升声音相似度和真实感。

跨语言支持: 支持与训练数据集不同语言的推理,目前支持英语、日语和中文。

WebUI 工具: 集成工具包括声音伴奏分离、自动训练集分割、中文自动 语音识别( ASR)和文本标注,协助初学者创建训练数据集和 GPT/SoVITS 模型。

GPT-SoVITS的github主页:https://github.com/RVC-Boss/GPT-SoVITS

GPT-SoVITS的huggingface下载地址:https://huggingface.co/lj1995/GPT-SoVITS-windows-package/tree/main

如果你无法访问huggingface,可以点击下面的代理链接下载:

GPT-SoVITS-beta.7z

GPT-SoVITS-beta0207.7z


压缩包下载到本地后,解压到你自己选择的位置即可!双击“go-webui.bat”即可用运行“GPT-SoVITS”程序!

开源AI声音克隆程序GPT-SoVITS本地运行教程 | AI声音克隆教程

使用方法

训练模型

程序的使用分为几个步骤,当然根据自己的实际情况,其中有些步骤并非必须的!

人声伴奏分离&去混响(可选)

这个步骤并非是必须的步骤,如果你的音频文件中没有背景音乐或者其他伴奏,你可以跳过该步骤!该步骤可以将你的音频文件中的纯人声单独分离出来,以便于后面的使用!

人声分离步骤

一、点选“是否开启UVR5-WebUI”,会自动弹出一个新的页面;

二、在新的页面中指定音频文件(可以指定包含1个或者多个音频文件的文件夹,也可以直接将音频文件拖入,2种方式二选一);

三、建议选择“HP5_only_main_vocal”模型,输出的路径可以修改为你自己指定的路径,也可以保持默认的路径,导出文件格式建议选择wav;

四、点击转换之后,会在设置的文件夹中生成2个音频文件,名称较短的那个就是纯人声的音频;


GPT-SoVITS

GPT-SoVITS

GPT-SoVITS

GPT-SoVITS
GPT-SoVITS
视频教程:十分钟手把手教会你用AI克隆自己的声音 | GPT-SoVITS教程

主题测试文章,只做测试使用。发布者:zhaolou,转转请注明出处:https://www.zhaolou.cc/archives/13

Like (0)
zhaolou的头像zhaolou
Previous 2025年4月4日 上午10:08
Next 2024年8月17日

相关推荐

  • Midjourney-IP提示词-3D rendering

    a Super cute girl, Hanfu, Dance, silk, with magpie, hairpin,flowers, dreamy, Full-body picture, A bright color, Bright light,Movie light, wide angle, Pixar, 3D rendering, High deta…

    2025年4月4日
    7500
  • AI提示词分享——宫崎骏(吉卜力艺术)

    1.吉卜力艺术,在月球上,天空是黑色的,远处是一座火山,火山顶上有一颗巨大的橙子,一条清澈的河流从火山口流下,两边有月球地貌的峡谷,河水是橙色的,河里有人在划船,移轴摄影,创意摄影,高清画质,色彩简约,色调简约,画面干净宫崎骏电影获奖作品 2.吉卜力艺术,在现代化高楼林立的城市里,一只巨大的橘猫抱着一栋大厦,橘猫的身体与大厦一样大,巨物感,超现实主义,迷雾感…

    AI 2025年2月25日
    21700
  • AI绘画提示词词典-Midjourney/stable-diffusion-webui

    收集整理了Midjourney/stable-diffusion-webui AI绘图相关的提示词描述词词库,从绘图质量(清晰度、画质)、绘画风格、画面效果、容貌描述(头发、头饰、眼睛、耳朵表情)、构图、命令进行了详细分类。 绘图质量 绘图风格 绘图风格 画面效果 容貌描述 构图 命令 Post Views: 405

    2024年12月21日
    35600
  • AI制作爆款《赌神归来》的橘猫回家过年创意短视频 提示词

    提示词一: 一只拟人的橘猫,肥胖。拟人橘猫头上戴着黑色的爵士帽,嘴里含着一根雪茄,拟人橘猫一手提着黑色手提箱,一手抬起露出手腕上佩戴的百达翡丽昂贵手表,拟人橘猫穿着蓝色条纹西服和七分西裤,脚上是红色中袜和黑色皮鞋。走在农村乡下的房区小路,80年代,现实主义,自然纹理,背景虚化,正面特写,全身照,电影镜头质感,高清人像摄影,8K,超级细节,超高分辨率 提示词二…

    AI 2025年2月25日
    23400
  • AI提示词优化

    1. 语言风格类: 2.防止AI检测类: 3.文章结构类:    a)开篇点题(1-2段)-案例分析(2-3段)-多角度讨论(3-4段)-总结反思(1-2段)    b)开幕吸引(1段)-详细叙述(3-4段)-深入分析(3-4段)-总结升华(1-2段) 4.内容方向类: 5.排版优化类: 6.创新补充: Post Vi…

    AI 2025年1月2日
    51700

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

在线咨询: QQ交谈

邮件:156738051@qq.com

工作时间:周一至周五,9:00-18:00,节假日休息

关注微信