MockingBird为github开源项目,项目地址:https://github.com/babysor/MockingBird
操作步骤中所有使用的软件安装包已上传网盘,可以关注公众号【站在前沿】,回复voice,获取网盘下载链接,也可以自行下载。
1、安装python3.8版本及以上
https://www.python.org/downloads/windows/
2、安装 PyTorch, 直接官网下载 Start Locally | PyTorch
如果GPU不支持CUDA,请默认选择,没有显卡就选择CPU。使用管理员CMD运行命令。如CPU命令:pip3 install torch torchvision torchaudio
3、安装 ffmpeg ,Download FFmpeg,下载后解压,然后进入bin目录,拷贝路径添加到系统环镜变量,使用CMD测试一下。
4、下载开源项目,GitHub - babysor/MockingBird: 🚀AI拟声: 5秒内克隆您的声音并生成任意语音内容 Clone a voice in 5 seconds to generate arbitrary speech in real-time,下载后解压。
5、进入源码目录,在地址栏里输入CMD,确认当前路径是解压后的源码目录,使用下列命令安装必备程序包
python -m pip install --upgrade pip pip install -r requirements.txt pip install webrtcvad-wheels
运行第二行命令时间比较长,一般会报错,需要安装C++编译环境,下载社区版就可以,下载 Visual Studio Tools - 免费安装 Windows、Mac、Linux,再运行第二行命令
6、下载语言模型,下载模型后,确保 xxx.pt 格式的文件放在 synthesizer\saved_models文件夹下,saved_models 如不存在请新建文件夹。
7、执行下列运行命令,启动Web程序
python web.py
8、下载训练数据集
由于训练数据集比较大,上传到的谷歌网盘,需要安全上网后下载,下载地址:https://drive.google.com/u/0/uc?id=110A11KZoVe7vy6kXlLb6zVPLb_J91I_t&export=download
9、也可以启动工具箱程序,数据集路径为 C:\data\aidatatang_200zh
,那么
就是 C:\data
python demo_toolbox.py -vc -d F:\data
所有使用的软件安装包已上传网盘,可以关注公众号【站在前沿】,回复voice,获取网盘下载链接,也可以自行下载。