侧边栏壁纸
  • 累计撰写 2,058 篇文章
  • 累计创建 73 个标签
  • 累计收到 20 条评论

目 录CONTENT

文章目录

AI拟声: 5秒内克隆您的声音并生成任意语音内容

大猿本猿
2022-10-26 / 1,383 阅读 / 275 字

项目地址

https://github.com/babysor/MockingBird

项目简介

🌍 中文 支持普通话并使用多种中文数据集进行测试:aidatatang_200zh, magicdata, aishell3, biaobei, MozillaCommonVoice, data_aishell 等

🤩 PyTorch 适用于 pytorch,已在 1.9.0 版本(最新于 2021 年 8 月)中测试,GPU Tesla T4 和 GTX 2060

🌍 Windows + Linux 可在 Windows 操作系统和 linux 操作系统中运行(苹果系统M1版也有社区成功运行案例)

🤩 Easy & Awesome 仅需下载或新训练合成器(synthesizer)就有良好效果,复用预训练的编码器/声码器,或实时的HiFi-GAN作为vocoder

🌍 Webserver Ready 可伺服你的训练结果,供远程调用。

使用说明

安装:

中午文档:https://github.com/babysor/MockingBird/blob/main/README-CN.md

安装PyTorch:

根据选项生成命令:

pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu116

image

安装ffmpeg:

image

安装其他包:pip install -r requirements.txt

安装 webrtcvad pip install webrtcvad-wheels

其他

B站教程:https://www.bilibili.com/video/BV1DL4y1q7VL/?vd_source=16159b4f6f1b9f06db46124ecd2bd0ab