Python 人工智能 5秒钟偷走你的声音

介绍

Python 深度学习AI - 声音克隆、声音模仿,是一个三阶段的深度学习框架,允许从几秒钟的音频中创建语音的数字表示,并用它来调节文本到语音模型,该模型经过培训,可以概括到新的声音。

环境准备与安装

原始英文版地址:

https://github.com/CorentinJ/...

中文二次开发版(本文使用该版本):

https://github.com/babysor/Mo...

pycharm环境下载:

https://www.jetbrains.com/pyc...

conda虚拟环境:

https://www.anaconda.com/prod...

FFmpeg :

https://github.com/BtbN/FFmpe...

模型文件:

https://pan.baidu.com/s/1PI-h... 提取码 2021

在电脑系统上安装 FFmpeg 工具

下载zip压缩包连接为:https://github.com/BtbN/FFmpe...

下载完成后将其解压到一个目录后在系统的环境变量中添加该目录

Python 人工智能 5秒钟偷走你的声音_第1张图片

打开新的cmd中查看是否安装成功

ffmpeg -version

Python 人工智能 5秒钟偷走你的声音_第2张图片

使用打开项目目录后,创建时使用conda的Python 3.9虚拟环境

Python 人工智能 5秒钟偷走你的声音_第3张图片

创建完成后,在cmd中查看现有的虚拟环境,并进入刚刚创建的虚拟环境

conda env list

activate pythonProject1

Python 人工智能 5秒钟偷走你的声音_第4张图片

进入环境后在进行安装pip所需依赖,并使用国内源进行安装实现下载加速

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.ed...

Python 人工智能 5秒钟偷走你的声音_第5张图片

在虚拟环境下安装pytorch

pip install torch  -i https://pypi.tuna.tsinghua.ed...

Python 人工智能 5秒钟偷走你的声音_第6张图片

回到pycharm中,将模型导入到项目目录下,把目录复制黏贴到项目中

Python 人工智能 5秒钟偷走你的声音_第7张图片

修改一行代码,在 synthesizer/utils/symbols.py 文件中

修改为:
_characters = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz12340!'(),-.:;? '

Python 人工智能 5秒钟偷走你的声音_第8张图片

之后在terminal中启动工具箱

Python 人工智能 5秒钟偷走你的声音_第9张图片

使用音频合成工具箱

Python 人工智能 5秒钟偷走你的声音_第10张图片

Python 人工智能 5秒钟偷走你的声音_第11张图片

Linux运维交流社区

Linux运维交流社区,互联网新闻以及技术交流。

48篇原创内容

公众号

Python 人工智能 5秒钟偷走你的声音_第12张图片

https://blog.csdn.net/qq_3392...

https://my.oschina.net/u/3981543

https://www.zhihu.com/people/...

https://segmentfault.com/u/hp...

https://juejin.cn/user/331578...

https://space.bilibili.com/35...

https://cloud.tencent.com/dev...

知乎、CSDN、开源中国、思否、掘金、哔哩哔哩、腾讯云

本文使用 文章同步助手 同步

你可能感兴趣的:(Python 人工智能 5秒钟偷走你的声音)