VoiceFixer 2:用于语音恢复的工具包

项目简介

欢迎使用 VoiceFixer 2,下一代 VoiceFixer。VoiceFixer 是一款通用语音修复工具,使用 AI 消除背景噪音、修复降级语音、增强旧录音的音频质量、提高音频分辨率等等,全部功能都在一个模型中!

VoiceFixer 的目标是恢复人类语音,无论其退化有多严重。它可以在一个模型内处理噪声、混响、低分辨率和削波效果!


与原来的 VoiceFixer 有什么不同?

VoiceFixer 的原始版本继续更新,进行了细微的更改和错误修复,但是,如果尝试安装它并开箱即用,则会遇到一些错误,需要修改已安装的软件包才能修复。

有什么问题?这是如何解决的?VoiceFixer 需要旧版本的 librosa 库,该库与新版本的 numpy 库不兼容。我们通过修复旧版本的 librosa 和 voicefixer 解决了这个问题。我们还添加了一些新功能。


VoiceFixer 2 中的新功能

我们在 VoiceFixer 2 中添加了以下功能:

  • 我们添加了 MPS 支持,这意味着您可以在 M1 Mac 上使用 GPU 加速。您可以通过将 cuda 参数设置为 True 来启用此功能。使用命令行界面 (CLI) 时会自动启用它。

  • 我们通过 TQDM 添加了进度条以获取更长的音频

  • 我们现在支持非 WAV 文件(即 MP3)

  • 我们现在使用 cached_path 而不是硬编码缓存路径来增加操作系统支持

  • 我们提供更快的模型下载和 Hugging Face

  • 更多功能即将推出!

安装

不想安装该软件包,但只想尝试一下?

使用我们的免费 API(无需 API 密钥)处理 5 分钟以内的音频文件。仅限非商业用途,可能会收集音频。详情见网页。

curl -X POST -H "Content-Type: multipart/form-data" -F "[email protected]" https://voicefixer-voicefixer-api.hf.space/process_audio > processed_audio.wav

注意:如果您在 Apple Silicon 上有任何问题,请安装 PyTorch Nightly ( pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu )

您可以通过安装我们的软件包。PyPI(Python Package Index),官方 Python 包索引。

pip install voicefixer2

这将安装最新发布的版本。

如果您想安装最新的开发版本,或者出于任何原因不信任 PyPI,请直接从源安装:

pip install git+https://github.com/fakerybakery/voicefixer

项目链接

https://github.com/voicefixer/voicefixer

你可能感兴趣的:(智能语音,人工智能,音视频)