AudioCaps是从AudioSet数据集中筛选再加工得到的数据集。 AudioCaps数据集的下载使用python的第三方库 audiocaps-download,根据README.md的提示,先进行配置下载环境:
1.安装python3.9的环境
2.下载windows版本的ffmeg,进入ffmeg的官网,选择windows版本的ffmpeg-release-essentials.zip,下载完成后进行解压,然后将bin目录设置为环境变量,通过dos窗口验证ffmeg命令是否可以执行
3.下载audiocaps-download第三方库,如果安装过程中出现Visual Studio报错,那就需要安装Visual Studio。
pip install audiocaps-download -i https://pypi.tuna.tsinghua.edu.cn/simple
4.AudioCaps大小60G以上,使用如下代码下载数据集,注意:需要有VPN,不然无法访问外网。
from audiocaps_download import Downloader
d = Downloader(root_path='audiocaps/', n_jobs=16)
d.download(format = 'wav')
百度网盘链接:https://pan.baidu.com/s/1OenmnKfHPznFr7QU_azG9w
提取码:zaq8