Google数据集audio set 使用教程

Audioset 官网

前言

注意这个数据集是依托于youtube的,不是一键下载文件全都有的。
所以使用起来略有一些繁琐。不过放心,我这里已经找到了很多工具,可以方便使用。

下载数据集索引

进入 https://research.google.com/audioset/download.html
下载 Unbalanced train
这是一个csv格式
打开后会发现
形如这样
Aclv9drugo0, 50.000, 60.000, "/m/03q5_w,/m/09x0r"
从左到后是youtube视频id,音频开始时间,结束时间,最后就是label了。

label 的索引

进入这里
https://github.com/audioset/ontology
打开ontology.json文件,这里有label的编码和对应的实际意义。
例如我想要所有包含piano声音的片段
搜索Piano,得到对应 id 是 /m/05r5c

Google数据集audio set 使用教程_第1张图片
piano.png

如此便可从csv文件中筛选出需要的视频id.

下载音频/视频

这段代码会帮你根据id分析出视频的下载地址,mp4,flv等格式
https://github.com/zarkiel/Youtube
最后提取对应时间的音频片段即可。

你可能感兴趣的:(Google数据集audio set 使用教程)