深度学习是当今场景的游戏规则改变者,数据集在塑造技术的未来方面发挥着主导作用。学习从获得正确的数据开始,掌握该领域的最佳方法是通过练习高质量的数据集来亲自动手。
在这里,我们列出了 15 个开放的高质量数据集,用于在包括图像处理、语音处理等在内的深度学习空间中进行练习。
该数据集受到图像和视觉研究领域日益增长的情绪的启发,可以说是计算机视觉分类算法的事实数据集。这是根据 WordNet 层次结构组织的图像数据集。
类别:图像处理
数据集信息:图像总数包括 14,197,122。WordNet 中的概念由“同义词集”或“同义词集”来描述,WordNet 中存在超过 100,000 个同义词集,ImageNet 为每个同义词集平均提供 1000 个图像。
这是实现此数据集的论文的链接。
这是深度学习的重要数据库之一。据报道,微软和谷歌实验室的研究人员为这个手写数字数据集做出了贡献。它基本上是由 NIST 构建的,其中包含手写数字的二进制图像。
类别:图像处理
数据集信息:数据集包含 60,000 个训练集示例和 10,000 个测试集示例。该数据集中有四个文件。这是实现此数据集的论文的链接。
LSUN 或大规模场景理解是一个数据集,用于检测和加速场景理解的进度,包括场景分类、显着性预测、房间布局估计等。
类别:图像处理
数据集信息:普林斯顿大学的这个数据集由每个场景和对象类别的大约一百万张标记图像组成,其中测试集包含 10,000 张图像。
一个大规模的对象检测、分割和字幕数据集,包含上下文识别、超像素东西分割、对象分割等特征。
类别:图像处理
数据集信息:该数据集包含 150 万个对象实例,包含 80 个对象类别、91 个东西类别,并且每张图像都带有 5 个标题。
Youtube-8M 是谷歌集团于 2016 年 9 月宣布的大规模视频数据集。每个视频的标签被组织成 24 个顶级垂直。
类别:图像处理
数据集信息:该数据集包含 610 万个 YouTube 视频 ID、26 亿个带有高质量注释的音频/视频特征和 3800 多个视觉实体。
这是来自 Yelp 的用于学术学习目的的开放数据集,它是用户数据、评论和业务的子集。
类别:自然语言处理
数据集信息:该数据集包含来自 10 个大都市地区的超过 500 万条评论。它还包含 140 万个业务属性,例如营业时间、停车位、氛围等。
这是一个大规模的英语语音数据集,来源于阅读 LibriVox 项目的有声读物。它包含准备好的语言模型训练数据和预构建的语言模型。
类别:语音识别
数据信息:该数据集包含以 16 kHz 采样的 1000 小时语音,其中包括 yes-no 录音、丹麦语发音词典、大型英语语音语料库、西班牙语单词列表、非洲口音法语语音录音等。
该数据集提供了设计和评估新生物识别算法的工具以及将生物识别技术整合到最终用户应用程序中的界面。
类别:生物识别
数据集信息:该数据集包含用于面部识别、年龄估计和性别估计的开源代码。
该数据集取自 YouTube 视频,由一个扩展的本体组成,该本体被指定为事件类别的层次图,涵盖人类和动物的声音、乐器的声音、流派、日常环境声音等。
类别:声音
数据集信息:数据集由 210 万个带注释的视频组成,其中包括 527 个类和 5800 小时的音频。
该数据集由 2004 年从 blogger.com 收集的博客组成。在这里,每个博客都表示为一个单独的文件,每个组由相同数量的男性和女性博主组成。
类别:自然语言处理
数据集信息:该数据集由 19,230 位博主收集的帖子组成,总共包含 681,288 个帖子和超过 1.4 亿字。
该数据集是由 Alex Krizhevsky、Vinod Nair 和 Geoffrey Hinton 收集的 8000 万个微小图像数据集的标记子集。
类别:图像分类
数据集信息:该数据集包含 10 个类别的 60,000 个 32X32 彩色图像,每个类别 6000 个图像。训练图像和测试数据分别由 50,000 和 10,000 张图像组成。
这是一个大规模的开放数据集,旨在促进自动驾驶技术的发展。它包含数十万帧的高分辨率 RGB 视频及其对应的逐像素语义注释、密集点云、立体图像等。
类别:自动驾驶
数据集信息:数据集包含 25 个不同的语义项目,如汽车、自行车、行人、路灯等,由 5 个组覆盖。
这是普林斯顿大学的一个大型英语同义词数据集,包含任何意见、发现、结论、建议等。它是计算语言学和自然语言处理的有用工具。
类别:自然语言处理
数据集信息:它包含 11,7000 个同义词集,每个同义词集通过少量概念关系链接到其他同义词集。
该数据集包含已使用图像级标签和对象边界框注释的开放图像。
类别:图像分类
数据集信息:数据集分为超过 900 万张图像的训练集、超过 4 万张图像的验证集和 125,436 张图像的测试集。
该数据集用于二元情感分类,其中包括除训练和测试评论之外的未标记数据。
类别:自然语言处理
数据集信息:该数据集包含 25,000 条用于训练的高度极性电影评论以及 25,000 条用于测试的评论。