腾讯AI Lab开源业内最大规模多标签图像数据集(附下载地址)

 

腾讯AI Lab开源业内最大规模多标签图像数据集(附下载地址)_第1张图片

 

今日(10 月 18 日),腾讯AI Lab宣布正式开源“Tencent ML-Images”项目。该项目由多标签图像数据集 ML-Images,以及业内目前同类深度学习模型中精度最高的深度残差网络 ResNet-101 构成。

 

该开源项目的主要内容包括:

 

1、ML-Images 数据集的全部图像 URLs,以及相应的类别标注。出于原始图像版权的考虑,此次开源将不直接提供原始图像,用户可利用我们提供的下载代码和 URLs 自行下载图像。

 

2、ML-Images 数据集的详细介绍,包括图像来源,图像数量,类别数量,类别的语义标签体系,标注方法,以及图像的标注数量等统计量。

 

3、完整的代码和模型。我们提供的代码涵盖从图像下载,图像预处理,基于 ML-Images 的预训练,基于 ImageNet 的迁移学习,到基于训练所得模型的图像特征提取的完整流程。该项目提供了基于小数据集的训练示例,以方便用户快速体验我们的训练流程。该项目还提供了非常高精度的 ResNet-101 模型(在单标签基准数据集 ImageNet 的验证集上的 top-1 精度为 80.73%)。用户可根据自身需求,随意选用该项目的代码或模型。

 

以深度神经网络为典型代表的深度学习技术已经在很多领域充分展现出其优异的能力,尤其是计算机视觉领域,包括图像和视频的分类、理解和生成等重要任务。然而,要充分发挥出深度学习的视觉表示能力,必须建立在充足的高质量训练数据、优秀的模型结构和模型训练方法,以及强大的的计算资源等基础能力之上。

 

腾讯 AI Lab团队将基于 Tencent ML-Images 的 ResNet-101 模型迁移到很多其他视觉任务,包括图像物体检测,图像语义分割,视频物体分割,视频物体跟踪等。

 

腾讯AI Lab开源业内最大规模多标签图像数据集(附下载地址)_第2张图片

应用于“天天快报”新闻封面图像的质量得到明显提高

 

这些视觉迁移任务进一步验证了该模型的强大视觉表示能力和优异的泛化性能。“Tencent ML-Images”项目未来还将在更多视觉相关的产品中发挥重要作用。

 

开源地址:

https://github.com/Tencent/tencent-ml-images

 

【完】

 

2018 AI开发者大会

 

2018 AI开发者大会是一场由中美人工智能技术高手联袂打造的AI技术与产业的年度盛会!是一场以技术落地为导向的干货会议!大会设置了10场技术专题论坛,力邀15+硅谷实力讲师团和80+AI领军企业技术核心人物,多位一线经验大咖带你将AI从云端落地。

大会日程以及嘉宾议题请查看下方海报(点击查看大图)

腾讯AI Lab开源业内最大规模多标签图像数据集(附下载地址)_第3张图片

 

你可能感兴趣的:(AI,人工智能)