在一个合格模型的诞生过程中,繁杂的数据收集与处理工作往往给算法工程师带来了低效的工作体验。
▲一个模型的诞...生...
好的数据,对模型训练至关重要。自己做数据,即昂贵又费时费力;但是,使用现成的数据集,既不好找又不好下载及使用,数据质量也参差不齐,只有到下载后才能知道!
……
等等!
小编最近发现了一个数据集获取神器
Graviti Open Dataset
这是一个提供公开数据集的平台,你可以很方便地从中搜索到想要的数据集,可在线预览样例数据、标注、标签,无需“梯子”即可免费高速下载国外数据集。
▷ 丰富多元的数据集种类
目前,Graviti Open Dataset已收录1000+个高质量人工智能数据集。提供一站式检索、高速下载,免费贡献学术社区。
覆盖2D/3D目标检测、图像分割、图像分类、目标跟踪、OCR、姿态估计、无人驾驶、智慧零售、机器人等多种AI应用领域。
与此同时,Graviti Open Dataset还包含了点云、图像、视频序列、三维模型等多种数据格式。
这里举两个栗子:
无人驾驶类数据集
KITTI-object&Synscapes
▲KITTI-object,含2D/3D目标检测点云和图像数据
▲Synscapes,含25,000个真实街景图像
文本识别类数据集
MNIST&SVHN
▲MNIST,含60,000个手写数字样本的训练集和10,000个样本的测试集
▲SVHN,含600,000个数字图像
▷ 便捷迅速的数据集查找
想找心仪数据集,现在一目了然。你不仅可以靠数据集的内容关键词搜索,还可以通过应用行业、标注类型等属性进行多维度查询。
众所周知:找数据难,找海外数据更是难上加难。但拥有Graviti网站就像拥有一把万能钥匙。
想进行COVID肺部医学影像检测模型训练?
在搜索框输入“COVID”即可一键抵达
▲搜索得到的优质数据集示例
还想搜索医学影像数据集?
选择“medical”进行行业搜索即得
▲更多医学相关数据集
▷ 直接美观的数据集可视化
话不多说,先上图片
▲训练集人像截取示例
▲图像多元素分类
使用Graviti数据可视化插件,实现在线可视化数据标注和数据分布,所见即为所得。
更有多种可视化方案供你随时查看。再也不用担心费劲下完整套数据才发现根本不是自己想要的内容。
还 没 有 心 动 吗 ?
压轴亮点来了!
▷ 畅通高速的海外数据下载
很多时候,我们的数据获取渠道都只提供主流的国内公开数据集,而更普适的模型却需要用海内外的多元数据去共同训练。
针对海外数据获取难、下载慢的问题,Graviti给出了一站式解决方案——将全球资源Host至国内镜像,无需VPN访问,满带宽极速下载。和进入海外官网下载相比,Graviti至少提速100%。
从此告别繁琐的登录注册流程,告别令人抓狂的下载时长!
▲普通带宽下载海外数据,实测就有10MB/s的速度
那么问题来了,海外下载提速需要会员吗?还是按次计费呢?
答案是:
“
完全免费
”
在Graviti,还有更多有趣又高质量的数据集在持续更新中,快来一起探索吧!
另外,如果你在他们网站发现自己感兴趣的数据不存在,也可以进他们的官方微信群反馈,说不定下次就为你上线了呢:)
一键获取数据集↓
↑进官方微信群
除了托管公开标准的数据集,小编还发现该网站正在开发针对用户的个性化的数据管理服务,包括数据免费托管、数据版本管理~还可以轻松完成对数据的拆分与合并,对于开发自己数据集的同学无疑是个非常值得期待的功能。
点击阅读原文,直达官网体验。