benchmark里找自己需要的数据集

经典算法比较

1.PASCAL VOC(权威鼻祖)

在此也给出如何更改xml文件中属性值的方法,链接如下,比如批量更改公共数据集中某个类别的名称
https://github.com/XinZhangNLPR/Xml-document-modify.git
https://blog.csdn.net/gvfdbdf/article/details/52214008
https://blog.csdn.net/zcy0xy/article/details/79614862
PASCAL VOC数据集分析
PASCAL VOC是一个图像集,由Mark Everingham (University ofLeeds)、Luc van Gool (ETHZ, Zurich)等人创立,有**1.7W+**张图片,分为20类。PASCALVOC竞赛也是计算机视觉竞赛的鼻祖,从2005年到2012年一共举办了8届,包含了物体分类(Classification)、目标检测(Detection)、图像分割(Segmentation)、Person Layout等任务,后来逐渐被ILSVRC竞赛替代。

从中发现一个惊天大秘密就是Main文件夹下包含了20个分类的***_train.txt、***_val.txt和***_trainval.txt
前面的表示图像的name,后面的1代表正样本,-1代表负样本。
_train中存放的是训练使用的数据,每一个class的train数据都有5717个。
_val中存放的是验证结果使用的数据,每一个class的val数据都有5823个。
_trainval将上面两个进行了合并,每一个class有11540个。

https://github.com/bearpaw/clothing-co-parsing

PyTorch实现的VOC2012数据集Pixel-wise目标分割【BodoKaiser】
benchmark里找自己需要的数据集_第1张图片

2. ImageNet数据集

ImageNet是一个图像集,由斯坦福大学李飞飞创立,有1400W+张样例图片分为27大类和2W+小类,只能用于非商业研究和教学使用。与ImageNet图像集相应的是著名的ILSVRC竞赛,各种新机器学习算法脱颖而出(AlexNet、ZFNet、GoogleNet、ResNet、…),图像识别率得以显著提高,在ILSVRC竞赛上一举成名是近几年来计算机视觉从业者的梦想。
数据集下载
数据集大小:~1TB(ILSVRC2016比赛全部数据);我就笑笑不说话,实验室资源太重要了,我的小电脑根本存不下
下载地址:http://image-net.org/download-images

http://image-net.org/synset?wnid=n02084071
这里有很详细的分类
benchmark里找自己需要的数据集_第2张图片

3. COCO数据集

官网: http://cocodataset.org

MS COCO的全称是Microsoft Common Objects in Context,起源于微软于2014年出资标注的Microsoft COCO数据集,与ImageNet竞赛一样,被视为是计算机视觉领域最受关注和最权威的比赛之一。

COCO数据集是一个大型的、丰富的物体检测,分割和字幕数据集。这个数据集以scene understanding为目标,主要从复杂的日常场景中截取,图像中的目标通过精确的segmentation进行位置的标定。图像包括91类目标,328,000影像和2,500,000个label。目前为止有语义分割的最大数据集,提供的类别有80 类,有超过33 万张图片,其中20 万张有标注,整个数据集中个体的数目超过150 万个。
benchmark里找自己需要的数据集_第3张图片
在这里插入图片描述

你可能感兴趣的:(240_Background,Knowledges)