updated@2018-12-07 15:22:08
官方下载地址:http://www.image-net.org/challenges/LSVRC/2012/nonpub-downloads ,需要“非.com结尾的邮箱注册的账号”
也可以从网盘下载,链接:https://pan.baidu.com/s/17gQSrqD2j921HEMYVGVZ7Q 密码:28fj
(注:此网盘分享目录中没有test和train的image,因为都比较大,没有传)
下面听我啰嗦一下:
分类和定位任务(task1&&task2, 即classification && localization)
图片
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_train.tar
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_val.tar
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_test.tar(三个任务的test图片都在一个压缩包里)
开发包
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_devkit_t12.tar (含val标签)
标签
synset.txt下载地址:
分类任务(classification)的val的标签在开发包里:D:\data\imagenet\ILSVRC2012_devkit_t12\data\ILSVRC2012_validation_ground_truth.txt
,开头几行:
490 #表示第1张val的图片,label为490
361
171
822
这个label有个小问题:和一些开源的caffemodel的输出对不上,比如MobileNet,对于ILSVRC2012_val_00000001.JPEG的top1预测结果是:
confidence: 0.75
category index: 65
label: 'n01751748 sea snake'
但是从ILSVRC2012_validation_ground_truth.txt看到的label是490。两种解决思路:
1)使用caffe版本的imagenet2012分类任务label,而不是devkit中的。
基于caffe训练的,使用了get_ilsvrc_aux.sh文件下载的imagenet的label。这些label和imagnet官方的不一样。
其实就是从http://dl.caffe.berkeleyvision.org/caffe_ilsvrc12.tar.gz下载的caffe版本imagenet标签。
2)使用映射表,把基于caffe版本的imagenet分类label,映射为imagenet原版lable,或把imagenet原版label映射为caffe版本。
映射表下载地址:https://github.com/fh295/semanticCNN/blob/master/imagenet_labels/ILSVRC2012_mapping.txt 。至于这个映射表怎么来的,迷一样。
BBox
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_bbox_train_v2.tar.gz (我只做分类任务,这些框没有用过)
检测任务(task3, object detection)
图片
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_train_t3.tar
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_test.tar (前面列出过了,三个任务的test图片都在一个压缩包里)
开发包
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_devkit_t3.tar.gz
标签
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_bbox_train_v2.tar
评论区有人提到没有给annotation的下载地址。原版地址忘记了,不过可以从百度网盘下载:
关于label的说明(仅验证过validation的label,train理论上也是这样):
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_devkit_t12.tar.gz
吐槽
caffe标签到原版标签的映射:
caffemodel预测出top1的index是idx(比如65),加上1就是66,对应到synsets.txt第66行,也就是n01751748;从ILSVRC2012_mapping.txt找到n01751748,对应的映射id为490,表示原版imagenet label是490(1开始标记)或489(0开始标记)
整这么麻烦,其实直接用caffe版本的标签好了。。