COCO2017 数据集分类统计

文章目录

  • 1. 前言
  • 2. COCO 类别编号及名称
  • 3. 类别数量统计代码
  • 4. 统计结果

1. 前言

最近用到 COCO2017 数据集做目标检测,顺便整理一下数据集。

COCO 数据集用专门的 python api 方便直接来读取图片数据,详细可看 https://github.com/cocodataset/cocoapi,

这里主要是统计数据集的类别,这样就清楚自己的训练数据是否足够,不同的类别分布是否均衡等问题

2. COCO 类别编号及名称

COCO2017 数据集共 80 小类,类别 id 号不连续,最大为 90,各类别 id 与类别名称对应关系如下:
COCO2017 数据集分类统计_第1张图片

3. 类别数量统计代码

使用以下代码来统计类别、图片数、标注框数:

from pycocotools.coco import COCO
 
dataDir='./COCO'
dataType='val2017'
#dataType='train2017'
annFile='{}/annotations/instances_{}.json'.format(dataDir, dataType)
 
# initialize COCO api for instance annotations
coco=COCO(annFile)
 
# display COCO categories and supercategories
cats = coco.loadCats(coco.getCatIds())
cat_nms=[cat['name'] for cat in cats]
print('number of categories: ', len(cat_nms))
print('COCO categories: \n', cat_nms)
 
# 统计各类的图片数量和标注框数量
for cat_name in cat_nms:
    catId = coco.getCatIds(catNms=cat_name)     # 1~90
    imgId = coco.getImgIds(catIds=catId)        # 图片的id  
    annId = coco.getAnnIds(catIds=catId)        # 标注框的id

4. 统计结果

训练集

类别 图片数量 标注框数量
person 64115 262465
bicycle 3252 7113
car 12251 43867
motorcycle 3502 8725
airplane 2986 5135
bus 3952 6069
train 3588 4571
truck 6127 9973
boat 3025 10759
traffic light 4139 12884
fire hydrant 1711 1865
stop sign 1734 1983
parking meter 705 1285
bench 5570 9838
bird 3237 10806
cat 4114 4768
dog 4385 5508
horse 2941 6587
sheep 1529 9509
cow 1968 8147
elephant 2143 5513
bear 960 1294
zebra 1916 5303
giraffe 2546 5131
backpack 5528 8720
umbrella 3968 11431
handbag 6841 12354
tie 3810 6496
suitcase 2402 6192
frisbee 2184 2682
skis 3082 6646
snowboard 1654 2685
sports ball 4262 6347
kite 2261 9076
baseball bat 2506 3276
baseball glove 2629 3747
skateboard 3476 5543
surfboard 3486 6126
tennis racket 3394 4812
bottle 8501 24342
wine glass 2533 7913
cup 9189 20650
fork 3555 5479
knife 4326 7770
spoon 3529 6165
bowl 7111 14358
banana 2243 9458
apple 1586 5851
sandwich 2365 4373
orange 1699 6399
broccoli 1939 7308
carrot 245 1719
hot dog 118 426
pizza 3166 5821
donut 1523 7179
cake 2925 6353
chair 12774 38491
couch 4423 5779
potted plant 4452 8652
bed 3682 4192
dining table 11837 15714
toilet 3353 4157
tv 4561 5805
laptop 3524 4970
mouse 1876 2262
remote 3076 5703
keyboard 2115 2855
cell phone 4803 6434
microwave 1547 1673
oven 2877 3334
toaster 217 225
sink 4678 5610
refrigerator 2360 2637
book 5332 24715
clock 4659 6334
vase 3593 6613
scissors 947 1481
teddy bear 16 6087
hair drier 189 198
toothbrush 1007 1954

参考:
1号链接
2号链接

.

你可能感兴趣的:(目标检测,深度学习,计算机视觉)