目标检测数据可视化,分析anchor_ratio的设置问题

网上有很多类似的文章和代码,但是都不怎么好,这里分享一下我打比赛用的。

import os
import json
import random
import pandas as pd
import seaborn as sns
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['font.family']='sans-serif'
plt.rcParams['figure.figsize'] = (10.0, 5.0)

# 这里打开你的训练集的标注,格式是COCO数据集的格式
with open('annotation.json') as f:
    ann=json.load(f)
    
category_dic=dict([(i['id'],i['name']) for i in ann['categories']])
counts_label=dict([(i['name'],0) for i in ann['categories']])

for i in ann['annotations']:
    counts_label[category_dic[i['category_id']]]+=1
    
box_w = []
box_h = []
box_wh = []
categorys_wh = [[] for j in range(204)]
for a in ann['annotations']:
    if a['category_id'] != 0:
        box_w.append(round(a['bbox'][2],2))
        box_h.append(round(a['bbox'][3],2))
        #因为anchor_ratio是指H/W,这里就统计H/W
        hw = a['bbox'][3]/a['bbox'][2]
        if hw > 1:
            hw = round(hw, 0)
        else:
            hw = round(hw, 1)
        box_wh.append(hw)
        categorys_wh[a['category_id']-1].append(hw)
        
# 所有标签的长宽高比例
box_wh_unique = list(set(box_wh))
box_wh_unique.sort()
box_wh_count=[box_wh.count(i) for i in box_wh_unique]

# 绘图
wh_df = pd.DataFrame(box_wh_count,index=box_wh_unique,columns=['宽高比数量'])
wh_df.plot(kind='bar',color="#55aacc")
plt.show()

目标检测数据可视化,分析anchor_ratio的设置问题_第1张图片
得到图像你就可以大概选一些ratio了,选择出现比例比较多的ratio,比如这个例子里面我就选了红色箭头的这些,可以跑跑看看结果,然后再微调一下看看哪个结果好。

你可能感兴趣的:(深度学习算法)