改变网络输入图像分辨率需要不需要重新训练?

以yolov3为例,我们做实验验证这个问题,yolov3有三种格式的分辨率输入,分别是320*320, 416*416, 608*608,验证思路是分别将这三种尺寸的图像输入网络,看推理效果有没有受到影响,另外,为了便于对照,我们再设置一些额外的网络不支持的分辨率,看现象如何。

关于图像前处理操作的流程参考下面博客:

Darknet框架解读_tugouxp的专栏-CSDN博客

320*320:

改变网络输入图像分辨率需要不需要重新训练?_第1张图片

执行./image_yolov3.sh,结果如下所示,效果非常不错:

推理时间为4036ms.

416x416 

改为416*416分辨率后,推理时间明显变慢了,为7666MS,并且每个物体的置信度都有所变化,这说明改变网络输入图像的尺寸,会对推理结果产生影响:

改变网络输入图像分辨率需要不需要重新训练?_第2张图片

608*608:

推理时间更长了,达到了17S,这是三种分辨率中精度最高的一个。

改变网络输入图像分辨率需要不需要重新训练?_第3张图片

以上说明,网络输入的图像尺寸变化情况下,不需要重新训练,因为在训练阶段的训练数据是针对这三种分辨率进行的。

现在看一种不支持的分辨率:

224*224:

不支持的分辨率,推理时间明显变短,而且推理结果很差。

改变网络输入图像分辨率需要不需要重新训练?_第4张图片

192*192:

160*160:

也很差。


结束!

你可能感兴趣的:(人工智能,嵌入式系统,算法,网络,深度学习,计算机视觉)