近日,在使用CascadeRCNN完成目标检测任务时,我在使用这个模型训练自己的数据集时出现了如下错误:
tensorflow.python.framework.errors_impl.OutOfRangeError: PaddingFIFOQueue '_1_get_batch/batch/padding_fifo_queue' is closed and has insufficient elements (requested 1, current size 0)
[[node get_batch/batch (defined at ../data/io/read_tfrecord.py:98) ]]
具体如下截图所示:
我使用的教程是这个链接:cascade r-cnn训练和测试(tensorflow框架)
在出现这个错误的时候,以为是数据集的错误,在经过多次检查数据,并且删掉运行报错的图片等尝试多次无果后,最终选择重新制作数据才解决掉这个错误。注意,训练所使用的数据集在FasterRCNN模型是能够训练起来的。
事后回想,可能有两个地方导致出现这个错误。
1、作者的教程里面有段标红的文字当时我选择忽略了。
我当时我根本没有做过这步,我以为VOC格式里面数据集已经划分好测试集和训练集了,所以就没有管这个步骤了,后来证明代码作者根本没有管VOC里面的txt文件。所以我觉得这个错误可能也是引发这个错误的原因。
2、在经过重新制作数据集没有出现这个错误后,后面又出现了这个错误,这次又仔细检查了数据集,发现在制作VOC2007数据集的时候,图片名字竟然有中文(巨坑),导致制作出来的txt乱码了,然后我在重新制作数据集的过程中,指定了encoding=’utf-8’编码,然后再把数据丢进模型去训练,最终解决了这个错误。
现在也不能肯定出现这个错误到底是什么原因,不过我上面的两个解决方案是能够解决这个问题的,而我在网上查找到的资料大部分也是数据集的原因。后期如果再出现这个错误但是有了不同的解决方法的时候,我会更新这篇博客的。