今天在写代码的时候遇到一个挺有趣的bug,我也是找了半天才查到资料解决的。
bug描述如下:
用训练好的caffemode做infernece(inference函数代码如下):
#进行预测
def inference(img, transformer, net, labelnames):
#img = caffe.io.load_image(img_name, True)
transformed_image = transformer.preprocess('data',img)
net.blobs['data'].data[...] = transformed_image
output = net.forward()
result = output['prob'][0].argmax()
print result
print labelnames[result]
由于我写的是一个比较大的程序,前面的得到的图像块,在后面用CNN做识别,所以在inference时直接传的是numpy格式的矩阵,结果发现识别的结果非常差(这应该是不可能的,因为我用的是已经训练好的caffemodel),开始我认为可能是内存中图像的问题,所以我把图像保存下来自己看了一下,发现没任何问题。这就让我抓瞎了= =
我想要不就直接读这些保存下来的图像做识别(修改后的inference代码如下)
#进行预测
def inference(img_name, transformer, net, labelnames):#注意这里修改了
img = caffe.io.load_image(img_name, True)#注意这里也修改了
transformed_image = transformer.preprocess('data',img)
net.blobs['data'].data[...] = transformed_image
output = net.forward()
result = output['prob'][0].argmax()
print result
print labelnames[result]
结果发现识别结果居然又全对了,这就让我更抓瞎了= =
bug原因及解决办法如下:
后来查到了问题在caffe默认的caffe.io.load_image读取后的图像格式这里,因为我最开始传到inference函数中的numpy图像是0~255范围的,而caffe.io.load_image读取后图像会归一化到0~1之间,所以我直接用caffe.io.load_image做inference是没问题的,但是传0~255范围的numpy矩阵就会出错。所以解决办法是直接在原来的inference函数中加一句
img = img / 255.0
即可。
最后在inference中用opencv代替caffe.io.load_image()的code为:
self.net.blobs['data'].reshape(1, 3, self.image_resize, self.image_resize)
####image = caffe.io.load_image(image_file)
image = cv2.imread(image_file)
image = cv2.resize(image, (300,300))
img = np.zeros((1,3,300,300))
img[0,0,:,:] = image[:,:,0]-104.0
img[0,1,:,:] = image[:,:,1]-113.0
img[0,2,:,:] = image[:,:,2]-127.0
self.net.blobs['data'].data[...] = img
总结:
需要注意的就是caffe.io.load_image得到的图像是0~1范围的,而我们平时遇到的图像,包括opencv的cv2.imread函数得到都是0~255范围的。(只有这最后一句话才是正题。。)