首先RGB与BGR本质都没有什么区别,OpenCV和PIL读取图片的格式分别是BGR和RGB。
当我们使用OpenCV读取图像时,你应该也会发现读取的数组其实是BGR格式,而不是我们听得最多、用得最多的RGB格式。那为什么要用BGR通道而不用RGB通道来描述图像呢?
OpenCV默认通道为BGR,可能是基于某种硬件层面的原因。因为caffe,作为最早最流行的一批库的代表,用了opencv,而opencv默认通道是bgr的。这是opencv的入门大坑之一,bgr是个历史遗留问题,为了兼容早年的某些硬件,opencv也不好改回来了。其实你自己训练完全可以用rgb,新库也基本没了bgr还是rgb这个问题,就是切换下顺序。但如果你要用一些老的训练好的模型,就得兼容老模型的bgr。
【官网更详细解释】RGB是字节顺序。但是大多数vanilla图形库的有意实现选择是它们在内部将颜色视为无符号32位整数,其中三个(或四个,通常包括alpha)组件被打包到整数中。在小端机器(例如x86)上,整数0x01020304实际上将作为0x04030201存储在内存中。因此0x00BBGGRR将存储为0xRRGGBB00!所以术语BGR(和BGRA等)是一个漏洞抽象,其中图形库解释整数是如何按逻辑排序的,以便使直接访问颜色组件的代码更具可读性。请记住,位图通常由硬件的更多部分访问,而不是处理器,并且由传统显示适配器指定的字节序不一定与CPU的字节序相同。在操纵像素中的通道的级别上,CPU无论其顺序如何都可以提取字段;它纯粹是程序员理解标签的东西。
让我们用OpenCV和PIL分别阅读并展示下面的图片,并比较结果:
cv2
import cv2
img_path = 'dataset1/train/ants_img/0013035.jpg'
img = cv2.imread(img_path)
print(img)
PIL
from PIL import Image
img_path = 'dataset1/train/ants_img/0013035.jpg'
img = Image.open(img_path)
img_arr = np.array(img)
print(img_arr)
结果如下:
简单点来说我们从第一个[]分析,可以看到一个是cv2 [233 151 80]与PIL [80 151 233] 正好分别对应了GBR与RGB。
由于二者的颜色通道不同,因此同一张图片显示的结果也应该不同,具体如下图所示
当执行 [:,:,::-1]后,数组会左右翻折,从而达到相互转换的效果,因此我们以cv2读取的图像进行实验,具体代码如下:
img_path = 'dataset1/train/ants_img/0013035.jpg'
img = cv2.imread(img_path)
img = img[:, :, ::-1]#BGR转为RGB
print(img)
plt.imshow(img)
plt.show()
结果如下:
最终发现,我们通过img[:, :, ::-1]果然实现了BGR转为RGB。
以下是参考别人的比较好的总结,原文链接在下方
1、img = Image.open(ImgPath)
打开的图片是PIL类型,默认RGB。
将PIL类型转化为numpy类型:im = numpy.array(img)
才能看到shape属性,是(height, width, channel)数组,channel的通道数据是RGB。
2、cv2.imread(path, 读取方式):
path: 图片的路径;
读取方式: cv2.IMREAD_COLOR:读入一副彩色图片;cv2.IMREAD_GRAYSCALE:以灰度模式读入图片;cv2.IMREAD_UNCHANGED:读入一幅图片,并包括其alpha通道。
默认为cv2.IMREAD_COLOR。
返回值是(height,width,channel)数组,channel的顺序是BGR顺序
3、两者之间的相互转换
PIL Image转化为OpenCV格式:
img = Image.open()
img = cv2.cvtColor(np.asarray(img), cv2.COLOR_RGB2BGR)
OpenCV转化为PIL Image格式:
img = cv2.imread()
img2 = Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
plt.imshow()和cv2.imshow()
4、这个显示是和读取对着的,也就是说要想可视化出来正常的RGB格式,给plt.imshow()的应该是rgb格式的图片,给cv2.imshow()的应该是bgr格式的图片。多说一些plt.imshow(),因为我平时几乎不用cv2.imshow()。在plt.imshow()中,接受的图片类型可以是np.ndarray,tensor, PIL Image这些任意的类型。
【PyTorch】图像解析:RGB和BGR转换 - 知乎
【openCV中的BGR和RGB】img[:,:,::-1]和img[:, :, (2, 1, 0)]对图像操作