在处理图像时,了解 RGB 和 BGR 色彩空间之间的区别非常重要。RGB 和 BGR 都具有三个颜色通道:红色、绿色和蓝色。但是,这些通道在图像文件中的存储顺序可能不同。
RGB 通常用于图像编辑和显示应用程序,顺序为红色、绿色和蓝色。
BGR 通常用于图像处理应用程序,顺序为蓝色、绿色和红色。
图像数据可以保存在不同的颜色空间(RGB、BGR、Gray等),不同的文件格式可以将图像保存在不同的颜色空间。这取决于图像处理库和软件在保存(或打开)图像时使用的颜色空间。
但是,将图像保存为文件格式时,通常的做法是将其保存在 RGB 颜色空间中。值得注意的是,当你以 BGR 顺序保存图像时,它仍然可以被大多数库和软件读取,但它们会将其视为 RGB 图像并以 RGB 格式显示。(你会看到交换了红色和蓝色通道的图像)
使用exiftool之类的工具查看图片的元数据,可能会得到这样的结果:
color mode: RGB
或者Color Space Data: RGB
这意味着一张图片有 3 个通道,但并不意味着 3 个颜色通道的顺序是red-green-blue,它也可能是blue-green-red。
读取和解释图像文件的程序决定了如何解释图像的颜色通道:不同的库(例如 OpenCV 和 PIL)对图像文件使用不同的默认解码方法,这可能导致图像被解释为BGR或RGB。
使用 Python 处理图像文件时,OpenCV 库(cv2)在读取图像时默认使用 BGR 颜色空间,而 PIL 库使用 RGB 颜色空间:
import cv2
from PIL import Image
#reading an image using cv2.imread()
img_bgr = cv2.imread("image.jpg")
#reading an image using plt.imread()
img_rgb = Image.open("image.jpg")
总而言之,当我们说 rgb 图像(有时称为真彩色图像)时,这意味着通过假设该图像的颜色通道顺序为红-绿-蓝来保存图像,而 bgr-image 则通过假设颜色顺序为蓝-绿-红。当我们打开该图像并通过某些软件或库进行绘图时,该软件或库将决定以 RGB 色彩空间还是 BGR 色彩空间显示图像。
import numpy as np
from PIL import Image, ImageOps
import matplotlib.pyplot as plt
# Here we show rgb-image in RGB-color-space
rgb_img = Image.open("parrot-org.jpg")
plt.imshow(rgb_img)
BGR 不是实际的颜色空间,它只是图像的表示,其中颜色通道的顺序不同于传统的 RGB 表示。图像中像素的颜色值保持不变,但颜色通道的顺序交换了,第一个通道是蓝色,第二个通道是绿色,第三个通道是红色。
例如,[240,26,0]是左上角的像素值,当你通过 plt.imshow() 绘制图像时,你将在图像的左上角看到一个红点。因此,这意味着 plt.imshow() 使用了RGB-color-space,它确定了255表示红色,0表示绿色,0表示蓝色。然后像这样交换颜色通道:(1,2,3)-->(3,2,1)。
之后,左上角的像素值 ( [240, 26, 0]) 变为[0, 26, 240],然后你再次绘制它。现在你将在图像的左上角看到一个蓝点。因此,这意味着plt.imshow()使用了RGB 颜色空间,它确定0表示红色,0表示绿色,255表示蓝色。
这就是为什么你看到的是蓝点而不是红点。
基于此,我们可以说BGR颜色空间是RGB颜色空间中交换颜色通道的图像的表示。
# Here we show bgr-image in RGB-color-space
rgb_data = np.array(rgb_img)
bgr_data = rgb_data[:, :, ::-1] # (red,green,blue) --> (blue,green,red)
bgr_img = Image.fromarray(bgr_data)
plt.imshow(bgr_img);
有多种方法可以将图像从 RGB 颜色空间转换为灰度,但最常用的方法之一是使用红色、绿色和蓝色值的加权平均值。该方法根据人眼对每种颜色的相对敏感度,为三个颜色通道分配不同的权重。
最常用的权重是:gray_weighted_average= 0.299 * R + 0.587 * G + 0.114 * B
另一种转换为灰度的方法是使用光度法,它根据人眼的光度函数分配不同的权重。这是将彩色图像转换为灰度图像的更准确方法:gray_luminosity = 0.2126 * R + 0.7152 * G + 0.0722 * B
OpenCV的
cv2.cvtColor(img_bgr, cv2.COLOR_BGR2RGB)
采用加权平均法,Pil.ImageOps.grayscale(rgb_img)
采用光度法。
gray_img = ImageOps.grayscale(rgb_img)
plt.imshow(gray_img, cmap='gray');
tint_names = ["red", "green", "blue"]
plt.figure(figsize=(12,5))
for i in range(3):
plt.subplot(1, 3, i+1)
arr = np.zeros((3,), dtype='int')
arr[i] = 1
img1 = rgb_data*arr
plt.title(f"channel={i+1} in #{tint_names[i]} tint")
plt.imshow(img1)
plt.figure(figsize=(12,5))
for i in range(3):
plt.subplot(1, 3, i+1)
img1 = rgb_data[:, :, i]
plt.title(f"channel={i+1} in #grey tint")
plt.imshow(img1, cmap='gray')
RGB 图像——假设颜色通道的顺序是红-绿-蓝保存。
当你使用 opencv 读取 RGB 图像时 —>cv2.imread()
读取 rgb 图像并通过交换颜色通道将其作为 bgr 图像返回
在通过 opencv 读取 rgb 图像之后,如果你还使用 opencv 绘图 ->cv2.imshow()
将在 BGR 颜色空间中绘制图像
因此,当你使用 opencv 打开 rgb 图像并使用 opencv 绘制它时,你将在 BGR 颜色空间中看到 bgr 图像,这看起来与 RGB 颜色空间中的 rgb 图像 相同。
import cv2
# Here we see bgr-image in rgb-color-space
bgr_img_by_cv2 = cv2.imread(img_path)
plt.imshow(bgr_img_by_cv2);
你将通过以下代码片段在 BGR 颜色空间中看到 bgr 图像,并且弹出窗口显示图像(按ESC关闭它)
cv2.imshow("bgr-image in BGR-color-space", bgr_img_by_cv2)
cv2.waitKey(0)
cv2.destroyAllWindows()
首先,阅读以下解释:https://www.quora.com/How-does-the-computer-memory-store-media-files/answer/Jabali-Searcot
如果图像具有 1 个颜色通道(灰度)和 1 位颜色深度,则 1 个像素将为 1/8 字节或 0.125 字节:
# 1 channel and 1-bit-color-depth --> 2 color combinations
_, binary_image = cv2.threshold(gray_img_by_cv2, 128, 255, cv2.THRESH_BINARY)
plt.imshow(binary_image, cmap='gray')
如果图像具有 1 个颜色通道(灰度)和 2 位颜色深度,则 1 个像素将为 2/8 字节或 0.25 字节:
# 1 channel 2-bit-color-depth --> 4 color combinations
scaled_image = (gray_img_by_cv2/64).astype(np.uint8)
plt.imshow(scaled_image, cmap='gray');
如果图像具有 1 个颜色通道(灰度)和 3 位颜色深度,则 1 个像素将为 3/8 字节或 0.375 字节:
# 1 channel and 3-bit-color-depth --> 8 color combinations
scaled_image = (gray_img_by_cv2/32).astype(np.uint8)
plt.imshow(scaled_image, cmap='gray');
如果图像具有 1 个颜色通道(灰度)和 4 位颜色深度,则 1 个像素将为 4/8 字节或 0.5 字节:
# 1 channel 4-bit-color-depth --> 16 color combinations
scaled_image = (gray_img_by_cv2/16).astype(np.uint8)
plt.imshow(scaled_image, cmap='gray');
如果图像具有 1 个颜色通道(灰度)和 8 位颜色深度,则 1 个像素将是 8/8 字节或 1 个字节:
# 8bit color depth and 1 channel --> 256 color combinations
scaled_image = (gray_img_by_cv2).astype(np.uint8)
plt.imshow(scaled_image, cmap='gray');
如果图像有 3 个颜色通道和每个通道的 1 位颜色深度,则 1 个像素将为 3/8 字节或 0.375 字节:
# 3 channel and 1bit color depth --> 8 color combinations
_, binary_image_from_rgb_img_by_cv2 = cv2.threshold(rgb_img_by_cv2, 128, 255, cv2.THRESH_BINARY)
plt.imshow(binary_image_from_rgb_img_by_cv2);
如果图像有 3 个颜色通道,并且每个通道的每个通道都是 8 位颜色深度,那么 1 个像素将是 24/8 字节或 3 个字节:每个通道 1 个像素。
通常,图像有 3 个颜色通道,每个通道都是 8 位颜色深度,称为 24 位颜色(或真彩色)图像:
# 3 channel and 8-bit-color-depth --> 16777216 color combinations
# 256*256*256 = 16777216
scaled_image = (rgb_img_by_cv2).astype(np.uint8)
plt.imshow(scaled_image, cmap='gray');
重要的!然而,当我们使用扩展名(jpg/jpeg、png、tiff、bmp等)保存图像时,这些扩展名使用压缩算法将图像保存到内存中。这意味着24位彩色图像的1个像素将不会是3个字节,由于这些压缩算法,像素的大小将比3个字节小得多。
本文代码:https://github.com/zrruziev/deep_learning_practice/blob/main/TENSORFLOW/rgb-bgr-color_depth.ipynb
☆ END ☆
如果看到这里,说明你喜欢这篇文章,请转发、点赞。微信搜索「uncle_pn」,欢迎添加小编微信「 woshicver」,每日朋友圈更新一篇高质量博文。
↓扫描二维码添加小编↓