2.1 Core - 图像基本操作

目标

  • 访问像素值并修改它们
  • 访问图像属性
  • 设置图像区域(ROI)
  • 分割和合并图像

访问和修改像素值

您可以通过像素值的行和列坐标访问它。对于BGR图像,它返回一个蓝、绿、红值数组。对于灰度图像,只返回相应的强度。

import numpy as np 
import cv2

img = cv2.imread('RandomColor.png')

px = img[100,100]
print(px)
# [157 166 200]

# accessing only blue pixel
blue = img[100,100,0]
print(blue)
# 157

您可以用同样的方法修改像素值。

img[100,100] = [255,255,255]
print img[100,100]
# [255 255 255]

上面提到的方法通常用于选择数组的区域,比如前5行和后3列。对于单个像素访问,numpy数组方法 array.item() 和 array.itemset() 被认为更好。但它总是返回一个标量。因此,如果您想要访问所有的b、g、r值,就需要分别为所有值调用array.item()。

# accessing RED value
img.item(10,10,2)
# 59

# modifying RED value
img.itemset((10,10,2),100)
img.item(10,10,2)
# 100

访问图像属性

图像属性包括行数、列数和通道数、图像数据类型、像素数等。

图像的形状由img.shape访问。它返回行数、列数和通道数的元组(如果图像为彩色):

print(img.shape)
# (342, 548, 3)

如果图像是灰度的,则返回的元组只包含行数和列数。因此,这是一个很好的方法来检查加载图像是灰度还是彩色图像。

img.size 访问的像素总数:

print(img.size)
# 562248

图像数据类型通过 img.dtype 获得:

print(img.dtype)
# uint8

图像区域

有时,你必须在特定的图像区域进行操作。对于图像中的眼睛检测,首先对图像执行人脸检测,直到找到人脸,然后在人脸区域内搜索眼睛。这种方法提高了准确性和性能。

使用numpy索引获得ROI。在这里,我选择球并复制到图像中的另一个区域:

ball = img[280:340, 330:390]
img[273:333, 100:160] = ball
roi.jpg

分割和合并图像通道

图像的B、G、R通道可以在需要时分割为各自的平面。然后,各个通道可以重新合并在一起,形成一个BGR图像。这可以通过以下方式执行:

b,g,r = cv2.split(img)
img = cv2.merge((b,g,r))

或者

b = img[:,:,0]

假设你想把所有的红色像素都变成零,你不需要像这样拆分,然后把它等于零。您可以简单地使用numpy索引,这会更快。

img[:,:,2] = 0

cv2.split() 是一个代价高昂的操作(就时间而言),因此只有在必要时才使用它。numpy索引更有效,如果可能的话应该使用。


为图像制作边框(填充)

如果要在图像周围创建边框(如照片框),可以使用 cv2.copyMakeBorder() 函数。但它在卷积运算、零填充等方面有更多的应用。此函数采用以下参数:

  • src - 输入图像
  • top, bottom, left, right - 对应方向上像素数的边框宽度
  • borderType - 定义要添加的边框类型的标志。它可以是以下类型:
    • cv2.BORDER_CONSTANT - 添加一个恒定的彩色边框。该值应作为下一个参数提供。
    • cv2.BORDER_REFLECT - 将是边界元素的镜像反射,如:fedcba|abcdefgh|hgfedcb
    • cv2.BORDER_REFLECT_101cv2.BORDER_DEFAULT - 与上面相同,但略有变化,如:gfedcb|abcdefgh|gfedcba
    • cv2.BORDER_REPLICATE - 在整个过程中复制最后一个元素,如:aaaaaa|abcdefgh|hhhhhhh
    • cv2.BORDER_WRAP - 如下所示:cdefgh|abcdefgh|abcdefg
  • value - 边框类型为 cv2.BORDER_CONSTANT 时的边框颜色

下面是一个示例代码,演示了所有这些边界类型,以便更好地理解:

import numpy as np 
import cv2
from matplotlib import pyplot as plt 

BLUE = [255,0,0]

img1 = cv2.imread('1.png')

replicate = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REPLICATE)
reflect = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REFLECT)
reflect101 = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REFLECT_101)
wrap = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_WRAP)
constant= cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_CONSTANT,value=BLUE)

plt.subplot(231),plt.imshow(img1,'gray'),plt.title('ORIGINAL')
plt.subplot(232),plt.imshow(replicate,'gray'),plt.title('REPLICATE')
plt.subplot(233),plt.imshow(reflect,'gray'),plt.title('REFLECT')
plt.subplot(234),plt.imshow(reflect101,'gray'),plt.title('REFLECT_101')
plt.subplot(235),plt.imshow(wrap,'gray'),plt.title('WRAP')
plt.subplot(236),plt.imshow(constant,'gray'),plt.title('CONSTANT')

plt.show()
Figure_1.png

(图像以matplotlib显示。所以红蓝两色会互换)

你可能感兴趣的:(2.1 Core - 图像基本操作)