Python-OpenCV教程-4

OpenCV版本要求在2.3.1以上

本文主要介绍OpenCV中对图像的基本操作和基本算法

1.基本操作

在Python环境下,我们有两种方式来操作图像——通过OpenCV提供的函数来操作图像或者是通过Numpy来直接修改图像的数组。这里,我们推荐使用Numpy的方式,应为它清晰并且高效。

首先我们读取一幅图像:

>>> import cv2
>>> import numpy as np

>>> img = cv2.imread('messi5.jpg')

然后,我们可以直接通过行列坐标来访问这个像素的BGR值。对于灰度图像,则是访问它的灰度值。

>>> px = img[100,100]
>>> print px
[157 166 200]

# accessing only blue pixel
>>> blue = img[100,100,0]
>>> print blue
157

然后通过这种方式也可以修改像素的值:

>>> img[100,100] = [255,255,255]
>>> print img[100,100]
[255 255 255]

但是,以上这种读取像素值的方式非常缓慢。因此,我们耿推荐使用Numpy的函数——array.item()和array.itemset()来访问。

以下是推荐的访问和修改方式:

# accessing RED value
>>> img.item(10,10,2)
59

# modifying RED value
>>> img.itemset((10,10,2),100)
>>> img.item(10,10,2)
100
除了访问图像的像素值,我们还能获取图像的属性——行数、列数、通道数、图像的数据类型以及像素点的数量等。

通过img.shape这个属性,我们可以得到一个记录了图像行数、列数和通道数的元组(灰度图像则只返回行列数,通过这个可以区分图像是彩色的还是灰度的)。

像素点的数量可以通过img.size这个函数获得,图像的数据类型可以通过img.dtype来获得:

>>> print img.shape
(342, 548, 3)
>>> print img.size
562248
>>> print img.dtype
uint8
有时,我们会经常对一幅图像的特定区域进行操作。比如我们要对一幅图像进行人眼检测,那么一般会先去检测人脸,然后在人脸的区域内去检测眼睛。这样做即提高的精度(因为眼睛总是长在脸上 : D),又提高了速度(搜索区域变小了)。

我们把这种特定区域的操作叫做ROI(region of image),下面的代码中,我们把图中的球复制到另一区域:

>>> ball = img[280:340, 330:390]
>>> img[273:333, 100:160] = ball
效果如下:


有时我们还需要把图形的RGB通道分离,或者是把分离的三个通道合成成一幅RGB图像:

>>> b,g,r = cv2.split(img)
>>> img = cv2.merge((b,g,r))
或者

>>> b = img[:,:,0]
假设你想要把所有红色像素的值置为0:

>>> img[:,:,2] = 0
另外,cv2.split()函数运行非常消耗时间,所以在不必要的情况下最好别用。因此,我们更即推荐第二种方法。
最后,再介绍一个基本操作——边界填补(Padding)

在卷积计算、零点补偿等领域内,Padding有非常大的用处。Padding主要使用cv2.copyMakeBorder()这个函数,它需要的参数如下:

src:输入的图片

top,bottom,left,right:上下左右边界的宽度。

borderType:请参考英文页面

下面的代码显示了所有不同类型的边界:

import cv2
import numpy as np
from matplotlib import pyplot as plt

BLUE = [255,0,0]

img1 = cv2.imread('opencv_logo.png')

replicate = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REPLICATE)
reflect = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REFLECT)
reflect101 = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REFLECT_101)
wrap = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_WRAP)
constant= cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_CONSTANT,value=BLUE)

plt.subplot(231),plt.imshow(img1,'gray'),plt.title('ORIGINAL')
plt.subplot(232),plt.imshow(replicate,'gray'),plt.title('REPLICATE')
plt.subplot(233),plt.imshow(reflect,'gray'),plt.title('REFLECT')
plt.subplot(234),plt.imshow(reflect101,'gray'),plt.title('REFLECT_101')
plt.subplot(235),plt.imshow(wrap,'gray'),plt.title('WRAP')
plt.subplot(236),plt.imshow(constant,'gray'),plt.title('CONSTANT')

plt.show()


翻译自http://docs.opencv.org/trunk/doc/py_tutorials/py_core/py_basic_ops/py_basic_ops.html#basic-ops

2.基本算法

我们可以通过cv2.add()函数或者是numpy的运算res=img1+img2来相加两幅图片。需要说明的是add()函数两个数相加如果大于255则结果就是255,而直接相加的会如果大于255则会把结果对255取模。

>>> x = np.uint8([250])
>>> y = np.uint8([10])

>>> print cv2.add(x,y) # 250+10 = 260 => 255
[[255]]

>>> print x+y          # 250+10 = 260 % 256 = 4
[4]
除了简单相加两幅图像,我们还能按比重去混合两幅图像,混合时按照以下公式:

把从调整,我们能看到从一幅图像慢慢变为另一副图像,cv2.addWeighted()按照以下公式来混合两幅图像:

img1 = cv2.imread('ml.png')
img2 = cv2.imread('opencv_logo.jpg')

dst = cv2.addWeighted(img1,0.7,img2,0.3,0)

cv2.imshow('dst',dst)
cv2.waitKey(0)
cv2.destroyAllWindows()
效果如下

另外OpenCV还支持对象素点的位运算(与或非和亦或)。这些运算方法在提取图片的非矩形区域时,能发挥意想不到的作用。

比如我想把上面的OpenCV的logo给抠下来放到另一张图片里去,如果之家吧两幅图片相加,那么颜色就会改变,如果混合两幅图片,则会造成透明的效果,这时就可以巧妙地运用为运算来解决这个问题:

# Load two images
img1 = cv2.imread('messi5.jpg')
img2 = cv2.imread('opencv_logo.png')

# I want to put logo on top-left corner, So I create a ROI
rows,cols,channels = img2.shape
roi = img1[0:rows, 0:cols ]

# Now create a mask of logo and create its inverse mask also
img2gray = cv2.cvtColor(img2,cv2.COLOR_BGR2GRAY)
ret, mask = cv2.threshold(img2gray, 10, 255, cv2.THRESH_BINARY)
mask_inv = cv2.bitwise_not(mask)

# Now black-out the area of logo in ROI
img1_bg = cv2.bitwise_and(roi,roi,mask = mask_inv)

# Take only region of logo from logo image.
img2_fg = cv2.bitwise_and(img2,img2,mask = mask)

# Put logo in ROI and modify the main image
dst = cv2.add(img1_bg,img2_fg)
img1[0:rows, 0:cols ] = dst

cv2.imshow('res',img1)
cv2.waitKey(0)
cv2.destroyAllWindows()

左图是mask的图像,右图是最后的结果。

这个程序要求logo必须是黑底的,它先用cvtColor把原图转换成灰度图,然后用threshold函数,根据灰度把图像分成了两部分——logo部分和背景部分,其中logo的灰度值为255(白色),背景为0(黑色),这就是mask图像。然后,对mask取反,让logo为0,背景为255,得到mask_inv图像。然后让messi5的左上角和它自身以mask_inv为掩码做与运算——即掩码为0,则结果得0,掩码大于0,则结果不变(这就在messi5上用黑色抠了一个logo,接下来要上色了)。再接着,让logo和它自身以mask为掩码做与运算(把有颜色的部分抠出来)。最后使用add函数把两个图片相加就得到了右图(这里用到了黑色是(0,0,0),它加上什么颜色就是什么颜色这个特性)。

翻译自http://docs.opencv.org/trunk/doc/py_tutorials/py_core/py_image_arithmetics/py_image_arithmetics.html#image-arithmetics


你可能感兴趣的:(python)