人脸识别和目标检测这样的术语听起来觉得很酷,但是当涉及到从头开始实现它们时,每个初学者都会觉得困难,这些技术实际上并没有那么难实现,一旦你掌握了其基本原理,那么实现它们就相当简单了。
图像处理有很多种应用,包括用于解析文档和生成相应文本的光学字符识别(OCR)、图像增强与重建、物体识别、人体运动识别、手势识别、人脸识别等。
在学习的过程中,你会遇到过奇形怪状的各种图像滤波器,那有没有去思考如何实现它吗,在本文中,我们将通过实现一个简单的滤波器来开始我们的图像处理之旅!
OpenCV是一个开源库,包含了许多计算机视觉算法。它在计算机视觉和图像处理中起着重要作用,用于实时操作,其效率足以满足工业上的要求。OpenCV可以与其他库一起使用,比如Numpy,这使得Python能够处理OpenCV数组结构。
计算机不能像人类一样识别物体,为了能让计算机达到这个目的,我们可以使用各种技术来让计算机理解图像,我们会将颜色作为检测物体的主要依据。
我们使用HSV颜色空间作为检测特征。
HSV是Hue, Saturation 和Value(色调、饱和度和值)。
OpenCV中有150多种颜色空间转换方法,其中一种是彩色图像到HSV图像的转换。
我们需要导入我们要使用的库-OpenCV(cv2)和Numpy。
import cv2import numpy as np
Numpy是一个python库,用于处理数组,它比传统的python列表快50倍,这对我们来说非常重要,因为我们要处理很多图像。Numpy给了我们在线性代数、傅立叶变换、矩阵等领域工作的函数。
import cv2import numpy as npdef nothing(): passcap=cv2.VideoCapture(0)while(1): _, img = cap.read() k=cv2.waitkey(1)&0xFF if k==27: breakcap.release()cv2.destroyAllWindows()
我们创建了一个回调函数,它什么也不做,让我们看看为什么。
我们使用一个窗口来控制HSV,因为我们不知道要检测的对象的HSV,因此我们用它来调整HSV的上下限。
因为当我们使用创建trackbar的方法时,我们需要传递一个必要的回调函数,在我们的例子中,这个回调函数什么也不做(但是它的使用会根据父函数的需要而改变);然后我们使用了一个方法cv2.videocapture(0),它是一个内置函数,用来从默认摄像机捕捉视频(0表示选择默认摄像机);最后,我们删除了所有的窗口,并在一个点击事件(这里我们设置为ESC键)后释放捕获。
我们可以用下面的函数命名一个窗口。
cv2.namedWindow()
让我们继续敲代码…
import cv2import numpy as npdef nothing(x): pass cap=cv2.VideoCapture(0)cv2.namedWindow('tracking')cv2.createTrackbar('LH','tracking',0,255,nothing)cv2.createTrackbar('LS','tracking',0,255,nothing)cv2.createTrackbar('LV','tracking',0,255,nothing)cv2.createTrackbar('UH','tracking',255,255,nothing)cv2.createTrackbar('US','tracking',255,255,nothing)cv2.createTrackbar('UV','tracking',255,255,nothing)
因此,在设置检测条件后,我们需要将原始数据(即彩色图像)转换为HSV图像。为了将基本彩色图像转换为HSV图像,我们使用
= cv2.cvtColor(,cv2.COLOR_BGR2HSV)
然后利用Numpy数组方法设置trackbar中数据的上下界。
= np.array()
使用这个,我们会得到上面设置的所有轨迹条值。接下来我们主要做两件事:
1.创建掩码
掩码是一种二进制图像,它指示要在其中执行操作的像素。
2.我们将使用位和逻辑来屏蔽原始图像。我们使用名为“bitwise_and”的cv2方法,它执行逻辑与运算。
= cv2.inRange(hav, l_b, u_b)res = cv2.bitwise_and(, , mask = )
import cv2import numpy as npdef nothing(x): passcap=cv2.VideoCapture(0)cv2.namedWindow('tracking')cv2.createTrackbar('LH','tracking',0,255,nothing)cv2.createTrackbar('LS','tracking',0,255,nothing)cv2.createTrackbar('LV','tracking',0,255,nothing)cv2.createTrackbar('UH','tracking',255,255,nothing)cv2.createTrackbar('US','tracking',255,255,nothing)cv2.createTrackbar('UV','tracking',255,255,nothing)while (1): _, img=cap.read() hav=cv2.cvtColor(img,cv2.COLOR_BGR2HSV) l_h=cv2.getTrackbarPos('LH','tracking') l_s=cv2.getTrackbarPos('LS', 'tracking') l_v=cv2.getTrackbarPos('LV', 'tracking') u_h=cv2.getTrackbarPos('UH', 'tracking') u_s=cv2.getTrackbarPos('US', 'tracking') u_v=cv2.getTrackbarPos('UV', 'tracking') l_b=np.array([l_h,l_s,l_v]) u_b=np.array([u_h,u_s,u_v]) mask=cv2.inRange(hav, l_b, u_b) res = cv2.bitwise_and(img, img, mask=mask) cv2.imshow('image', img) cv2.imshow('mask', mask) cv2.imshow('res', res) k=cv2.waitKey(1)&0xFF if k==27: breakcap.release()cv2.destroyAllWindows()
这些帧使用名为“imshow”的方法显示。
cv2.imshow(, )
结果
结果只检测到粉红色的物体,这是因为我们只想选择粉红色的物体!实际上,我们已经使用轨迹条为特定的粉红色设置了HSV值,这就是输出只有特定粉红色的原因。您可以选择要检测的任何特定颜色值。
本文我们实现了一个滤波器,可以检测我们指定特定颜色的物体。我们所做的只是图像处理和目标检测的一个非常基本的介绍性任务。近年来,计算机视觉领域有了很大的发展,其中大部分都包含了机器学习和深度学习技术。在许多项目中,对象检测是首先执行的基本任务,因为它为我们提供了有关环境的信息,我们可以根据使用情况进行过滤。