以前一直都在做目标检测和分类项目,现在准备入坑目标跟踪,准备从传统算法开始学习,然后再到深度学习方法。
目标跟踪是计算机视觉领域的一个重要研究领域,也被广泛的使用。
在目标跟踪任务中又可以分为单目标跟踪和多目标跟踪。
按照任务计算类型又可以分为以下2类。
而目标跟踪也有自己的技术难点,比如:目标的形态、尺度、环境光照等变换,或者运动速度快,有遮挡时也会导致跟踪失败
在目标跟踪的发展中,也产生了很多算法,传统算法比如有光流法,背景差分法,粒子滤波法等等,直至现在常用的深度学习。
本文先研究的背景法,以后会不断更新其他方法。
背景法:将视频的初始帧(当然也可以自己去设定某一帧)设定为背景,因为背景是几乎没什么变化的,变的是运动的物体。然后让之后的每一帧与背景帧做差值,这样就可以检测出运动物体,这种方法也不用像深度学习需要进行训练。缺点就是对周围光照很敏感,所以适合在光照稳定的场景中
代码:
【代码都已经加了注释,基本上一看就懂】
import cv2
import numpy as np
'''
背景法将开始的一幅图像作为背景,然后和后面的每一帧对比,缺点是一开始存入的背景可能随光照变法而造成错误
但是可以用在光照环境稳定的地方,优点是可以检测之前背景没有的景象
'''
camera = cv2.VideoCapture(0)
if (camera.isOpened()): # 判断视频是否打开
print('设想头成功打开')
else:
print('摄像头未打开')
fps = camera.get(cv2.CAP_PROP_FPS)
fourcc = cv2.VideoWriter_fourcc(*'XVID')
# 读取视频尺寸
size = (int(camera.get(cv2.CAP_PROP_FRAME_WIDTH)),
int(camera.get(cv2.CAP_PROP_FRAME_HEIGHT)))
out_frame = cv2.VideoWriter('跟踪.avi', fourcc, fps, size)
print('视频尺寸:', size)
# 构建3*3 用来构造内核
# cv2.getStructuringElement(shape, ksize, anchor=None)
# shape:表示内核的形状 MORPH_RECT(矩形),MORPH_CROSS(交叉形),MORPH_ELLIPSE(椭圆形)
# kisze:内核的尺寸
es = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))
kernel = np.ones((5, 5), np.uint8)
background = None # 背景
while True:
# 读取视频流
ret, frame = camera.read()
# 对帧进行预处理
gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) # 转灰度图像
gray = cv2.GaussianBlur(gray, (21, 21), 0) # 高斯滤波(降噪:摄像头震动、光照变化)
# 将第一帧设置为整个输入的背景
if background is None:
background = gray # 将第一帧做位背景图,此刻background不再是None
continue
# 对比背景之后的帧与背景之间的差异,并得到一个差分图(different map)。
# 二值化处---->膨胀(dilate)得到图像区域块
# cv2.threshold(src, thresh, maxval, type, dst=None)通过阈值二值化处理图像,
# src是需要操作的图像
# thresh是阈值参数
# maxval是高于阈值时赋予的参数,高于阈值的像素点全部位maxval,小于阈值的为0
# type是方法参数,cv2.THRESH_BINARY(黑白二值)
# cv2.dilate形态学中的膨胀处理,用上面我们构建的元素来对图像进行膨胀
diff_img = cv2.absdiff(background, gray) # 获取差分图,就是两幅图做差(第一帧的时候肯定是0)
diff_img = cv2.threshold(diff_img, 25, 255, cv2.THRESH_BINARY)[1] # 图像二值化处理
diff_img = cv2.dilate(diff_img, es, iterations=2)
# 显示矩形框:计算一幅图像中目标的轮廓 cv2.RETR_EXTERNAL查找外轮廓,cv2.CHAIN_APPROX_SIMPLE 轮廓只需4个点来保存轮廓信息
# contours 一个列表,用来存储能描述轮廓的信息
contours, hierarchy = cv2.findContours(diff_img.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
for c in contours:
# cv2.contourArea(c)计算轮廓面积 c是单个输入的轮廓值
if cv2.contourArea(c) < 1500:
continue
(x, y, w, h) = cv2.boundingRect(c) # 该函数计算矩形的边界框
cv2.rectangle(frame, (x, y), (x+w, y+h), (0, 255, 0), 2)
cv2.imshow('contours', frame)
out_frame.write(frame)
cv2.imshow('diff_img', diff_img)
key = cv2.waitKey(1) & 0xFF
if key == ord('q'): # 按'q'健退出循环
break
# 释放资源并关闭窗口
camera.release()
cv2.destroyAllWindows()
上述代码需要讲下的部分:
es是通过构建一个模板(可以理解为一个卷积),我这里设置的是一个3*3的矩形,用来做后面的膨胀处理【对一些间隙做填充,平滑作用】
es = cv2.getStructuringElement(cv2.MORPH_RECT, (3, 3))
kernel = np.ones((5, 5), np.uint8)
background = None # 背景
对灰度图像进行高斯滤波去噪,并将处理后的图像赋给背景,以此作为背景帧。
# 对帧进行预处理
gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) # 转灰度图像
gray = cv2.GaussianBlur(gray, (21, 21), 0) # 高斯滤波(降噪:摄像头震动、光照变化)
# 将第一帧设置为整个输入的背景
if background is None:
background = gray # 将第一帧做位背景图,此刻background不再是None
continue
这里就是用差分和膨胀进行图像处理
diff_img = cv2.absdiff(background, gray) # 获取差分图,就是两幅图做差(第一帧的时候肯定是0)
diff_img = cv2.threshold(diff_img, 25, 255, cv2.THRESH_BINARY)[1] # 图像二值化处理
diff_img = cv2.dilate(diff_img, es, iterations=2)
然后让我们来看一下效果吧~~ 注意:使用环境要进尽可能光照稳定、场景简单,还有这个并不能对特定的目标进行跟踪。
下面的图就是通过与背景帧差值后跟踪的结果了~