img = cv2.read('AM.png')
cv_show(up, 'up')
up = cv2.pyrUp(img) # 补充0变模糊,细节丢失
cv_show(up, 'up')
down = cv2.pyrDown(img) # 细节丢失
cv_show(down, 'down')
也可以在进行了一次上采样或下采样后,再一次在这个基础上再进行上、下采样
拉普拉斯金字塔
原始图像-先down再up的图像
down = cv2.pyrDown(img)
down_up = cv2.pyrUp(down)
1_1 = img - down_up
边缘:零零散散的
轮廓:是一个整体
为了更高的准确率,使用二值图像。
import cv2
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline #专有魔法指令,即时显示
def cv_show(name,img):
cv2.imshow(name,img)
cv2.waitKey(0)
cv2.destoryAllWindows()
img = cv2.imread('car.png')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
ret, thresh = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY)
cv_show(thresh, 'thresh')
binary, contours, hierarchy = cv2.findContours(thresh, cv2.RETR_TREE, cv2.CHAIN_APPROX_NONE)
# 新版返回参数只有contours, hierarchy
# 最常用的就是RETR_TREE
# contours是轮廓,hierarchy是轮廓级别的排序
# 传入绘制图像,轮廓,轮廓索引,颜色模式,线条厚度
绘制轮廓
# 传入绘制图像,轮廓, 轮廓索引,颜色模式,线条厚度
# 注意需要copy,要不原图会变。。。
draw_img = img.copy()
res = cv2.drawContours(draw_img, contours, -1, (0, 0, 255), 2)
# -1 相当于画出所有的轮廓
cv_show(res, 'res')
轮廓特征
cnt = contours[0] # 第0个轮廓
# 面积
cv2.contourArea(cnt)
# 周长,True表示闭合的
cv2.arcLength(cnt, True)
轮廓近似
img = cv2.imread('contours2.png')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
ret, thresh = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY)
binary, contours, hierarchy = cv2.findContours(thresh, cv2.RETR_TREE, cv2.CHAIN_APPROX_NONE)
cnt = contours[0]
draw_img = img.copy()
res = cv2.drawContours(draw_img, [cnt], -1, (0, 0, 255), 2)
cv_show(res, 'res')
epsilon = 0.1 * cv2.arcLength(cnt, True)
epsilon = 0.01 * cv2.arcLength(cnt, True) # 系数越小,越细致
approx = cv2.approxPolyDP(cnt, epsilon, True)
draw_img2 = img.copy()
res = cv2.drawContours(draw_img2, [approx], -1, (0, 0, 255), 2)
cv_show(res, 'res')
epsilon 是一个指定的值T(通常取周长的比例),比如有一段A到B的弧线,先连接A、B的直线,在弧线上取一点C使得C到直线的距离d最大,比较d和T;若d < T,则可以把AB弧线的轮廓近似为直线AB;若d > T,则重新连接两条直线AC和BC,再次在弧线AC和BC上找出到直线距离最大的点,再次比较,如此往复
边界矩形
img = cv2.imread('contours2.png')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
ret, thresh = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY)
binary, contours, hierarchy = cv2.findContours(thresh, cv2.RETR_TREE, cv2.CHAIN_APPROX_NONE)
cnt = contours[0]
x, y, w, h = cv2.boundingRect(cnt)
img = cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 2)
cv_show(img, 'img')
外接圆
(x, y), radius = cv2.minEnclosingCircle(cnt)
center = (int(x), int(y))
radius = int(radius)
img = cv2.circle(img, center, radius, (0, 255, 0), 2)
cv_show(img, 'img')
匹配顺序:从左到右,从上到下
模板匹配和卷积原理很像,模板再原图像上从原点开始滑动,计算模板与(图像倍模板覆盖的地方)的差别程度,这个差别程度的计算方法再opencv里有6中,然后将每次计算的结果放入一个矩阵里,作为结果输出。假如原图形是A×B大小,而模板是a×b大小,则输出结果的矩阵是(A-a+1)×(B-b+1)
模式匹配模式计算解释链接
# 模板匹配
img = cv2.imread('lean.jpg', 0)
template = cv2.imread('face.jpg', 0)
h, w = template.shape(:2)
methods = ['cv2.TM_CCOFFF', 'cv2.TM_CCOEFF_NORMED', 'cv2.TM_CCORR', 'cv2.TM_CCORR_NORMED', 'cv2.TM_SQDIFF', 'cv2.TM_SQDIFF_NORMED', ]
res = cv2.matchTemplate(img, template, cv2.TM_SQDIFF) # cv2.TM_SQDIFF不能写成字符串形式,尽量使用带归一化的操作
# 和res = cv2.matchTemplate(img, template, 1)一样
for meth in method:
img2 = img.copy()
# 匹配方法的真值
method = eval(meth) # 执行一个字符串表达式,并返回表达式的值
# 因为不能传递字符串,所以eval一下传递一个值
print(method)
res = cv2.matchTemplate(img, teplate, method)
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)
# 如果是平方差匹配TM_SQDIFF或归一化平方差匹配TM_SQDIFF_NORMED,取最小值
if method in [cv2.TM_SQDIFF, cv2.SQDIFF_NORMED]:
top_left = min_loc
else:
top_left = max_loc
bottom_right = (top_left[0] + w, top_left[1] + h)
#画矩形
cv2.rectangle(img2, top_left, bottom_right,255 ,2)
plt.subplot(121),plt.imshow(res,cmap = 'gray')
plt.xticks([]), plt.yticks([]), #隐藏坐标轴
plt.subplot(122),plt.imshow(img2,cmap = 'gray')
plt.xticks([]),plt.yticks([])
plt.suptitle(meth)
plt.show()
res是每个窗口返回的结果值
一般都用带归一化的
匹配多个对象
img_rgb = cv2.imread('mario. jpg')
img_gray = cv2.cvtColor(img_rgb, cv2.COLOR_BGR2GRAY)
template = cv2.imread('mario_coin.jpg', 0)
h, w = template.shape[2]
res = cv2.matchTemplate(img_gray, template, cv2.TM_CCOEFF_NORMED) # res为匹配系数,越接近1越好
threshold = 0.8
# 取匹配程度大于%80的坐标
loc = np.where(res >= threshold)
for pt in zip(*loc[::-1]): # *表示可选参数
bottom_right = (pt[0] + w, pt[1] + h)
cv2.rectangle(img_rgb, pt, bottom_right, (0, 0, 255), 2)
cv2.imshow('img_rgb', img_rgb)
cv2.waitKey(0)
mario_coin.jpg:
x = [1, 2, 3]
y= [4, 5, 6]
print(list(zip(x, y)))
[(1, 4), (2, 5), (3, 6)]
这样的解释的话,第三段代码就好理解了:因为loc是先y坐标再x坐标,所以用loc[::-1]翻转一下,然后再用zip函数拼接一下。
a[::-1]就是将序列a中的元素翻转
cv2.pyrUp(img)
高斯金字塔:向上采样(放大图像)
cv2.pyrDown(img)
高斯金字塔:向下采样(缩小图像)
img-cv2.pyrUp(cv2.pyrDown(img))
拉普拉斯金字塔(原图-(先缩小后放大))
cv2.findContours(img, mode, method)
找出轮廓
img:待测图像
mode:轮廓检索模式
(1)RETR_EXTERNAL:只检索最外面的轮廓;
(2)RETR_LIST:检索所有的轮廓。并将其保存到一条链表当中;
(3)RETR_CCOMP:检索所有的轮廓,并将他们组织为两层;顶层是各部分的外部边界,第二层是空洞的边界;
(4)RETR_TREE:检索所有的轮廓,并重构嵌套轮廓的整个层次;
(最常用的是第四个,默认检测所有,以嵌套保存)
method:轮廓逼近方法
(1)CHAIN_APPROX_NONE:以Freeman链码的方式输出轮廓,所有其他方法输出多边形(顶点的序列)。
(2)CHAIN_APPROX_SIMPLE:压缩水平的、垂直的和斜的部分,也就是,函数只保留他们的终点部分。
返回值:contours,hierarchy;contours是轮廓,hierarchy是轮廓级别的排序
cv2.drawContours(img, contours, contourIdx, color,width)
画出轮廓
contours:轮廓
contourIdx:轮廓数量,画第几个轮廓;默认-1,即所有轮廓
color:颜色(B,G,R)
width:线条的宽度
cv2.contourArea(cnt)
计算轮廓面积
cv2.arcLength(cnt, True)
计算轮廓周长,True表示闭合
cv2.approxPolyDP(cnt, epsilon, True)
轮廓近似(普朗克算法)
cnt:具体哪个轮廓
epsilon:给字节指定一个值来比较,一般按照周长的百分比设置
True:闭合
x, y, w, h = cv2.boundingRect(cnt)
(x, y)为坐标点,w, h为矩形长宽
cv2.rectangle(img, pt1, pt2, color,width)
画矩形
pt1:坐标点1
pt2:坐标点2
width:线宽
(x, y), radius = cv2.minEnclosingCircle(cnt)
外接圆近似
cv2.circle(img, center, radius,color, width)
画圆
res = cv2.matchTemplate(img, template, method)
模板匹配
method:
(1)cv2.TM_SQDIFF:计算平方不同,计算出来的值越小,越相关
(2)cv2.TM_CCORR:计算相关性,计算出来的值越大,越相关
(3)cv2.TM_CCOFFF:计算相关系数,计算出来的值越大,越相关
(4)cv2.TM_SQDIFF_NORMED:计算归一化平方不同,计算出来的值越接近0,越相关
(5)cv2.TM_CCORR_NORMED:计算归一化相关性,计算出来的值越接近1,越相关
(6)cv2.TM_CCOEFF_NORMED:计算归一化相关系数,计算出来的值越接近1,越相关
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)
min_val:算法算出的最小值
max_val:算法算出的最大值
min_loc:最小值所在的坐标(因为得到了h,w,所以可得到矩形)
max_loc :最大值所在的坐标