Opencv学习笔记八(Canny边缘检测 图像金字塔 图像模板匹配)

文章目录

    • Canny边缘检测
    • 图像金字塔
    • 拉普拉斯金字塔
    • 图像模板匹配

Canny边缘检测

1986年,JOHN CANNY 提出一个很好的边缘检测算法,被称为Canny编边缘检测器。

Canny边缘检测器是一种经典的图像边缘检测与提取算法,应用广泛,主要是因为Canny边缘检测具备以下特点:

  1. 有效的噪声抑制
  2. 更强的完整边缘提取能力

Canny算法是如何做到精准的边缘提取的,主要是靠下面五个步骤

  1. 高斯模糊 – 抑制噪声
  2. 梯度提取得到边缘候选
  3. 角度计算与非最大信号抑制
  4. 高低阈值链接、获取完整边缘
  5. 输出边缘

OpenCV中Canny边缘检测的API如下:

void cv::Canny(

 InputArray image, 

OutputArray edges, 

double threshold1, 

double threshold2, 

int apertureSize = 3, 

bool L2gradient = false ) 

threshold1 是Canny边缘检测算法第四步中高低阈值链接中低阈值

threshold2 是Canny边缘检测算法第四步中高低阈值链接中高阈值、高低阈值之比在2:1~3:1之间

最后一个参数是计算gradient的方法L1或者L2

edge=cv.Canny(src,100,300)
cv.imshow("mask image",edge)

图像金字塔

图像金字塔是对一张输入图像先模糊下采样为原来大小的1/4(宽高缩小一半)、不断重复模糊与下采样的过程就得到了不同分辨率的输出图像,叠加在一起就形成了图像金字塔、所以图像金字塔是图像的空间多分辨率存在形式。这里的模糊是指高斯模糊,所以这个方式生成的金字塔图像又称为高斯金字塔图像。高斯金字塔图像有两个基本操作
reduce 是从原图生成高斯金字塔图像、生成一系列低分辨图像
expand是从高斯金字塔图像反向生成高分辨率图像

规则:

  1. 图像金字塔在redude过程或者expand过程中必须是逐层
  2. reduce过程中每一层都是前一层的1/4
    相关API
    reduce 操作 pyrDown
    expand操作 pyrUp
    Opencv学习笔记八(Canny边缘检测 图像金字塔 图像模板匹配)_第1张图片
def pyramid_down(pyramid_images):
    level = len(pyramid_images)
    print("level = ",level)
    for i in range(level-1, -1, -1):
        expand = cv.pyrUp(pyramid_images[i])
        cv.imshow("pyramid_down_"+str(i), expand)

def pyramid_up(image, level=3):#下采样
    temp = image.copy()
    # cv.imshow("input", image)
    pyramid_images = []
    for i in range(level):
        dst = cv.pyrDown(temp)
        pyramid_images.append(dst)
        # cv.imshow("pyramid_up_" + str(i), dst)
        temp = dst.copy()
    return pyramid_images


src = cv.imread("D:/images/master.jpg")
cv.namedWindow("input", cv.WINDOW_AUTOSIZE)
cv.imshow("input", src)
# pyramid_up(src)
pyramid_down(pyramid_up(src))

cv.waitKey(0)
cv.destroyAllWindows()

拉普拉斯金字塔

对输入图像实现金字塔的reduce操作就会生成不同分辨率的图像、对这些图像进行金字塔expand操作,然后使用reduce减去expand之后的结果就会得到图像拉普拉斯金字塔图像。
举例如下:
输入图像G(0)
金字塔reduce操作生成 G(1), G(2), G(3)
拉普拉斯金字塔:
L0 = G(0)-expand(G(1))
L1 = G(1)-expand(G(2))
L2 = G(2)–expand(G(3))

通过金字塔,将低分辨率图像重建为高分辨率图像

G(0)减去expand(G(1))得到的结果就是两次高斯模糊输出的不同,所以L0称为DOG(高斯不同)、它约等于LOG所以又称为拉普拉斯金字塔。所以要求的图像的拉普拉斯金字塔,首先要进行金字塔的reduce操作,然后在通过expand操作,最后相减得到拉普拉斯金字塔图像。

Opencv学习笔记八(Canny边缘检测 图像金字塔 图像模板匹配)_第2张图片

def laplaian_demo(pyramid_images):
    level = len(pyramid_images)
    for i in range(level-1, -1, -1):
        if (i-1) < 0:#求第0层拉普拉斯金字塔
            h, w = src.shape[:2]
            expand = cv.pyrUp(pyramid_images[i], dstsize=(w, h))
            lpls = cv.subtract(src, expand) + 127
            cv.imshow("lpls_" + str(i), lpls)
        else:
            h, w = pyramid_images[i-1].shape[:2]
            expand = cv.pyrUp(pyramid_images[i], dstsize=(w, h))
            lpls = cv.subtract(pyramid_images[i-1], expand) + 127
            cv.imshow("lpls_"+str(i), lpls)


def pyramid_up(image, level=3):#生成三层高斯金字塔,将各层图片存放在pyramid_images列表中
    temp = image.copy()
    pyramid_images = []
    for i in range(level):
        dst = cv.pyrDown(temp)
        pyramid_images.append(dst)
        temp = dst.copy()
    return pyramid_images


src = cv.imread("D:/images/master.jpg")
cv.namedWindow("input", cv.WINDOW_AUTOSIZE)
cv.imshow("input", src)
laplaian_demo(pyramid_up(src))

[外链图片转存失败(img-dJnSZXqf-1564754275963)(C:\Users\yuwenhao\AppData\Roaming\Typora\typora-user-images\1564751516789.png)]

图像模板匹配

模板匹配被称为最简单的模式识别方法、同时也被很多人认为是最没有用的模式识别方法。这里里面有很大的误区,就是模板匹配是工作条件限制比较严格,只有满足理论设置的条件以后,模板匹配才会比较好的开始工作,而且它不是基于特征的匹配,所以有很多弊端,但是不妨碍它成为入门级别模式识别的方法,通过它可以学习到很多相关的原理性内容,为后续学习打下良好的基础。
OpenCV中模板匹配的API为

void cv::matchTemplate (
InputArray image,
InputArray templ,
OutputArray result,
int method,
InputArray mask = noArray() 
)		
Python:
result = cv.matchTemplate(image, templ, method, result, mask)

其中method表示模板匹配时候采用的计算像素相似程度的方法,常见有如下
TM_SQDIFF = 0
TM_SQDIFF_NORMED = 1
平方不同与平方不同的归一化版本
TM_CCORR = 2
TM_CCORR_NORMED = 3
相关性,值越大相关性越强,表示匹配程度越高。
归一化版本值在0~1之间,1表示高度匹配,0表示完全不匹配
TM_CCOEFF = 4
TM_CCOEFF_NORMED = 5
相关因子,值越大相关性越强,表示匹配程度越高。
归一化版本值在0~1之间,1表示高度匹配,0表示完全不匹配

def template_demo():
    src = cv.imread("D:/images/llk.jpg")#读取图片
    tpl = cv.imread("D:/images/llk_tpl.png")#读取模板
    th, tw = tpl.shape[:2]#提取模板的高和宽
    result = cv.matchTemplate(src, tpl, cv.TM_CCORR_NORMED)
    cv.imshow("result", result)
    cv.imwrite("D:/039_003.png", np.uint8(result*255))
    t = 0.98
    loc = np.where(result > t)

    for pt in zip(*loc[::-1]):#绘制矩形
        cv.rectangle(src, pt, (pt[0] + tw, pt[1] + th), (255, 0, 0), 1, 8, 0)
    cv.imshow("llk-demo", src)
template_demo()

Opencv学习笔记八(Canny边缘检测 图像金字塔 图像模板匹配)_第3张图片
Opencv学习笔记八(Canny边缘检测 图像金字塔 图像模板匹配)_第4张图片

你可能感兴趣的:(Opencv学习笔记八(Canny边缘检测 图像金字塔 图像模板匹配))