hough变换就是这样一种检测的工具。

在数字图像中,往往存在着一些特殊形状的几何图形,像检测马路边一条直线,检测人眼的圆形等等,有时我们需要把这些特定图形检测出来,hough变换就是这样一种检测的工具。

Hough变换的原理是将特定图形上的点变换到一组参数空间上,根据参数空间点的累计结果找到一个极大值对应的解,那么这个解就对应着要寻找的几何形状的参数(比如说直线,那么就会得到直线的斜率k与常熟b,圆就会得到圆心与半径等等)。

关于hough变换,核心以及难点就是关于就是有原始空间到参数空间的变换上。以直线检测为例,假设有一条直线L,原点到该直线的垂直距离为p,垂线与x轴夹角为θθ,那么这条直线是唯一的,且直线的方程为 ρ=xcosθ+ysinθρ=xcosθ+ysinθ, 如下图所示:

可以看到的是这条直线在极坐标系下只有一个(ρ,θ)(ρ,θ)与之对应,随便改变其中一个参数的大小,变换到空间域上的这个直线将会改变。好了,再回来看看这个空间域上的这条直线上的所有点吧,你会发现,这条直线上的所有点都可以是在极坐标为(ρ,θ)(ρ,θ)所表示的直线上的,为什么说是都可以在,因为其中随便的一个点也可以在其他的(ρ,θ)(ρ,θ)所表示的直线上,就比如上述的(x,y)吧,它可以再很多直线上,准确的说,在经过这个点的直线上,随便画两条如下:

可以看到,光是空间上的一个点在极坐标系下就可能在很多极坐标对所对应的直线上,具体有多少个极坐标对呢?那得看你的θθ的步长了,我们可以看到θθ无非是从0-360度(0−2π0−2π)变化,假设我们没10度一走取一个直线(这个点在这个直线上),那么我们走一圈是不是取了36条直线,也就对应36个极坐标对没错吧,那么这个极坐标对,画在坐标轴上是什么样子的呢?因为θθ是从0−2π0−2π,并且一个点定了,如果一个θθ也定了,你想想它对应的直线的ρρ会怎么样,自然也是唯一的。那么这个点在极坐标下对应的(ρ,θ)(ρ,θ)画出来一个周期可能就是这样的,以θθ为x轴的话:

ok前面说的是单单这一个点对应的极坐标系下的参数对,那么如果每个点都这么找一圈呢?也就是每个点在参数空间上都对应一系列参数对吧,现在把它们华仔同一个坐标系下会怎么样呢?为了方便,假设在这个直线上取3个点画一下:

那么可以看到,首先对于每一个点,在极坐标下,会存在一个周期的曲线来表示通过这个点,其次,这三个极坐标曲线同时经过一个点,要搞清楚的是,极坐标上每一个点对(ρ,θ)(ρ,θ)在空间坐标上都是对应一条直线的。好了,同时经过的这一个点有什么含义呢?它表示在空间坐标系下,有一条直线可以经过点1,经过点2,经过点3,这是什么意思?说明这三个点在一条直线上吧。反过来再来看这个极坐标系下的曲线,那么我们只需要找到交点最多的点,把它返回到空间域就是这个需要找的直线了。为什么是找相交最多的点,因为上面这只是三个点的曲线,当空间上很多点都画出来的时候,那么相交的点可能就不知上述看到的一个点了,可能有多个曲线相交点,但是有一点,势必是一条直线上的所有点汇成的交点是曲线相交次数最多的。

再来分析这个算法。可以看到hough变换就是参数映射变换。对每一个点都进行映射,并且每一个映射还不止一次,(ρ,θ)(ρ,θ)都是存在步长的,像一个点映射成一个(ρ,θ)(ρ,θ),以θθ取步长为例,当θθ取得步长大的时候,映射的(ρ,θ)(ρ,θ)对少些,反之则多,但是我们有看到,映射后的点对是需要求交点的,上述画出来的曲线是连续的,然而实际上因为θθ步长的存在,他不可能是连续的,像上上个图一样,是离散的。那么当θθ步长取得比较大的时候,你还想有很多交点是不可能的,因为这个时候是离散的曲线然后再去相交,所以说θθ步长不能太大,理论上是越小效果越好,因为越小,越接近于连续曲线,也就越容易相交,但是越小带来的问题就是需要非常多的内存,计算机不会有那么多内存给你的,并且越小,计算量越大,想想一个点就需要映射那么多次,每次映射是需要计算的,耗时的。那么再想想对于一副图像所有点都进行映射,随便假设一副100100的图像(很小吧),就有10000个点,对每个点假设就映射36组(ρ,θ)(ρ,θ)参数(此时角度的步长是10度了,10度,已经非常大的一个概念了),那么总共需要映射360000次,在考虑每次映射计算的时间吧。可想而知,hough是多么耗时耗力。所以必须对其进行改进。首先就是对图像进行改进,100100的图像,10000个点,是不是每个点都要计算?大可不必,我们只需要在开始把图像进行一个轮廓提取,一般使用canny算子就可以,生成黑白二值图像,白的是轮廓,那么在映射的时候,只需要把轮廓上的点进行参数空间变换,为什么提轮廓?想想无论检测图像中存在的直线呀圆呀,它们都是轮廓鲜明的。那么需要变换的点可能就从10000个点降到可能1000个点了,这也就是为什么看到许多hough变换提取形状时为什么要把图像提取轮廓,变成二值图像了。

继续算法,分析这么多,可想而知那么一个hough变换在算法设计上就可以如下步骤:
(1)将参数空间(ρ,θ)(ρ,θ)量化,赋初值一个二维矩阵M,M(ρ,θ)M(ρ,θ)就是一个累加器了。
(2)然后对图像边界上的每一个点进行变换,变换到属于哪一组(ρ,θ)(ρ,θ),就把该组(ρ,θ)(ρ,θ)对应的累加器数加1,这里的需要变换的点就是上面说的经过边缘提取以后的图像了。
(3)当所有点处理完成后,就来分析得到的M(ρ,θ)M(ρ,θ),设置一个阈值T,认为当M(ρ,θ)>TM(ρ,θ)>T,就认为存在一条有意义的直线存在。而对应的M(ρ,θ)M(ρ,θ)就是这组直线的参数,至于T是多少,自己去式,试的比较合适为止。
(4)有了M(ρ,θ)M(ρ,θ)和点(x,y)计算出来这个直线就ok了。

说了这么多,这就是原理上hough变换的最底层原理,事实上完全可以自己写程序去实现这些,然而,也说过,hough变换是一个耗时耗力的算法,自己写循环实现通常很慢,曾经用matlab写过这个,也有实际的hough变换例子可以看看:

虹膜识别(三):Hough变换检测内圆边缘

那么我们在实际中大可不必自己写,opencv已经集成了hough变换的函数,调用它的函数效率高,也很简单。
Opencv中检测直线的函数有cv2.HoughLines(),cv2.HoughLinesP()
函数cv2.HoughLines()返回值有三个(opencv 3.0),实际是个二维矩阵,表述的就是上述的(ρ,θ)(ρ,θ),其中ρρ的单位是像素长度(也就是直线到图像原点(0,0)点的距离),而θθ的单位是弧度。这个函数有四个输入,第一个是二值图像,上述的canny变换后的图像,二三参数分别是ρρ和θθ的精确度,可以理解为步长。第四个参数为阈值T,认为当累加器中的值高于T是才认为是一条直线。自己画了个图实验一下:

import cv2
import numpy as np
import matplotlib.pyplot as plt

img = cv2.imread(‘line.jpg’)
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)#灰度图像
#open to see how to use: cv2.Canny
#http://blog.csdn.net/on2way/article/details/46851451
edges = cv2.Canny(gray,50,200)
plt.subplot(121),plt.imshow(edges,‘gray’)
plt.xticks([]),plt.yticks([])
#hough transform
lines = cv2.HoughLines(edges,1,np.pi/180,160)
lines1 = lines[:,0,:]#提取为为二维
for rho,theta in lines1[:]:
a = np.cos(theta)
b = np.sin(theta)
x0 = arho
y0 = b
rho
x1 = int(x0 + 1000*(-b))
y1 = int(y0 + 1000*(a))
x2 = int(x0 - 1000*(-b))
y2 = int(y0 - 1000*(a))
cv2.line(img,(x1,y1),(x2,y2),(255,0,0),1)

plt.subplot(122),plt.imshow(img,)
plt.xticks([]),plt.yticks([])


本文来自 我i智能 的CSDN 博客 ,全文地址请点击:https://blog.csdn.net/on2way/article/details/47028969?utm_source=copy

你可能感兴趣的:(机器学习)