什么是阈值?
它是一种最简单的图像分割的方法。
应用举例:从一副图像中利用阈值分割出我们需要的物体部分(当然这里的物体可以是一部分或者整体)。这样的图像分割方法是基于图像中物体与背景之间的灰度差异,而且此分割属于像素级的分割。
为了从一副图像中提取出我们需要的部分,应该用图像中的每一个像素点的灰度值与选取的阈值进行比较,并作出相应的判断。(注意:阈值的选取依赖于具体的问题。即:物体在不同的图像中有可能会有不同的灰度值。
一旦找到了需要分割的物体的像素点,我们可以对这些像素点设定一些特定的值来表示。(例如:可以将该物体的像素点的灰度值设定为:‘0’(黑色),其他的像素点的灰度值为:‘255’(白色);当然像素点的灰度值可以任意,但最好设定的两种颜色对比度较强,方便观察结果)。
OpenCV中提供了阈值化函数: cv2.threshold()
、cv2.adaptiveThreshold()
。
这个函数有5种阈值化类型,在接下来的章节中将会具体介绍。
retval, dst = cv2.threshold ( InputArray src,
double thresh,
double maxval,
int type
)
参数 | 说明 |
---|---|
src | 输入图,输入数组(多通道,8位或32位浮点数),一般为灰度图。 |
dst | 输出图,与src具有相同大小和类型以及相同通道数量的输出数组。 |
thresh | 阈值,与THRESH_BINARY和THRESH_BINARY_INV阈值类型一起使用的最大值 |
maxval | 当像素值超过了阈值(或者小于阈值,根据type来决定),所赋予的值 |
type | 二值化操作的类型,阈值类型(参见ThresholdTypes)。 |
ThresholdTypes包含以下5种类型: cv2.THRESH_BINARY
; cv2.THRESH_BINARY_INV
; cv2.THRESH_TRUNC
; cv2.THRESH_TOZERO
;cv2.THRESH_TOZERO_INV
ThresholdTypes参数 | 说明 |
---|---|
cv2.THRESH_BINARY | 超过阈值部分取maxval(最大值),否则取0 |
cv2.THRESH_BINARY_INV | THRESH_BINARY的反转 |
cv2.THRESH_TRUNC | 大于阈值部分设为阈值,否则不变 |
cv2.THRESH_TOZERO | 大于阈值部分不改变,否则设为0 |
cv2.THRESH_TOZERO_INV | THRESH_TOZERO的反转 |
cv2.THRESH_MASK | |
cv2.THRESH_OTSU | 标志,使用Otsu算法选择最优阈值 |
cv2.THRESH_TRIANGLE | 标志,使用三角形算法选择最优阈值 |
对每个数组元素应用一个固定级别的阈值。
该函数对多通道阵列应用固定级别阈值。该函数通常用于从灰度图像中获得双级(二值)图像(compare也可用于此目的)或去除噪声,即过滤出值太小或太大的像素。该函数支持几种类型的阈值设置。它们由类型参数决定。
另外,特殊值THRESH_OTSU
或THRESH_TRIANGLE
可以与上述值中的一个结合使用。在这些情况下,函数使用Otsu的或Triangle算法确定最佳阈值。
注意:目前,Otsu和Triangle方法仅适用于8位的单通道图像。
import cv2
import numpy as np
from matplotlib import pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei'] #文字字体为黑体
#彩色图像阈值化
img = cv2.imread('dog.jpg')
b,g,r = cv2.split(img)
img = cv2.merge((r,g,b)) #BGR转RGB
ret, thresh1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
ret, thresh2 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)
ret, thresh3 = cv2.threshold(img, 127, 255, cv2.THRESH_TRUNC)
ret, thresh4 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO)
ret, thresh5 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO_INV)
titles = ['Original Image', 'BINARY', 'BINARY_INV', 'TRUNC', 'TOZERO', 'TOZERO_INV']
images = [img, thresh1, thresh2, thresh3, thresh4, thresh5]
plt.figure()
for i in range(6):
plt.subplot(2, 3, i + 1), plt.imshow(images[i], 'gray')
plt.suptitle('彩色图像阈值化')
plt.title(titles[i])
plt.xticks([]), plt.yticks([])
plt.show()
运行结果:
注意:通过实践,cv2.threshold()
是可以处理BGR彩色图像的,而下文介绍的cv2.adaptiveThreshold()
不能处理彩色图像。但是在我的专业领域下,可能对彩色图像阈值化处理并没有多大意义,所以还是统一使用灰度图最为输入图像吧。
#灰度图像阈值化
img = cv2.imread('dog.jpg')
img_gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
ret, thresh1 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY)
ret, thresh2 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY_INV)
ret, thresh3 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TRUNC)
ret, thresh4 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TOZERO)
ret, thresh5 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TOZERO_INV)
titles = ['Original Image', 'BINARY', 'BINARY_INV', 'TRUNC', 'TOZERO', 'TOZERO_INV']
images = [img_gray, thresh1, thresh2, thresh3, thresh4, thresh5]
plt.figure()
for i in range(6):
plt.subplot(2, 3, i + 1), plt.imshow(images[i], 'gray')
plt.suptitle('灰度图像阈值化')
plt.title(titles[i])
plt.xticks([]), plt.yticks([])
plt.show()
在上一节中,我们使用全局值作为阈值。但它可能不是在所有的条件下,图像有不同的照明条件在不同的区域。在这种情况下,我们使用自适应阈值。在这种情况下,算法计算的阈值的小区域的图像。因此,我们对同一幅图像的不同区域得到了不同的阈值,对不同光照的图像得到了更好的结果。
它有三个“特殊的”输入参数,只有一个输出参数。
自适应方法-它决定如何阈值的计算。
ADAPTIVE_THRESH_MEAN_C
:阈值是相邻区域的均值。ADAPTIVE_THRESH_GAUSSIAN_C
:阈值是权重为高斯窗的邻域值的加权和。dst = cv2.adaptiveThreshold ( InputArray src,
double maxValue,
int adaptiveMethod,
int thresholdType,
int blockSize,
double C
)
参数 | 说明 |
---|---|
src | 输入图,8位单通道图像 |
dst | 与src相同大小和类型的目标图像 |
maxValue | 赋给满足条件的像素的非零值 |
adaptiveMethod | 使用自适应阈值算法,请参见AdaptiveThresholdTypes。使用BORDER_REPLICATE, BORDER_ISOLATED来处理边界 |
thresholdType | 阈值类型必须为THRESH_BINARY或THRESH_BINARY_INV,请参见ThresholdTypes |
blockSize | 用于计算像素阈值的像素邻域大小:3、5、7,等等 |
C | 常数减去平均值或加权平均值(详见下文)。通常,它是正的,但也可以是零或负的 |
AdaptiveThresholdTypes
(自适应阈值算法参数)
AdaptiveThresholdTypes参数 | 说明 |
---|---|
cv2.ADAPTIVE_THRESH_MEAN_C | 阈值T(x,y)是(x,y) - C的blockSize×blockSize邻域的均值 |
cv2.ADAPTIVE_THRESH_GAUSSIAN_C | 阈值T(x,y)是(x,y) - C的blockSize×blockSize邻域的加权和(与高斯窗口相互关联)。指定的块大小使用默认的sigma(标准偏差)。见getGaussianKernel |
对数组应用自适应阈值。
该函数将灰度图像转换为二值图像,其公式如下:
#自适应阈值处理
img = cv2.imread('dog.jpg')
img_gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
img = cv2.medianBlur(img_gray,5) #中值滤波平滑处理
ret,th1 = cv2.threshold(img,127,255,cv2.THRESH_BINARY) #全局图像阈值处理
th2 = cv2.adaptiveThreshold(img,255,cv2.ADAPTIVE_THRESH_MEAN_C,cv2.THRESH_BINARY,11,2) #自适应图像阈值处理
th3 = cv2.adaptiveThreshold(img,255,cv2.ADAPTIVE_THRESH_GAUSSIAN_C,cv2.THRESH_BINARY,11,2)
titles = ['Original Image', 'Global Thresholding (v = 127)',
'Adaptive Mean Thresholding', 'Adaptive Gaussian Thresholding']
images = [img, th1, th2, th3]
plt.figure()
for i in range(4):
plt.subplot(2,2,i+1),plt.imshow(images[i],'gray')
plt.title(titles[i])
plt.xticks([]),plt.yticks([])
plt.show()
运行结果:
通过对比可以看出,图2进行的全局统一阈值化处理的效果和图3、图4自适应阈值化处理的效果有很大的不同。
在第一节中,函数返回值还有第二个参数retVal。当我们使用Otsu的二值化时,就会用到它。那么它是什么呢?
在全局阈值中,我们使用任意值作为阈值,那么,我们如何知道我们选择的值是好是坏呢?答案是,试错法。但是考虑一个双峰图像(简单地说,双峰图像是直方图有两个峰值的图像)。对于这个图像,我们可以在这些峰值中间取一个值作为阈值,这就是大津二值化所做的。因此,简单地说,它从图像直方图的双峰图像自动计算一个阈值。(对于非双峰的图像,二值化是不准确的)
为此,使用我们的cv2.threshold()
函数,但传递一个额外的标志cv2.THRESH_OTSU
。对于阈值,只需传递0即可。然后,该算法会找到最优阈值,并作为第二个输出retVal
返回给您。如果不使用Otsu阈值,则retVal与您使用的阈值相同。
由于我们使用的是双峰图像,Otsu的算法试图找到一个阈值(t),使由关系给出的加权类内方差最小:
其中:
它会找到一个t值位于两个峰值之间这样两类的方差都是最小的。
看看下面的例子。输入图像是有噪声的图像。在第一个例子中,我为127应用了全局阈值。在第二种情况中,我直接应用了Otsu的阈值。在第三种情况下,我用5x5高斯核滤除图像中的噪声,然后应用Otsu阈值。查看噪声滤波如何改善结果。
#大津二值化算法 ( Otsu's binarization )
img = cv2.imread('dog.jpg')
img = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) #转化为灰度图
# global thresholding
ret1,th1 = cv2.threshold(img,127,255,cv2.THRESH_BINARY) #全局图像阈值化处理
# Otsu's thresholding
ret2,th2 = cv2.threshold(img,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU) #Otsu算法阈值化
# Otsu's thresholding after Gaussian filtering
blur = cv2.GaussianBlur(img,(5,5),0) #高斯滤波
ret3,th3 = cv2.threshold(blur,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU) #高斯滤波之后,Otsu算法阈值化
# plot all the images and their histograms
images = [img, 0, th1,
img, 0, th2,
blur, 0, th3]
titles = ['Original Noisy Image','Histogram','Global Thresholding (v=127)',
'Original Noisy Image','Histogram',"Otsu's Thresholding",
'Gaussian filtered Image','Histogram',"Otsu's Thresholding"]
for i in range(3):
plt.subplot(3,3,i*3+1),plt.imshow(images[i*3],'gray')
plt.title(titles[i*3]), plt.xticks([]), plt.yticks([])
plt.subplot(3,3,i*3+2),plt.hist(images[i*3].ravel(),256)
plt.title(titles[i*3+1]), plt.xticks([]), plt.yticks([])
plt.subplot(3,3,i*3+3),plt.imshow(images[i*3+2],'gray')
plt.title(titles[i*3+2]), plt.xticks([]), plt.yticks([])
plt.show()
主要参考于OpenCV官方网站:http://www.opencv.org.cn/
目前博主已更新OpenCV平滑处理函数、形态学操作函数的详细介绍,链接如下:
【OpenCV-图像处理】图像平滑处理函数
【OpenCV-图像处理】形态学变换函数
<后续还会继续翻译和整理【OpenCV-图像处理】相关内容,如果需要,可持续关注我哦~> |
<翻译和整理不易,留个赞或评论支持一下我吧^^>
如有疑问,欢迎批评指正^^