跟着b站的教程学习链接:https://www.bilibili.com/video/BV1RQ4y1R7M6?p=6
内容基本按照教程走,进行了一些简单的注释和总结。
无原理解释,默认学过
1.读取和处理
图片读取
src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_GRAYSCALE) # opencv读取文件的路径不能有中文名
# src =img[0:50, 0:200] # 截取图像中的一部分
b, g, r = cv.split(src)
# cv.IMREAD_GRAYSCALE 转灰度图像
cv.namedWindow("cat and girl", cv.WINDOW_AUTOSIZE)
cv.imshow("cat and girl", src)
cv.waitKey(0) # 等待事件触发,参数0表示指令发出后立即执行。本题是按任意键执行destroyAllWindows
cv.destroyAllWindows() # 释放窗口
cv.imwrite()
视频读取
video_test01 = cv.VideoCapture("D:/ALL_LEARN/video/test01.mp4")
# 检查是否能打开
if video_test01.isOpened():
open, frame = video_test01.read()
else:
open = False
while open:
ret, frame = video_test01.read()
if frame is None:
break
# if ret == True:
if ret:
gray = cv.cvtColor(frame, cv.COLOR_BGR2GRAY) # 转灰度图
cv.imshow("result", gray)
if cv.waitKey(10) & 0xFF == 27: # 27表示键盘中退出键Esc, 10表示功能运行速度
break
video_test01.release()
cv.destroyAllWindows()
2.ROI区域(兴趣区域)
src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_COLOR)
# b, g, r = cv.split(src)
# src = cv.merge(b, g, r) # 转回rgb图
cur_src = src.copy()
cur_src[:, :, 0] = 0 # 前两个":"表示取所有像素点
cur_src[:, :, 1] = 0 # BGR 分表用012代表,各通道置0
cv.imshow("R", cur_src)
cv.waitKey(0)
cv.destroyAllWindows()
cv.imwrite()
3.边界填充
src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_COLOR)
replicate = cv.copyMakeBorder(src, 50, 50, 50, 50, borderType=cv.BORDER_CONSTANT)
cv.imshow("R", replicate)
cv.waitKey(0)
cv.destroyAllWindows()
cv.imwrite()
# BORDER_REPLICATE:复制边缘像素
# BORDER_CONSTANT常量法,常数值填充,value=0,
# BORDER_REFLECT:反射法,fedcba|abcdef|fedcba
# BORDER_REFLECT_101:反射法:fedcba|bcdef|edcba
4.数值计算
# img_dog = cv.imread("dog.jpg")
# img_cat = cv.imread("cat.jpg")
# img_cat1 = img_cat + 10 # 所有值+10
# img_cat[:5, :, 0] # 打印前五行
# cv.add(img_cat, img_dog) # 像素点相加,大于255置255
# cv.resize(img_cat, (0, 0), fx=2, fy=1) # 重新设置大小
# cv.addWeighted(img_cat, 0.2, img_dog, 0.6) # 图像融合
ctrl+/取消注释
5.图像阈值
src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_GRAYSCALE)
ret, dst = cv.threshold(src, 127, 255, type=cv.THRESH_TOZERO)
cv.imshow("R", dst)
cv.waitKey(0)
cv.destroyAllWindows()
# src:输入图,单通道,灰度图
# dst:输出图、thresh:阈值,maxval:像素值超过阈值后所赋予的值
# type:二值化类型,加上INV就是其反转
# type=cv.THRESH_BINARY超过阈值部分取maxval,否则取0
# cv.THRESH_BINARY_INV超过阈值部分取0,否则取maxval
# THRESH_TOZERO大于阈值不变,否则取0
# THRESH_TRUNC:大于设为阈值,否则不变
# THRESH_MASK:不支持,未找到相关用法,尝试后全黑
# TOZERO:大于阈值不变,小于为0
6.图像平滑处理
# src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_GRAYSCALE)
src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_COLOR)
mean = cv.blur(src, (3, 3))
cv.imshow("mean", mean)
cv.waitKey(0)
cv.destroyAllWindows()
"""
1.均值滤波
取滤波器均值
cv.blur(src,(3,3))
2.方框滤波
加入归一化
cv.boxFilter(src,-1,(3,3),normalize=False)
-1表示通道数一致
False表示不归一化,大于255取255
3.高斯滤波
构造权重矩阵
cv.GaussianBlur(src,(3,3),1)
4.中值滤波
找到均值后作为当前值
medianBlur
展示所有
res =np.hstack((,,,))
print(res)
imshow(res)
"""
7.形态学
src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_GRAYSCALE)
# src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_COLOR)
kernel = np.ones((5, 5), np.uint8)
erosion = cv.erode(src, kernel, iterations=1)
cv.imshow("erosion", erosion)
cv.waitKey(0)
cv.destroyAllWindows()
"""
1.腐蚀
kernel =no.ones((5,5),np.uint8) # 核大小决定每次腐蚀面积的大小
erosion=cv.erode(src,kernel,iterations=2)#iterations迭代次数
2.膨胀
dilate=cv.dilate(src,kernel,iterations=2)#iterations迭代次数
3.开闭运算
开运算:先腐蚀后膨胀
闭运算:先膨胀后腐蚀
open = cv.morphologyEx(src,cv.MORPH_OPEN,kernel)
close = cv.morphologyEx(src,cv.MORPH_CLOSE,kernel)
"""
8.梯度计算
src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_GRAYSCALE)
# src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_COLOR)
kernel = np.ones((5, 5), np.uint8)
sobel_x = cv.Sobel(src, cv.CV_64F, 1, 0, ksize=3)
sobel_x = cv.convertScaleAbs(sobel_x) # 数值转换
cv.imshow("sobel_x", sobel_x)
cv.waitKey(0)
cv.destroyAllWindows()
"""
1.Sobel算子:[(-1 0 1)(-2 0 2)(-1 0 1)]
cv.Sobel(src,ddepth,dx,dy,ksize)
sobel_x=cv.Sobel(src,cv.CV_64F,1,0,ksize=3)
#计算dx,ddepth一般为-1,CV_64F可以表示负数的形式,然后取绝对值
sobel_x=cv.convertScaleAbs(sobel_x)#数值转换
#白到黑为正,黑到白为负,负数会被截断为0,需要取正
2.梯度计算方法
先计算dx,dy,再进行叠加(分开计算结果更好,为什么?)
sobelxy=cv.addWeighted(sobelx,0.5,sobely,0.5)
3.Scharr算子[(-3 0 3)(-10 0 10)(-3 0 3)]
对于sobel,对结果更敏感,头发线条的梯度信息也会捕捉到
4.laplacian[(0 1 0)(1 -4 1)(0 1 0)]
但同时对噪声点也敏感
"""
9.边缘检测
src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_GRAYSCALE)
# src = cv.imread("D:/ALL_LEARN/picture/cat.jpg", cv.IMREAD_COLOR)
src = src[200:500, 200:500]
v1 = cv.Canny(src, 80, 150) # 80,150双阈值检测的阈值minVal,越小获得的边界越多
v2 = cv.Canny(src, 50, 100)
res = np.hstack((v1, v2)) # vstack
# takes 1 positional argument but 2 were given (())
cv.imshow("res", res)
cv.waitKey(0)
cv.destroyAllWindows()
"""
Canny边缘检测
1.使用高斯滤波,去噪
2.计算每个像素点梯度和方向,sobel算子。
3.应用非极大值(Non-Maximum Suppression)抑制,消除杂散响应
极大值抑制:同一目标获得多个结果,取概率最大的结果
1.线性插值法:亚像素点梯度的值为临近两点的均值(有权重)
2.把一个像素的梯度离散为八个方向进行计算
4.双阈值检测边缘:进一步过滤,获得真实的边界
5.抑制鼓励弱边缘
"""