weixin_47924038

OpenCV计算机视觉实战 - Task6 - 答题卡识别判卷【项目实战】

项目要求

提供一张答题卡图像，通过图像处理识别出答题卡上每个题的选项，与正确答案对比，得出分数并写在答题卡上。

主要步骤：先进行仿射变换去除背景（只留试卷部分），二值化，圆形轮廓检测，遍历每一行选项，统计非零像素，记录填充选项（即非零像素最多的轮廓区域），与正确答案进行比对，正确则correct数+1，得到总成绩

1、预处理

1、灰度图
2、滤波去噪
3、边缘检测Canny
4、轮廓检测

# 预处理
image = cv2.imread("./images/test_01.png")
contours_img = image.copy()
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blurred = cv2.GaussianBlur(gray, (5, 5), 0)#高斯滤波
cv_show('blurred',blurred)
edged = cv2.Canny(blurred, 75, 200)#边缘检测
cv_show('edged',edged)

# 轮廓检测:cnt保存的就是轮廓的坐标
cnts = cv2.findContours(edged.copy(), cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)[0]
cv2.drawContours(contours_img,cnts,-1,(0,0,255),3)
cv_show('contours_img',contours_img)

灰度图

边缘检测

轮廓检测

2、透视变换

透视变换的原理参考OCR文本扫描轮廓检测透视变换-唐宇迪笔记

# 确保检测到了
if len(cnts) > 0:
	# 根据轮廓面积大小进行排序
	cnts = sorted(cnts, key=cv2.contourArea, reverse=True)

	# 遍历每一个轮廓
	for c in cnts:
		# 近似
		peri = cv2.arcLength(c, True)
		approx = cv2.approxPolyDP(c, 0.02 * peri, True)

		# 准备做透视变换：如果顶点有4个，那么就是这个轮廓
		if len(approx) == 4:#通过四个点来做变换
			docCnt = approx
			break

# 执行透视变换

warped = four_point_transform(gray, docCnt.reshape(4, 2))
cv_show('warped',warped)


def order_points(pts):
	'''# 一共4个坐标点，其实这个函数就是将四个点按照左上，右上，右下，左下的位置排列'''
	rect = np.zeros((4, 2), dtype = "float32")

	# 按顺序找到对应坐标0123分别是 左上，右上，右下，左下
	# 计算左上，右下
	s = pts.sum(axis = 1)#所谓的pts.sum(axis=1)就是将pts这个4 * 2的矩阵的每行相加，得到四个值
	rect[0] = pts[np.argmin(s)]#给出水平方向最小值的下标,rect[0]实际上就是pts的第一个点=（131，206）
	rect[2] = pts[np.argmax(s)]#给出水平方向最大值的下标rect[2]=（448，614）

	# 计算右上和左下
	diff = np.diff(pts, axis = 1)#其实s和diff没有什么意义。就是为了下面的函数形使用
	rect[1] = pts[np.argmin(diff)]
	rect[3] = pts[np.argmax(diff)]

	return rect

def four_point_transform(image, pts):
	# 获取输入坐标点
	rect = order_points(pts)#现在rect将4个点都按照左上，右上，右下，左下的位置排列
	(tl, tr, br, bl) = rect
	'''
	根据几个关系利用公式 s = ((x2-x1)^2 + (y2-y1))2)1/2 
	因为四个点确定的近似轮廓不一定是矩形，所以分别取长和宽最大长度，
	'''
	#根据几个关系利用公式 s = ((x2-x1)^2 + (y2-y1))2)1/2
	# 因为四个点确定的近似轮廓不一定是矩形，所以分别取长和宽最大长度，
	# 计算输入的w和h值，其实就是计算4个边的长和宽的最大值
	widthA = np.sqrt(((br[0] - bl[0]) ** 2) + ((br[1] - bl[1]) ** 2))
	widthB = np.sqrt(((tr[0] - tl[0]) ** 2) + ((tr[1] - tl[1]) ** 2))
	maxWidth = max(int(widthA), int(widthB))

	heightA = np.sqrt(((tr[0] - br[0]) ** 2) + ((tr[1] - br[1]) ** 2))
	heightB = np.sqrt(((tl[0] - bl[0]) ** 2) + ((tl[1] - bl[1]) ** 2))
	maxHeight = max(int(heightA), int(heightB))

	# 变换后对应坐标位置：就是确定好变换后的坐标是一个矩形，下面只需要计算矩阵M即可
	dst = np.array([
		[0, 0],
		[maxWidth - 1, 0],
		[maxWidth - 1, maxHeight - 1],
		[0, maxHeight - 1]], dtype = "float32")

	# 计算变换矩阵
	M = cv2.getPerspectiveTransform(rect, dst)
	warped = cv2.warpPerspective(image, M, (maxWidth, maxHeight))

	# 返回变换后结果
	return warped

透视变换主要步骤：

根据轮廓大小排序，遍历每一个轮廓，找到有四个顶点的轮廓。
然后在order_points(pts)函数中，将四个顶点按照左上，右上，右下，左下的顺序排序。
在four_point_transform(image, pts)函数中，根据四个坐标点计算出最大的长和宽，确定坐标变换之后的位置。
根据四个坐标位置和变换之后的位置通过cv2.getPerspectiveTransform函数计算出变换矩阵M，最后通过cv2.warpPerspective得到了变换后的结果

3、阈值处理+轮廓检测

阈值处理
THRESH_OTSU会自动寻找合适的阈值，适合双峰，需把阈值参数设置为0
在信用卡数字识别案例中出现也有应用(第三、五部分)
然后怎么区分涂和没涂的圆？
这里不用霍夫变换,因为有些涂完后会突出边界，如下

# 又进行了阈值处理：这里写0是因为cv2.THRESH_OTSU自适应选择阈值
thresh = cv2.threshold(warped, 0, 255,cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1]
cv_show('thresh',thresh)
thresh_Contours = thresh.copy()
# 找到每一个圆圈轮廓
cnts = cv2.findContours(thresh.copy(), cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)[0]
cv2.drawContours(thresh_Contours,cnts,-1,(0,0,255),3)
cv_show('thresh_Contours',thresh_Contours)
questionCnts = []

4、筛选答题圈

遍历所有圆圈轮廓(包括干扰项) 筛选出答题区域的圆,其轮廓存于questionCnts
无论是圆形还是矩形的答题卡,都是规则的形状,比例相同.
所以这里要人工设定圆圈外接矩形的长宽比例
然后按照从上到下(从左到右)进行排序

# 遍历
for c in cnts:
	'''主要是为了排除非选项的背景干扰'''
	# 计算比例和大小
	(x, y, w, h) = cv2.boundingRect(c)#对每个圆做外接矩形，然后将矩形的四个顶点坐标取出来
	ar = w / float(h)#计算长和宽的比值，以此来判断是否是想要的轮廓

	# 根据实际情况指定标准：满足则认为是其中的选项，
	if w >= 20 and h >= 20 and ar >= 0.9 and ar <= 1.1:
		questionCnts.append(c)

# 按照从上到下进行排序：按照第一题有5个圆，这五个圆的x是不同的，但是y是相同的，所以可以根据这个进行排序
questionCnts = sort_contours(questionCnts,method="top-to-bottom")[0]
correct = 0

def sort_contours(cnts, method="left-to-right"):
    reverse = False
    i = 0
    if method == "right-to-left" or method == "bottom-to-top":
        reverse = True
    if method == "top-to-bottom" or method == "bottom-to-top":
        i = 1

    boundingBoxes = [cv2.boundingRect(c) for c in cnts]
	#cv2.boundingRect(cnt)这个函数这个函数很简单，cnt是一个轮廓点集合，也就是它的参数，返回四个值，分别是x，y，w，h；
    (cnts, boundingBoxes) = zip(*sorted(zip(cnts, boundingBoxes),key=lambda b: b[1][i], reverse=reverse))
	#i=1意思就是第一题的五个
    return cnts, boundingBoxes

5、每行的5个选项分别比对正确答案

第一个循环
答题圈的轮廓questionCnts长度应为25（25个轮廓）, 间隔5, 可以遍历5次, 则q 取0 1 2 3 4,共5行;
i 表示从第几个轮廓开始:0,5,10,15,20. 即每行的第一个轮廓
第二个循环中
1、 j 取每个选项0 1 2 3 4
2、使用mask来判断结果：#mask就是和投射变换之后图像同样大小的纯黑的掩码，初始化一个跟透视变换后的图一样大小的mask(全黑)。然后在mask上, 画出当前遍历的这个(圆圈)轮廓c, 画成白色
3、与操作：用原图的copy 跟得到的黑白图片进行与操作,将轮廓保留了下来
cv2.bitwise_and(src1, src2, dst=None, mask=None)
对图像(灰度图像或彩色图像均可)每个像素值进行二进制“与”操作,
1&1=1，1&0=0，0&1=0，0&0=0
4、通过计算非零点数量（cv2.countNonZero）来算是否选择这个答案：因为真正的答案被涂黑了
5、依次判断5个选项的哪个非零值最大(即哪个被填充上了)， total > bubbled[0] 比它大的才保留到bubbled
bubbled 保留最大的选项( 即填充上的选项 ) j

# 每排有5个选项
for (q, i) in enumerate(np.arange(0, len(questionCnts), 5)):
	# 排序
	cnts = sort_contours(questionCnts[i:i + 5])[0]
	bubbled = None

	# 遍历每一个结果
	for (j, c) in enumerate(cnts):#j表示的就是，某题的第j+1个选项
		# 使用mask来判断结果
		mask = np.zeros(thresh.shape, dtype="uint8")
		#mask就是和投射变换之后图像同样大小的纯黑的掩码
		# c表示第一题的第一个轮廓，此时mask就是第一题的A选项为纯白
		cv2.drawContours(mask, [c], -1, 255, -1) #-1表示填充
		cv_show('mask',mask)

		# 通过计算非零点数量来算是否选择这个答案：因为真正的答案被涂黑了
		mask = cv2.bitwise_and(thresh, thresh, mask=mask)
		total = cv2.countNonZero(mask)

		# 通过阈值判断
		if bubbled is None or total > bubbled[0]:
			bubbled = (total, j)

	# 对比正确答案
	color = (0, 0, 255)
	k = ANSWER_KEY[q]#q表示第几题，在第一层for循环中

	# 判断正确：说明找到了答案
	if k == bubbled[1]:
		color = (0, 255, 0)
		correct += 1

	# 绘图
	cv2.drawContours(warped, [cnts[k]], -1, color, 3)

6、正确答案的判断

k = ANSWER_KEY[q] 是第几题(行)的正确答案
若k = bubbled[1]，判断正确，correct+=1

7、打印正确率

# 10.打印正确率
score = (correct / 5.0) * 100
print("[INFO] score: {:.2f}%".format(score))
cv2.putText(warped, "{:.2f}%".format(score), (10, 30),
	cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 255, 0), 2)
cv2.imshow("Original", image)
cv2.imshow("Exam", warped)
cv2.waitKey(0)

结束语：这个项目不是很难，其实就是将过去学的知识综合起来

完整代码

#导入工具包
import numpy as np
import argparse
import imutils
import cv2


# 正确答案
ANSWER_KEY = {0: 1, 1: 4, 2: 0, 3: 3, 4: 1}

def order_points(pts):
	'''# 一共4个坐标点，其实这个函数就是将四个点按照左上，右上，右下，左下的位置排列'''
	rect = np.zeros((4, 2), dtype = "float32")

	# 按顺序找到对应坐标0123分别是 左上，右上，右下，左下
	# 计算左上，右下
	s = pts.sum(axis = 1)#所谓的pts.sum(axis=1)就是将pts这个4 * 2的矩阵的每行相加，得到四个值
	rect[0] = pts[np.argmin(s)]#给出水平方向最小值的下标,rect[0]实际上就是pts的第一个点=（131，206）
	rect[2] = pts[np.argmax(s)]#给出水平方向最大值的下标rect[2]=（448，614）

	# 计算右上和左下
	diff = np.diff(pts, axis = 1)#其实s和diff没有什么意义。就是为了下面的函数形使用
	rect[1] = pts[np.argmin(diff)]
	rect[3] = pts[np.argmax(diff)]

	return rect

def four_point_transform(image, pts):
	# 获取输入坐标点
	rect = order_points(pts)#现在rect将4个点都按照左上，右上，右下，左下的位置排列
	(tl, tr, br, bl) = rect
	'''
	根据几个关系利用公式 s = ((x2-x1)^2 + (y2-y1))2)1/2 
	因为四个点确定的近似轮廓不一定是矩形，所以分别取长和宽最大长度，
	'''
	#根据几个关系利用公式 s = ((x2-x1)^2 + (y2-y1))2)1/2
	# 因为四个点确定的近似轮廓不一定是矩形，所以分别取长和宽最大长度，
	# 计算输入的w和h值，其实就是计算4个边的长和宽的最大值
	widthA = np.sqrt(((br[0] - bl[0]) ** 2) + ((br[1] - bl[1]) ** 2))
	widthB = np.sqrt(((tr[0] - tl[0]) ** 2) + ((tr[1] - tl[1]) ** 2))
	maxWidth = max(int(widthA), int(widthB))

	heightA = np.sqrt(((tr[0] - br[0]) ** 2) + ((tr[1] - br[1]) ** 2))
	heightB = np.sqrt(((tl[0] - bl[0]) ** 2) + ((tl[1] - bl[1]) ** 2))
	maxHeight = max(int(heightA), int(heightB))

	# 变换后对应坐标位置：就是确定好变换后的坐标是一个矩形，下面只需要计算矩阵M即可
	dst = np.array([
		[0, 0],
		[maxWidth - 1, 0],
		[maxWidth - 1, maxHeight - 1],
		[0, maxHeight - 1]], dtype = "float32")

	# 计算变换矩阵
	M = cv2.getPerspectiveTransform(rect, dst)
	warped = cv2.warpPerspective(image, M, (maxWidth, maxHeight))

	# 返回变换后结果
	return warped
def sort_contours(cnts, method="left-to-right"):
    reverse = False
    i = 0
    if method == "right-to-left" or method == "bottom-to-top":
        reverse = True
    if method == "top-to-bottom" or method == "bottom-to-top":
        i = 1

    boundingBoxes = [cv2.boundingRect(c) for c in cnts]
	#cv2.boundingRect(cnt)这个函数这个函数很简单，cnt是一个轮廓点集合，也就是它的参数，返回四个值，分别是x，y，w，h；
    (cnts, boundingBoxes) = zip(*sorted(zip(cnts, boundingBoxes),key=lambda b: b[1][i], reverse=reverse))
	#i=1意思就是第一题的五个
    return cnts, boundingBoxes
def cv_show(name,img):
        cv2.imshow(name, img)
        cv2.waitKey(0)
        cv2.destroyAllWindows()

# 预处理
image = cv2.imread("./images/test_01.png")
contours_img = image.copy()
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blurred = cv2.GaussianBlur(gray, (5, 5), 0)#高斯滤波
cv_show('blurred',blurred)
edged = cv2.Canny(blurred, 75, 200)#边缘检测
cv_show('edged',edged)

# 轮廓检测:cnt保存的就是轮廓的坐标
cnts = cv2.findContours(edged.copy(), cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)[0]
cv2.drawContours(contours_img,cnts,-1,(0,0,255),3)
cv_show('contours_img',contours_img)
docCnt = None

# 确保检测到了
if len(cnts) > 0:
	# 根据轮廓面积大小进行排序
	cnts = sorted(cnts, key=cv2.contourArea, reverse=True)

	# 遍历每一个轮廓
	for c in cnts:
		# 近似
		peri = cv2.arcLength(c, True)
		approx = cv2.approxPolyDP(c, 0.02 * peri, True)

		# 准备做透视变换：如果顶点有4个，那么就是这个轮廓
		if len(approx) == 4:#通过四个点来做变换
			docCnt = approx
			break

# 执行透视变换

warped = four_point_transform(gray, docCnt.reshape(4, 2))
cv_show('warped',warped)
# 又进行了阈值处理：这里写0是因为cv2.THRESH_OTSU自适应选择阈值
thresh = cv2.threshold(warped, 0, 255,cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1]
cv_show('thresh',thresh)
thresh_Contours = thresh.copy()
# 找到每一个圆圈轮廓
cnts = cv2.findContours(thresh.copy(), cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)[0]
cv2.drawContours(thresh_Contours,cnts,-1,(0,0,255),3)
cv_show('thresh_Contours',thresh_Contours)
questionCnts = []

# 遍历
for c in cnts:
	'''主要是为了排除非选项的背景干扰'''
	# 计算比例和大小
	(x, y, w, h) = cv2.boundingRect(c)#对每个圆做外接矩形，然后将矩形的四个顶点坐标取出来
	ar = w / float(h)#计算长和宽的比值

	# 根据实际情况指定标准：满足则认为是其中的选项，
	if w >= 20 and h >= 20 and ar >= 0.9 and ar <= 1.1:
		questionCnts.append(c)

# 按照从上到下进行排序：按照第一题有5个圆，这五个圆的x是不同的，但是y是相同的，所以可以根据这个进行排序
questionCnts = sort_contours(questionCnts,method="top-to-bottom")[0]
correct = 0

# 每排有5个选项
for (q, i) in enumerate(np.arange(0, len(questionCnts), 5)):
	# 排序
	cnts = sort_contours(questionCnts[i:i + 5])[0]
	bubbled = None

	# 遍历每一个结果
	for (j, c) in enumerate(cnts):#j表示的就是，某题的第j+1个选项
		# 使用mask来判断结果
		mask = np.zeros(thresh.shape, dtype="uint8")
		#mask就是和投射变换之后图像同样大小的纯黑的掩码
		# c表示第一题的第一个轮廓，此时mask就是第一题的A选项为纯白
		cv2.drawContours(mask, [c], -1, 255, -1) #-1表示填充
		cv_show('mask',mask)

		# 通过计算非零点数量来算是否选择这个答案：因为真正的答案被涂黑了
		mask = cv2.bitwise_and(thresh, thresh, mask=mask)
		total = cv2.countNonZero(mask)

		# 通过阈值判断
		if bubbled is None or total > bubbled[0]:
			bubbled = (total, j)

	# 对比正确答案
	color = (0, 0, 255)
	k = ANSWER_KEY[q]#q表示第几题，在第一层for循环中

	# 判断正确：说明找到了答案
	if k == bubbled[1]:
		color = (0, 255, 0)
		correct += 1

	# 绘图
	cv2.drawContours(warped, [cnts[k]], -1, color, 3)


score = (correct / 5.0) * 100
print("[INFO] score: {:.2f}%".format(score))
cv2.putText(warped, "{:.2f}%".format(score), (10, 30),
	cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 0, 255), 2)
cv2.imshow("Original", image)
cv2.imshow("Exam", warped)
cv2.waitKey(0)

OpenCV学习(二十一) ：计算图像连通分量:connectedComponents(),connectedComponentsWithStats() Leon_Chen0 OpenCV
OpenCV学习(二十一)：计算图像连通分量:connectedComponents(),connectedComponentsWithStats()1、connectedComponents()函数ConnectedComponents即连通体算法用id标注图中每个连通体，将连通体中序号最小的顶点的id作为连通体的id。如果在图G中，任意2个顶点之间都存在路径，那么称G为连通图，否则称该图为非连
Python opencv学习-19 背景减除算法一头秀发的假程序猿 Python OpenCV 图像学习 opencv 计算机视觉
文章转载自https://blog.csdn.net/tengfei461807914/article/details/81588808目标：这一节要了解背景减除算法在opencv中的应用。基础：背景减除算法是很多以机器视觉为基础的应用中，非常重要的预处理算法。例如，使用固定的摄像头来统计一个房间的进出人数或者交通摄像头提取关于交通工具的信息等等。在所有这些例子当中，你首先要做的就是把人和交通工具
OpenMV和K210(fron ChatGPT) overwizard 个人图像处理计算机视觉学习自动化机器人
文章目录OpenMV特点：学习资源：K210(KendryteK210)特点：学习资源：选择建议1.OpenCV简介安装OpenCV2.树莓派(RaspberryPi)与OpenCV安装OpenCV学习资源3.香橙派(OrangePi)与OpenCV安装OpenCV学习资源综合学习资源OpenMV和K210是两个流行的嵌入式视觉平台，各自有其独特的特点和应用场景。以下是对这两个平台的介绍及其学习资
深度学习目标检测中的_单目测距原理与实现关键点及改进建议 QQ_767172261 单目测距深度学习目标检测人工智能
深度学习目标检测中的_单目测距原理与实现关键点及改进建议文章目录单目测距的进一步解释1.焦距的确定2.物体宽度$W$的获取3.图像处理技巧4.提高性能的建议5.实现代码中的注释添加一、前言单目视觉测距：网上有很多关于单目测距的文章，主要借鉴的是OpenCV学习笔记（二十一）——简单的单目视觉测距尝试和单目摄像机测距（python+opencv）两篇文章，在这里特别作出说明。工作环境：Ubunt
opencv学习：图像旋转的两种方法，旋转后的图片进行模板匹配代码实现夜清寒风学习 opencv 机器学习人工智能计算机视觉
图像旋转在图像处理中，rotate和rot90是两种常见的图像旋转方法，它们在功能和使用上有一些区别。下面我将分别介绍这两种方法，并解释它们的主要区别rot90方法rot90方法是NumPy提供的一种数组旋转函数，它主要用于对二维数组（如图像）进行90度的旋转。这个方法比较简单，只支持90度的倍数旋转，不支持任意角度旋转。使用NumPy进行旋转使用NumPy的rot90函数对模板图像进行旋转操作。
opencv 学习 1 木木ainiks opencv 计算机视觉 python
opencv学习的第一天#coding:utf-8importcv2ascv#首先读图片src=cv.imread(“img/1.jpg”)#设置图片的名字cv.namedWindow(“1”,cv.WINDOW_AUTOSIZE)#显示图片第一个参数设置图片名，第二个参数图片的地址cv.imshow(“1”,src)cv.waitKey(0)#将图片写入固定位置cv.imwrite(“img/2
opencv学习：形态学操作和边缘检测算子夜清寒风 opencv 学习人工智能算法计算机视觉
cv2.morphologyEx()是OpenCV库中的一个函数，用于执行更复杂的形态学操作。这个函数可以执行开运算、闭运算、梯度运算、膨胀、腐蚀以及顶帽和黑帽转换等。这些操作通常用于图像预处理，如去除噪声、平滑边界、突出特征等。dst=cv2.morphologyEx(src,op,kernel[,dst[,anchor[,iterations[,borderType[,borderValue]
零基础Opencv学习（二）随风逐流wrx opencv 学习人工智能
图像变换一、边缘检测1：边缘检测Cannycv::MatiamgeCan;cv::Canny(image,iamgeCan,3,9,3);cv::imshow("Canny",iamgeCan);///边缘检测高级用法Canny用法cv::Matdst,edge,gray;dst.create(image.size(),image.type());///图像转灰度图像cv::cvtColor(im
opencv学习笔记19-opencv焊点（原点）计数 The_xz opencv 学习笔记
一、原理：opencv学习笔记13-opencv连通组件标记实现硬币计数二、不同情况思路：当焊点为背景时，进行反色处理（二值化后若焊点为背景，转化为前景）。三、示例代码：#include#include#include#include#include#includeusingnamespacecv;usingnamespacestd;intmain(){utils::logging::setLog
opencv学习（十一）之绘图函数梧桐栖鸦 OpenCV基础 opencv2/3基础教程 opencv直线 circle ellipse fillpoly opencv绘图函数
opencv中提供了很多绘图函数，在进行图像处理，对感兴趣区域进行标定时，就需要利用这些绘图函数。现在集中做一个归纳介绍。1.PointPoint常用来指定一幅二维图像中的点。如Pointpt;pt.x=10;pt.y=8;或Pointpt=Point(10,8);其指向的是在图像中(10,8)位置的一个像素点。查找Point引用可以在”core.hpp”文件发现如下语句：typedefPoint
OpenCV学习路线图 superdont 计算机视觉 opencv 学习人工智能
下面是针对初学者设计的一个学习路线图：第1周：计算机视觉和OpenCV概述介绍计算机视觉及其应用领域讨论OpenCV的历史、特点和工作原理OpenCV的安装和配置（Windows/Linux/macOS）了解OpenCV的基本数据结构（cv::Mat等）第2周：OpenCV基础图像的基本操作（读取、显示、保存图片）图像的属性（色彩空间、像素访问与修改）图像的几何变换（缩放、旋转、剪切）第3周：图像
【Opencv学习】04-图像加法 R三哥哥啊 opencv opencv 学习人工智能
文章目录前言一、图像加法混合1.1代码1.2运行结果二、图像的按位运算-组合相加2.1代码2.2运行结果示例：PPT平滑切换运行结果总结前言简单说就是介绍了两张图如何组合在一起。1、混合，透明度和颜色会发生改变2、组合，叠加起来。可以改变大小。3、两张图片如何平滑切换4、学会如何裁剪图片5、明白掩码操作6、如何将图片置于左侧右侧一、图像加法混合OpenCV中的加法与Numpy的加法是有所不同的。O
OpenCV学习笔记：如何扫描图像、利用查找表和计时 weixin_33772645 人工智能 c/c++测试
目的我们将探索以下问题的答案：如何遍历图像中的每一个像素？OpenCV的矩阵值是如何存储的？如何测试我们所实现算法的性能？查找表是什么？为什么要用它？测试用例这里我们测试的，是一种简单的颜色缩减方法。如果矩阵元素存储的是单通道像素，使用C或C++的无符号字符类型，那么像素可有256个不同值。但若是三通道图像，这种存储格式的颜色数就太多了（确切地说，有一千六百多万种）。用如此之多的颜色可能会对我们的
OpenCV学习记录——形态学处理 KAIs32 树莓派——OpenCV opencv 学习人工智能计算机视觉嵌入式硬件
文章目录前言一、腐蚀和膨胀二、高级形态学运算三、具体应用代码前言形态学是图像处理中最常用的技术之一，它主要用于从图像中提取有意义的形状信息，例如边界和连通区域，以便后续的识别工作能够捕捉到目标对象最重要的形状特征。此外，细化、像素化和修剪毛刺等技术也常用于图像的预处理和后处理，以增强图像质量。形态学转换主要有腐蚀和膨胀、开运算和闭运算、顶帽和底帽一、腐蚀和膨胀腐蚀和膨胀是两种最基本、最重要的形态学
opencv学习记录——（15）模板匹配蜡笔小新qqq opencv 学习计算机视觉
一、单模板匹配#include"opencv2/opencv.hpp"#includeusingnamespacestd;usingnamespacecv;voidmain(){///单模板匹配Mattemp=imread("temp.png");//模板图像Matsrc=imread("src.png");//待搜索图像即原图imshow("temp",temp);imshow("src",sr
Opencv学习笔记——特征匹配纸箱里的猫咪 Opencv学习笔记 opencv 计算机视觉学习
文章目录Brute-Force蛮力匹配1对1的匹配k对最佳匹配随机抽样一致算法（Randomsampleconsensus，RANSAC）单应性矩阵Brute-Force蛮力匹配通过SIFT算法可以得到图像关键点，通过比较两张图像的关键点，也就是比较关键点向量之间的差异，Brute-Force蛮力匹配通过比较特征向量，离得最近的特征向量也就是最相似的。默认的是用归一化的欧氏距离。bf=cv2.
OpenCV学习记录——特征匹配 KAIs32 树莓派——OpenCV opencv 学习人工智能嵌入式硬件计算机视觉
文章目录前言一、暴力匹配步骤分析二、代码分析前言特征匹配是一种图像处理技术，用于在不同图像之间寻找相似的特征点，并将它们进行匹配。特征匹配在计算机视觉和图像处理领域中具有广泛的应用，包括目标识别、图像拼接、三维重建等。一、暴力匹配步骤分析暴力匹配是一种简单直接的匹配方法，它遍历所有特征点的描述符，并计算它们之间的距离。然后根据距离进行排序，选择距离最短的特征点作为匹配点。虽然暴力匹配方法简单，但在
OpenCV学习记录——轮廓检测 KAIs32 树莓派——OpenCV opencv 学习人工智能计算机视觉嵌入式硬件
文章目录前言一、寻找、绘制轮廓二、具体应用代码前言寻找目标图像的轮廓并绘制出该轮廓是我们进行图像识别时常用的手段，轮廓是图像中连续的边界线，可以用于物体检测、形状分析等应用。为了获取更高的准确性，会先进行二值化处理，在得到二进制图像后，寻找轮廓就是从黑色背景中找到白色物体，因此我们要找的对象应是白色，背景应该是黑色。一、寻找、绘制轮廓（一）寻找图像轮廓寻找图像轮廓函数如下：contours,hie
OpenCV学习笔记（Python）—— 批量提取图像轮廓并保存结果到保持原始结构的输出目录六个核桃Lu OpenCV学习 opencv 人工智能 python 图像处理计算机视觉
批量处理图像，对每个图像提取轮廓内的区域并将轮廓外的区域设置为白色背景，然后保存处理后的图像到指定的输出目录，同时保持与输入目录相同的文件和目录结构。importcv2importnumpyasnpimportosfromtqdmimporttqdmdefprocess_image(input_path,output_path):#读取图像img=cv2.imread(input_path)ifi
OpenCV学习记录——图像的绘制 KAIs32 树莓派——OpenCV opencv 学习人工智能嵌入式硬件计算机视觉
文章目录前言一、绘制直线二、绘制矩形三、绘制圆形四、绘制文本前言我们在进行图像处理的过程中，通常需要进行划线、画矩形框锁定目标等操作来凸显指定目标，OpenCV提供了方便的绘图功能，可以进行直线、矩形、圆、文本文字等内容的绘制，这篇文章将记录OpenCV中图像的绘制相关内容。一、绘制直线绘制直线的函数如下：cv2.line(image,pt1,pt2,color,thickness)其中，五个参数
OpenCV学习记录——阈值处理（全局阈值处理、自适应阈值处理） KAIs32 树莓派——OpenCV opencv 学习人工智能计算机视觉嵌入式硬件
文章目录一、学习目的二、图像二值化三、全局阈值处理四、自适应阈值处理一、学习目的在进行图像处理时，我们通常要进行颜色识别等一系列需要进行图像阈值处理的操作，今天我们就记录一下opencv进行阈值处理的一些基本操作和代码二、图像二值化我们首先要明白一个概念，图像二值化就是将图像上的像素点的灰度值设置为两个值，一般为0（表示黑色）和255（表示白色），可以将整个图像呈现出明显的黑白效果。最常用的方法就
OpenCV学习记录——平滑处理 KAIs32 树莓派——OpenCV opencv 学习人工智能嵌入式硬件计算机视觉
文章目录前言一、图像噪声二、图像平滑处理三、完整应用代码前言当我们用树莓派进行opencv图像处理时，摄像头所获取的图像质量通常会有所下降，此时，需要多种手段来优化图像的质量，提高图像识别的准度。今天所记录的是当图片经过传输等过程后出现的图像噪声现象及对应解决方法——平滑一、图像噪声在数字图像的采集、处理和传输过程中，可能会受到各种噪声的干扰，这会导致图像质量下降、图像变得模糊，甚至使图像的特征难
OpenCV学习记录——边缘检测 KAIs32 树莓派——OpenCV opencv 学习人工智能嵌入式硬件计算机视觉
文章目录前言一、边缘检测原理二、Canny边缘检测算法三、具体应用代码前言在做某些图像处理时，通常需要将识别到的物体边界提取出来，从而帮助我们实现目标检测，这就需要用到边缘检测，例如人脸识别和运动目标的检测都需要先进行边缘检测，这篇文章就记录一下边缘检测的原理及应用代码。一、边缘检测原理边缘检测是图像处理和计算机视觉中的基本问题，其目的在于标识数字图像中亮度变化明显的点，图像边缘检测大幅度地减少了
opencv学习机器学习小猴啊0.0 opencv 学习机器学习
Kmeansdoublecv::kmeans(InputArraydataintkInputOutputArraybestLabels//输出的所有样本的标签数组TermCriteriacriteriaintattempts//采样不同初始化标签的尝试次数intflag//中心点初始化方法，支持KMEANS_RANDOM_CENTERS//KMEANS_PP_CENTERS//KMEANS_USE
opencv学习二值分析小猴啊0.0 opencv 学习人工智能
内容来源于《opencv4应用开发入门、进阶与工程化实践》二值分析：常见的二值化方法：基于全局阈值（threshold）得到的二值图像；基于自适应阈值（adaptiveThreshold）得到的二值图像；边缘检测（Canny）基于像素值范围（inRange）thresholdthresholdType介绍:THRESH_BINARY表示大于thresh的取maxval,否则取0;THRESH_BI
【Opencv学习】03-读取图片信息 R三哥哥啊 opencv opencv 学习人工智能
前言几乎所有这些操作与Numpy的关系都比与OpenCV的关系更加紧密，因此熟练Numpy可以帮助我们写出性能更好的代码。Numpy是经过优化了的进行快速矩阵运算的软件包。所以我们不推荐逐个获取像素值并修改，这样会很慢，能有矩阵运算就不要用循环。读取像素点在计算机视觉和图像处理中，图像是由像素点组成的。每个像素点包含了颜色（在彩色图像中）和亮度（在灰度图像中）的信息。通过读取和操作这些像素点，我们
【Opencv学习】01-对图像进行简单的操作 R三哥哥啊 opencv 学习 python
首先了解一下什么是init.pyi文件文件init.pyi文件是Python中的类型提示文件，用于提供对特定包或模块的类型信息。它是类型提示的一种形式，用于描述包、模块、类、函数和变量的静态类型。在Python中，类型提示的目的是为了提供代码编辑器和静态类型检查工具更好的代码补全、类型检查和类型推断功能。init.pyi文件被放置在包或模块的目录中，并且可以包含该包或模块定义的类、函数、方法和变量
【Python_Opencv图像处理框架】信用卡数字识别项目畅游星辰大海 #Python_Opencv opencv python 图像处理
写在前面本篇文章是opencv学习的第六篇文章，前面主要讲解了对图像的一些基本操作，这篇文章我们就开始大展身手，将前面所学的基础操作活学活用。既能复习基础操作，又能学到一些新的知识。作为初学者，我尽己所能，但仍会存在疏漏的地方，希望各位看官不吝指正写在中间（1）简单介绍我们通过opencv提供的一些函数，来实现基础操作，看完本篇文章，你就能轻松地将这信用卡上的数字识别出来该技术首先通过图像处理技术
opencv学习特征提取小猴啊0.0 opencv 学习人工智能
内容来源于《opencv4应用开发入门、进阶与工程化实践》图像金字塔略拉普拉斯金字塔对输入图像进行reduce操作会生成不同分辨率的图像，对这些图像进行expand操作，然后使用reduce减去expand之后的结果，就会得到拉普拉斯金字塔图像。详情可查看https://zhuanlan.zhihu.com/p/80362140图像金字塔融合拉普拉斯金字塔通过源图像减去先缩小再放大的图像构成，保留
opencv学习形态学分析小猴啊0.0 opencv 学习人工智能
内容来源于《opencv4应用开发入门、进阶与工程化实践》膨胀操作与腐蚀操作膨胀操作一定程度上会把相邻的对象连接起来成为一个对象；腐蚀操作会让对象面积变小或者擦除小的对象。//膨胀操作voidcv::dilate(InputArraysrcOutputArraydstInputArraykernelPointanchor=Point(-1,-1)intiterations=1intborderTy
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，