Asionm

计算机视觉实验：图像处理综合-路沿检测

实验步骤与过程

1. 路沿检测方法设计

2. 路沿检测方法实现

2.1 视频图像提取

2.2 图像预处理

2.3 兴趣区域提取

2.4 边缘检测

2.5 Hough变换

2.6 线条过滤与图像输出

3. 路沿检测结果展示

4. 其他路沿检测方法

实验结论或体会

实验内容：针对给定的视频，利用图像处理基本方法实现道路路沿的检测；

提示：可利用Hough变换进行线检测，融合路沿的结构信息实现路沿边界定位（图中红色的点位置）。

实验步骤与过程

1. 路沿检测方法设计

图1 路沿检测方法思路图

对于路沿检测，整体思路如上所示。首先利用opencv提取出视频中的每一帧，然后对每一帧图像进行预处理。此处的预处理包含了灰度变换、图像二值化、均值滤波、再次二值化等，其目的主要在于将图像处理成路沿较容易被识别出来的状态。对图像进行预处理后需要进行兴趣区域提取。此处的兴趣区域提取，我首先根据图像的几何信息规定了一个大概的范围，然后再通过Hough变换找出路基与路标线的区域最后将此区域作为最后的兴趣区域。最后再进行常规的边缘检测与hough变换，并对结果进行过滤即可较好地检测出路沿。

2. 路沿检测方法实现

下面将根据上面的路沿检测方法的设计进行具体的实现。

2.1 视频图像提取

由视频属性说明

由于视频是由一帧一帧的图像所组成的，所以对一个视频做路沿检测相当于对每一帧图像都做路沿检测。一般每秒中视频有24、25、30、60帧图像，帧数越多视频越顺滑但是处理的数据量也越大。在本次实验提供的视频中，根据属性查看可知其帧数为24帧/s，其属性如下图图2所示。

图2 视频属性

opencv帧数提取

在opencv中提供了一个模块用于提取视频中的每一帧，这个模块叫做Videocapture，其拥有一个必要参数——视频的地址。在建立videocapture对象后，调用其read函数其即可以以迭代器的方式返回每一帧图像。下面为videocapture的一个使用案例。

import cv2
# 打开视频文件
cap = cv2.VideoCapture('./实验2实验数据/01.avi')
# 逐帧读取视频
while True:
ret, frame = cap.read()
if not ret:
break
# 处理当前帧
cv2.imshow('Frame', frame)
cv2.waitKey(1)
# 释放资源
cap.release()
cv2.destroyAllWindows()

2.2 图像预处理

灰度变换

所提供的视频均为拥有RGB三通道的彩色视频，而在检测边缘中或许只需要一个通道即灰度图即可。当通道变多时颜色信息或许作用并不大，而且可能会影响边缘的判别。同时将图像变成灰度图还可以加快处理速度，节省计算资源。因此此处将图像转变成灰度图[1]。此处可以使用下面公式进行灰度变换：

Gray = R*0.299 + G*0.587 + B*0.114

同时也可利用opencv自带的函数进行变换，其原理一致，案例代码如下。

gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

变换前后结果如下面两图所示，可以看到去除颜色后更容易分辨道路的边界而去除周围无用信息的影响。

图3 灰度变换前

图4 灰度变换后

二值化

从图像中进行观察可以清晰地看到路沿有一个重要的特征就是拥有阴影与明显地轮廓特征（表现为颜色微小地颜色变化）。因此可以利用以上的特征对图像进行处理，首先至少使得人眼可明显观察得到粗略的路沿区域。那么想到的方法是对图像进行二值化，下面进行具体的试验。首先将阈值设置为一半即127可以看到结果如图x所示，而将阈值设置为200时其结果如图x所示，可以看到前者可以清晰看出近处的路沿，而后者可以看到整条道路的路沿，但是十分粗糙，于是调整阈值以获得最佳值。

图5 二值化阈值为127时的图像

图6 二值化阈值为200时的图像

从120至200逐一调整后，发现阈值为185时较佳，其结果如下所示。

图7 阈值为185时的二值化图像

可以清晰看出路沿的轮廓，但是其四周却存在部分阴影，因此可以对其进行多次均值滤波后再次二值化去除，其步骤见均值二值化处理。

均值滤波二值化

在前面的图中可以清晰看出路沿的轮廓，但是轮廓周边却存在一些干扰的黑线，如下图所示。

图8 轮廓周边的黑线

因此可以尝试对二值化后的图像进行均值滤波，对这些黑边的灰度值进行弱化，然后再进行一次二值化即可去掉黑边。

对整幅图像进行均值二值化处理，并将参数调整至最佳其结果如下所示、

图9 均值二值化处理

可以发现四周的黑边去除了,但是同时远处的轮廓线也没了.因此对整张图进行均值滤波后再二值化会存在问题.于是考虑到在远处黑边的影响比较小,而且远处的宽容度无需太高,所以应该只要对右下角区域进行处理.

2. 对右下角区域进行处理，首先提取处ROI区域，其代码如下

# 获取图像的行数和列数
rows, cols = img_binary.shape[:2]
# 指定右下角区域的起始和结束位置
x_start, y_start = int(cols * 0.5), int(rows * 0.5)
x_end, y_end = cols, rows
# 提取右下角区域
roi = gray[y_start:y_end, x_start:x_end]

然后对其进行均值滤波，并将roi区域幅值到整张图中。最后再次进行二值化操作，此时阈值设置为160。

# 选定右小角区域做均值滤波
blur = cv2.blur(roi, (5, 5))
# 将滤波后的区域复制回原图像的右下角
img_binary[y_start:y_end, x_start:x_end] = blur
# 再次进行二值化操作
_, img_binary = cv2.threshold(img_binary, 170, 255, cv2.THRESH_BINARY)

其结果如下所示。

图10 ROI区域均值滤波与二值化处理结果图

可以发现近处的黑边已被去除，而远方的轮廓线仍清晰可见。

2.3 兴趣区域提取

粗略提取

对上面的区域进行预处理后下一步就是提取兴趣区域，也就是路沿所在的区域，以排除其他区域的影响。从视频中可以看出路沿是在我们右手边的，而在其他行驶条件中，我国的道路一般也都是在右边.因此首先可以截取左向数起2/5区域作为兴趣区域。而再仔细观察可以发现路边与左边2/5处边界线成60度范围，因此可以截取如下的区域作为兴趣区。

图11 兴趣区域示意图

兴趣区域提取的代码如下所示，

def get_roi(img):
# 获取图像大小
h, w = img.shape[:2]
# 计算多边形顶点
x1 = int(w / 5 * 2)
x2 = int(w / 5 * 2)
x3 = int(w / 5 * 2 + h*math.tan(math.pi/3))
y1 = 50
y2 = int(h)
y3 = h
pts = np.array([(x2, y1), (x3, y2), (x3, y3), (x1, y3), (x1, y2), (x2, y1)])
mask = np.zeros((rows, cols), dtype=np.uint8)
# 填充多边形
cv2.fillPoly(mask, [pts], (255, 255, 255))
roi = cv2.bitwise_and(img, img, mask=mask)
return roi

精确提取

在除此提取后发现左右两边的区域或许会产生影响，因此下一步消除左右两边的边界。其思路如下图所示。主要的目的是在整个画面中只留下路沿而其他标志线的边界均去除，其实现方法在于先提取标志线与路基边缘区域，然后将此区域变成兴趣区进行截取，然后将区域外的颜色均变为白色。那么最后结果就只剩下路沿线。

图12 精确提取思路图

在进行均值滤波与二值化后，其结果如下所示。可以看到中间的路沿线已经去除，方便进行边缘提取与霍夫变换。

图13 去除中间路沿线

在得到上面的图像后进行边缘提取，最后使用掩膜进行变换得到下图。

图14 提取后的效果图

可以看到标志线与路基区域已经精确地截取得到。从图中可以看出可以形成三条边沿线，而我们所需要的仅仅是中间的。因此将掩膜区域外的图像变为白色，其结果如下。

图15 保留轮廓线

可以看到效果并不好，因此尝试压缩范围，以最后得到中间的黑线，通过改变截距的大小来进行，其代码如下。

def adjust_line_intercept(point1, point2, c):
x1, y1 = point1
x2, y2 = point2
k = (y2 - y1) / (x2 - x1)
b = y1 - k * x1
b += c
y1_new = k * x1 + b
y2_new = k * x2 + b
return [(int(x1), int(y1_new)), (int(x2), int(y2_new))]

然而却发现结果并不佳,因为随着图像的变化,较难找到最佳的截距参数.所以区域限制的方法无太大作用，最后此方法未用到最终结果中。

2.4 边缘检测

在上面的过程中其实一直有涉及到边缘检测的部分,，的边缘检测我选择了canny边缘检测。它是一种经典的边缘检测算法。通过高斯模糊、计算梯度、非极大值抑制、双阈值检测、边缘连接几个步骤对边缘进行检测。在此次实验中，我参考了高等人[1]的方法设置了高低阈值，即使用光照强度参数 BL的0.4倍作为低阈值，1.2倍作为高阈值。最后还使用cv2.bitwise_and函数来将边缘图像edges和掩码mask进行按位与运算，从而将边缘检测结果限制在指定的区域内。其代码如下。

bl = cv2.mean(img)[0]
canny_low = int(0.4 * bl)
canny_high = int(1.2 * bl)
edges = cv2.Canny(img, canny_low, canny_high)
edges = cv2.bitwise_and(edges, edges, mask=cv2.inRange(frame, (0, 0, 0), (200, 200, 200)))

2.5 Hough变换

霍夫变换是一种经典的图像处理算法，一般它会配合边缘检测以提取出边缘的的坐标信息形成直线或圆。在此处的路沿检测中，路沿一般是直线，所以主要使用线条的hough变换即可。为了得到更好的效果，我进行了多次调整参数。下表为调整threshold的结果统计，默认参数为threshold=100，minLineLength=100， maxLineGap=100。

表1 threshold结果统计

threshold	结果说明	显示效果
150	边界线条较稀疏，路沿线可能无法显示
100	边界线条可以正常显示
50	线条数量多较为稠密

下表为改变minLineLength最短线条长度的结果。

表2 minLineLength结果统计

threshold	结果说明	显示效果
150	边界线条可以正常显示
100	边界线条可以正常显示
50	线条变短

改变maxLineGap最大线条间隔的结果，三者的改变对结果影响不大，因此不展示统计表。因此最后参数均选择为100。

2.6 线条过滤与图像输出

上面的结果中，包含了路沿的边界线，但是同时也含有两侧路基边线与路标线。因此最终输出应该进行过滤，在前面的兴趣区域提取中曾尝试过去除影响但是结果并不佳。同时在hough变换中，会存在某些异常线条，这些线条的斜率往往与路沿的差别很大。于是尝试使用斜率筛选与截距排序来对结果进行过滤。

斜率平均值

统计视频中线条的斜率平均值，将每个视频中线条的斜率累加然后除以线条总数据，以下为各视频线条斜率的统计结果。

表3 各视频路沿斜率统计

视频名称	斜率平均值
01.avi	2.48
02.avi	3.19
03.avi	1.56

三者平均值为，在此均值范围内加减其百分之50%作为范围，即1.21~3.62。修改前后如下图所示，可以看到异常的线条给去除了。

图16 斜率限定前

图17 斜率限定后

路沿截距

目前所能看到的图像虽然包含了路沿线，但是也包含了其他的边界线，因此需要过滤。人工统计三个视频中路沿线截距，其结果如下表所示。

表4 各视频路沿截距统计

视频名称	截距范围
01.avi	550-600
02.avi	550-700
03.avi	400-500

因此根据以上的条件进行过滤。以02.avi为例，其变化前后如下图所示，可以看到改变前是很多条线的，而处理后只有路沿存在线。然而这种做法却存在太大的主观性，需要根据特定的视频进行定制无法通用，存在极大的不便性。

图 18截距限定前

图 19截距限定后

3. 路沿检测结果展示

01.avi

图20 01.avi最终结果截图

02.avi

图21 02.avi最终结果截图

03.avi

图22 03.avi最终结果截图

从上面的图中可以看出，其实对于此次实验的路沿检测基本是可以完成的，但是细节上的内容还可以更进一步地完善。比如再进一步自适应兴趣区域，自动识别路沿斜率范围等。

4. 其他路沿检测方法

在查阅文献时，发现了还有很多针对路沿检测的方法，这些方法主要分为两大类。第一类大多出现在10年前，主要是利用hough变换、canny边缘检测等的传统方法来对路沿进行检测；第二类则是使用深度学习的方法对对路沿进行检测。

传统方法介绍

对于第传统方法，其研究主要集中在10年前，如杨[2]等人提出了一种基于边缘的道路检测算法，采用颜色和方差规则消除非道路边缘的干扰，通过Hough变换确定道路边界的位置，同时通过限定感兴趣区域，进一步提高算法效率。高[1]等人提出了一种基于Canny算子和Hough变换的路缘识别和距离测量算法，能够实时准确地检测不同类型的路缘并进行距离测量。徐[3]等人提出了一种基于直线模型的道路识别算法，采用自然边界作为道路识别的依据，可以应用在有或没有车道线的道路环境中。刘[4]等人提出了一种基于三维道路模型的道路检测和跟踪算法，利用道路标志线的颜色突变来检测道路的边界线，同时利用卡尔曼滤波来进行跟踪分析。Gao[5]等人提出了一种双阈值方法获取道路的二值图像，并采用自适应Hough变换和SUSAN算法来获取道路边界。郭[6]等人采用自适应分离、模糊C均值和模糊规则来进行道路的识别，同时采用Canny算子得到良好的车道线检测效果，应对光照变化的情况。

深度学习方法介绍

以上传统的这些方法大多都是在深度学习受限于计算机性能无法得到较好发展的年代发表的，这些算法都拥有较好的性能无需太多的计算资源。而如今随着深度学习的火热目前路沿检测也拥有很多的神经网络模型。下面介绍三种关于路沿检测的模型。

1. SCNN

SCNN是一种基于卷积神经网络的语义分割模型，它使用了空洞卷积来增加感受野，以便能够更好地捕捉图像中的长距离信息。为了能够处理不同尺度的图像，SCNN使用了下采样和上采样的操作。其中，下采样用于降低特征图的分辨率，以便能够在更大的感受野范围内进行信息提取。在网络结构上，SCNN采用了一种U-Net结构，在特征提取和语义分割之间添加了一个对称的上采样模块，以便能够恢复原始图像的尺寸。它还使用了交叉熵损失函数来优化网络参数，同时还引入了一些额外的约束条件，如边界损失和平滑损失，以提高模型的鲁棒性和准确性。其效果图如下所示。

图23 SCNN效果图转载于https://github.com/XingangPan/SCNN

2. LaneNet

LaneNet是一种用于车道线检测的深度学习模型，可以实现实时、高精度的车道线检测和分割。LaneNet模型主要由两个部分组成：Encoder网络和Decoder网络。Encoder网络是一个卷积神经网络（CNN），用于提取输入图像的特征。Decoder网络由两个分支组成，一个分支用于车道线二值化分割，另一个分支用于车道线实例分割。LaneNet通过将分割和实例分割任务组合在一起，可以同时检测和分割多条车道线，且可以区分同一车道线上的不同部分。LaneNet的优点在于在不同光照、天气等情况下具有较好的鲁棒性和准确性；能够处理复杂的车道线形状和多车道情况；模型参数相对较小，可以在嵌入式设备上实现实时车道线检测。此模型的结构图如下所示。

图24 LaneNet结构图转载于https://github.com/amusi/awesome-lane-detection

3. VPGNet

vpgnet在2017年的CVF会议上提出的，它使用消失点作为特征值来引导对路沿线与车道线的检测。它将消失点和车道线的位置和宽度作为输入，使用卷积神经网络对图像进行特征提取和车道线检测。其效果图如下：

图25 VPGNet效果图转载于https://github.com/SeokjuLee/VPGNet

vpgnet主要包含三个部分：车道检测分支、路标检测分支和消失点回归分支。在训练过程中，网络同时学习车道和路标的位置和类别信息以及消失点的位置信息，最终通过单次前向传递预测车道和路标的位置和类别，以及消失点的位置。此模型在不良天气条件下进行了有效的实现，其具有高精度和鲁棒性，且实时性较高。

参考文献

[1]高灿, 曾杨, 郑庆华. 基于机器视觉的路缘识别及距离测量方法研究[J]. 建设机械技术与管理, 2014 (10): 125-130.

[2]杨文杰, 胡明昊, 杨静宇. 一种快速的基于边缘的道路检测算法[J]. 计算机科学, 2006, 33(5):257-260.

[3]徐友春, 王荣本, 李克强,等. 一种基于直线模型的道路识别算法研究[J]. 中国图象图形学报：A辑, 2004, 9(7):7.

[4]刘富强, 田敏, 胡振程. 智能汽车中基于视觉的道路检测与跟踪算法[J]. 同济大学学报：自然科学版, 2007, 35(11):7.

[5]Dezhi Gao，Wei Li，Jianmin Duan，etc. A Practical Method of Road Detection for Intelligent Vehicle[C]. In:Proceedings of the IEEE International Conference on Automation and Logistics，Beijing，China，2009:980-985

[6]Jyungguo Wang，Chengjian Lin，Shy i m i ng Chen. Applying Fuzzy Method to Vision-Based Lane Detection and Departure Warning System[J]. Expert Systems with Applications，2010，37:113-126.

[7]郭春钊，山部尚孝，三田诚一. 基于立体视觉平面单应性的智能车辆可行驶道路边界检测[J]. 自动化学报，2013， 39(4):371-380

[8]Pan, X. SCNN [Source code]. v1.0. Retrieved from https://github.com/XingangPan/SCNN

[9]MaybeShewill-CV. (2018). lanenet-lane-detection [Source code]. GitHub. https://github.com/MaybeShewill-CV/lanenet-lane-detection

[10]Lee, Seokju, et al. "VPGNet: Vanishing Point Guided Network for Lane and Road Marking Detection and Recognition." IEEE Transactions on Image Processing 28.12 (2019): 6034-6046.

[11]https://github.com/amusi/awesome-lane-detection

[12]https://blog.csdn.net/weixin_51426083/article/details/127812799

实验结论或体会

在本次的实验中，我使用了灰度变换、二值化、canny边缘检测以及hough变换等多种方法对视频的每一帧进行了处理，最后成功地对三个视频的路沿线进行了识别。虽然在整个视频中存在某些帧无法正常识别，以及线条偏离，但是大部分的视频帧都能成功识别出路沿线。对于视频的处理以及方法的调用，基本上使用的都是python的opencv库，整个实验下来我对opencv的一些函数与使用方法有了更深入地了解。

在开始实验前，我搜寻了很多关于路沿检测的文献，了解了很多传统的处理方法以及近5年来最新的路沿检测模型。在实验过程中，我并不是完全模仿前人的工作，我还创新性地提出了我自己的想法并得以实现。我认为在此次的实验中的创新点在于多次使用二值化来放大路沿特征与兴趣区域以实现对路沿检测。总而言之，此次的实验是对课上学到的知识地很好一次实践，让我对理论知识拥有更好地了解，受益无穷。

你可能感兴趣的:(计算机视觉,计算机视觉,图像处理,opencv)

Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
tiff批量转png 诺有缸的高飞鸟 opencv 图像处理 python opencv 图像处理
目录写在前面代码完写在前面1、本文内容tiff批量转png2、平台/环境opencv,python3、转载请注明出处：https://blog.csdn.net/qq_41102371/article/details/132975023代码importnumpyasnpimportcv2importosdeffindAllFile(base):file_list=[]forroot,ds,fsin
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
Python实现下载当前年份的谷歌影像 sand&wich python 开发语言
在GIS项目和地图应用中，获取最新的地理影像数据是非常重要的。本文将介绍如何使用Python代码从Google地图自动下载当前年份的影像数据，并将其保存为高分辨率的TIFF格式文件。这个过程涉及地理坐标转换、多线程下载和图像处理。关键功能该脚本的核心功能包括：坐标转换：支持WGS-84与WebMercator投影之间转换，以及处理中国GCJ-02偏移。自动化下载：多线程下载地图瓦片，提高效率。图像
Python实现TIFF 文件转换为 PNG 和 JPG 格式 sand&wich python 开发语言
在日常的图像处理工作中，可能会遇到需要将TIFF格式的图像转换为其他格式的情况，例如PNG和JPG。下面，本文将介绍如何使用Python和GDAL库实现这一功能。准备工作在开始之前，请确保已经安装了必要的库：GDAL（GeospatialDataAbstractionLibrary）可以使用以下命令安装GDAL：pipinstallgdal代码实现以下是一个将TIFF文件转换为PNG文件的示例代码
windows下python opencv ffmpeg读取摄像头实现rtsp推流拉流图像处理大大大大大牛啊 opencv实战代码讲解视觉图像项目 windows python opencv
windows下pythonopencvffmpeg读取摄像头实现rtsp推流拉流整体流程1.下载所需文件1.1下载rtsp推流服务器1.2下载ffmpeg2.开启RTSP服务器3.opencv读取摄像头并调用ffmpeg进行推流4.opencv进行拉流5.opencv异步拉流整体流程1.下载所需文件1.1下载rtsp推流服务器下载RTSP服务器下载页面https://github.com/blu
c++ opencv4.3 sift匹配图像处理大大大大大牛啊图像处理 opencv实战代码讲解 opencv sift c++opencv4 特征点
c++opencv4.3sift匹配main.cppintmain(){vectorkeypoints1,keypoints2;Matimg1,img2,descriptors1,descriptors2;intnumF
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
ubuntu安装opencv最快的方法 Derek重名了
最快方法，当然不能太多文字$sudoapt-getinstallpython-opencv借助python就可以把ubuntu的opencv环境搞起来，非常快非常容易参考：https://docs.opencv.org/trunk/d2/de6/tutorial_py_setup_in_ubuntu.html
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
使用Python和Playwright破解滑动验证码 asfdsgdf python 开发语言
滑动验证码是一种常见的验证码形式，通过拖动滑块将缺失的拼图块对准原图中的空缺位置来验证用户操作。本文将介绍如何使用Python中的OpenCV进行模板匹配，并结合Playwright实现自动化破解滑动验证码的过程。所需技术OpenCV模板匹配：用于识别滑块在背景图中的正确位置。Python：主要编程语言。Playwright：用于浏览器自动化，模拟用户操作。破解过程概述获取验证码图像：下载背景图和
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
opencv学习：图像旋转的两种方法，旋转后的图片进行模板匹配代码实现夜清寒风学习 opencv 机器学习人工智能计算机视觉
图像旋转在图像处理中，rotate和rot90是两种常见的图像旋转方法，它们在功能和使用上有一些区别。下面我将分别介绍这两种方法，并解释它们的主要区别rot90方法rot90方法是NumPy提供的一种数组旋转函数，它主要用于对二维数组（如图像）进行90度的旋转。这个方法比较简单，只支持90度的倍数旋转，不支持任意角度旋转。使用NumPy进行旋转使用NumPy的rot90函数对模板图像进行旋转操作。
Python OpenCV图像处理：从基础到高级的全方位指南极客代码玩转Python 开发语言 python opencv 图像处理计算机视觉
目录第一部分：PythonOpenCV图像处理基础1.1OpenCV简介1.2PythonOpenCV安装1.3实战案例：图像显示与保存1.4注意事项第二部分：PythonOpenCV图像处理高级技巧2.1图像变换2.2图像增强2.3图像复原第三部分：PythonOpenCV图像处理实战项目3.1图像滤波3.2图像分割3.3图像特征提取第四部分：PythonOpenCV图像处理注意事项与优化策略4
python图像匹配_opencvpython中的图像匹配 weixin_39585675 python图像匹配
我一直在做一个项目，用opencvpython识别相机中显示的标志。我已经尝试过使用surf、颜色直方图匹配和模板匹配。但在这3个问题中，它并不总是返回正确的答案。我现在想要的是，解决我这个问题的最好办法是什么。模板图像示例：以下是摄像头中显示的标志示例。如果这是我想要识别的图像，该怎么用？在更新matchTemplate中的代码flags=["Cambodia.jpg","Laos.jpg","
利用Python+OpenCV实现截图匹配图像，支持自适应缩放、灰度匹配、区域匹配、匹配多个结果 xu-jssy Python自动化脚本 python opencv 开发语言图像处理自动化
可以直接通过pip获取，无需手动安装其他依赖pipinstallxug示例：importxugxug.find_image_on_screen(,,,)=========================================================================一、依赖安装pipinstallopencv-pythonpipinstallpyautogui二、获
服务器状态监控php源码,服务器状态监控_监控Linux服务器网站状态的SHELL脚本温糯米服务器状态监控php源码
摘要腾兴网为您分享:监控Linux服务器网站状态的SHELL脚本，蜗牛集市，同花顺，探客宝，手柄助手等软件知识，以及日期倒计时插件，云南省教育资源公共，rui手机桌面，小屁孩桌面便签，合金装备崛起复仇，朝夕日历，photoshop图像处理软件,一年级学生每日计划表，悟空找房，饿了吗外卖商家版，逃生，中国民宿网，realpolitiks，交通安全知识竞赛，雅思流利说等软件it资讯，欢迎关注腾兴网。1
CV、NLP、数据控掘推荐、量化海的那边- AI算法自然语言处理人工智能
下面是对CV（计算机视觉）、NLP（自然语言处理）、数据挖掘推荐和量化的简要概述及其应用领域的介绍：1.CV（计算机视觉，ComputerVision）定义：计算机视觉是一门让计算机能够从图像或视频中提取有用信息，并做出决策的学科。它通过模拟人类的视觉系统来识别、处理和理解视觉信息。主要任务：图像分类：识别图像中的物体并分类，比如猫、狗、车等。目标检测：在图像或视频中定位并识别多个对象，如人脸检测
opencv 学习 1 木木ainiks opencv 计算机视觉 python
opencv学习的第一天#coding:utf-8importcv2ascv#首先读图片src=cv.imread(“img/1.jpg”)#设置图片的名字cv.namedWindow(“1”,cv.WINDOW_AUTOSIZE)#显示图片第一个参数设置图片名，第二个参数图片的地址cv.imshow(“1”,src)cv.waitKey(0)#将图片写入固定位置cv.imwrite(“img/2
OpenCV结构分析与形状描述符（24）检测两个旋转矩形之间是否相交的一个函数rotatedRectangleIntersection()的使用 jndingxin OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述测两个旋转矩形之间是否存在交集。如果存在交集，则还返回交集区域的顶点。下面是一些交集配置的例子。斜线图案表示交集区域，红色顶点是由函数返回的。rotatedRectangleIntersection()这个函数看起来像是用于检测两个旋转矩形之间是否相交的一个方法。
python-opencv cv2.findContours()函数 fjswcjswzy opencv python笔记 python opencv
示例代码：image,contours,hierarchy=cv2.findContours(contour,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)输入：contour：带有轮廓信息的图像；cv2.RETR_TREE：提取轮廓后，输出轮廓信息的组织形式，除了cv2.RETR_TREE还有以下几种选项：cv2.RETR_EXTERNAL：输出轮廓中只有外侧轮廓信
【Python】【Opencv】cv2.findContours()、cv2.drawContours()和cv2.contourArea()函数详解和运行示例木彳 Python学习和使用过程积累 python opencv 开发语言人工智能计算机视觉
为帮助大家理解和使用cv2.findContours()、cv2.drawContours()和cv2.contourArea()函数，本文通过对函数内容进行详解，并通过运行示例更直观表述。函数解析cv2.findContours()cv2.drawContours()cv2.contourArea()运行示例运行示例示例详解函数解析cv2.findContours()cv2.findContou
python如何判断NoneTpye #如花 opencv 人工智能计算机视觉 python
python如何判断NoneTpye最近用python-opencv解析多个视频文件，解析到第一个视频的最后一帧，出现了NoneTpye报错为了让循环继续，需要判断解析出来的图片是否为NoneType。试了几种方法#第一种方法img==None当img为空时，表达式为True。但是当img解析出了图片时，返回的是一个array，大小和img一致。正确写法imgisNone用isNone判断None
多模态Transformer之文本与图像联合建模 - Transformer教程 shandianfk_com ChatGPT Transformer transformer 深度学习人工智能
大家好，今天我们来聊聊一个既前沿又有趣的话题——多模态Transformer，特别是文本与图像的联合建模。对于很多小伙伴来说，Transformer这个词已经不陌生了，但它不仅仅应用于自然语言处理，还能在图像处理、甚至是多模态数据的处理上大显身手。接下来，我会带大家深入了解什么是多模态Transformer，以及它是如何实现文本与图像的联合建模的。Transformer简介首先，我们简单回顾一下T
三点or多点的变换矩阵求解opencv & eigen 合工大机器人实验室 C++矩阵 opencv 线性代数
《Estimating3-DRigidBodyTransformations:AComparisonofFourMajorAlgorithms》，它使用SVD方法计算T和t。只要算出变换矩阵，就可以算出A坐标系的一个点P在坐标系B里的对应点坐标，即R为3x3的转换矩阵，t为3x1的位移变换向量，这里点坐标均为3x1的列向量（非齐次形式，齐次形式下为4x1列向量，多出的一个元素值补1而已）。理论上只
Matlab2024a安装教程是阿宇呢信息可视化开发语言
MATLAB是一款商业数学软件，用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境，主要包括MATLAB和Simulink两大部分，可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等，主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。1.解压安装包：①鼠标右击【MATLABR2024a(64bit)
Python计算机视觉编程第三章图像到图像的映射一只小小程序猿计算机视觉 python opencv
目录单应性变换直接线性变换算法仿射变换图像扭曲图像中的图像分段仿射扭曲创建全景图RANSAC拼接图像单应性变换单应性变换是将一个平面内的点映射到另一个平面内的二维投影变换。在这里，平面是指图像或者三维中的平面表面。单应性变换具有很强的实用性，比如图像配准、图像纠正和纹理扭曲，以及创建全景图像。单应性变换本质上是一种二维到二维的映射，可以将一个平面内的点映射到另一个平面上的对应点。代码如下：impo
DIODE：超高分辨率室内室外数据集（猫脸码客第186期）猫脸码客: catCode2024 开源数据集猫脸码客开源数据集超高分辨率室内室外数据集
亲爱的读者们，您是否在寻找某个特定的数据集，用于研究或项目实践？欢迎您在评论区留言，或者通过公众号私信告诉我，您想要的数据集的类型主题。小编会竭尽全力为您寻找，并在找到后第一时间与您分享。在计算机视觉和深度学习领域，深度信息作为三维空间感知的重要组成部分，对于实现高级视觉任务如场景理解、机器人导航、增强现实等具有至关重要的作用。然而，获取准确且密集的深度数据一直是一个挑战，尤其是在同时涵盖室内和室
逆radon变换matlab,Radon变换及其Matlab代码实现少年商学院逆radon变换matlab
Radon变换和Hough变换类似，最初是用于检测图像中的直线(例如笔直的街道边沿、房屋的边沿、笔直的电线等)。关于Hough变换，可以参考OpenCV中的代码和示例(其实除了HoughLines还有HoughCircles等等变种)，此处不再赘述。关于Radon变换，可以参考wiki或者百科，或者网络上的其他资料介绍。这里做一个简单的总结。首先准备一张灰度化的图像，及黑白图像，然后检测图像的边缘
xml解析小猪猪08 xml
1、DOM解析的步奏准备工作： 1.创建DocumentBuilderFactory的对象 2.创建DocumentBuilder对象 3.通过DocumentBuilder对象的parse(String fileName)方法解析xml文件 4.通过Document的getElem
每个开发人员都需要了解的一个SQL技巧 brotherlamp linux linux视频 linux教程 linux自学 linux资料
对于数据过滤而言CHECK约束已经算是相当不错了。然而它仍存在一些缺陷，比如说它们是应用到表上面的，但有的时候你可能希望指定一条约束，而它只在特定条件下才生效。使用SQL标准的WITH CHECK OPTION子句就能完成这点，至少Oracle和SQL Server都实现了这个功能。下面是实现方式： CREATE TABLE books ( id &
Quartz——CronTrigger触发器 eksliang quartz CronTrigger
转载请出自出处：http://eksliang.iteye.com/blog/2208295 一.概述 CronTrigger 能够提供比 SimpleTrigger 更有具体实际意义的调度方案，调度规则基于 Cron 表达式，CronTrigger 支持日历相关的重复时间间隔（比如每月第一个周一执行），而不是简单的周期时间间隔。二.Cron表达式介绍 1）Cron表达式规则表 Quartz
Informatica基础 18289753290 Informatica Monitor manager workflow Designer
1. 1）PowerCenter Designer：设计开发环境，定义源及目标数据结构；设计转换规则，生成ETL映射。 2）Workflow Manager：合理地实现复杂的ETL工作流，基于时间，事件的作业调度 3）Workflow Monitor：监控Workflow和Session运行情况，生成日志和报告 4）Repository Manager：
linux下为程序创建启动和关闭的的sh文件，scrapyd为例酷的飞上天空 scrapy
对于一些未提供service管理的程序每次启动和关闭都要加上全部路径，想到可以做一个简单的启动和关闭控制的文件下面以scrapy启动server为例，文件名为run.sh： #端口号，根据此端口号确定PID PORT=6800 #启动命令所在目录 HOME='/home/jmscra/scrapy/' #查询出监听了PORT端口
人--自私与无私永夜-极光
今天上毛概课,老师提出一个问题--人是自私的还是无私的,根源是什么? 从客观的角度来看,人有自私的行为,也有无私的
Ubuntu安装NS-3 环境脚本随便小屋 ubuntu
将附件下载下来之后解压，将解压后的文件ns3environment.sh复制到下载目录下（其实放在哪里都可以，就是为了和我下面的命令相统一）。输入命令： sudo ./ns3environment.sh >>result 这样系统就自动安装ns3的环境，运行的结果在result文件中，如果提示 com
创业的简单感受 aijuans 创业的简单感受
2009年11月9日我进入a公司实习，2012年4月26日，我离开a公司，开始自己的创业之旅。今天是2012年5月30日，我忽然很想谈谈自己创业一个月的感受。当初离开边锋时，我就对自己说：“自己选择的路，就是跪着也要把他走完”，我也做好了心理准备，准备迎接一次次的困难。我这次走出来，不管成败
如何经营自己的独立人脉 aoyouzi 如何经营自己的独立人脉
独立人脉不是父母、亲戚的人脉，而是自己主动投入构造的人脉圈。“放长线，钓大鱼”，先行投入才能产生后续产出。现在几乎做所有的事情都需要人脉。以银行柜员为例，需要拉储户，而其本质就是社会人脉，就是社交！很多人都说，人脉我不行，因为我爸不行、我妈不行、我姨不行、我舅不行……我谁谁谁都不行，怎么能建立人脉？我这里说的人脉，是你的独立人脉。以一个普通的银行柜员
JSP基础百合不是茶 jsp 注释隐式对象
1,JSP语句的声明 <%! 声明 %> 　　声明：这个就是提供java代码声明变量、方法等的场所。表达式 <%= 表达式 %> 　　这个相当于赋值，可以在页面上显示表达式的结果，程序代码段/小型指令　<% 程序代码片段 %> 2,JSP的注释
web.xml之session-config、mime-mapping bijian1013 java web.xml servlet session-config mime-mapping
session-config 1.定义： <session-config> <session-timeout>20</session-timeout> </session-config> 2.作用：用于定义整个WEB站点session的有效期限，单位是分钟。 mime-mapping 1.定义： <mime-m
互联网开放平台（1） Bill_chen 互联网 qq 新浪微博百度腾讯
现在各互联网公司都推出了自己的开放平台供用户创造自己的应用，互联网的开放技术欣欣向荣，自己总结如下： 1.淘宝开放平台(TOP) 网址：http://open.taobao.com/ 依赖淘宝强大的电子商务数据，将淘宝内部业务数据作为API开放出去，同时将外部ISV的应用引入进来。目前TOP的三条主线： TOP访问网站：open.taobao.com ISV后台：my.open.ta
【MongoDB学习笔记九】MongoDB索引 bit1129 mongodb
索引可以在任意列上建立索引索引的构造和使用与传统关系型数据库几乎一样,适用于Oracle的索引优化技巧也适用于Mongodb 使用索引可以加快查询,但同时会降低修改,插入等的性能内嵌文档照样可以建立使用索引测试数据 var p1 = { "name":"Jack", "age&q
JDBC常用API之外的总结白糖_ jdbc
做JAVA的人玩JDBC肯定已经很熟练了，像DriverManager、Connection、ResultSet、Statement这些基本类大家肯定很常用啦，我不赘述那些诸如注册JDBC驱动、创建连接、获取数据集的API了，在这我介绍一些写框架时常用的API，大家共同学习吧。 ResultSetMetaData获取ResultSet对象的元数据信息
apache VelocityEngine使用记录 bozch VelocityEngine
VelocityEngine是一个模板引擎，能够基于模板生成指定的文件代码。使用方法如下： VelocityEngine engine = new VelocityEngine();// 定义模板引擎 Properties properties = new Properties();// 模板引擎属
编程之美-快速找出故障机器 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; public class TheLostID { /*编程之美假设一个机器仅存储一个标号为ID的记录，假设机器总量在10亿以下且ID是小于10亿的整数，假设每份数据保存两个备份，这样就有两个机器存储了同样的数据。 1.假设在某个时间得到一个数据文件ID的列表，是
关于Java中redirect与forward的区别 chenbowen00 java servlet
在Servlet中两种实现： forward方式：request.getRequestDispatcher(“/somePage.jsp”).forward(request, response); redirect方式：response.sendRedirect(“/somePage.jsp”); forward是服务器内部重定向，程序收到请求后重新定向到另一个程序，客户机并不知
[信号与系统]人体最关键的两个信号节点 comsci 系统
如果把人体看做是一个带生物磁场的导体,那么这个导体有两个很重要的节点,第一个在头部,中医的名称叫做百汇穴, 另外一个节点在腰部,中医的名称叫做命门如果要保护自己的脑部磁场不受到外界有害信号的攻击,最简单的
oracle 存储过程执行权限 daizj oracle 存储过程权限执行者调用者
在数据库系统中存储过程是必不可少的利器，存储过程是预先编译好的为实现一个复杂功能的一段Sql语句集合。它的优点我就不多说了，说一下我碰到的问题吧。我在项目开发的过程中需要用存储过程来实现一个功能，其中涉及到判断一张表是否已经建立，没有建立就由存储过程来建立这张表。 CREATE OR REPLACE PROCEDURE TestProc IS fla
为mysql数据库建立索引 dengkane mysql 性能索引
前些时候，一位颇高级的程序员居然问我什么叫做索引，令我感到十分的惊奇，我想这绝不会是沧海一粟，因为有成千上万的开发者（可能大部分是使用MySQL的）都没有受过有关数据库的正规培训，尽管他们都为客户做过一些开发，但却对如何为数据库建立适当的索引所知较少，因此我起了写一篇相关文章的念头。最普通的情况，是为出现在where子句的字段建一个索引。为方便讲述，我们先建立一个如下的表。
学习C语言常见误区如何看懂一个程序如何掌握一个程序以及几个小题目示例 dcj3sjt126com c 算法
如果看懂一个程序，分三步 1、流程 2、每个语句的功能 3、试数如何学习一些小算法的程序尝试自己去编程解决它，大部分人都自己无法解决如果解决不了就看答案关键是把答案看懂，这个是要花很大的精力，也是我们学习的重点看懂之后尝试自己去修改程序，并且知道修改之后程序的不同输出结果的含义照着答案去敲调试错误
centos6.3安装php5.4报错 dcj3sjt126com centos6
报错内容如下: Resolving Dependencies --> Running transaction check ---> Package php54w.x86_64 0:5.4.38-1.w6 will be installed --> Processing Dependency: php54w-common(x86-64) = 5.4.38-1.w6 for
JSONP请求 flyer0126 jsonp
使用jsonp不能发起POST请求。 It is not possible to make a JSONP POST request. JSONP works by creating a <script> tag that executes Javascript from a different domain; it is not pos
Spring Security（03）——核心类简介 234390216 Authentication
核心类简介目录 1.1 Authentication 1.2 SecurityContextHolder 1.3 AuthenticationManager和AuthenticationProvider 1.3.1 &nb
在CentOS上部署JAVA服务 java--hhf java jdk centos Java服务
本文将介绍如何在CentOS上运行Java Web服务，其中将包括如何搭建JAVA运行环境、如何开启端口号、如何使得服务在命令执行窗口关闭后依旧运行第一步：卸载旧Linux自带的JDK ①查看本机JDK版本 java -version 结果如下 java version "1.6.0"
oracle、sqlserver、mysql常用函数对比[to_char、to_number、to_date] ldzyz007 oracle mysql SQL Server
oracle &n
记Protocol Oriented Programming in Swift of WWDC 2015 ningandjin protocol WWDC 2015 Swift2.0
其实最先朋友让我就这个题目写篇文章的时候，我是拒绝的，因为觉得苹果就是在炒冷饭，把已经流行了数十年的OOP中的“面向接口编程”还拿来讲，看完整个Session之后呢，虽然还是觉得在炒冷饭，但是毕竟还是加了蛋的，有些东西还是值得说说的。通常谈到面向接口编程，其主要作用是把系统设计和具体实现分离开，让系统的每个部分都可以在不影响别的部分的情况下，改变自身的具体实现。接口的设计就反映了系统
搭建 CentOS 6 服务器(15) - Keepalived、HAProxy、LVS rensanning keepalived
（一）Keepalived （1）安装 # cd /usr/local/src # wget http://www.keepalived.org/software/keepalived-1.2.15.tar.gz # tar zxvf keepalived-1.2.15.tar.gz # cd keepalived-1.2.15 # ./configure # make &a
ORACLE数据库SCN和时间的互相转换 tomcat_oracle oracle sql
SCN（System Change Number 简称 SCN）是当Oracle数据库更新后，由DBMS自动维护去累积递增的一个数字，可以理解成ORACLE数据库的时间戳，从ORACLE 10G开始，提供了函数可以实现SCN和时间进行相互转换；　　用途：在进行数据库的还原和利用数据库的闪回功能时，进行SCN和时间的转换就变的非常必要了；　　操作方法：　　1、通过dbms_f
Spring MVC 方法注解拦截器 xp9802 spring mvc
应用场景，在方法级别对本次调用进行鉴权，如api接口中有个用户唯一标示accessToken,对于有accessToken的每次请求可以在方法加一个拦截器，获得本次请求的用户，存放到request或者session域。 python中，之前在python flask中可以使用装饰器来对方法进行预处理，进行权限处理先看一个实例,使用@access_required拦截： ?

计算机视觉实验：图像处理综合-路沿检测

实验步骤与过程

1. 路沿检测方法设计

2. 路沿检测方法实现

2.1 视频图像提取

2.2 图像预处理

2.3 兴趣区域提取

​​​​​​​2.4 边缘检测

​​​​​​​2.5 Hough变换

​​​​​​​2.6 线条过滤与图像输出

3. 路沿检测结果展示

4. 其他路沿检测方法

实验结论或体会

你可能感兴趣的:(计算机视觉,计算机视觉,图像处理,opencv)

2.4 边缘检测

2.5 Hough变换

2.6 线条过滤与图像输出