mysticalwing

立体匹配(Stereo Matching)

- - - 模块类图结构
    - BM(Block Matching)
      - 1. 参考资料
      - 2. 主要公式和概念
      - 3. 算法流程
      - 4. 注意事项
    - SGBM(Semi-Global Block Matching)
      - 1. 参考资料
      - 2. 主要公式和概念
      - 3. 算法流程
      - 4. 注意事项
    - 重要API参数解析
      - 1. StereoBinaryBM
      - 2. StereoBinarySGBM
    - 一些使用该模块时的注意事项
    - 运行效果截图

模块类图结构

１. StereoMatcher 类为该模块顶级父类，为一抽象类，定义了StereoBinary*子类的一些公共接口

２. StereoBinaryBM 和 StereoBinarySGBM为StereoMatcher类的两个派生子类, 分别实现了基于BM(Block Matching) 和 SGM(Semi-Global Matching)的立体匹配算法.

BM(Block Matching)

1. 参考资料

(1) Small Vision Systems: Hardware and Implementation 1997

(2) Weighted Semi-Global Matching and Center-Symmetric Census Transform for Robust Driver Assistance 2013

(3) Sum of Absolute Differences algorithm in stereo correspondence problem for stereo matching in computer vision application

2. 主要公式和概念

(0) 一些假设:

块匹配假设在像素的局部区域, 所有像素具有同一视差值.

(1) Census Transformation(CT)变换: 一种将像素值变为Binary String 的变换. 通过将中心像素值与邻域内像素值比较(此处以8邻域为例), 大于中心像素值的置0(1), 反之置1(0). 公式如下:

$L B P N (x, y) = \sum i = 0 N - 1 s (n i - n c) 2 i > (1)$

$s (x) = {10 x \geq 0 x < 0 > >$

(2) 计算对应像素点间不同视差值下的汉明距离:

$h (x, y, d) = H a m m i n g D i s t a n c e (L B P L (x, y), L B P R (x - d, y)) > (2a)$
Note: OpenCV的 hammingDistanceBlockMatching() 函数返回的汉明距离图的内存组织形式如下:
$S i z e (h a m m i n g D i s t a n c e) = H \times (W * n u m D i s p a r i t i e s) > (2b)$
其中每一行内容如下(以第 i 行为例, n=numDisparities ):

P(0, i)	P(1, i)	…	P(w, i)
h(0,i,0) , h(0,i,1) , …, h(0,i,n)	h(1,i,0) , h(1,i,1) ), …, h(1,i,n)	…	h(w−1,i,0) , h(w−1,i,1) , …, h(w−1,i,n)

(3) 块代价聚集(Block Cost Aggregate)

OpenCV实现中,分两步实现块代价聚集.

(i) 计算代价累计图

代价的水平积累:

$c' (x, y, d) = h (x - 1, y - 1, d) + c' (x - 1, y, d) > (3.1a)$
代价的垂直积累:
$c (x, y, d) = c' (x, y, d) + c' (x, y - 1, d) > (3.1b)$
(ii) 根据代价累计图计算指定窗内的块聚集代价
$C (x, y, d) = c (x - w, y - w, d) + c (x + w, y + w, d) - c (x - w, y + w, d) - c (x + w, y - w, d) > (3.2)$
其中 w=(windowSize/2) windowSize 必须为奇数. 上面两步的操作实际上就是求以某一点为中心的一个局部窗内的像素点的汉明距离的和.

(4) 根据块聚集代价图计算视差图
　　(i) 在上一步得到的 C(x,y,d) 图中, 在每一个像素处,假设存在一个以像素 p(x,y) 为横轴,以视差 d 为纵轴的局部坐标系 Coor(p,d) :
首先在坐标平面 Coor(p,d) 内原点处,沿垂直方向搜索一点 (0,lr) 使得该点的 C(x,y,d) 值最小且满足confidence check条件(其中 min∗ 表示第几小):

$l r = {m i n 3 ( C ( x , y , d 3 ) ) m i n 1 ( C ( x , y , d 1 ) ) \leq C O N F I D E N C E, - 1, d 1 o t h e r s > (4.1a)$
当 lr≠−1 时, 再次在坐标平面 Coor(p,d) 内的 [p−lr,pnumDisparity−lr] 区间内沿对角线搜索一点 (p,v) 使得该点同样满足上述条件:
$v = {m i n 3 ( C ( x , y , d 3 ) ) m i n 1 ( C ( x , y , d 1 ) ) \leq C O N F I D E N C E, - 1, d 1 o t h e r s > (4.1b)$
　 (ii) 得到 lr,v 后, 对其进行差值,得到sub-pixel级别的结果 p1,p2 , 如果 p1,p2 差值在阈值范围内,则该像素点的视差值为 p2∗scallingFactor , 否则视差为0:

p1,p2 差值公式如下:

$p' = {1 2 - 1 4 * [(m 3 - m 1 m 2 - m 1) 2 + m 3 - m 1 m 2 - m 1] - 1 * [1 2 - 1 4 * [(m 3 - m 1 m 2 - m 1) 2 + m 3 - m 1 m 2 - m 1]] m 2 > m 3 o t h e r s > (4.2.a)$

$p 1 = p' + v > (4.2.b)$

$p 2 = p' + l r > (4.2.c)$

$d = {p 2 * s c a l l i n g F a c t o r 0 | p 1 - p 2 | \leq t h r e s h o t h e r s > (4.2.d)$

Note: 计算 p1,p2 时, p′ 计算公式中的 m1,m2,m3 是不相同的.
(5) 后处理: 滤掉一些斑点区域(speckle)同时对于空洞区域进行插值处理.

$CV_SPECKLE_REMOVAL_AVG_ALGORITHMd(x,y)={d(x,y)1n(∑nid(xi,yi))d(x,y)>0others>(5a) (5a) C V _ S P E C K L E _ R E M O V A L _ A V G _ A L G O R I T H M d ( x , y ) = { d ( x , y ) d ( x , y ) > 0 1 n ( ∑ i n d ( x i , y i ) ) o t h e r s >$

$CV_SPECKLE_REMOVAL_ALGORITHMd(x,y)={d(x,y)NEW_VALUEd(x,y)>0others>(5b) (5b) C V _ S P E C K L E _ R E M O V A L _ A L G O R I T H M d ( x , y ) = { d ( x , y ) d ( x , y ) > 0 N E W _ V A L U E o t h e r s >$

3. 算法流程

Created with Raphaël 2.1.2 开始 CT变换->censusImageLeft,censusImageLeft 计算censusImageLeft,censusImageLeft两图中对应像素在不同视差值下的汉明距离图->hammingDistance 计算块匹配的聚合代价->agregatedHammingLRCost 计算视差图->disp0 后处理->disparityMap 结束

4. 注意事项

(1) 通过create() 创建BM算法对象时, numDisparities 参数必须能被16整除, blockSize 参数必须为奇数.

(2) 通过compute() 函数计算视差图时, 作为输入参数的左右两张图必须具有相同大小且图像类型都为CV_8UC1.

SGBM(Semi-Global Block Matching)

1. 参考资料

(1) Stereo Processing by Semi-Global Matching and Mutual Information 2008

(2) A Pixel Dissimilarity Measure That Is Insensitive to Image Sampling 1998

(3) Small Vision Systems: Hardware and Implementation 1997

2. 主要公式和概念

(0) 一些基本公式

$M I I 1, I 2 = H 1 + H 2 - H I 1, I 2 > (1)$

$H I = - \int 10 P I (i) l o g P I (i) d i > (2)$

$H I 1, I 2 = - \int 10 \int 10 P I 1, I 2 (i 1, i 2) l o g P I 1, I 2 (i 1, i 2) d i 1 d i 2 > (3)$

$H I 1, I 2 = \sum p h I 1, I 2 (I 1 p, I 2 p) > (4)$

$h I 1, I 2 (i, k) = - 1 n l o g (P I 1, I 2 (i, k) \otimes g (i, k)) \otimes g (i, k) > (5)$

$P I 1, I 2 (i, k) = 1 n \sum p T [(i, k) = = (I 1 p, I 2 p)] > (6)$

(1) Mutual Information(互信息):

参考:

博客: 经典算法Semi-Global Matching(SGM) 之HMI计算

MI是一种基于熵定义的用于表示两幅图相关性的一个概念. 对于在Base Image 和 Match Image 中没有相互对应的像素点对的值 I1,I2 ，对其熵的定义仿照联合熵进行定义：

$H I = \sum p h I (I p) > (1a)$

$h I (i) = - 1 n l o g (P I (i) \otimes g (i)) \otimes g (i) > (1b)$

其中 g(i) 为 Gaussian 函数。

因此， MI 的最总定义如下：

$M I I 1, I 2 = \sum p m i I i, I 2 (I 1 p, I 2 p) > (1c)$

$m i I i, I 2 (i, k) = h I 1 (i) + h I 2 (k) - h I 1, I 2 (i, k) > (1d)$

(2) 基于MI的代价函数(MI Matching Cost) CMI :

$C M I (p, d) = - m i I b, f D (I m) (I b p, I m q) > (2a)$

$q = e b m (p, d) > (2b)$

$> e b m (p, d) = [p x - d, p y] T > (2c)$

$f D (I m) = D + I m >$

其中 D 为视差图 D=Ib−Im

Note: 根据上述公式定义，可以看到， CMI 的计算需要事先知道视差图。这在实际应用中是不太可能满足的。作者在论文中提出了，首先对原图进行 116 的缩放，然后初始化一张随机的视差图，进行3次迭代计算后，再逐层向上放大，每层进行一次计算，直到和原图大小相同为止。另外，需要注意，为了保证误差不会逐层向上传播，较低分辨率的视差图只用于估计 P ，而 CMI 则用更高分辨率的视差图进行计算，其余的所有参数都从0开始计算. 上述公式中， (i,k) 分别代表 I1,I2 中像素点的值(pixel intensities)。 PI(i) 和 PI1.I2(i,k) 表示值为 i 的像素点和 (i,k) 的像素点对出现的概率。

(3) 代价聚集(Cost Aggregation)

参考:

博客: 经典算法Semi-Global Matching(SGM) 之动态规划

首先定义全局能量函数:

$E (D) = \sum p [C (p, D p) + \sum q \in N p (P 1 T [| D p - D q | = 1]) + \sum q \in N p (P 2 T [| D p - D q | > 1])] > (11)$
其中 Np 表示像素 p 的邻域. P1,P2 是惩罚系数.较小的 P1 使得该能量函数对于斜面和曲面(slanted or curved surface) 具有一定的适应性, 较大的 P2 使得能量函数能尽量阻止不连续性视差的产生. 一般来说,在边缘处的视差不连续变换是正常的,因此可以将 P2 设置为一个与图像梯度相适应的值,即 P2=P′2|Ibp−Ibq| .这样,对于处于边缘处的像素,即使是较大的视差变化,也能容忍.

有了上述能量函数后,求解立体匹配的问题就变成了求解使能量函数 E(D) 最小化的问题.而对于二维平面来说,求解该问题是一个NP完全问题. 如果将图像的每一行独立出来,则该问题转化为一个1D的优化问题,可以使用动态规划进行求解. 但是这样一来就会存在条纹效应(streaking). 因为这样只考虑了水平方向的约束,而对垂直方向的约束很弱甚至没有. 为了解决这个问题,作者在论文中提出了”aggregating matching costs in 1D from all directions equally”, 即对于每一个像素点,计算每一个方向上的一条代价最小路径的和,将之作为聚合后的代价值. 示意图如下:

首先递归定义每个方向上的最小代价:

$L r (p, d) = C (p, d) + min [L r (p - r, d), L r (p - r, d - 1) + P 1, L r (p - r, d + 1) + P 1, min i [L r (p - r, i) + P 2] - min k L r (p - r, k)] > (3a)$
则对于每个像素点,其聚合代价定义如下:
$S (p, d) = \sum r L r (p, d) > (3b)$

(4) 视差计算(Disparity Computation)

由(3)最小化聚合代价, 我们可以得到视差图 D=mindS[p,d] , 分别对左右两张图都进行上述计算,则有:

$D b p = min d S (b p, d) > (4a)$

$D m p = min d S (n p, d) > (4b)$

然后进行视差一致性检验(disparity consistency check), 得到最终的视差图 Dp :

$D p = {D b p D i n v a l i d i f | D b p - D m q | \leq d i s p 12 M a x D i f f o t h e r s > (4c)$

$q = e b m (p, D b p) > (4d)$

(5) Disparity Refinement

(i) Removal of Peaks: 对上一步得到的视差图,利用区域生长的, 取得不同的区域

$C i = \sum p (| D p - D i | \leq s p e c k l e R a n g e) > (5.1a)$
对得到的所有区域, 统计该区域的像素点的个数, 将之作为该区域的大小 Size(Ci)=COUNT(Ci) , 如果区域大小小于某一阈值,则认为该区域为speckle, 将区域内视差值都标记为非法值:
$D p = {D p D i n v a l i d i f S i z e (C i) < s p e c k l e W i n d o w S i z e o t h e r s >$
(5) Birchfield-Tomasi 代价函数根据块聚集代价图计算视差图

$I - R = I R^(x R - 1 2) = 1 2 (I R (x R) + I R (x R - 1)) > (4a)$

$I + R = I R^(x R + 1 2) = 1 2 (I R (x R) + I R (x R + 1)) > (4b)$

$I m i n = min (I - R, I + R, I R (x r)) > (4c)$

$I m a x = max (I - R, I + R, I R (x r)) > (4d)$

$d ¯ (x L, x R, I L, I R) = max (0, I L (x L) - I m a x, I m i n - I L (x L)) > (4e)$

对于另外一张图,具有类似的对称定义 d¯(xR,xL,IL,IR) .

3. 算法流程

Created with Raphaël 2.1.2 开始 CT变换->censusImageLeft,censusImageLeft 计算CT变换后两图中对应像素在不同视差值下的汉明距离图->hammingDistance 根据SGM算法计算视差图->disp 后处理->disparityMap 结束

4. 注意事项

OpenCV中的SGBM算法与原始论文中的算法略有不同,主要体现在以下几个点(SGBM API文档):

(1) 算法中计算聚合代价(aggregation cost)时, 计算的是8个方向上的聚合代价,而实现中默认只计算5个方向, 可以通过在创建SGBM对象时通过设置mode = StereoSGBM::MODE_HH 来改变算法行为, 使之计算8个方向.

(2) 原始论文中使用的是单像素匹配, 实现使用的是块匹配(block match). 可以通过设置blockSize = 1 来将块匹配降级为单像素匹配.

(3) 原始论文使用互信息(mutual information)作为匹配的代价函数, 实现中使用一种更简单的, 在参考资料[2]中提出的Birchfield-Tomasi 代价函数.

(4) 实现了参考资料[3] 中使用的一些后处理方法, 提高算法结果.

重要API参数解析

1. StereoBinaryBM

(1) StereoBinaryBM::create()

    /** 
        @brief Creates StereoBM object
        @param numDisparities 视差值d的搜索范围.
        @param blockSize 进行块聚合代价计算时的块窗口大小.必须为奇数! 
    */
static Ptr create(
        int numDisparities = 0,
        int blockSize = 9);

2. StereoBinarySGBM

(1) StereoBinarySGBM::create()64

    /** 
        @brief Creates StereoSGBM object
        @param minDisparity 视差值的最小值. 
        @param numDisparities Maximum disparity minus minimum disparity. 
        @param blockSize 块匹配的窗口大小, 必须为奇数且应在[3,11]区间内取值. 
        @param P1 公式(3a)中的P1. The first parameter controlling the disparity smoothness.
            This parameter is used for the case of slanted surfaces (not fronto parallel).
        @param P2 公式(3a)中的P2. The second parameter controlling the disparity smoothness.
            This parameter is used for "solving" the depth discontinuities problem. The 
            larger the values are, the smoother the disparity is. 
            P1 is the penalty on the disparity change by plus or minus 1 between neighbor
            pixels. P2 is the penalty on the disparity change by more than 1 between 
            neighbor 
        @param disp12MaxDiff 在对视差值进行左右交叉验证时,允许对应像素点处出现的左右视差的最大差值. 
            prefiltered image pixels. The algorithm first computes x-derivative at each
            pixel and clips its Birchfield-Tomasi pixel cost function. 
        @param uniquenessRatio Margin in percentage by which the best (minimum) computed
            cost function value should "win" the second best value to consider the found
            match correct. Normally, a value within the 5-15 range is good enough. 
            对算法在边缘处的视差值具有较大影响,使用默认值即可.
        @param speckleWindowSize Maximum size of smooth disparity regions to consider 
            their noise speckles and invalidate. Set it to 0 to disable speckle filtering.
            Otherwise, set it somewhere in the 50-200 range.
        @param speckleRange 计算区域大小时,判断两个点是否属于同一区域的差值阈值. Maximum disparity
            variation within each connected component. If you do speckle filtering, set 
            the parameter to a positive value, it will be implicitly multiplied by 16. 
            Normally, 1 or 2 is good enough.
        @param mode Set it to StereoSGBM::MODE_HH to run the full-scale two-pass dynamic
            programming algorithm. It will consume O(W\*H\*numDisparities) bytes, which
            is large for 640x480 stereo and huge for HD-size pictures. 
            By default, it is set to false .
    */
static Ptr create(
        int minDisparity, 
        int numDisparities, 
        int blockSize,
        int P1 = 100,
        int P2 = 1000,
        int disp12MaxDiff = 1,
        int preFilterCap = 0, 
        int uniquenessRatio = 5,
        int speckleWindowSize = 400,
        int speckleRange = 200,
        int mode = StereoBinarySGBM::MODE_SGBM);

一些使用该模块时的注意事项

numDisparities 参数对于算法性能影响很大, 应尽量设得小一些, 单应能被16整除.

blockSize 参数一般应设在[3, 11]内, 根据不同的CT变换核函数, 其范围略微有所不同.

运行效果截图

Input Image size: [384 x 288]
BM Costs: 47.3848 ms
SGBM Costs: 35.6961 ms
numDisparities: 64
blockSize: 9

输入左右视图:

左视图

右视图

真实视差图:

BM算法得到的视差图(归一化到0-255):

SGBM算法得到的视差图(归一化到0-255):

基于OpenCV的道路损伤识别 Srlua小谢传知代码论文复现 python 图形图像
✨✨欢迎大家来访Srlua的博文（づ￣3￣）づ╭❤～✨✨欢迎各位亲爱的读者，感谢你们抽出宝贵的时间来阅读我的文章。我是Srlua小谢，在这里我会分享我的知识和经验。希望在这里，我们能一起探索IT世界的奥妙，提升我们的技能。记得先点赞后阅读哦~所属专栏：传知代码论文复现欢迎访问我的主页：Srlua小谢获取更多信息和资源。✨✨目录一、背景介绍二、算法原理（一）中值滤波（二）直方图均衡化（三）调节阈值（
Python自动化运维：一键掌控服务器的高效之道蒙娜丽宁 Python杂谈运维 python 自动化
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在互联网和云计算高速发展的今天，服务器数量的指数增长使得手动运维和管理变得异常繁琐。Python凭借其强大的可读性和丰富的生态系统，成为实现自动化运维的理想语言。本文以“Python自动化运维：编写自动化脚本进行服务器管理”为主题，深入探讨了如何利用Py
用opencv生成视频流，然后用rtsp进行拉流显示 hunter206206 python opencv python 人工智能
importcv2importnumpyasnpimporttimefromdatetimeimportdatetimeimportgiimportsocketimportsysgi.require_version('Gst','1.0')try:gi.require_version('GstRtspServer','1.0')fromgi.repositoryimportGst,GLib,Gst
opencv c++ 调用 cornerHarris函数一直报错OpenCV(4.5.5) Error: Assertion failed (src.type() == CV_8UC1 || src. Wsyoneself cv opencv
报错：OpenCV(4.5.5)Error:Assertionfailed(src.type()==CV_8UC1||src.type()==CV_32FC1)in。。。原因：该函数的源矩阵（第一个参数）必须是单通道图像解决：三通道转为单通道之后再调用cvtColor(src,sc_img,COLOR_RGB2GRAY);//将三通道转为单通道cornerHarris(sc_img,dst,2,3
使用 Python结合ffmpeg 实现单线程和多线程推流浪浪山小白兔 python ffmpeg opencv
一、引言在本文中，我们将详细介绍如何使用Python进行视频的推流操作。我们将通过两个不同的实现方式，即单线程推流和多线程推流，来展示如何利用cv2（OpenCV）和subprocess等库将视频帧推送到指定的RTMP地址。这两种方式都涉及到从摄像头读取视频帧，以及使用ffmpeg命令行工具将视频帧进行编码和推流的过程。二、单线程推流以下是单线程推流的代码：importcv2ascvimports
基于C++和ONNX Runtime的YOLOv5目标检测实战浪浪山小白兔 c++YOLO 目标检测
1.前言在计算机视觉领域，目标检测是一项关键任务，其应用广泛，涵盖了安防监控、自动驾驶、工业检测等众多领域。YOLOv5作为一种先进的目标检测算法，以其速度快、精度高的特点备受关注。本文将详细介绍如何使用C++结合ONNXRuntime推理引擎来部署YOLOv5模型，实现高效的目标检测。2.ONNX与YOLOv52.1ONNX简介ONNX（OpenNeuralNetworkExchange）是一种
JNI Android Bitmap 和 cv::Mat 互相转换安卓手机运行Opencv动态库或普通c++函数配置指南 chezabo6116 android
JNIAndroidBitmap和cv::Mat互相转换https://blog.csdn.net/tyfwin/article/details/140714946安卓手机运行Opencv动态库或普通c++函数配置指南https://blog.csdn.net/snjs000111/article/details/135067493
【深度学习基础】线性神经网络 | softmax回归的简洁实现 Francek Chen PyTorch深度学习深度学习神经网络回归 softmax 人工智能
【作者主页】FrancekChen【专栏介绍】⌈⌈⌈PyTorch深度学习⌋⌋⌋深度学习(DL,DeepLearning)特指基于深层神经网络模型和方法的机器学习。它是在统计机器学习、人工神经网络等算法模型基础上，结合当代大数据和大算力的发展而发展出来的。深度学习最重要的技术特征是具有自动提取特征的能力。神经网络算法、算力和数据是开展深度学习的三要素。深度学习在计算机视觉、自然语言处理、多模态数据
【粉丝福利社】Python OpenCV从入门到精通愚公搬代码愚公系列-送书福利社 python opencv 开发语言
标题详情作者简介愚公搬代码头衔华为云特约编辑，华为云云享专家，华为开发者专家，华为产品云测专家，CSDN博客专家，CSDN商业化专家，阿里云专家博主，阿里云签约作者，腾讯云优秀博主，腾讯云内容共创官，掘金优秀博主，亚马逊技领云博主，51CTO博客专家等。近期荣誉2022年度博客之星TOP2，2023年度博客之星TOP2，2022年华为云十佳博主，2023年华为云十佳博主，2024年华为云十佳博主等
《探秘鸿蒙Next：非结构化数据处理与模型轻量化的完美适配》人工智能深度学习
在鸿蒙Next的人工智能应用场景中，处理非结构化数据并使其适配模型轻量化需求是一项关键且具有挑战性的任务。以下是一些有效的方法和策略。数据预处理数据清洗：非结构化数据中往往存在噪声、重复和错误数据。对于文本数据，要去除乱码、特殊字符等；对于图像数据，需处理模糊、损坏的图像。比如在处理鸿蒙Next设备采集的监控图像时，通过OpenCV的HarmonyOS适配库进行图像滤波等操作去除噪声。数据归一化与
【OpenCV 】第三章: 图像运算：加法运算、位运算、掩码、位平面分解、加密、数字水印、脸部打码宝贝儿好 OpenCV opencv 图像处理 python 算法
第三章:图像运算图像加法运算1、"+"2、cv2.add()函数3、图像加权和：cv2.addWeighted()函数图像位运算(位逻辑运算)1、按位与运算：cv2.bitwise_and()函数2、按位或运算：cv2.bitwise_or()函数3、按位非运算：cv2.bitwise_not()函数4、按位异或运算：cv2.bitwise_xor()函数掩模(掩码)参数图像与数值的运算图像位平面
卷积调制空间自注意力SPATIALatt模型详解及代码复现清风AI 深度学习人工智能 python 神经网络 conda
背景与意义SPATIALaTT模型的提出源于对自注意力机制和卷积神经网络（CNN）的深入研究。在计算机视觉领域，CNN长期占据主导地位，而自注意力机制的引入为视觉任务带来了新的思路。SPATIALaTT模型的意义在于融合了这两种强大的特征提取方法，充分发挥了它们的优势。这种融合不仅提高了模型的性能，还为设计更高效的视觉模型提供了新的思路，推动了计算机视觉技术的发展。通过结合自注意力机制和卷积神经网
基于YOLOv5、YOLOv8和YOLOv10的机场安检行李检测：深度学习应用与实现 2025年数学建模美赛 YOLO 深度学习人工智能目标跟踪目标检测
引言随着全球航空运输业的持续增长，机场的安全性变得越来越重要。机场安检作为航空安全的重要组成部分，主要负责对乘客和行李进行检查，防止危险物品进入机场或飞行器。传统的安检方式多依赖人工检查，效率低下且容易出错。因此，基于深度学习的自动化行李检测系统应运而生，通过计算机视觉技术，自动识别和分类行李中的物品，大大提高了安检的效率与准确性。YOLO（YouOnlyLookOnce）系列算法，由于其高效的目
OpenCV: 深入理解OpenCV中CV_WRAP_AS宏及其作用湫兮之风 opencv opencv 人工智能计算机视觉
在OpenCV中，CV_WRAP_AS是一个宏，主要用于为C++函数或运算符定义别名，以便在生成语言绑定时使用。这对于在不同的编程语言（如Python）中使用OpenCV库时提供更友好的接口非常有用。尽管它在C++代码中不会改变函数的行为，但它在OpenCV的语言绑定系统中起到了重要作用，特别是当OpenCV要为多个语言（如Python）提供接口时。1.CV_WRAP_AS宏的基本用途CV_WRA
C++: Dtrees:load(constg String& filepath, const String& nodeName)中nodeName参数含义湫兮之风 c++c++开发语言算法
1.nodeName的作用当你保存模型时，整个决策树会被序列化到一个XML或YAML文件中。nodeName是加载时指定的一个逻辑路径，用于从文件中找到某个节点或子结构，而不是存储在文件中的字段。如果你不指定nodeName，OpenCV默认会尝试加载文件中根节点对应的模型。2.默认的行为如果你不指定nodeName，通常会加载文件的根节点：Ptrtree=cv::ml::DTrees::load
【Python】深入探讨Python中的单例模式：元类与装饰器实现方式分析与代码示例蒙娜丽宁 Python杂谈 python 单例模式开发语言
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界单例模式（SingletonPattern）是一种常见的设计模式，它确保一个类只有一个实例，并提供一个全局访问点。在Python中，实现单例模式的方式多种多样，包括基于装饰器、元类和模块级别的单例实现。本文将详细探讨这些实现方式，并通过大量代码示例进行演
Python从0到100（八十三）：神经网络-使用残差网络RESNET识别手写数字是Dream呀 python 神经网络网络
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
【人工智能】Python实战：构建高效的多任务学习模型蒙娜丽宁 Python杂谈 AI 人工智能 python 学习
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界多任务学习（Multi-taskLearning,MTL）作为机器学习领域中的一种重要方法，通过在单一模型中同时学习多个相关任务，不仅能够提高模型的泛化能力，还能有效利用任务间的共享信息。本文深入探讨了多任务学习的基本概念、优势及其在实际应用中的重要性。
opencv相机特性记录 faris_5bing 默认 opencv 音视频人工智能
参考文档VideoCaptureAPIscv2.VideoCapture(0,cv2.VideoCaptureProperties)常见VideoCaptureProperties名称备注（含义）cv2.CAP_ANYautodetectcv2.CAP_VFWvideoforwindowscv2.CAP_V4L(cv2.CAP_V4L2)videoforlinuxcv2.CAP_DSHOWdire
人脸识别【java-基于OpenCV】思维导图-java架构用心去追梦 java opencv 架构
为了创建一个关于基于OpenCV的Java人脸识别项目的思维导图，可以围绕项目的主要组成部分进行组织：环境搭建、数据准备、人脸检测、特征提取、模型训练、识别与验证、以及优化和部署。以下是一个结构化的建议框架，你可以根据这个框架使用任何思维导图软件来创建具体的图形化版本。Java+OpenCV人脸识别项目-思维导图1.环境搭建安装依赖安装Java开发工具包（JDK）。下载并配置OpenCV库及其Ja
Python基于OpenCV和PyQt5的人脸识别上课签到系统【附源码】 Java老徐 Python 毕业设计 python opencv 人脸识别上课签到系统人脸识别上课签到上课签到系统 PyQt5
博主介绍：✌Java老徐、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2024-2025年Java毕业设计选题推荐Python基于Django的微博热搜、微博舆论可视化系统，附源码基于PythonDjango的北极星招聘数据可视化系统感兴趣的可以先收藏起
机器视觉在医疗影像分析中的应用：助力放射科医生精准诊断人工智能专属驿站大数据人工智能计算机视觉
在现代医疗领域，影像学检查如X光、CT扫描和MRI等是诊断疾病的重要手段。随着技术的不断发展，机器视觉算法在医疗影像分析中的应用日益广泛，为放射科医生提供了强大的辅助工具，极大地提高了诊断的准确性和效率。本文将探讨机器视觉在医疗影像分析中的具体应用及其对医疗诊断带来的变革。一、机器视觉算法简介机器视觉是一种模拟人类视觉的科学技术，通过图像处理、模式识别和计算机视觉等技术，使计算机能够“看”懂图像中
matlab程序代编程写做代码图像处理BP神经网络机器深度学习python matlabgoodboy 深度学习 matlab 图像处理
1.安装必要的库首先，确保你已经安装了必要的Python库。如果没有安装，请运行以下命令：bash复制代码pipinstallnumpymatplotlibtensorflowopencv-python2.图像预处理我们将使用OpenCV来加载和预处理图像数据。假设你有一个图像数据集，每个类别的图像存放在单独的文件夹中。python复制代码importosimportcv2importnumpya
【计算机视觉】人脸识别油泼辣子多加计算机视觉计算机视觉 opencv 人工智能
一、简介人脸识别是将图像或者视频帧中的人脸与数据库中的人脸进行对比，判断输入人脸是否与数据库中的某一张人脸匹配，即判断输入人脸是谁或者判断输入人脸是否是数据库中的某个人。人脸识别属于1：N的比对，输入人脸身份是1，数据库人脸身份数量为N，一般应用在办公室门禁，疑犯追踪；人脸验证属于1:1的比对，输入人脸身份为1，数据库中为同一人的数据，在安全领域应用比较多。一个完整的人脸识别流程主要包括人脸检测、
快速上手：C OpenCvSharp Yolov8 人脸关键点检测工具卢枫岱
快速上手：C#OpenCvSharpYolov8人脸关键点检测工具COpenCvSharpYolov8FaceLandmarks.rar项目地址:https://gitcode.com/open-source-toolkit/4d2a0项目介绍在当今的数字化时代，人脸识别和关键点检测技术已经成为许多应用的核心组成部分。无论是安防监控、人机交互还是虚拟现实，准确且高效的人脸关键点检测都是不可或缺的。
Python从0到100（七十三）：Python OpenCV-OpenCV实现手势虚拟拖拽是Dream呀 python opencv 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
opencv依赖的lib名称苏三福 opencv
#依赖的lib名称OPENCV_LIB=-lopencv_dnn-lopencv_flann-lopencv_videoio-lopencv_videostab-lopencv_superres-lopencv_video-lopencv_ml-lopencv_photo-lopencv_shape-lopencv_stitching-lopencv_calib3d-lopencv_feature
ACNet：深度学习中的自适应卷积网络新星郎轶诺
ACNet：深度学习中的自适应卷积网络新星项目地址:https://gitcode.com/gh_mirrors/ac/ACNet在深度学习领域，卷积神经网络（CNN）一直是图像处理和计算机视觉任务的核心技术。然而，传统的固定大小的卷积核无法灵活适应不同区域的信息密度。针对这一问题，ACNet（AdaptiveConvolutionNetwork）项目应运而生，它引入了一种新型的自适应卷积层，旨在
ai照片放大python源码_AI新时代-大牛教你使用python+Opencv完成人脸解锁（附源码）... weixin_39639505 ai照片放大python源码
好吧，伙计们，我回来了。说我拖更不写文章的可以过来用你的小拳拳狠命地捶我胸口....那么今天我们来讲关于使用python+opencv+face++来实现人脸验证及人脸解锁。代码量同样不多，你可以将这些代码运用在其它一些智能领域，如智能家居，进门的时候判断你是谁，也可以加入机器学习判断来的人是客人还是熟人。在讲之前我们会先适当的拓扑一下关于人脸识别的知识点。OK废话少说下面开始正是话题。解锁原理：
美图鉴赏-古风，OpenCV视频批量处理图苑 java 图像处理 AIGC opencv
publicstaticvoidmixBatch(StringoutputPath,ListvideoList,intclipDuration,intnumber,intmergeDuration,ProgressCallbackcallback)throwsException{//临时裁剪文件夹StringclipTempDir=outputPath+File.separator+"_clipT
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam

立体匹配(Stereo Matching)

模块类图结构

BM(Block Matching)

1. 参考资料

2. 主要公式和概念

3. 算法流程

4. 注意事项

SGBM(Semi-Global Block Matching)

1. 参考资料

2. 主要公式和概念

3. 算法流程

4. 注意事项

重要API参数解析

1. StereoBinaryBM

2. StereoBinarySGBM

一些使用该模块时的注意事项

运行效果截图

你可能感兴趣的:(OpenCV,计算机视觉)