lhanchao

特征点匹配——SIFT算法详解

之前在学习三维重建的过程中，了解过SIFT算法，现在老师要求详细的了解SIFT算法，看看能不能对它进行改进，于是又详细的看了一遍SIFT算法。记录一下。

一、SIFT算法综述

SIFT（Scale Invariant Feature Transform）全称尺度不变特征变换，是1999年Lowe提出的一种局部特征描述算子，在2004年得到了改善。
SIFT算子是把图像中检测到的特征点用一个128维的特征向量进行描述，因此一幅图像经过SIFT算法后表示为一个128维的特征向量集，该特征向量集具有对图像缩放，平移，旋转不变的特征，对于光照、仿射和投影变换也有一定的不变性，是一种非常优秀的局部特征描述算法。
SIFT算法的流程分别为：

尺度空间极点检测
关键点精确定位
关键点的方向确定
特征向量的生成

下面将会依次对这几步进行介绍。

二、尺度空间极点检测

2.1 尺度空间

特征点的检测就需要知道特征点的位置和尺度，需要位置的原因显而易见，而需要尺度的原因则是因为真实世界中的物体只有在一定尺度下才有意义。我们寻找的特征点就是要找到在连续的尺度空间下位置不发生改变的点。
构建尺度空间的目的就是找到在尺度变化中具有不变性的位置，可以使用连续的尺度变化，即在尺度空间中所有可能的尺度变化中找到稳定的特征点，通过这种方式找到的极点可以保证在图像缩放和旋转变化中具有不变性。
经过前人证明，尺度空间内核是高斯函数。因此假设 I(x,y) 是原始图像， G(x,y,σ) 是尺度空间可变的高斯函数，则一个图像的尺度空间可以定义为

L (x, y, σ) = G (x, y, σ) * I (x, y) (1)

其中，

∗ 表示的是卷积运算，

σ 表示尺度空间的大小，

σ 越大则表示越模糊，表示图像的概貌，

σ 越小则表示越清晰，表示图像的细节。高斯函数

G(x,y,σ) 定义为

G (x, y, σ) = 1 2 π σ 2 e - (x 2 + y 2) / 2 σ 2 (2)

经过一系列的尺度空间变换和二倍的下采样，最终得到高斯金字塔。
需要注意的是公式1中的图像

I(x,y) 具有无限的分辨率，也就是说他的尺度

σ=0 ，即

I(x,y)=L(x,y,0) 。也就是说公式1得到的尺度空间图像

L(x,y,σ) 是由尺度尺度空间为0的图像

L(x,y,0 生成的，但是现实生活中是不存在尺度空间为0，即具有无限分辨率的图像的。在Lowe的论文中，他们给定原图一个很小的尺度空间，为0.5。因此由一个小尺度空间图像

L(x,y,σ1) 生成一个大的尺度空间图像

L(x,y,σ2) 的过程为

L (x, y, σ 2) = G (x, y, σ 22 - σ 21 - - - - - - \sqrt) * L (x, y, σ 1) (3)

其中，

G (x, y, σ 22 - σ 21 - - - - - - \sqrt) = 1 2 π ( σ 2 2 - σ 2 1 ) e - x 2 + y 2 2 ( σ 2 2 - σ 2 1 ) (4)

由于实际中尺度为0的图像是无法得到的，因此我们得到的尺度图像的基准图像一定是由公式3得到的，这在SIFT算法的实现过程中尤为重要，不理解这里以后SIFT算法的实现看起来回比较吃力。

2.2 高斯差分

为了在尺度空间中找到稳定不变的极值点，在SIFT算法中使用了高斯差分(DOG)函数 D(x,y,σ) ，定义为

D (x, y, σ) = [G (x, y, k σ) - G (x, y, σ)] * I (x, y) = L (x, y, k σ) - L (x, y, σ)

其中

kσ 和

σ 是连续的两个图像的平滑尺度，所得到的差分图像再高斯差分金字塔中。
选择高斯差分函数的原因如下：
1. 计算简单，因为

L(x,y,σ) 是一定需要计算的，而

D(x,y,σ) 只需要执行减法。
2. 高斯拉普拉斯算子LoG(Laplacian of Gaussian)，即图像的二阶导数，能够在不同的尺度下检测到图像的斑点特征，从而检测到图像中尺度变化下的位置不动点，但是LoG的运算效率不高。而DoG是LoG的近似。DoG和LoG的关系如下述所示：

σ \nabla 2 G = \partial G \partial σ \approx G ( x , y , k σ ) - G ( x , y , σ ) k σ - σ (5)

因此，有

G (x, y, k σ) - G (x, y, y σ) \approx (k - 1) σ 2 \nabla 2 G (6)

而

σ2∇2G 正是尺度归一化算子的表达形式。在所有的尺度中

k−1 是一个常数，当

k 趋近于1的时候误差趋近于0，但实际上这种误差对于极值的位置检测并没有什么影响
3. 通过前人的实验证明LoG提取的特征稳定性最强。

2.3 高斯金字塔与高斯差分金字塔

高斯金字塔和高斯差分金字塔如下图所示：

这里的几个参数定义如下：
1. 金字塔的组数（number of octaves）：大多数情况下为4，但是实际上这个值与图像的大小有关，我在网上查到的资料大多数为 ⌊log2(min(M,N))⌋−3 或者 ⌊log2(min(M,N))⌋−2 ，具体实现看效果确定吧。
2. 每层的组数： S1=s+3 这里 s 为极值检测需要的层数，一般取3到5。
3. 参数： k=21s ， σ0=1.6
——————————————————————分割线——————————————————————
下面我们详细讲一下高斯金字塔的生成过程：
设我们输入的图像的尺度为0.5（Lowe论文中设定），由该图像进行高斯模糊得到第0组的第0层图像作为基准图像，设它的尺度为 σ0 ，即Lowe论文中的1.6，我们称 σ0 为基准层尺度，由第0层生成第1层图像的尺度为 kσ0 ，第1层生成第2层的尺度为 k2σ0 ，依次类推。
那么第0组中的图像的尺度为

σ = k r σ 0, r = 0, 1, . . ., s - 2 (7)

当第0组构建完以后，再构建第1组，第1组中的第0层图像是根据第0组的倒数第三张图像进行隔点采样得到的。由公式7我们可以知道，第0组的倒数第三层的尺度为

ksσ0 ，而

k=21s 因此其尺度为

2σ0 ，所以第1组的第0张图像的尺度依然为

2σ0 。
但是第1组中的图像是第0组中的图像经过隔点采样后得到的，因此相对于输入图像分辨率来说，其尺度为

2σ0 ，而对于第1组中的图像分辨率来说，其尺度为

σ0 。因此我们称

σ0 为基准层尺度。
上述总结规律如下：
第

o 组中的第r个图像相对于输入图像的尺度为：

σ = 2 o k r σ 0, o = 0, 1, 2, . . .; r = 0, 1, 2, . . ., s + 2 (8)

该图像相对于本组中的基准图像的尺度为：

σ = k r σ 0 (9)

而DoG金字塔的生成过程就比较简单了，就是由高斯金字塔相邻的两层相减得到DoG金字塔中的一层，然后依次得到。由高斯金字塔中每组有

s+3 层，所以高斯差分金字塔中每组有

s+2 层。
——————————————————分割线——————————————————
金字塔中每一组（octave）中的每层（scale）的平滑尺度都不同，下一组的第一层都是由上一层的倒数第三张的图像隔点降采样得到的。
这样做的目的是使DoG满足尺度连续性，下面讲具体的原因：
在高斯金字塔中第一组中的不同层中的平滑尺度分别为

σ,kσ,k2σ,k3σ,…,ks+2σ ，把

k=21s 带入上面的数列中，则第一组中不同层的平滑尺度分别为

σ, 2 1 s σ, 2 2 s σ, 2 3 s σ, \dots, 2 s s σ, 2 s + 1 s σ, 2 s + 2 s σ

一共有

s+3 层，那么取得的高斯差分金子塔有

s+2 层,平滑尺度分别为

σ, 2 1 s σ, 2 2 s σ, 2 3 s σ, \dots, 2 s s σ, 2 s + 1 s σ

，最终有极值的只有平滑程度为

21sσ,22sσ,23sσ,…,2ssσ 的图层。
由第二组的第一层的平滑尺度为

2σ 可知，应该从第一组的倒数第三层开始下采样。按照这样的操作第二组的最终有极值的几层的平滑程度分别为

2s+1s,2s+2s,…,2s+ss ，与第一组的有极值的层的平滑尺度正好相接，满足连续性。剩余的基层操作与上面相同。

2.4 极值点的选定

如上图的最右方所示，只有当前点与其周围26个点值相比，如果是最大值或者最小值则该点为极值点，否则不是。这种比较计算量比较小，因为大多数的点在比较的前几步就已经被pass掉了
这里还有一个问题，对于除第一组以外的其他组中得到的极值点的位置，如何映射到原图中的位置呢？这里我觉得可能是根据位置的对应关系，但是具体还不清楚，等我把sift的实现源码看完后再解释。（这样理解是对的！）

三、特征点的精确定位

计算机中存储的图像数据是离散的，而我们之前找到的极值点也就是离散空间中的极值点，但是离散空间中的极值点并不是真实的连续空间中的极值点。所以需要对DoG空间进行拟合处理，以找到极值点的精确位置和尺度。另外，我们还需要去除那些在边缘位置的极值点，以提高关键点的稳定性。

3.1 特征点精确定位

在Lowe的论文中，使用的是泰勒展开式作为拟合函数。通过SIFT算法详解（1）综述与尺度空间检测中提到的，我们得到的极值点是一个三维向量，包括它所在的尺度 σ 以及所在尺度图像中的位置坐标，即 X=(x,y,σ) .因此需要三维的泰勒展开式进行展开，设 X0=(x0,y0,σ0) ，则其展开式的矩阵形式为：

f (⎡ ⎣ ⎢ x y σ ⎤ ⎦ ⎥) \approx f (⎡ ⎣ ⎢ x 0 y 0 σ 0 ⎤ ⎦ ⎥) + [\partial f \partial x \partial f \partial y \partial f \partial σ] ⎛ ⎝ ⎜ ⎡ ⎣ ⎢ x y σ ⎤ ⎦ ⎥ - ⎡ ⎣ ⎢ x 0 y 0 σ 0 ⎤ ⎦ ⎥ ⎞ ⎠ ⎟ + 1 2 ([x y σ] - [x 0 y 0 σ 0]) ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ \partial 2 f \partial x \partial x \partial 2 f \partial x \partial y \partial 2 f \partial x \partial σ \partial 2 f \partial x \partial y \partial 2 f \partial y \partial y \partial 2 f \partial y \partial σ \partial 2 f \partial x \partial σ \partial 2 f \partial y \partial σ \partial 2 f \partial σ \partial σ ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎛ ⎝ ⎜ ⎡ ⎣ ⎢ x y σ ⎤ ⎦ ⎥ - ⎡ ⎣ ⎢ x 0 y 0 σ 0 ⎤ ⎦ ⎥ ⎞ ⎠ ⎟ (10)

若写成矢量形式，则为

f (X) = f (X 0 ） + \partial f T \partial X (X - X 0) + 1 2 (X - X 0) T \partial 2 f \partial X 2 (X - X 0) (11)

在这里

X0 表示离散的差值中心，

X 表示拟合后连续空间的差值点坐标，则设

X^=X−X0 ，表示偏移量，带入11式，另求得的导数为0，则有

X^= - \partial 2 f - 1 \partial X 2 \partial f \partial X (12)

把该极值点带入到原公式中，则有结果

f (X^) = f (X 0) + 1 2 \partial f T \partial X X^(13)

只要12式中得到的偏移量大于0.5，则认为偏移量过大，需要把位置移动到拟合后的新位置，继续进行迭代求偏移量，若迭代过一定次数后偏移量仍然大于0.5，则抛弃该点。如果迭代过程中有偏移量小于0.5，则停止迭代。
另外，如果13式中得到

f(X^) 过小，则抛弃该点，Lowe论文中阈值为0.03（设灰度值为0~1）

3.2 去除不稳定极值点

有些极值点的位置是在图像的边缘位置的，因为图像的边缘点很难定位，同时也容易受到噪声的干扰，我们把这些点看做是不稳定的极值点，需要进行去除。
由于图像中的物体的边缘位置的点的主曲率一般会比较高，因此我们可以通过主曲率来判断该点是否在物体的边缘位置。某像素点位置处的主曲率可以由二维的Hessian矩阵 H 计算得到

H = [D x x (x, y) D x y (x, y) D x y (x, y) D y y (x, y)]

设该矩阵的两个特征值分别为

α和β ，其中

α=γβ ，有如下公式：

T r (H) = α + β (14)

D e t (H) = α β (15)

其中

Tr(H) 表示矩阵的直迹，

Det(H) 表示的矩阵的行列式。
首先需要去除行列式为负的点。接下来需要去掉主曲率比较大的点，Lowe中使用如下判断规则：

T r ( H ) 2 D e t ( H ) = ( γ β + β ) 2 γ β 2 = ( γ + 1 ) 2 γ

这里

γ 越大，则表示该点越有可能在边缘，因此要检查主曲率是否超过一定的阈值

γ0 ，只需要判断

T r ( H ) 2 D e t ( H ) < ( γ 0 + 1 ) 2 γ 0 (16)

Lowe论文中阈值为10。

四、特征点方向的计算

为了实现特征点的旋转不变性，因此需要计算特征点的角度。在计算特征点的方向时是根据特征点所在的高斯尺度图像中的局部特征计算出的。该高斯尺度 σ 是已知的，并且该尺度是相对于该图像所在的组的基准图像的。所谓的局部特征就是特征点的邻域区域内所有像素的梯度幅角和梯度幅值，这里邻域区域定义为在该图像中以特征点为圆心，以 r 为半径的圆形区域

r = 3 * 1.5 σ (17)

这里的

σ 就是上面提到的相对于该组的基准图像的尺度。
像素的梯度幅值计算公式为

m (x, y) = (L (x + 1, y) - L (x - 1, y)) 2 + (L (x, y + 1) - L (x, y - 1)) 2 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - \sqrt (18)

像素的梯度幅角的计算公式为

θ (x, y) = a r c t a n (L ( x , y + 1 ) - L ( x , y - 1 ) L ( x + 1 , y ) - L ( x - 1 , y )) (19)

因为在特征点的邻域范围内并不是所有的像素的权值都是相同的，因此还需要对该邻域范围内的像素点进行加权，这里采用的是高斯加权，该高斯加权的方差

σm 为

σm=1.5σ ，这里的

σ 也是相对于该组的基准图像的尺度。
在完成邻域范围内的梯度幅值和幅角的计算以后，需要建立直方图来对邻域内各个像素点的幅角进行记录。在这里直方图一共分为36个柱，每个柱表示10度。把邻域内的所有像素点按所在的幅角范围进行分类，这里以0度~9度为例，把邻域内的所有幅角在该范围内的像素点的幅角乘以加权后的值相加作为该柱的高度。
把直方图建立好后，为了防止噪声的干扰，需要对直方图进行平滑。在OpenCV中的SIFT源码是使用下式进行平滑的

H (i) = h ( i - 2 ) + h ( i + 2 ) 16 + 4 * ( h ( i - 1 ) + h ( i + 1 ) ) 16 + 6 * h ( i ) 16 (20)

在这里

i 的取值范围为0到35，循环取值，如i为35时，i+1 = 0，i+2 = 1。
需要寻找直方图中的最高柱作为该特征点的主方向，因为该柱体表示的是一个范围，要精确求值需要如下的拟合

B = i + H ( i - 1 ) - H ( i + 1 ) 2 * ( H ( i - 1 ) + H ( i + 1 ) - 2 H ( i ) ) (21)

θ = 360 - 10 * B (22)

同理，这里的

i 也是0到35取值。
我们需要求出该柱体的具体的值，因为在Lowe的论文中，最高柱体的80%是一个阈值，用来判断该特征点的辅方向。
这样我们已经求出了SIFT特征点，以及特征点的方向，下面就是对于特征点的描述符的生成过程。
经过前面的一系列的操作，我们已经可以得到了图像中的所有特征点，并且计算了他们的方向。接下来要做的就是特征点描述符的生成了，有了特征点描述符，我们就可以准确的描述特征点，相当于特征点的特征，后面我们进行特征点匹配时用到的特征就是特征点描述符。
特征点描述符是跟特征点所在的尺度相关的，因此我们需要在特征点所在的尺度图像中生成特征点的描述符。在Lowe的论文中，把特征点的邻域区域划分为

d∗d 个正方形区域，Lowe论文中取

d=4 。每个正方形的区域的边长为

3σ ，这里的

σ 与SIFT算法详解（2）中定义的一样，也是相对于该组中的基准层的尺度。由于实际情况下，编程时用到双线性差值，因此这里用到的特征点邻域的边长实际为

3σ(d+1) ，因此邻域中一共有

(3σ(d+1))2 个像素点。
为了保证特征点的方向不变性，我们需要把特征点及其邻域进行旋转，旋转角度即为特征点的角度。由于是对正方形进行旋转，为了使旋转的区域包含整个正方形，则旋转的半径应为这个正方形的对角线的一半，即

r = 3 σ ( d + 1 ) 2 \sqrt 2

因此特征点邻域实际上有

(2r+1)2 个像素点。
像素点的旋转过程如下

[x' y'] = [c o s θ s i n θ - s i n θ c o s θ] [x y]

其中

[x′y′] 为旋转后的结果，

[xy] 为旋转前的坐标。
在这里，我们仍然需要计算像素点的梯度幅值和梯度幅角，用以生成直方图，同样，这里根据像素点与特征点的距离，像素点的加权值也是不一样的，这里仍然采用高斯加权，高斯处理的方法为

d22 。其实我们可以先在旋转前计算出各个像素点的梯度幅值和幅角，然后在进行旋转，拿这些梯度幅值和幅角进行对应。
最终形成的是一个128柱的直方图（

d∗d∗8，这里d=4，8是把360度分成8份），这个直方图的结果也就是我们的特征描述符。
这里需要注意一下，因为我们把特征点的邻域区域划分为了

d∗d 份，每份中的小正方形为

3σ∗3σ 。但是我们在统计直方图的时候，是把每个正方形看做一个整体进行统计的（即8个方向），那么一个显而易见的问题出现了：一个正方形中有很多像素点，这些像素点对于这个正方形的整体的贡献也是有权值的，因此还需要在此进行高斯加权。
因此每个像素点对于整个直方图的贡献的计算如下所述：

计算各个像素点的梯度幅值和梯度幅角；
根据该像素点距离特征点的距离进行加权（即第一次高斯加权），该像素点的幅值乘以加权值；
根据该像素点在所在的小正方形区域内据中心的距离进行加权（即第二次高斯加权），把2中的结果再乘以一个权值。

经过上面的计算，就可以得到128柱的直方图 {p1,p2,...,p128} ，为了去除光照的影响，需要进行归一化处理

q i = p i p 2 1 + p 2 2 + . . . + p 2 128 - - - - - - - - - - - - - - \sqrt, i = 1, 2, 3, . . ., 128

实际上为了去除非线性光照的变化，在实现的过程中对于已经归一化好的描述符

{q1,q2,...,q128} 需要设定一个阈值，一般阈值为0.2，当

qi 超过0.2以后，则

qi=0.2
————————————————————————————分割线————————————————————————————
最后放一点资料，主要是博客网址，其实现在SIFT算法研究的已经比较透彻了，网上有好多分析SIFT算法的文章，自己去找，英文好的话可以直接去读Lowe的论文。
这里放一些我写这几篇博客主要参考的网址，因为我写博客主要的目的是让我确认我确实理解这些算法了，因为只有理解了才能顺畅的介绍下来，其实我这几篇博客我参考的人有很多，主要有：
赵春江的专栏：Opencv2.4.9源码分析——SIFT
这篇写的SIFT算法非常非常详细，作者真是非常厉害！不过有些许错误，不过理解了SIFT以后发现这点错误也比较容易，这里就不列举了
小魏的修行路：SIFT原理与源码分析
这一系列文章也写得非常好，这两篇博文可以参照着看。
Rachel Zhang的介绍SIFT的博文
我的博客主要是用我认为好理解的话把SIFT算法的流程又说了一遍，写的马马虎虎。

ThinkSound V2版 - 一键给无声视频配音，为AI视频生成匹配音效支持50系显卡一键整合包下载昨日之日2006 ai语音音视频人工智能
ThinkSound是阿里通义实验室开源的首个音频生成模型，它能够让AI像专业“音效师”一样，根据视频内容生成高度逼真、与视觉内容完美契合的音频。ThinkSound可直接应用于影视后期制作，为AI生成的视频自动匹配精准的环境噪音与爆炸声效；服务于游戏开发领域，实时生成雨势变化等动态场景的自适应音效；同时可以无障碍视频生产，为视障用户同步生成画面描述与环境音效。今天分享的ThinkSoundV2版
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
无面试无offer? 你需要AI 求职co-pilot的帮助!
大家好啊，我写的开源免费求职AIco-pilot工具发布了v3.0.0，欢迎大家参与、使用!https://github.com/weicanie/prisma-ai一、项目介绍开源免费的求职co-pilot，自动化简历准备至offer到手的整个流程。优化您的项目、定制您的简历、为您匹配工作，并帮助您做好面试准备。二、核心价值prisma-ai旨在解决求职者在准备简历和寻找工作时最头疼的3个问题:
C#接口实现详解：从理论到实践，掌握面向对象编程的核心技巧钢铁男儿 C#图解教程 c#java 前端
在C#的世界里，接口是实现多态性和解耦设计的利器接口实现的核心规则实现主体限制只有类和结构体（struct）能实现接口。接口本身不包含实现代码，而是定义一组必须由实现类提供的成员契约。双重实现要求声明关联：在类/结构体的基类列表中明确包含接口名称classMyClass:IMyInterface//接口声明在冒号后成员实现：为接口声明的每个成员提供具体的实现代码，包括匹配的方法签名、属性和返回值类
.NET中的安全性之数字签名、数字证书、强签名程序集、反编译 hezudao25 NET .net assembly 加密算法 reference header
本文将探讨数字签名、数字证书、强签名程序集、反编译等以及它们在.NET中的运用（一些概念并不局限于.NET在其它技术、平台中也存在）。1.数字签名数字签名又称为公钥数字签名，或者电子签章等，它借助公钥加密技术实现。数字签名技术主要涉及公钥、私钥、非对称加密算法。1.1公钥与私钥公钥是公开的钥匙，私钥则是与公钥匹配的严格保护的私有密钥；私钥加密的信息只有公钥可以解开，反之亦然。在VisualStud
c++ 编译链接时报错找不到某个函数，如何排查? sun007700 c++chrome 开发语言
在C++开发中，链接时出现“undefinedreferenceto”错误是常见问题，以下是系统化的排查流程和解决方案：1.确认基础问题（30秒检查）#检查函数声明是否存在grep"function_name"include/*.hsrc/*.cpp#检查是否包含实现文件ls-lsrc/#确认包含实现的.cpp文件在编译列表中2.签名匹配检查（最常见问题）//头文件声明-voidprocess_d
iOS 获取Wifi信息
背景智能硬件入网的时候，硬件端通常需要通过WiFi入网，这种情况，可能需要App获取WiFi信息，来做WiFi匹配，同时也可以减少用户填写的信息。智能硬件WiFi入网方式利用HomeKit流程入网，然后利用Boujour绑定设备App连接硬件WiFi,将有网WiFi的信息通过http或者蓝牙方式发送给硬件（需要用户选择wifi，且可能有网WiFi是硬件不支持的，比如部分硬件不支持5GWiFi）部分
Python selenium 库 AI老李 python python selenium 开发语言
关键要点PythonSelenium库用于自动化Web浏览器，适合测试和爬虫，中文教程资源丰富。推荐菜鸟教程、CSDN博客和Selenium-Python中文文档，涵盖基础到进阶。学习需注意浏览器驱动匹配和动态加载处理，可能需显式等待。资源推荐以下是适合初学者和中级学习者的中文教程：菜鸟教程：提供全面的Selenium教程，包括安装和示例，详见Selenium教程。Selenium-Python中
C++中NULL等于啥奇妙之二进制嵌入式/Linux #C++编程法则 c++开发语言
文章目录**一、`NULL`的标准定义****二、常见实现方式**1.**定义为整数`0`**2.**定义为`0L`或`(void*)0`**（较少见）**三、与C语言的关键区别****四、`NULL`在C++中的问题**1.**重载函数匹配歧义**2.**模板参数推导错误****五、C++11+的替代方案：`nullptr`****六、最佳实践****七、总结**在C++中，NULL的定义与行为
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
每日mysql 卡卡卡卡罗特每日mysql mysql 数据库
什么是Mysql索引最左匹配原则？最左匹配原则是指，在复合索引中，查询条件需要从左到右和索引开始依次完全匹配的时候，复合索引才可以被有效使用。因为联合索引在建立b+树的过程中是根据索引的顺序从左到右进行排序的，所以使用的时候需要遵循这个原则。能否举例说明复合索引在查询时遵循最左匹配原则的情况假设有(name,age,city)这个复合索引，那么查询语句就得是：SELECT*FROMusersWHE
SQL server Merge into MERGE 语句试图多次更新或删除同一行。目标行与多个源行匹配时会出现这种情况。MERGE 语句无法多次更新/删除目标表的同一行。请简化 ON 子句， Favor_Yang SQL调优及高级SQL语法编写 Merge Into SQL sqlserver
SQLserverMergeinto的用法在匹配Using源表时，有时候会报异常消息8672，级别16，状态1，第1行MERGE语句试图多次更新或删除同一行。目标行与多个源行匹配时会出现这种情况。MERGE语句无法多次更新/删除目标表的同一行。请简化ON子句，针对这问题的解决办法一般是确保源表的on字段是唯一的。因为我们可以用distinct关键字，保证源表的On字段的唯一性。 mergeinto
SQL Server通过CLR连接InfluxDB实现异构数据关联查询技术指南 Favor_Yang SQL调优及高级SQL语法编写 SQL Server InfluxDB
一、背景与需求场景在工业物联网和金融监控场景中，实时时序数据（InfluxDB）需与业务元数据（SQLServer）联合分析：工业场景：设备传感器每秒采集温度、振动数据（InfluxDB），需关联工单状态、设备型号（SQLServer）金融场景：交易流水时序数据（每秒万条）需实时匹配客户风险等级、账户余额（SQLServer）核心痛点：传统ETL延迟高，无法满足实时风控/故障诊断需求，需实现毫秒级
【EGSR2025】材质+扩散模型+神经网络相关论文整理随笔（四） Superstarimage 文献随笔材质神经网络人工智能扩散模型
AnevaluationofSVBRDFPredictionfromGenerativeImageModelsforAppearanceModelingof3DScenes输入3D场景的几何和一张参考图像，通过扩散模型和SVBRDF预测器获取多视角的材质maps，这些maps最终合并成场景的纹理地图集，并支持在任意视角、任意光照条件下进行重新渲染。样例图如下：在当前时代的技术背景下，生成与几何匹配
SpringMVC参数校验（针对`@RequestBody`返回`400`） Ryan-Miao spring spring mvc
SpringMVC参数校验（针对@RequestBody返回400）前言习惯别人帮忙做事的结果是自己不会做事了。一直以来，spring帮我解决了程序运行中的各种问题，我只要关心我的业务逻辑，设计好我的业务代码，返回正确的结果即可。直到遇到了400。spring返回400的时候通常没有任何错误提示，当然也通常是参数不匹配。这在参数少的情况下还可以一眼看穿，但当参数很大是，排除参数也很麻烦，更何况，既
OpenCV入门到精通：从基础到实战的全面指南
摘要：本文旨在为初学者和有一定经验的开发者提供OpenCV从入门到精通的全面指南。文章首先介绍了OpenCV的基本概念和安装方法，然后深入讲解了图像处理基础、特征检测与匹配、视频处理与分析等核心内容，最后通过实战案例展示了OpenCV在计算机视觉任务中的应用。关键词：OpenCV；图像处理；特征检测；视频分析；实战案例引言OpenCV（OpenSourceComputerVisionLibrary
字典树前缀匹配 hi error.cn 经验分享
字典树前缀匹配什么是字典树（Trie）字典树（Trie），又称单词查找树或键树，是一种有序树结构的数据结构，常用于字符串关联查找的应用场景中。其主要特点是每个节点代表一个字符，并且从根到子节点的路径上的字符连起来构成所有在字典中的前缀。由于这种特性，字典树特别适合进行前缀匹配和自动补全等操作。字典树的基本结构字典树由节点（Node）和边（Edge）组成。每个节点表示一个字符或为空终结符，而边则代表
Gemini CLI 文件发现引擎深度解析：从模式匹配到智能搜索的架构演进步子哥智能涌现架构人工智能
前言在现代AI开发工具中，如何快速、准确地找到相关文件是一个基础而又重要的能力。今天我们将深入解析GeminiCLI中的GlobTool类——一个看似简单的文件搜索工具，实际上却承载着复杂的模式匹配、智能排序、Git集成等多重职责，展现了如何将传统的文件搜索演进为AI时代的智能文件发现系统。GlobTool的设计哲学核心设计理念GlobTool的设计体现了智能化文件发现¹的核心理念。它不仅仅是一个
React 中使用 ECharts 报错 "series not exists"
问题现象在React项目中使用ECharts时，控制台报错：seriesnotexists.Legenddatashouldbesamewithseriesnameordataname但已确认legend.data与series.name完全匹配，代码逻辑看似正确。问题根源未正确注册ECharts图表组件。自ECharts5起，官方采用按需引入（tree-shaking）的模块化设计，需显式注册图
XRDMatch代码复现与分析报告神经网络15044 大数据算法 python 神经网络人工智能深度学习网络 matlab
XRDMatch代码复现与分析报告1.项目概述XRDMatch是一个用于X射线衍射(XRD)数据匹配和分析的开源工具，由zhengwan-chem开发并托管在GitHub上。本项目旨在复现XRDMatch的核心功能，并对其实现进行详细分析。X射线衍射是材料科学中用于确定晶体结构的重要技术，通过分析衍射图谱可以获得材料的晶体结构信息。XRDMatch提供了一种有效的方法来匹配实验XRD图谱与参考图谱
基于SIFT-POCS的超分辨率图像重建技术研究与实现神经网络15044 算法深度学习仿真模型人工智能计算机视觉深度学习算法大数据机器学习
基于SIFT-POCS的超分辨率图像重建技术研究与实现摘要本文详细研究了基于SIFT特征匹配和POCS(ProjectionOntoConvexSets)算法的超分辨率图像重建方法，并完整实现了文献"Super-ResolutionImageReconstructionBasedonSIFT-POCS"中提出的算法。首先介绍了超分辨率重建的基本原理和研究意义，然后深入分析了SIFT特征提取与匹配、
土壤涂料材料耐火测试设备-太阳光模拟器 song15026537298 大数据
土壤涂料材料耐火测试设备概述土壤涂料材料的耐火测试通常涉及模拟高温或极端环境条件，以评估其防火性能、耐热性及稳定性。太阳光模拟器在此类测试中可用于模拟自然光照条件下的材料老化或热负荷反应。太阳光模拟器的核心功能太阳光模拟器通过氙灯或LED光源复现太阳光谱（包括紫外、可见光和红外波段），用于测试材料在光照下的耐火性能、热稳定性及抗老化能力。其关键参数包括：光谱匹配度：需符合国际标准（如IEC6090
Leetcode刷题笔记——栈篇 code_lover_forever Leetcode刷题笔记 leetcode 笔记算法 python
Leetcode刷题笔记——栈篇栈的简介栈是一种先进后出的数据结构(FirstInLastOut)，栈作为一种数据结构，是一种只能在一端进行插入和删除操作的特殊线性表，这里我不做过多介绍，栈的应用和练习算是面试中的高频考点了，接下来看下我们来看一下Leetcode关于栈的常见面试题题型，每道题都附上了简单明了的python解法，大家重点关注算法思想即可一、栈在括号匹配中的应用第一题：括号的最大嵌套
LeetCode Top100特训九筒- LeetCode 算法力扣
更新中……两数相加盛水最多的容器电话号码的字母组合删除链表的倒数第N个结点字母异位词分组寻找两个正序数组的中位数合并区间不同路径（与最小路径和类似）正则表达式匹配颜色分类单词搜索只出现一次的数字合并K个升序链表接雨水移除元素最长有效括号不同的二叉搜索树验证二叉搜索树对称二叉树从前序与中序遍历序列构造二叉树最长连续序列排序链表乘积最大子数组编辑距离最小栈最小覆盖子串计算右侧小于当前元素的个数柱状图中
身份认证C#集成方案-数字时代身份证实名认证利器 wt_cs 发票识别 c#开发语言
互联网时代，准确且高效的身份核验方式对于当下业务发展来说至关重要。身份证实名认证接口，宛如一位可靠的“数字卫士”强势登场，为各类需要精准身份认证的场景提供了坚实保障。身份证实名认证接口，实时联网通过将用户提供的身份证号码和姓名与权威数据库进行比对，瞬间便能返回是否匹配的结果。这一过程如同在庞大的信息海洋中精准定位，确保每一个身份信息都能得到准确核实，并支持身份证上的人像与权威数据库中的人像进行相似
OpenCV颜色矩哈希算法------cv::img_hash::ColorMomentHash
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述该类实现了颜色矩哈希算法（ColorMomentHash），用于图像相似性比较。它基于图像在HSV颜色空间中的颜色矩统计特征来生成哈希值，对颜色分布的变化具有较好的鲁棒性。适用于以下场景：图像检索图像去重水印检测色彩变化较大的图像匹配公共成员函数compute(I
YOLOv11模型轻量化挑战技术文章大纲程序猿全栈の董（董翔） github YOLOv11
模型轻量化的背景与意义目标检测模型YOLOv11的性能与应用场景轻量化的必要性：边缘设备部署、实时性需求、计算资源限制轻量化面临的挑战：精度与速度的权衡、模型压缩方法的选择YOLOv11的轻量化技术方向网络结构优化：深度可分离卷积、分组卷积、瓶颈设计模型剪枝：结构化剪枝与非结构化剪枝策略知识蒸馏：教师-学生模型框架与特征匹配方法量化与低比特压缩：FP16/INT8量化与二值化网络轻量化实现的具体方
智能防御原理和架构 hao_wujing 安全
大家读完觉得有帮助记得关注和点赞！智能防御系统通过**AI驱动的动态感知、主动决策与自治响应**构建自适应防护体系，其核心在于将被动规则匹配升级为**预测性威胁狩猎**，实现对新型攻击（如AI生成的0day漏洞利用）的有效遏制。以下从原理、架构到技术实现进行体系化拆解：---###⚙️核心防御原理####1.**多模态威胁感知**-**跨域数据融合**：-网络层：DPI深度包检测（如Zeek解析T
EDR、NDR、XDR工作原理和架构及区别 hao_wujing 安全
大家读完觉得有帮助记得关注和点赞！！！EDR、NDR、XDR是网络安全中关键的检测与响应技术，它们在覆盖范围、数据源和响应机制上有显著差异。以下是它们的工作原理和架构详解：---###一、EDR（端点检测与响应）####⚙️**工作原理**1.**数据采集**：在终端设备（PC、服务器等）部署代理，实时监控进程、文件操作、网络连接、注册表变更等行为数据。2.**威胁检测**：-**签名匹配**：比
解决idea中jsp使用内置对象标红的问题熬夜的大学生 intellij-idea tomcat java
如图使用session的方法会标红报错，session所在的包已经导入不是jar包的问题，网上的方法大部分都是导入jar包其实这不是问题所在本人本来使用的是JDK8+tomcat10tomcat10中提供的severletapi与jdk8不匹配下载tomcat9导入tomcat9中的jar包即可
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc