Darlingqiang

尺度空间理论与图像金字塔（二）

SIFT简介

整理一下方便阅读，作者写的东西摘自论文，在此感谢xiaowei等的贡献

DoG尺度空间构造（Scale-space extrema detection）http://blog.csdn.net/xiaowei_cqu/article/details/8067881
关键点搜索与定位（Keypoint localization）http://blog.csdn.net/xiaowei_cqu/article/details/8087239
方向赋值（Orientation assignment）http://blog.csdn.net/xiaowei_cqu/article/details/8096072
关键点描述（Keypoint descriptor）http://blog.csdn.net/xiaowei_cqu/article/details/8113565
OpenCV实现：特征检测器FeatureDetectorhttp://blog.csdn.net/xiaowei_cqu/article/details/8652096
SIFT中LoG和DoG的比较http://blog.csdn.net/xiaowei_cqu/article/details/27692123
DoG尺度空间构造

自然界中的物体随着观测尺度不同有不同的表现形态。例如我们形容建筑物用“米”，观测分子、原子等用“纳米”。更形象的例子比如Google地图，滑动鼠标轮可以改变观测地图的尺度，看到的地图绘制也不同；还有电影中的拉伸镜头等等……

尺度空间中各尺度图像的模糊程度逐渐变大，能够模拟人在距离目标由近到远时目标在视网膜上的形成过程。
尺度越大图像越模糊。

为什么要讨论尺度空间？

用机器视觉系统分析未知场景时，计算机并不预先知道图像中物体的尺度。我们需要同时考虑图像在多尺度下的描述，获知感兴趣物体的最佳尺度。另外如果不同的尺度下都有同样的关键点，那么在不同的尺度的输入图像下就都可以检测出来关键点匹配，也就是尺度不变性。

图像的尺度空间表达就是图像在所有尺度下的描述。

尺度空间表达与金字塔多分辨率表达

高斯模糊

高斯核是唯一可以产生多尺度空间的核（《Scale-space theory: A basic tool for analysing structures at different scales》）。一个图像的尺度空间L(x,y,σ) ,定义为原始图像I(x,y)与一个可变尺度的2维高斯函数G(x,y,σ)卷积运算。

二维空间高斯函数：

尺度空间：

尺度是自然客观存在的，不是主观创造的。高斯卷积只是表现尺度空间的一种形式。

二维空间高斯函数是等高线从中心成正太分布的同心圆：

分布不为零的点组成卷积阵与原始图像做变换，即每个像素值是周围相邻像素值的高斯平均。一个5*5的高斯模版如下所示：

高斯模版是圆对称的，且卷积的结果使原始像素值有最大的权重，距离中心越远的相邻像素值权重也越小。
在实际应用中，在计算高斯函数的离散近似时，在大概3σ距离之外的像素都可以看作不起作用，这些像素的计算也就可以忽略。所以，通常程序只计算(6σ+1)*(6σ+1)就可以保证相关像素影响。
高斯模糊另一个很厉害的性质就是线性可分：使用二维矩阵变换的高斯模糊可以通过在水平和竖直方向各进行一维高斯矩阵变换相加得到。

O(N^2*m*n)次乘法就缩减成了O(N*m*n)+O(N*m*n)次乘法。（N为高斯核大小，m,n为二维图像高和宽）

其实高斯这一部分只需要简单了解就可以了，在OpenCV也只需要一句代码：

[cpp] view plain copy
1. GaussianBlur(dbl, dbl, Size(), sig_diff, sig_diff);
我这里详写了一下是因为这块儿对分析算法效率比较有用，而且高斯模糊的算法真的很漂亮~

金字塔多分辨率

金字塔是早期图像多尺度的表示形式。图像金字塔化一般包括两个步骤：使用低通滤波器平滑图像；对平滑图像进行降采样（通常是水平，竖直方向1/2），从而得到一系列尺寸缩小的图像。

上图中（a）是对原始信号进行低通滤波，（b）是降采样得到的信号。

而对于二维图像，一个传统的金字塔中，每一层图像由上一层分辨率的长、宽各一半，也就是四分之一的像素组成：

多尺度和多分辨率

尺度空间表达和金字塔多分辨率表达之间最大的不同是：
- 尺度空间表达是由不同高斯核平滑卷积得到，在所有尺度上有相同的分辨率；
- 而金字塔多分辨率表达每层分辨率减少固定比率。
所以，金字塔多分辨率生成较快，且占用存储空间少；而多尺度表达随着尺度参数的增加冗余信息也变多。

多尺度表达的优点在于图像的局部特征可以用简单的形式在不同尺度上描述；而金字塔表达没有理论基础，难以分析图像局部特征。

DoG（Difference of Gaussian）

高斯拉普拉斯LoG金字塔

结合尺度空间表达和金字塔多分辨率表达，就是在使用尺度空间时使用金字塔表示，也就是计算机视觉中最有名的拉普拉斯金子塔（《The Laplacian pyramid as a compact image code》）。

高斯拉普拉斯LoG（Laplace of Guassian）算子就是对高斯函数进行拉普拉斯变换：

核心思想还是高斯，这个不多叙述。

高斯差分DoG金字塔

DoG（Difference of Gaussian）其实是对高斯拉普拉斯LoG的近似，也就是对的近似。SIFT算法建议，在某一尺度上的特征检测可以通过对两个相邻高斯尺度空间的图像相减，得到DoG的响应值图像D(x,y,σ)。然后仿照LoG方法，通过对响应值图像D(x,y,σ)进行局部最大值搜索，在空间位置和尺度空间定位局部特征点。其中：

k为相邻两个尺度空间倍数的常数。

上图中（a）是DoG的三维图，（b）是DoG与LoG的对比。

金字塔构建

构建高斯金字塔

为了得到DoG图像，先要构造高斯金字塔。我们回过头来继续说高斯金字塔~

高斯金字塔在多分辨率金字塔简单降采样基础上加了高斯滤波，也就是对金字塔每层图像用不同参数的σ做高斯模糊，使得每层金字塔有多张高斯模糊图像。金字塔每层多张图像合称为一组（Octave），每组有多张（也叫层Interval）图像。另外，降采样时，金字塔上边一组图像的第一张图像（最底层的一张）是由前一组（金字塔下面一组）图像的倒数第三张隔点采样得到。

以下是OpenCV中构建高斯金字塔的代码，我加了相应的注释：

[cpp] view plain copy
1. // 构建nOctaves组（每组nOctaves+3层）高斯金字塔
2. void SIFT::buildGaussianPyramid( const Mat& base, vector& pyr, int nOctaves ) const
3. {
4. vector<double> sig(nOctaveLayers + 3);
5. pyr.resize(nOctaves*(nOctaveLayers + 3));
7. // precompute Gaussian sigmas using the following formula:
8. // \sigma_{total}^2 = \sigma_{i}^2 + \sigma_{i-1}^2、
9. // 计算对图像做不同尺度高斯模糊的尺度因子
10. sig[0] = sigma;
11. double k = pow( 2., 1. / nOctaveLayers );
12. for( int i = 1; i < nOctaveLayers + 3; i++ )
13. {
14. double sig_prev = pow(k, (double)(i-1))*sigma;
15. double sig_total = sig_prev*k;
16. sig[i] = std::sqrt(sig_total*sig_total - sig_prev*sig_prev);
17. }
19. for( int o = 0; o < nOctaves; o++ )
20. {
21. // DoG金子塔需要nOctaveLayers+2层图像来检测nOctaves层尺度
22. // 所以高斯金字塔需要nOctaveLayers+3层图像得到nOctaveLayers+2层DoG金字塔
23. for( int i = 0; i < nOctaveLayers + 3; i++ )
24. {
25. // dst为第o组（Octave）金字塔
26. Mat& dst = pyr[o*(nOctaveLayers + 3) + i];
27. // 第0组第0层为原始图像
28. if( o == 0 && i == 0 )
29. dst = base;
31. // base of new octave is halved image from end of previous octave
32. // 每一组第0副图像时上一组倒数第三幅图像隔点采样得到
33. else if( i == 0 )
34. {
35. const Mat& src = pyr[(o-1)*(nOctaveLayers + 3) + nOctaveLayers];
36. resize(src, dst, Size(src.cols/2, src.rows/2),
37. 0, 0, INTER_NEAREST);
38. }
39. // 每一组第i副图像是由第i-1副图像进行sig[i]的高斯模糊得到
40. // 也就是本组图像在sig[i]的尺度空间下的图像
41. else
42. {
43. const Mat& src = pyr[o*(nOctaveLayers + 3) + i-1];
44. GaussianBlur(src, dst, Size(), sig[i], sig[i]);
45. }
46. }
47. }
48. }
高斯金字塔的组数为：

代码10-17行是计算高斯模糊的系数σ，具体关系如下：

其中，σ为尺度空间坐标，s为每组中层坐标，σ0为初始尺度，S为每组层数（一般为3~5）。根据这个公式，我们可以得到金字塔组内各层尺度以及组间各图像尺度关系。

组内相邻图像尺度关系：

相邻组间尺度关系：

所以，相邻两组的同一层尺度为2倍的关系。

最终尺度序列总结为：

o为金字塔组数，n为每组金字塔层数。

构建DoG金字塔

构建高斯金字塔之后，就是用金字塔相邻图像相减构造DoG金字塔。

下面为构造DoG的代码：

[cpp] view plain copy
1. // 构建nOctaves组（每组nOctaves+2层）高斯差分金字塔
2. void SIFT::buildDoGPyramid( const vector& gpyr, vector& dogpyr ) const
3. {
4. int nOctaves = (int)gpyr.size()/(nOctaveLayers + 3);
5. dogpyr.resize( nOctaves*(nOctaveLayers + 2) );
7. for( int o = 0; o < nOctaves; o++ )
8. {
9. for( int i = 0; i < nOctaveLayers + 2; i++ )
10. {
11. // 第o组第i副图像为高斯金字塔中第o组第i+1和i组图像相减得到
12. const Mat& src1 = gpyr[o*(nOctaveLayers + 3) + i];
13. const Mat& src2 = gpyr[o*(nOctaveLayers + 3) + i + 1];
14. Mat& dst = dogpyr[o*(nOctaveLayers + 2) + i];
15. subtract(src2, src1, dst, noArray(), CV_16S);
16. }
17. }
18. }
这个比较简单，就是一个subtract()函数。
尺度空间理论
由前一步《DoG尺度空间构造》，我们得到了DoG高斯差分金字塔：

如上图的金字塔，高斯尺度空间金字塔中每组有五层不同尺度图像，相邻两层相减得到四层DoG结果。关键点搜索就在这四层DoG图像上寻找局部极值点。

DoG局部极值点

寻找DoG极值点时，每一个像素点和它所有的相邻点比较，当其大于（或小于）它的图像域和尺度域的所有相邻点时，即为极值点。如下图所示，比较的范围是个3×3的立方体：中间的检测点和它同尺度的8个相邻点，以及和上下相邻尺度对应的9×2个点——共26个点比较，以确保在尺度空间和二维图像空间都检测到极值点。

在一组中，搜索从每组的第二层开始，以第二层为当前层，第一层和第三层分别作为立方体的的上下层；搜索完成后再以第三层为当前层做同样的搜索。所以每层的点搜索两次。通常我们将组Octaves索引以-1开始，则在比较时牺牲了-1组的第0层和第N组的最高层

高斯金字塔，DoG图像及极值计算的相互关系如上图所示。

二关键点精确定位

以上极值点的搜索是在离散空间进行搜索的，由下图可以看到，在离散空间找到的极值点不一定是真正意义上的极值点。可以通过对尺度空间DoG函数进行曲线拟合寻找极值点来减小这种误差。

利用DoG函数在尺度空间的Taylor展开式：

则极值点为：

程序中还除去了极值小于0.04的点。如下所示：

[cpp] view plain copy
1. // Detects features at extrema in DoG scale space. Bad features are discarded
2. // based on contrast and ratio of principal curvatures.
3. // 在DoG尺度空间寻特征点（极值点）
4. void SIFT::findScaleSpaceExtrema( const vector& gauss_pyr, const vector& dog_pyr,
5. vector& keypoints ) const
6. {
7. int nOctaves = (int)gauss_pyr.size()/(nOctaveLayers + 3);
9. // The contrast threshold used to filter out weak features in semi-uniform
10. // (low-contrast) regions. The larger the threshold, the less features are produced by the detector.
11. // 过滤掉弱特征的阈值 contrastThreshold默认为0.04
12. int threshold = cvFloor(0.5 * contrastThreshold / nOctaveLayers * 255 * SIFT_FIXPT_SCALE);
13. const int n = SIFT_ORI_HIST_BINS; //36
14. float hist[n];
15. KeyPoint kpt;
17. keypoints.clear();
19. for( int o = 0; o < nOctaves; o++ )
20. for( int i = 1; i <= nOctaveLayers; i++ )
21. {
22. int idx = o*(nOctaveLayers+2)+i;
23. const Mat& img = dog_pyr[idx];
24. const Mat& prev = dog_pyr[idx-1];
25. const Mat& next = dog_pyr[idx+1];
26. int step = (int)img.step1();
27. int rows = img.rows, cols = img.cols;
29. for( int r = SIFT_IMG_BORDER; r < rows-SIFT_IMG_BORDER; r++)
30. {
31. const short* currptr = img.ptr<short>(r);
32. const short* prevptr = prev.ptr<short>(r);
33. const short* nextptr = next.ptr<short>(r);
35. for( int c = SIFT_IMG_BORDER; c < cols-SIFT_IMG_BORDER; c++)
36. {
37. int val = currptr[c];
39. // find local extrema with pixel accuracy
40. // 寻找局部极值点，DoG中每个点与其所在的立方体周围的26个点比较
41. // if （val比所有都大或者 val比所有都小）
42. if( std::abs(val) > threshold &&
43. ((val > 0 && val >= currptr[c-1] && val >= currptr[c+1] &&
44. val >= currptr[c-step-1] && val >= currptr[c-step] &&
45. val >= currptr[c-step+1] && val >= currptr[c+step-1] &&
46. val >= currptr[c+step] && val >= currptr[c+step+1] &&
47. val >= nextptr[c] && val >= nextptr[c-1] &&
48. val >= nextptr[c+1] && val >= nextptr[c-step-1] &&
49. val >= nextptr[c-step] && val >= nextptr[c-step+1] &&
50. val >= nextptr[c+step-1] && val >= nextptr[c+step] &&
51. val >= nextptr[c+step+1] && val >= prevptr[c] &&
52. val >= prevptr[c-1] && val >= prevptr[c+1] &&
53. val >= prevptr[c-step-1] && val >= prevptr[c-step] &&
54. val >= prevptr[c-step+1] && val >= prevptr[c+step-1] &&
55. val >= prevptr[c+step] && val >= prevptr[c+step+1]) ||
56. (val < 0 && val <= currptr[c-1] && val <= currptr[c+1] &&
57. val <= currptr[c-step-1] && val <= currptr[c-step] &&
58. val <= currptr[c-step+1] && val <= currptr[c+step-1] &&
59. val <= currptr[c+step] && val <= currptr[c+step+1] &&
60. val <= nextptr[c] && val <= nextptr[c-1] &&
61. val <= nextptr[c+1] && val <= nextptr[c-step-1] &&
62. val <= nextptr[c-step] && val <= nextptr[c-step+1] &&
63. val <= nextptr[c+step-1] && val <= nextptr[c+step] &&
64. val <= nextptr[c+step+1] && val <= prevptr[c] &&
65. val <= prevptr[c-1] && val <= prevptr[c+1] &&
66. val <= prevptr[c-step-1] && val <= prevptr[c-step] &&
67. val <= prevptr[c-step+1] && val <= prevptr[c+step-1] &&
68. val <= prevptr[c+step] && val <= prevptr[c+step+1])))
69. {
70. int r1 = r, c1 = c, layer = i;
72. // 关键点精确定位
73. if( !adjustLocalExtrema(dog_pyr, kpt, o, layer, r1, c1,
74. nOctaveLayers, (float)contrastThreshold,
75. (float)edgeThreshold, (float)sigma) )
76. continue;
78. float scl_octv = kpt.size*0.5f/(1 << o);
79. // 计算梯度直方图
80. float omax = calcOrientationHist(
81. gauss_pyr[o*(nOctaveLayers+3) + layer],
82. Point(c1, r1),
83. cvRound(SIFT_ORI_RADIUS * scl_octv),
84. SIFT_ORI_SIG_FCTR * scl_octv,
85. hist, n);
86. float mag_thr = (float)(omax * SIFT_ORI_PEAK_RATIO);
87. for( int j = 0; j < n; j++ )
88. {
89. int l = j > 0 ? j - 1 : n - 1;
90. int r2 = j < n-1 ? j + 1 : 0;
92. if( hist[j] > hist[l] && hist[j] > hist[r2] && hist[j] >= mag_thr )
93. {
94. float bin = j + 0.5f * (hist[l]-hist[r2]) /
95. (hist[l] - 2*hist[j] + hist[r2]);
96. bin = bin < 0 ? n + bin : bin >= n ? bin - n : bin;
97. kpt.angle = (float)((360.f/n) * bin);
98. keypoints.push_back(kpt);
99. }
100. }
101. }
102. }
103. }
104. }
105. }
删除边缘效应

除了DoG响应较低的点，还有一些响应较强的点也不是稳定的特征点。DoG对图像中的边缘有较强的响应值，所以落在图像边缘的点也不是稳定的特征点。

一个平坦的DoG响应峰值在横跨边缘的地方有较大的主曲率，而在垂直边缘的地方有较小的主曲率。主曲率可以通过2×2的Hessian矩阵H求出：

D值可以通过求临近点差分得到。H的特征值与D的主曲率成正比，具体可参见Harris角点检测算法。

为了避免求具体的值，我们可以通过H将特征值的比例表示出来。令为最大特征值，为最小特征值，那么：

Tr(H)表示矩阵H的迹，Det(H)表示H的行列式。

令表示最大特征值与最小特征值的比值，则有：

上式与两个特征值的比例有关。随着主曲率比值的增加，也会增加。我们只需要去掉比率大于一定值的特征点。Lowe论文中去掉r=10的点。

[cpp] view plain copy
1. // Interpolates a scale-space extremum's location and scale to subpixel
2. // accuracy to form an image feature. Rejects features with low contrast.
3. // Based on Section 4 of Lowe's paper.
4. // 特征点精确定位
5. static bool adjustLocalExtrema( const vector& dog_pyr, KeyPoint& kpt, int octv,
6. int& layer, int& r, int& c, int nOctaveLayers,
7. float contrastThreshold, float edgeThreshold, float sigma )
8. {
9. const float img_scale = 1.f/(255*SIFT_FIXPT_SCALE);
10. const float deriv_scale = img_scale*0.5f;
11. const float second_deriv_scale = img_scale;
12. const float cross_deriv_scale = img_scale*0.25f;
14. float xi=0, xr=0, xc=0, contr;
15. int i = 0;
17. //三维子像元插值
18. for( ; i < SIFT_MAX_INTERP_STEPS; i++ )
19. {
20. int idx = octv*(nOctaveLayers+2) + layer;
21. const Mat& img = dog_pyr[idx];
22. const Mat& prev = dog_pyr[idx-1];
23. const Mat& next = dog_pyr[idx+1];
25. Vec3f dD((img.at<short>(r, c+1) - img.at<short>(r, c-1))*deriv_scale,
26. (img.at<short>(r+1, c) - img.at<short>(r-1, c))*deriv_scale,
27. (next.at<short>(r, c) - prev.at<short>(r, c))*deriv_scale);
29. float v2 = (float)img.at<short>(r, c)*2;
30. float dxx = (img.at<short>(r, c+1) +
31. img.at<short>(r, c-1) - v2)*second_deriv_scale;
32. float dyy = (img.at<short>(r+1, c) +
33. img.at<short>(r-1, c) - v2)*second_deriv_scale;
34. float dss = (next.at<short>(r, c) +
35. prev.at<short>(r, c) - v2)*second_deriv_scale;
36. float dxy = (img.at<short>(r+1, c+1) -
37. img.at<short>(r+1, c-1) - img.at<short>(r-1, c+1) +
38. img.at<short>(r-1, c-1))*cross_deriv_scale;
39. float dxs = (next.at<short>(r, c+1) -
40. next.at<short>(r, c-1) - prev.at<short>(r, c+1) +
41. prev.at<short>(r, c-1))*cross_deriv_scale;
42. float dys = (next.at<short>(r+1, c) -
43. next.at<short>(r-1, c) - prev.at<short>(r+1, c) +
44. prev.at<short>(r-1, c))*cross_deriv_scale;
46. Matx33f H(dxx, dxy, dxs,
47. dxy, dyy, dys,
48. dxs, dys, dss);
50. Vec3f X = H.solve(dD, DECOMP_LU);
52. xi = -X[2];
53. xr = -X[1];
54. xc = -X[0];
56. if( std::abs( xi ) < 0.5f && std::abs( xr ) < 0.5f && std::abs( xc ) < 0.5f )
57. break;
59. //将找到的极值点对应成像素（整数）
60. c += cvRound( xc );
61. r += cvRound( xr );
62. layer += cvRound( xi );
64. if( layer < 1 || layer > nOctaveLayers ||
65. c < SIFT_IMG_BORDER || c >= img.cols - SIFT_IMG_BORDER ||
66. r < SIFT_IMG_BORDER || r >= img.rows - SIFT_IMG_BORDER )
67. return false;
68. }
70. /* ensure convergence of interpolation */
71. // SIFT_MAX_INTERP_STEPS:插值最大步数，避免插值不收敛，程序中默认为5
72. if( i >= SIFT_MAX_INTERP_STEPS )
73. return false;
75. {
76. int idx = octv*(nOctaveLayers+2) + layer;
77. const Mat& img = dog_pyr[idx];
78. const Mat& prev = dog_pyr[idx-1];
79. const Mat& next = dog_pyr[idx+1];
80. Matx31f dD((img.at<short>(r, c+1) - img.at<short>(r, c-1))*deriv_scale,
81. (img.at<short>(r+1, c) - img.at<short>(r-1, c))*deriv_scale,
82. (next.at<short>(r, c) - prev.at<short>(r, c))*deriv_scale);
83. float t = dD.dot(Matx31f(xc, xr, xi));
85. contr = img.at<short>(r, c)*img_scale + t * 0.5f;
86. if( std::abs( contr ) * nOctaveLayers < contrastThreshold )
87. return false;
89. /* principal curvatures are computed using the trace and det of Hessian */
90. //利用Hessian矩阵的迹和行列式计算主曲率的比值
91. float v2 = img.at<short>(r, c)*2.f;
92. float dxx = (img.at<short>(r, c+1) +
93. img.at<short>(r, c-1) - v2)*second_deriv_scale;
94. float dyy = (img.at<short>(r+1, c) +
95. img.at<short>(r-1, c) - v2)*second_deriv_scale;
96. float dxy = (img.at<short>(r+1, c+1) -
97. img.at<short>(r+1, c-1) - img.at<short>(r-1, c+1) +
98. img.at<short>(r-1, c-1)) * cross_deriv_scale;
99. float tr = dxx + dyy;
100. float det = dxx * dyy - dxy * dxy;
102. //这里edgeThreshold可以在调用SIFT()时输入；
103. //其实代码中定义了 static const float SIFT_CURV_THR = 10.f 可以直接使用
104. if( det <= 0 || tr*tr*edgeThreshold >= (edgeThreshold + 1)*(edgeThreshold + 1)*det )
105. return false;
106. }
108. kpt.pt.x = (c + xc) * (1 << octv);
109. kpt.pt.y = (r + xr) * (1 << octv);
110. kpt.octave = octv + (layer << 8) + (cvRound((xi + 0.5)*255) << 16);
111. kpt.size = sigma*powf(2.f, (layer + xi) / nOctaveLayers)*(1 << octv)*2;
113. return true;
114. }
三方向赋值

OpenCV】SIFT原理与源码分析：方向赋值

由前一篇《关键点搜索与定位》，我们已经找到了关键点。为了实现图像旋转不变性，需要根据检测到的关键点局部图像结构为特征点方向赋值。也就是在findScaleSpaceExtrema()函数里看到的alcOrientationHist()语句：

[cpp] view plain copy
1. // 计算梯度直方图
2. float omax = calcOrientationHist(gauss_pyr[o*(nOctaveLayers+3) + layer],
3. Point(c1, r1),
4. cvRound(SIFT_ORI_RADIUS * scl_octv),
5. SIFT_ORI_SIG_FCTR * scl_octv,
6. hist, n);
我们使用图像的梯度直方图法求关键点局部结构的稳定方向。
梯度方向和幅值

在前文中，精确定位关键点后也找到改特征点的尺度值σ，根据这一尺度值，得到最接近这一尺度值的高斯图像：

使用有限差分，计算以关键点为中心，以3×1.5σ为半径的区域内图像梯度的幅角和幅值，公式如下：

梯度直方图

在完成关键点邻域内高斯图像梯度计算后，使用直方图统计邻域内像素对应的梯度方向和幅值。

有关直方图的基础知识可以参考《数字图像直方图》，可以看做是离散点的概率表示形式。此处方向直方图的核心是统计以关键点为原点，一定区域内的图像像素点对关键点方向生成所作的贡献。

梯度方向直方图的横轴是梯度方向角，纵轴是剃度方向角对应的梯度幅值累加值。梯度方向直方图将0°~360°的范围分为36个柱，每10°为一个柱。下图是从高斯图像上求取梯度，再由梯度得到梯度方向直方图的例图。

在计算直方图时，每个加入直方图的采样点都使用圆形高斯函数函数进行了加权处理，也就是进行高斯平滑。这主要是因为SIFT算法只考虑了尺度和旋转不变形，没有考虑仿射不变性。通过高斯平滑，可以使关键点附近的梯度幅值有较大权重，从而部分弥补没考虑仿射不变形产生的特征点不稳定。

通常离散的梯度直方图要进行插值拟合处理，以求取更精确的方向角度值。（这和《关键点搜索与定位》中插值的思路是一样的）。

关键点方向

直方图峰值代表该关键点处邻域内图像梯度的主方向，也就是该关键点的主方向。在梯度方向直方图中，当存在另一个相当于主峰值 80%能量的峰值时，则将这个方向认为是该关键点的辅方向。所以一个关键点可能检测得到多个方向，这可以增强匹配的鲁棒性。Lowe的论文指出大概有15%关键点具有多方向，但这些点对匹配的稳定性至为关键。

获得图像关键点主方向后，每个关键点有三个信息(x,y,σ,θ)：位置、尺度、方向。由此我们可以确定一个SIFT特征区域。通常使用一个带箭头的圆或直接使用箭头表示SIFT区域的三个值：中心表示特征点位置，半径表示关键点尺度（r=2.5σ）,箭头表示主方向。具有多个方向的关键点可以复制成多份，然后将方向值分别赋给复制后的关键点。如下图：

源码

[cpp] view plain copy
1. // Computes a gradient orientation histogram at a specified pixel
2. // 计算特定点的梯度方向直方图
3. static float calcOrientationHist( const Mat& img, Point pt, int radius,
4. float sigma, float* hist, int n )
5. {
6. //len：2r+1也就是以r为半径的圆（正方形）像素个数
7. int i, j, k, len = (radius*2+1)*(radius*2+1);
9. float expf_scale = -1.f/(2.f * sigma * sigma);
10. AutoBuffer<float> buf(len*4 + n+4);
11. float *X = buf, *Y = X + len, *Mag = X, *Ori = Y + len, *W = Ori + len;
12. float* temphist = W + len + 2;
14. for( i = 0; i < n; i++ )
15. temphist[i] = 0.f;
17. // 图像梯度直方图统计的像素范围
18. for( i = -radius, k = 0; i <= radius; i++ )
19. {
20. int y = pt.y + i;
21. if( y <= 0 || y >= img.rows - 1 )
22. continue;
23. for( j = -radius; j <= radius; j++ )
24. {
25. int x = pt.x + j;
26. if( x <= 0 || x >= img.cols - 1 )
27. continue;
29. float dx = (float)(img.at<short>(y, x+1) - img.at<short>(y, x-1));
30. float dy = (float)(img.at<short>(y-1, x) - img.at<short>(y+1, x));
32. X[k] = dx; Y[k] = dy; W[k] = (i*i + j*j)*expf_scale;
33. k++;
34. }
35. }
37. len = k;
39. // compute gradient values, orientations and the weights over the pixel neighborhood
40. exp(W, W, len);
41. fastAtan2(Y, X, Ori, len, true);
42. magnitude(X, Y, Mag, len);
44. // 计算直方图的每个bin
45. for( k = 0; k < len; k++ )
46. {
47. int bin = cvRound((n/360.f)*Ori[k]);
48. if( bin >= n )
49. bin -= n;
50. if( bin < 0 )
51. bin += n;
52. temphist[bin] += W[k]*Mag[k];
53. }
55. // smooth the histogram
56. // 高斯平滑
57. temphist[-1] = temphist[n-1];
58. temphist[-2] = temphist[n-2];
59. temphist[n] = temphist[0];
60. temphist[n+1] = temphist[1];
61. for( i = 0; i < n; i++ )
62. {
63. hist[i] = (temphist[i-2] + temphist[i+2])*(1.f/16.f) +
64. (temphist[i-1] + temphist[i+1])*(4.f/16.f) +
65. temphist[i]*(6.f/16.f);
66. }
68. // 得到主方向
69. float maxval = hist[0];
70. for( i = 1; i < n; i++ )
71. maxval = std::max(maxval, hist[i]);
73. return maxval;
74. }
四【OpenCV】SIFT原理与源码分析：关键点描述

《SIFT原理与源码分析》系列文章索引：http://blog.csdn.net/xiaowei_cqu/article/details/8069548

由前一篇《方向赋值》，为找到的关键点即SIFT特征点赋了值，包含位置、尺度和方向的信息。接下来的步骤是关键点描述，即用用一组向量将这个关键点描述出来，这个描述子不但包括关键点，也包括关键点周围对其有贡献的像素点。用来作为目标匹配的依据（所以描述子应该有较高的独特性，以保证匹配率），也可使关键点具有更多的不变特性，如光照变化、3D视点变化等。

SIFT描述子h(x,y,θ)是对关键点附近邻域内高斯图像梯度统计的结果，是一个三维矩阵，但通常用一个矢量来表示。矢量通过对三维矩阵按一定规律排列得到。

描述子采样区域

特征描述子与关键点所在尺度有关，因此对梯度的求取应在特征点对应的高斯图像上进行。将关键点附近划分成d×d个子区域，每个子区域尺寸为mσ个像元（d=4，m=3，σ为尺特征点的尺度值）。考虑到实际计算时需要双线性插值，故计算的图像区域为mσ(d+1)，再考虑旋转，则实际计算的图像区域为，如下图所示：

源码

[cpp] view plain copy
1. Point pt(cvRound(ptf.x), cvRound(ptf.y));
2. //计算余弦，正弦，CV_PI/180:将角度值转化为幅度值
3. float cos_t = cosf(ori*(float)(CV_PI/180));
4. float sin_t = sinf(ori*(float)(CV_PI/180));
5. float bins_per_rad = n / 360.f;
6. float exp_scale = -1.f/(d * d * 0.5f); //d:SIFT_DESCR_WIDTH 4
7. float hist_width = SIFT_DESCR_SCL_FCTR * scl; // SIFT_DESCR_SCL_FCTR: 3
8. // scl: size*0.5f
9. // 计算图像区域半径mσ(d+1)/2*sqrt(2)
10. // 1.4142135623730951f 为根号2
11. int radius = cvRound(hist_width * 1.4142135623730951f * (d + 1) * 0.5f);
12. cos_t /= hist_width;
13. sin_t /= hist_width;
区域坐标轴旋转

为了保证特征矢量具有旋转不变性，要以特征点为中心，在附近邻域内旋转θ角，即旋转为特征点的方向。

旋转后区域内采样点新的坐标为：

源码

[cpp] view plain copy
1. //计算采样区域点坐标旋转
2. for( i = -radius, k = 0; i <= radius; i++ )
3. for( j = -radius; j <= radius; j++ )
4. {
5. /*
6. Calculate sample's histogram array coords rotated relative to ori.
7. Subtract 0.5 so samples that fall e.g. in the center of row 1 (i.e.
8. r_rot = 1.5) have full weight placed in row 1 after interpolation.
9. */
10. float c_rot = j * cos_t - i * sin_t;
11. float r_rot = j * sin_t + i * cos_t;
12. float rbin = r_rot + d/2 - 0.5f;
13. float cbin = c_rot + d/2 - 0.5f;
14. int r = pt.y + i, c = pt.x + j;
16. if( rbin > -1 && rbin < d && cbin > -1 && cbin < d &&
17. r > 0 && r < rows - 1 && c > 0 && c < cols - 1 )
18. {
19. float dx = (float)(img.at<short>(r, c+1) - img.at<short>(r, c-1));
20. float dy = (float)(img.at<short>(r-1, c) - img.at<short>(r+1, c));
21. X[k] = dx; Y[k] = dy; RBin[k] = rbin; CBin[k] = cbin;
22. W[k] = (c_rot * c_rot + r_rot * r_rot)*exp_scale;
23. k++;
24. }
25. }
计算采样区域梯度直方图

将旋转后区域划分为d×d个子区域（每个区域间隔为mσ像元），在子区域内计算8个方向的梯度直方图，绘制每个方向梯度方向的累加值，形成一个种子点。

与求主方向不同的是，此时，每个子区域梯度方向直方图将0°~360°划分为8个方向区间，每个区间为45°。即每个种子点有8个方向区间的梯度强度信息。由于存在d×d，即4×4个子区域，所以最终共有4×4×8=128个数据，形成128维SIFT特征矢量。

对特征矢量需要加权处理，加权采用mσd/2的标准高斯函数。为了除去光照变化影响，还有一步归一化处理。

源码

[cpp] view plain copy
1. //计算梯度直方图
2. for( k = 0; k < len; k++ )
3. {
4. float rbin = RBin[k], cbin = CBin[k];
5. float obin = (Ori[k] - ori)*bins_per_rad;
6. float mag = Mag[k]*W[k];
8. int r0 = cvFloor( rbin );
9. int c0 = cvFloor( cbin );
10. int o0 = cvFloor( obin );
11. rbin -= r0;
12. cbin -= c0;
13. obin -= o0;
15. //n为SIFT_DESCR_HIST_BINS：8，即将360°分为8个区间
16. if( o0 < 0 )
17. o0 += n;
18. if( o0 >= n )
19. o0 -= n;
22. // histogram update using tri-linear interpolation
23. // 双线性插值
24. float v_r1 = mag*rbin, v_r0 = mag - v_r1;
25. float v_rc11 = v_r1*cbin, v_rc10 = v_r1 - v_rc11;
26. float v_rc01 = v_r0*cbin, v_rc00 = v_r0 - v_rc01;
27. float v_rco111 = v_rc11*obin, v_rco110 = v_rc11 - v_rco111;
28. float v_rco101 = v_rc10*obin, v_rco100 = v_rc10 - v_rco101;
29. float v_rco011 = v_rc01*obin, v_rco010 = v_rc01 - v_rco011;
30. float v_rco001 = v_rc00*obin, v_rco000 = v_rc00 - v_rco001;
32. int idx = ((r0+1)*(d+2) + c0+1)*(n+2) + o0;
33. hist[idx] += v_rco000;
34. hist[idx+1] += v_rco001;
35. hist[idx+(n+2)] += v_rco010;
36. hist[idx+(n+3)] += v_rco011;
37. hist[idx+(d+2)*(n+2)] += v_rco100;
38. hist[idx+(d+2)*(n+2)+1] += v_rco101;
39. hist[idx+(d+3)*(n+2)] += v_rco110;
40. hist[idx+(d+3)*(n+2)+1] += v_rco111;
41. }
关键点描述源码

[cpp] view plain copy
1. // SIFT关键点特征描述
2. // SIFT描述子是关键点领域高斯图像提取统计结果的一种表示
3. static void calcSIFTDescriptor( const Mat& img, Point2f ptf, float ori, float scl,
4. int d, int n, float* dst )
6. {
7. Point pt(cvRound(ptf.x), cvRound(ptf.y));
8. //计算余弦，正弦，CV_PI/180:将角度值转化为幅度值
9. float cos_t = cosf(ori*(float)(CV_PI/180));
10. float sin_t = sinf(ori*(float)(CV_PI/180));
11. float bins_per_rad = n / 360.f;
12. float exp_scale = -1.f/(d * d * 0.5f); //d:SIFT_DESCR_WIDTH 4
13. float hist_width = SIFT_DESCR_SCL_FCTR * scl; // SIFT_DESCR_SCL_FCTR: 3
14. // scl: size*0.5f
15. // 计算图像区域半径mσ(d+1)/2*sqrt(2)
16. // 1.4142135623730951f 为根号2
17. int radius = cvRound(hist_width * 1.4142135623730951f * (d + 1) * 0.5f);
18. cos_t /= hist_width;
19. sin_t /= hist_width;
21. int i, j, k, len = (radius*2+1)*(radius*2+1), histlen = (d+2)*(d+2)*(n+2);
22. int rows = img.rows, cols = img.cols;
24. AutoBuffer<float> buf(len*6 + histlen);
25. float *X = buf, *Y = X + len, *Mag = Y, *Ori = Mag + len, *W = Ori + len;
26. float *RBin = W + len, *CBin = RBin + len, *hist = CBin + len;
28. //初始化直方图
29. for( i = 0; i < d+2; i++ )
30. {
31. for( j = 0; j < d+2; j++ )
32. for( k = 0; k < n+2; k++ )
33. hist[(i*(d+2) + j)*(n+2) + k] = 0.;
34. }
36. //计算采样区域点坐标旋转
37. for( i = -radius, k = 0; i <= radius; i++ )
38. for( j = -radius; j <= radius; j++ )
39. {
40. /*
41. Calculate sample's histogram array coords rotated relative to ori.
42. Subtract 0.5 so samples that fall e.g. in the center of row 1 (i.e.
43. r_rot = 1.5) have full weight placed in row 1 after interpolation.
44. */
45. float c_rot = j * cos_t - i * sin_t;
46. float r_rot = j * sin_t + i * cos_t;
47. float rbin = r_rot + d/2 - 0.5f;
48. float cbin = c_rot + d/2 - 0.5f;
49. int r = pt.y + i, c = pt.x + j;
51. if( rbin > -1 && rbin < d && cbin > -1 && cbin < d &&
52. r > 0 && r < rows - 1 && c > 0 && c < cols - 1 )
53. {
54. float dx = (float)(img.at<short>(r, c+1) - img.at<short>(r, c-1));
55. float dy = (float)(img.at<short>(r-1, c) - img.at<short>(r+1, c));
56. X[k] = dx; Y[k] = dy; RBin[k] = rbin; CBin[k] = cbin;
57. W[k] = (c_rot * c_rot + r_rot * r_rot)*exp_scale;
58. k++;
59. }
60. }
62. len = k;
63. fastAtan2(Y, X, Ori, len, true);
64. magnitude(X, Y, Mag, len);
65. exp(W, W, len);
68. //计算梯度直方图
69. for( k = 0; k < len; k++ )
70. {
71. float rbin = RBin[k], cbin = CBin[k];
72. float obin = (Ori[k] - ori)*bins_per_rad;
73. float mag = Mag[k]*W[k];
75. int r0 = cvFloor( rbin );
76. int c0 = cvFloor( cbin );
77. int o0 = cvFloor( obin );
78. rbin -= r0;
79. cbin -= c0;
80. obin -= o0;
82. //n为SIFT_DESCR_HIST_BINS：8，即将360°分为8个区间
83. if( o0 < 0 )
84. o0 += n;
85. if( o0 >= n )
86. o0 -= n;
89. // histogram update using tri-linear interpolation
90. // 双线性插值
91. float v_r1 = mag*rbin, v_r0 = mag - v_r1;
92. float v_rc11 = v_r1*cbin, v_rc10 = v_r1 - v_rc11;
93. float v_rc01 = v_r0*cbin, v_rc00 = v_r0 - v_rc01;
94. float v_rco111 = v_rc11*obin, v_rco110 = v_rc11 - v_rco111;
95. float v_rco101 = v_rc10*obin, v_rco100 = v_rc10 - v_rco101;
96. float v_rco011 = v_rc01*obin, v_rco010 = v_rc01 - v_rco011;
97. float v_rco001 = v_rc00*obin, v_rco000 = v_rc00 - v_rco001;
99. int idx = ((r0+1)*(d+2) + c0+1)*(n+2) + o0;
100. hist[idx] += v_rco000;
101. hist[idx+1] += v_rco001;
102. hist[idx+(n+2)] += v_rco010;
103. hist[idx+(n+3)] += v_rco011;
104. hist[idx+(d+2)*(n+2)] += v_rco100;
105. hist[idx+(d+2)*(n+2)+1] += v_rco101;
106. hist[idx+(d+3)*(n+2)] += v_rco110;
107. hist[idx+(d+3)*(n+2)+1] += v_rco111;
108. }
110. // finalize histogram, since the orientation histograms are circular
111. // 最后确定直方图，目标方向直方图是圆的
112. for( i = 0; i < d; i++ )
113. for( j = 0; j < d; j++ )
114. {
115. int idx = ((i+1)*(d+2) + (j+1))*(n+2);
116. hist[idx] += hist[idx+n];
117. hist[idx+1] += hist[idx+n+1];
118. for( k = 0; k < n; k++ )
119. dst[(i*d + j)*n + k] = hist[idx+k];
120. }
121. // copy histogram to the descriptor,
122. // apply hysteresis thresholding
123. // and scale the result, so that it can be easily converted
124. // to byte array
125. float nrm2 = 0;
126. len = d*d*n;
127. for( k = 0; k < len; k++ )
128. nrm2 += dst[k]*dst[k];
129. float thr = std::sqrt(nrm2)*SIFT_DESCR_MAG_THR;
130. for( i = 0, nrm2 = 0; i < k; i++ )
131. {
132. float val = std::min(dst[i], thr);
133. dst[i] = val;
134. nrm2 += val*val;
135. }
136. nrm2 = SIFT_INT_DESCR_FCTR/std::max(std::sqrt(nrm2), FLT_EPSILON);
137. for( k = 0; k < len; k++ )
138. {
139. dst[k] = saturate_cast(dst[k]*nrm2);
140. }
141. }
五【OpenCV】特征检测器 FeatureDetector

OpenCV提供FeatureDetector实现特征检测及匹配

[cpp] view plain copy
1. class CV_EXPORTS FeatureDetector
2. {
3. public:
4. virtual ~FeatureDetector();
5. void detect( const Mat& image, vector& keypoints,
6. const Mat& mask=Mat() ) const;
7. void detect( const vector& images,
8. vector >& keypoints,
9. const vector& masks=vector() ) const;
10. virtual void read(const FileNode&);
11. virtual void write(FileStorage&) const;
12. static Ptr create( const string& detectorType );
13. protected:
14. ...
15. };
FeatureDetetor是虚类，通过定义FeatureDetector的对象可以使用多种特征检测方法。通过create()函数调用：

[cpp] view plain copy
1. Ptr FeatureDetector::create(const string& detectorType);
OpenCV 2.4.3提供了10种特征检测方法：
- "FAST" – FastFeatureDetector
- "STAR" – StarFeatureDetector
- "SIFT" – SIFT (nonfree module)
- "SURF" – SURF (nonfree module)
- "ORB" – ORB
- "MSER" – MSER
- "GFTT" – GoodFeaturesToTrackDetector
- "HARRIS" – GoodFeaturesToTrackDetector with Harris detector enabled
- "Dense" – DenseFeatureDetector
- "SimpleBlob" – SimpleBlobDetector
图片中的特征大体可分为三种：点特征、线特征、块特征。

FAST算法是Rosten提出的一种快速提取的点特征[1]，Harris与GFTT也是点特征，更具体来说是角点特征（参考这里）。

SimpleBlob是简单块特征，可以通过设置SimpleBlobDetector的参数决定提取图像块的主要性质，提供5种：

颜色 By color、面积 By area、圆形度 By circularity、最大inertia （不知道怎么翻译）与最小inertia的比例 By ratio of the minimum inertia to maximum inertia、以及凸性 By convexity.

最常用的当属SIFT，尺度不变特征匹配算法（参考这里）；以及后来发展起来的SURF，都可以看做较为复杂的块特征。这两个算法在OpenCV nonfree的模块里面，需要在附件引用项中添加opencv_nonfree243.lib，同时在代码中加入：

[cpp] view plain copy
1. initModule_nonfree();
至于其他几种算法，我就不太了解了 ^_^

一个简单的使用演示：

[cpp] view plain copy
1. int main()
2. {
4. initModule_nonfree();//if use SIFT or SURF
5. Ptr detector = FeatureDetector::create( "SIFT" );
6. Ptr descriptor_extractor = DescriptorExtractor::create( "SIFT" );
7. Ptr descriptor_matcher = DescriptorMatcher::create( "BruteForce" );
8. if( detector.empty() || descriptor_extractor.empty() )
9. throw runtime_error("fail to create detector!");
11. Mat img1 = imread("images\\box_in_scene.png");
12. Mat img2 = imread("images\\box.png");
14. //detect keypoints;
15. vector keypoints1,keypoints2;
16. detector->detect( img1, keypoints1 );
17. detector->detect( img2, keypoints2 );
18. cout <<"img1:"<< keypoints1.size() << " points img2:" <
19. << " points" << endl << ">" << endl;
21. //compute descriptors for keypoints;
22. cout << "< Computing descriptors for keypoints from images..." << endl;
23. Mat descriptors1,descriptors2;
24. descriptor_extractor->compute( img1, keypoints1, descriptors1 );
25. descriptor_extractor->compute( img2, keypoints2, descriptors2 );
27. cout<"Descriptors Size: "<" >"<
28. cout<"Descriptor's Column: "<
29. <<"Descriptor's Row: "<
30. cout << ">" << endl;
32. //Draw And Match img1,img2 keypoints
33. Mat img_keypoints1,img_keypoints2;
34. drawKeypoints(img1,keypoints1,img_keypoints1,Scalar::all(-1),0);
35. drawKeypoints(img2,keypoints2,img_keypoints2,Scalar::all(-1),0);
36. imshow("Box_in_scene keyPoints",img_keypoints1);
37. imshow("Box keyPoints",img_keypoints2);
39. descriptor_extractor->compute( img1, keypoints1, descriptors1 );
40. vector matches;
41. descriptor_matcher->match( descriptors1, descriptors2, matches );
43. Mat img_matches;
44. drawMatches(img1,keypoints1,img2,keypoints2,matches,img_matches,Scalar::all(-1),CV_RGB(255,255,255),Mat(),4);
46. imshow("Mathc",img_matches);
47. waitKey(10000);
48. return 0;
49. }
特征检测结果如图：

Box_in_scene

Box

特征点匹配结果：

Match

另一点需要一提的是SimpleBlob的实现是有Bug的。不能直接通过 Ptr detector = FeatureDetector::create("SimpleBlob"); 语句来调用，而应该直接创建 SimpleBlobDetector的对象：

[cpp] view plain copy
1. Mat image = imread("images\\features.jpg");
2. Mat descriptors;
3. vector keypoints;
4. SimpleBlobDetector::Params params;
5. //params.minThreshold = 10;
6. //params.maxThreshold = 100;
7. //params.thresholdStep = 10;
8. //params.minArea = 10;
9. //params.minConvexity = 0.3;
10. //params.minInertiaRatio = 0.01;
11. //params.maxArea = 8000;
12. //params.maxConvexity = 10;
13. //params.filterByColor = false;
14. //params.filterByCircularity = false;
15. SimpleBlobDetector blobDetector( params );
16. blobDetector.create("SimpleBlob");
17. blobDetector.detect( image, keypoints );
18. drawKeypoints(image, keypoints, image, Scalar(255,0,0));
以下是SimpleBlobDetector按颜色检测的图像特征：

六计算机视觉】SIFT中LoG和DoG比较

实际计算时，三种方法计算的金字塔组数noctaves，尺度空间坐标σ，以及每组金字塔内的层数S是一样的。同时，假设图像为640*480的标准图像。

金字塔层数：

其中o_min = 0，对于分辨率为640*480的图像N=5。

每组金字塔内图像数：
S=3，即在做极值检测时使用金子塔内中间3张图像。
对于LoG每组金字塔内有S+2张图像（S=-1，0,1,2,3），需要做S+1次高斯模糊操作（后一张图像由前一张做高斯模糊得到）；而DoG每组金字塔有S+3张高斯图像，得到S+2张DoG图像。
尺度空间系数：

其中，S表示每组金字塔内图像层数，n为当前高斯层数，取0-4。DoG需要5个尺度系数得到6张GSS图像，而LoG只需要前4个尺度系数得到5张图像。

LoG

高斯核使用正太分布（高斯函数）计算模糊模版，N维空间正太分布方程为：

于是，二维高斯模板上的距离中心点为(x,y)的元素对应高斯计算公式为：

规范化的高斯拉普拉斯图像为

最终构造LoG金字塔有5层，每层有S+2=5张图像，每层金字塔内每张图像尺度是前一张的k倍，即构成的连续尺度序列：

其中o为当前金字塔层数，n为在当前金字塔层中图像张数。
由于卷积计算性质：

在计算时，通过对前一张图像做尺度系数为的卷积操作，可以减少卷积计算次数。故在金字塔每层内的S+2张图像，需要S+1次卷积操作，每次LoG核的尺度系数为：

图1. LoG金字塔示意图。左侧为图像尺度空间系数，红色矩形框为实际参与比较的空间系数，右侧为在上一张图像做LoG卷积操作的尺度系数

DoG

由于LoG与Gauss核具有如下关系：

即，

因此，LoG算子可以用高斯差分算子DoG（Difference of Guassians）表示。

于是通过高斯金字塔每层内相邻两张图像相减可以得到DoG金字塔。对于最后需要S张图像寻找极值点，需要S+2张DoG图像，S+3张高斯图像。具体关系如图2.所示。

图 2. 由高斯金字塔得到DoG金字塔及其对应的尺度空间系数示意图。

LoG & DoG

一个直观的比较结果，使用分别计算LoG和DoG，得到：

可以看到，LoG比DoG明显需要更多的加法运算和乘法运算。虽然DoG需要在每层金字塔多做一次高斯操作（即为了得到S+2张DoG图需要S+3张高斯模糊图），但通过减法取代LoG核的计算过程，显著减少了运算次数，大大节省了运算时间。

你可能感兴趣的:(ORB,尺度空间理论,图像金字塔,多尺度空间)

大白话解释深度学习中多尺度特征融合及其意义来自宇宙的曹先生深度学习人工智能
想象一下，你正在看一幅城市街道的照片。在这张照片中，你可能会看到：远处的小汽车，它们在图像中看起来很小。近处的大巴士，它们在图像中看起来很大。还有一些行人，他们可能在不同的距离上，大小各异。假设你想训练一个计算机程序来识别和分割这些不同的物体（汽车、巴士、行人）。如果这个程序只能在一个固定的尺度上“看”图像，比如说只能处理大物体，它可能会错过那些远处的小汽车，因为这些小汽车在图像中占据的像素很少。
Pod调度、嵌入式脚本、Pod标签管理 yanjiaweiya 云原生 kubernetes 容器
多容器Pod案例3排错[root@master~]#vimweb2.yaml---kind:PodapiVersion:v1metadata:name:web2namespace:defaultspec:containers:-name:nginximage:myos:nginx-name:apacheimage:myos:httpdstatus:{}[root@master~]#kubectla
fcpx音视频剪辑编辑 Final Cut Pro X（Mac电脑） fengyun2891 macos mac
fcpx一款专业的视频剪辑工具，专为苹果用户设计。它具备强大的视频剪辑、音轨、图形特效和调色功能，支持整片输出，提升创作效率。经过Apple芯片优化，利用Metal引擎动力，可处理更复杂的项目，并支持高分辨率视频格式，并提供了多种高级功能，例如多摄像头编辑、音频混合、色彩校正、视觉特效和动画等。原文地址：macFinalCutProXMacfcpx音视频剪辑编辑工具
企业级多模型服务架构（MaaS）私有部署实战指南：统一调度、模型隔离与服务编排全路径解析观熵架构人工智能私有化部署
企业级多模型服务架构（MaaS）私有部署实战指南：统一调度、模型隔离与服务编排全路径解析关键词：多模型服务架构、MaaS、私有化部署、模型管理、推理调度、模型编排、TritonInferenceServer、DeepSeek、模型隔离、企业级AI平台摘要：随着企业对多任务、多模型能力的需求日益增长，MaaS（Model-as-a-Service）架构已成为私有部署中的关键支撑技术之一。该文聚焦当前
汇编语言:基于x86处理器第一章习题解答「已注销」 Linux 内核资深专家 arm
汇编语言习题解答习题解答1.1.3本节回顾习题解答1.1.3本节回顾1、汇编器和链接器是如何一起工作的？汇编程序要转化为可执行程序，需要先译码后组合。这是因为一个完整的汇编程序常常是由多个文件构成，先用汇编器将每一个文件中的汇编代码转化为机器语言后，链接器再把这些文件组合成一个可执行程序。2、学习汇编语言如何能提高你对操作系统的理解？可用汇编语言验证操作系统的理论知识，从而更深刻的掌握操作系统3、
C#配置全面详解：从传统方式到现代配置系统阿蒙Armon C#工作中的应用 c#网络数据库
C#配置全面详解：从传统方式到现代配置系统在软件开发中，配置是指应用程序运行时可调整的参数集合，如数据库连接字符串、API地址、日志级别等。将这些参数从代码中分离出来，便于在不修改代码的情况下调整应用行为。C#提供了多种配置管理方式，从传统的XML配置文件到现代的多源配置系统，每种方式都有其适用场景。本文将全面介绍C#中的配置技术，帮助开发者根据项目需求选择合适的配置方案。一、配置基础与核心概念1
Python打卡：Day46 剑桥折刀s python打卡 python
importtorchimporttorch.nnasnnimporttorch.optimasoptimimporttorchvisionfromtorchvisionimportdatasets,transformsfromtorch.utils.dataimportDataLoaderfromtorch.utils.tensorboardimportSummaryWriterimportnu
软考（软件设计师）数据库原理-数据库规范化理论，四大范式，完整性约束
关系数据库规范化理论，四大范式，完整性约束关系数据库规范化是一种组织数据库表结构和字段的技术，目的是减少数据冗余、消除更新异常，并确保数据依赖的合理性。一、范式基本概念范式（NormalForm）是符合某一种级别的关系模式的集合，分为1NF、2NF、3NF、BCNF、4NF、5NF等，级别越高约束越严格。二、各范式详细说明1.第一范式（1NF）要求：表中每个字段都是原子性的，不可再分每个字段具有相
Flutter 类似onResume 监听，解决入场动画卡顿(2) bawomingtian123 flutter
接着完善上一篇内容，上一篇我们是能监听到初次进入路由页面节点，往往还想监听从当前路由跳转到其他路由后，再返回到当前路由页面，上一篇内容就无法满足当前需求了，不过我们完全可以按照上一篇的原理实现这个需求。直接上代码///@authorbawomingtian///@date2023/10/16///@desc通过监听路由入场动画完成，判断路由完全进入，可以用来优化在进场动画执行过程中///异步请求数
Java 实现后端调用 Chromium 浏览器无头模式截图的方案一只帆記 Java SpringBoot java 开发语言
Java实现后端调用Chromium浏览器无头模式截图的方案1.使用Playwright优点：功能强大、支持多浏览器（Chromium/Firefox/WebKit）、支持异步操作。实现方式：利用Playwright创建无头浏览器实例；使用Java的调度任务框架（如ScheduledExecutorService）定时触发截图逻辑。示例代码结构：ScheduledExecutorServicesc
AI智能体长期记忆系统架构设计与落地实践：从理论到生产部署一休哥助手人工智能人工智能
摘要长期记忆能力是AI智能体实现持续个性化服务的核心瓶颈。本文基于Mem0、MemoryOS等前沿研究，系统解析长期记忆系统的三级架构、六大原子操作与生产级优化方案，结合金融、医疗等场景案例，通过7张架构图与4张对比表格，揭示如何实现91%延迟降低与90%成本节约的企业级记忆系统。全文超6000字，提供可落地的架构范式。1长期记忆：AI智能体的认知基石1.1人类记忆与AI记忆的类比情景记忆语义记忆
30个网络抓包/调试工具-IT运维与网络工程师必会，从零基础到精通，收藏这篇就够了！程序员羊羊黑客网安工程师网络安全网络运维安全数据库压力测试 web安全
运维老兵都知道，网络抓包这活儿，就像给网络做CT，透视内部问题。但工具再多，用不对也是白搭。今天咱就来聊聊30款抓包/调试“神器”，别再只会用Wireshark了！一、协议分析工具：别光看表面，还得懂“潜台词”Wireshark：老牌劲旅，但别迷信它简介：开源界的扛把子，协议分析界的“瑞士军刀”，跨平台支持是基本操作。特点：协议多？那是必须的，2000+协议解析，过滤表达式（tcp.port==8
文献分享: 注释数据库＆溯源半环理论(Part2) Dann Hiroaki 文献阅读笔记数据库抽象代数
文章目录3.\textbf{3.}3.处理递归查询:基于Datalog\textbf{Datalog}Datalog3.1.\textbf{3.1.}3.1.关于Datalog\textbf{Datalog}Datalog3.1.1.\textbf{3.1.1.}3.1.1.Datalog\textbf{Datalog}Datalog基本结构3.1.2.Datalog\textbf{3.1.2.}
Django多表查询(ORM) 八九燕来 django 数据库 python
1、建立表结构三个表：book、Author、publisher。书籍和作者是多对多的关系，一本书可以有多个作者，一个作者可以有多本书。出版社和书籍是一对多的关系，一个出版社可以出版多本书（多方，多方定义外键），一本书只能由某一个出版社出版（现实情况可能不同，只是我们这里这样规定。）fromdjango.dbimportmodels#Createyourmodelshere.classBook(m
【AI论文】基于图像思维的多模态推理：理论基础、方法及未来前沿东临碣石82 人工智能
摘要：近期，文本思维链（Chain-of-Thought，CoT）显著推动了多模态推理的进展。在这一范式下，模型在语言层面进行推理。然而，这种以文本为中心的方法将视觉信息视为静态的初始语境，从而在丰富的感知数据与离散的符号思维之间造成了根本性的“语义鸿沟”。人类认知往往超越语言的局限，将视觉作为动态的心理草图板加以利用。如今，人工智能领域也正经历着类似的演变，标志着从仅能对图像进行思考的模型向真正
【深度学习新浪潮】什么是上下文长度？小米玄戒Andrew 深度学习新浪潮深度学习人工智能 LLM 语言模型大模型模型优化上下文长度
大型语言模型（LLM）的上下文长度是指模型在处理当前输入时能够有效利用的历史文本长度，通常以token（如单词、子词或标点）为单位衡量。例如，GPT-4支持128Ktoken的上下文，而Llama4Scout甚至达到了10Mtoken的惊人规模。这一指标直接影响模型在长文档理解、多轮对话等复杂任务中的表现。一、上下文长度的合理范围上下文长度的选择需结合具体应用场景：日常对话：通常需要8K–32Kt
DeepSeek 帮助自己的工作
引言简述人工智能助手在职场中的普及趋势DeepSeek作为智能创作助手的核心功能概述DeepSeek的核心能力信息检索与整合：基于用户意图精准搜索并生成答案多场景应用：技术文档撰写、数据分析、代码生成等交互优化：遵循用户指定的格式与内容规范职场应用场景与实操案例技术文档撰写自动生成API文档框架根据需求补充技术细节示例代码块与公式的规范化输出数据分析支持快速检索行业数据并生成可视化建议数学建模中的
【DeepSeek实战】17、MCP地图服务集成全景指南：高德、百度、腾讯三大平台接入实战
引言：为什么MCP是地图服务的下一代革命？在数字化时代，位置服务已成为电商、出行、物流等行业的核心基础设施。但单一地图服务商的局限性日益凸显：某外卖平台因高德地图API突发故障导致30分钟订单配送延迟，某打车软件因百度地图路线规划偏差引发用户投诉激增，某物流企业因腾讯地图POI数据不全导致仓库定位错误……这些问题的根源，在于缺乏一套能统一管理多地图服务的智能平台。MCP（地图控制平台）应运而生。它
【学习教程】遥感、GIS和GPS技术在水文、气象、灾害、生态、环境及卫生等领域中的应用
【内容简介】：第一讲3S技术及软件简介1.13S技术及应用案例文献解析1.23S技术软件（ArcGIS、ENVI）简介1.3如何快速掌握ArcGIS1.4ArcGIS界面及数据加载1.5文档保存方式第二讲ArcGIS数据管理2.1ArcGIS数据类型与数据结构2.2shapefile数据、个人地理数据库MDB和文件地理数据库GDB2.3地理空间数据建库的理论、方法和步骤2.4ArcGIS数据管理第
Python机器学习与深度学习：决策树、随机森林、XGBoost与LightGBM、迁移学习、循环神经网络、长短时记忆网络、时间卷积网络、自编码器、生成对抗网络、YOLO目标检测等 WangYan2022 机器学习/深度学习 Python 机器学习深度学习随机森林迁移学习
融合最新技术动态与实战经验，旨在系统提升以下能力：①掌握ChatGPT、DeepSeek等大语言模型在代码生成、模型调试、实验设计、论文撰写等方面的实际应用技巧②深入理解深度学习与经典机器学习算法的关联与差异，掌握其理论基础③熟练运用PyTorch实现各类深度学习模型，包括迁移学习、循环神经网络（RNN）、长短时记忆网络（LSTM）、时间卷积网络（TCN）、自编码器、生成对抗网络（GAN）、YOL
BLE中心与外围设备MTU协商过程详解秋の水 BLE 智能硬件
一、MTU基础概念1.MTU定义最大传输单元（MTU）指单次数据传输中允许的最大字节数，包含协议头部（3字节）和有效载荷（最多517字节）。BLE默认MTU为23字节（有效载荷20字节），但可通过协商提升至设备支持的最大值（如512字节）。2.协商目的效率优化：增大MTU可减少分包次数，提升传输速率（例如MTU=244时理论速度可达63KB/s，而默认仅5KB/s）。保障兼容性：设备能力差异（如旧
DeepSeek API 完整调用指南：从基础到高级应用实战独立开发者阿乐原创 Deepseek api API调用 api接口核心能力模型 DeepSeek API
文章目录DeepSeekAPI调用全流程详解：从入门到生产级实践1.DeepSeekAPI概述1.1DeepSeekAPI核心能力1.2API版本与计费2.API调用准备工作2.1注册与认证2.2环境准备2.3API密钥管理3.基础API调用实现3.1RESTfulAPI调用3.2流式响应处理4.高级API使用技巧4.1多轮对话管理4.2文件上传与处理5.生产环境最佳实践5.1错误处理与重试机制5
【PTA数据结构 | C语言版】两枚硬币秋说 PTA 数据结构题目集数据结构 c语言算法
本专栏持续输出数据结构题目集，欢迎订阅。文章目录题目代码题目伊娃喜欢收集全宇宙的硬币，包括火星币等等。一天她到了一家宇宙商店，这家商店可以接受任何星球的货币，但有一个条件，无论什么价格，都必须用2枚硬币一次付清，不能多也不能少。而她有多达10^5个硬币，于是求助于你。给定任一价格，请帮她找出可以付款的2枚硬币。输入格式：第1行给出2个正整数：n(≤10^5)为硬币枚数、m（≤10^3）为伊娃要付清
Karmada Multi-Ingress（MCI）技术实践启明真纳 k8s kubernetes 容器云原生
一、背景在多集群场景中，Kubernetes原生Ingress控制器无法跨集群调度和管理流量。Karmada作为一款Kubernetes多集群管理控制平面，推出了Multi-ClusterIngress（MCI）能力，专门解决多集群应用统一入口问题。MCI通过MultiClusterIngressCRD资源实现多集群Ingress的管理与自动下发，结合karmada-agent实现资源同步，最终达
Docker技术笔记-从零开始的容器技术之旅青竹易寒 docker 学习容器
理论一、容器技术简介容器是一种轻量级、可移植、隔离的软件环境，通过操作系统级虚拟化实现资源隔离,确保应用程序在不同环境中能够保持一致运行。容器和虚拟机对比对比维度容器(Docker)虚拟机(VM、KVM)架构原理共享宿主机内核,通过命名空间(Namespaces)和控制组(Cgroups)实现资源隔离。通过Hypervisor虚拟化硬件资源,每个VM运行独立完整的操作系统(GuestOS)。资源消
三个静态路由实验：一篇文章教会你怎么配置静态路由
三个静态路由实验：一篇文章教会你怎么配置静态路由静态路由是一种特殊的路由，它由管理员手工配置当网络结构比较简单时，只需要配置静态路由就可以使网络正常工作。恰当地设置和使用静态路由可以改进网络的性能，并可为重要的网络应用保证带宽。本篇文章不多说静态路由的理论，直接通过三个实验教会你怎么配置静态路由。要配置静态路由，你只需要记住下面这个命令：iproute-staticip【目标网段】【掩码】【下一跳
鸿蒙生态下的全能开发板：SC-3568HA如何解决多场景硬件开发痛点？ ShiMetaPi 鸿蒙系统 OpenHarmony 鸿蒙开发板 SC-3568HA RK3568 树莓派嵌入式硬件
一、行业痛点分析1.1硬件碎片化兼容难题传统嵌入式开发中，不同硬件设备（摄像头、传感器、Wi-Fi模块）需要针对不同开发板重复适配驱动，导致开发周期长、维护成本高。鸿蒙优势：基于OpenHarmony统一内核抽象层（KAL）和硬件驱动框架（HDF），实现驱动标准化。硬件厂商只需基于统一接口开发，驱动即可跨设备复用，开发者调用统一API，无需关心底层差异。例：HDF驱动框架支持快速注册和加载摄像头驱
【求职】有没有大疆内推哇，开始找工作，不知所措啊，求硬件工程师的岗位，无人机飞控工程师的岗位
救命！26届的我找工作已经快把自己逼疯了海投无数简历，大多石沉大海，每天都在焦虑和自我怀疑中循环。想找一份无人机相关，或者硬件工程师之类的岗位。本人南京航空航天大学，控制科学与工程专业，是南航的A级双一流学科，学过嵌入式系统设计，最优控制理论，航天器控制仿真等课程，拥有扎实的理论基础，熟练掌握电路设计与分析，如模拟电路、数字电路，能独立完成电路原理图的设计工作。硬件开发流程在嵌入式硬件开发方面，熟
LoRaWAN 标准中为什么没有 SF5 和 SF6？后端java
LoRaWAN在物联网通信领域被誉为“远距离、低功耗”方案的代表，凭借其出色的覆盖能力和灵活的组网方式，成为智慧城市、智慧楼宇、智慧农业等场景的热门选择。不过，有些技术爱好者可能会注意到，LoRa的物理层理论上支持SF5～SF12的扩频因子，但LoRaWAN协议中只使用了SF7～SF12。那么，SF5和SF6到底去了哪里？为什么不被LoRaWAN标准采用？这背后其实藏着不少有趣的技术逻辑。什么是S
找了两个月，没找到工作
最近接触的很多测试从业者：找了两个月，没找到工作。对于此现状，多数人，肯定是焦虑、着急。而且每次面试，面试官都会问，为何这么久没找到工作。最终，迫于压力，多半会找到一家不太满意的岗位，先应付当前现状。如此，恶性循环。这里十二根据自己的职场经验，分享几点建议，供参考：1、别裸辞。2、平时多积累、多归纳总结，整理自己的知识体系。3、多提升技术，「软件测试」职业，是技术岗位，脱离不了技术。4、出了问题，
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa

尺度空间理论与图像金字塔（二）

SIFT简介

DoG尺度空间构造

为什么要讨论尺度空间？

尺度空间表达与金字塔多分辨率表达

高斯模糊

金字塔多分辨率

多尺度和多分辨率

尺度空间表达和金字塔多分辨率表达之间最大的不同是：

DoG（Difference of Gaussian）

高斯拉普拉斯LoG金字塔

高斯差分DoG金字塔

金字塔构建

构建高斯金字塔

构建DoG金字塔

尺度空间理论

DoG局部极值点

二 关键点精确定位

删除边缘效应

OpenCV】SIFT原理与源码分析：方向赋值

梯度方向和幅值

梯度直方图

关键点方向

源码

四 【OpenCV】SIFT原理与源码分析：关键点描述

《SIFT原理与源码分析》系列文章索引：http://blog.csdn.net/xiaowei_cqu/article/details/8069548

描述子采样区域

源码

区域坐标轴旋转

源码

计算采样区域梯度直方图

源码

关键点描述源码

五 【OpenCV】特征检测器 FeatureDetector

六 计算机视觉】SIFT中LoG和DoG比较

LoG

DoG

你可能感兴趣的:(ORB,尺度空间理论,图像金字塔,多尺度空间)

二关键点精确定位

四【OpenCV】SIFT原理与源码分析：关键点描述

五【OpenCV】特征检测器 FeatureDetector

六计算机视觉】SIFT中LoG和DoG比较