u011867581

【OpenCV】SIFT原理与源码分析

原文出自：http://blog.csdn.net/xiaowei_cqu/article/details/8069548

SIFT简介

Scale Invariant Feature Transform，尺度不变特征变换匹配算法，是由David G. Lowe在1999年（《Object Recognition from Local Scale-Invariant Features》）提出的高效区域检测算法，在2004年（《Distinctive Image Features from Scale-Invariant Keypoints》）得以完善。

SIFT特征对旋转、尺度缩放、亮度变化等保持不变性，是非常稳定的局部特征，现在应用很广泛。而SIFT算法是将Blob检测，特征矢量生成，特征匹配搜索等步骤结合在一起优化。我会更新一系列文章，分析SIFT算法原理及OpenCV 2.4.2实现的SIFT源码：

DoG尺度空间构造（Scale-space extrema detection）
关键点搜索与定位（Keypoint localization）
方向赋值（Orientation assignment）
关键点描述（Keypoint descriptor）

OpenCV2.3之后实现了SIFT的代码，2.4改掉了一些bug。本系列文章主要分析OpenCV 2.4.2SIFT函数源码。

SIFT位于OpenCV nonfree的模块， David G. Lowe申请了算法的版权，请尊重作者权力，务必在允许范围内使用。

SIFT in OpenCV

OpenCV中的SIFT函数主要有两个接口。

构造函数：

[cpp]  view plain copy print ? 
         
 SIFT::SIFT(int nfeatures=0, int nOctaveLayers=3, double contrastThreshold=0.04, double edgeThreshold=  
 10, double sigma=1.6)  
nfeatures：特征点数目（算法对检测出的特征点排名，返回最好的nfeatures个特征点）。 
     
nOctaveLayers：金字塔中每组的层数（算法中会自己计算这个值，后面会介绍）。 
     
contrastThreshold：过滤掉较差的特征点的对阈值。contrastThreshold越大，返回的特征点越少。 
     
edgeThreshold：过滤掉边缘效应的阈值。edgeThreshold越大，特征点越多（被多滤掉的越少）。 
     
sigma：金字塔第0层图像高斯滤波系数，也就是σ。

重载操作符：

[cpp]  view plain copy print ? 
       
      
 void SIFT::operator()(InputArray img, InputArray mask, vector<KeyPoint>& keypoints, OutputArray  
 descriptors, bool useProvidedKeypoints=false)  

img：8bit灰度图像
mask：图像检测区域（可选）
keypoints：特征向量矩阵
descipotors：特征点描述的输出向量（如果不需要输出，需要传cv::noArray()）。
useProvidedKeypoints：是否进行特征点检测。ture，则检测特征点；false，只计算图像特征描述。

函数源码

构造函数SIFT()主要用来初始化参数，并没有特定的操作：

[cpp]  view plain copy print ? 
         
        
 SIFT::SIFT( int _nfeatures, int _nOctaveLayers,  
            double _contrastThreshold, double _edgeThreshold, double _sigma )  
     : nfeatures(_nfeatures), nOctaveLayers(_nOctaveLayers),  
     contrastThreshold(_contrastThreshold), edgeThreshold(_edgeThreshold), sigma(_sigma)  
     // sigma：对第0层进行高斯模糊的尺度空间因子。  
     // 默认为1.6（如果是软镜摄像头捕获的图像，可以适当减小此值）  
 {  
 }  

 主要操作还是利用重载操作符()来执行： 
    

[cpp]  view plain copy print ? 
         
        
 void SIFT::operator()(InputArray _image, InputArray _mask,  
                       vector<KeyPoint>& keypoints,  
                       OutputArray _descriptors,  
                       bool useProvidedKeypoints) const  
 // mask ：Optional input mask that marks the regions where we should detect features.  
 // Boolean flag. If it is true, the keypoint detector is not run. Instead,  
 // the provided vector of keypoints is used and the algorithm just computes their descriptors.  
 // descriptors – The output matrix of descriptors.  
 // Pass cv::noArray() if you do not need them.              
 {  
     Mat image = _image.getMat(), mask = _mask.getMat();  
   
     if( image.empty() || image.depth() != CV_8U )  
         CV_Error( CV_StsBadArg, "image is empty or has incorrect depth (!=CV_8U)" );  
   
     if( !mask.empty() && mask.type() != CV_8UC1 )  
         CV_Error( CV_StsBadArg, "mask has incorrect type (!=CV_8UC1)" );  
   
           
     // 得到第1组（Octave）图像  
     Mat base = createInitialImage(image, false, (float)sigma);  
     vector<Mat> gpyr, dogpyr;  
     // 每层金字塔图像的组数（Octave）  
     int nOctaves = cvRound(log( (double)std::min( base.cols, base.rows ) ) / log(2.) - 2);  
   
     // double t, tf = getTickFrequency();  
     // t = (double)getTickCount();  
       
     // 构建金字塔（金字塔层数和组数相等）  
     buildGaussianPyramid(base, gpyr, nOctaves);  
     // 构建高斯差分金字塔  
     buildDoGPyramid(gpyr, dogpyr);  
   
     //t = (double)getTickCount() - t;  
     //printf("pyramid construction time: %g\n", t*1000./tf);  
       
     // useProvidedKeypoints默认为false  
     // 使用keypoints并计算特征点的描述符  
     if( !useProvidedKeypoints )  
     {  
         //t = (double)getTickCount();  
         findScaleSpaceExtrema(gpyr, dogpyr, keypoints);  
         //除去重复特征点  
         KeyPointsFilter::removeDuplicated( keypoints );   
   
         // mask标记检测区域（可选）  
         if( !mask.empty() )  
             KeyPointsFilter::runByPixelsMask( keypoints, mask );  
   
         // retainBest:根据相应保留指定数目的特征点（features2d.hpp）  
         if( nfeatures > 0 )  
             KeyPointsFilter::retainBest(keypoints, nfeatures);  
         //t = (double)getTickCount() - t;  
         //printf("keypoint detection time: %g\n", t*1000./tf);  
     }  
     else  
     {  
         // filter keypoints by mask  
         // KeyPointsFilter::runByPixelsMask( keypoints, mask );  
     }  
   
     // 特征点输出数组  
     if( _descriptors.needed() )  
     {  
         //t = (double)getTickCount();  
         int dsize = descriptorSize();  
         _descriptors.create((int)keypoints.size(), dsize, CV_32F);  
         Mat descriptors = _descriptors.getMat();  
   
         calcDescriptors(gpyr, keypoints, descriptors, nOctaveLayers);  
         //t = (double)getTickCount() - t;  
         //printf("descriptor extraction time: %g\n", t*1000./tf);  
     }  
 }  

 函数中用到的构造金字塔： buildGaussianPyramid(base, gpyr, nOctaves);等步骤请参见文章后续系列。 
    

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

1.DoG尺度空间构造（Scale-space extrema detection）

尺度空间理论

自然界中的物体随着观测尺度不同有不同的表现形态。例如我们形容建筑物用“米”，观测分子、原子等用“纳米”。更形象的例子比如 Google地图，滑动鼠标轮可以改变观测地图的尺度，看到的地图绘制也不同；还有电影中的拉伸镜头等等……

尺度空间中各尺度图像的模糊程度逐渐变大，能够模拟人在距离目标由近到远时目标在视网膜上的形成过程。
尺度越大图像越模糊。

为什么要讨论尺度空间？

用机器视觉系统分析未知场景时，计算机并不预先知道图像中物体的尺度。我们需要同时考虑图像在多尺度下的描述，获知感兴趣物体的 最佳尺度。另外如果不同的尺度下都有同样的关键点，那么在不同的尺度的输入图像下就都可以检测出来关键点匹配，也就是 尺度不变性。

图像的尺度空间表达就是图像在所有尺度下的描述。

尺度空间表达与金字塔多分辨率表达

高斯模糊

高斯核是唯一可以产生多尺度空间的核（《Scale-space theory: A basic tool for analysing structures at different scales》）。一个图像的尺度空间L(x,y,σ) ,定义为原始图像I(x,y)与一个可变尺度的2维高斯函数G(x,y,σ)卷积运算。

二维空间高斯函数：

尺度空间：

尺度是自然客观存在的，不是主观创造的。高斯卷积只是表现尺度空间的一种形式。

二维空间高斯函数是等高线从中心成正太分布的同心圆：

分布不为零的点组成卷积阵与原始图像做变换，即每个像素值是周围相邻像素值的高斯平均。一个5*5的高斯模版如下所示：

高斯模版是圆对称的，且卷积的结果使原始像素值有最大的权重，距离中心越远的相邻像素值权重也越小。
在实际应用中，在计算高斯函数的离散近似时，在大概 3σ距离之外的像素都可以看作不起作用，这些像素的计算也就可以忽略。所以，通常程序只计算 (6σ+1)*(6σ+1)就可以保证相关像素影响。

高斯模糊另一个很厉害的性质就是线性可分：使用二维矩阵变换的高斯模糊可以通过在水平和竖直方向各进行一维高斯矩阵变换相加得到。

O(N^2*m*n)次乘法就缩减成了O(N*m*n)+O(N*m*n)次乘法。（N为高斯核大小，m,n为二维图像高和宽）

其实高斯这一部分只需要简单了解就可以了，在OpenCV也只需要一句代码：

[cpp] view plain copy print ?

[cpp]  view plain copy print ? 
       
 GaussianBlur(dbl, dbl, Size(), sig_diff, sig_diff);

我这里详写了一下是因为这块儿对分析算法效率比较有用，而且高斯模糊的算法真的很漂亮~

金字塔多分辨率

金字塔是早期图像多尺度的表示形式。图像金字塔化一般包括两个步骤：使用低通滤波器平滑图像；对平滑图像进行降采样（通常是水平，竖直方向1/2），从而得到一系列尺寸缩小的图像。

上图中（a）是对原始信号进行低通滤波，（b）是降采样得到的信号。

而对于二维图像，一个传统的金字塔中，每一层图像由上一层分辨率的长、宽各一半，也就是四分之一的像素组成：

多尺度和多分辨率

尺度空间表达和金字塔多分辨率表达之间最大的不同是：

尺度空间表达是由不同高斯核平滑卷积得到，在所有尺度上有相同的分辨率；
而金字塔多分辨率表达每层分辨率减少固定比率。

所以，金字塔多分辨率生成较快，且占用存储空间少；而多尺度表达随着尺度参数的增加冗余信息也变多。

多尺度表达的优点在于图像的局部特征可以用简单的形式在不同尺度上描述；而金字塔表达没有理论基础，难以分析图像局部特征。

DoG（Difference of Gaussian）

高斯拉普拉斯LoG金字塔

结合尺度空间表达和金字塔多分辨率表达，就是在使用尺度空间时使用金字塔表示，也就是计算机视觉中最有名的拉普拉斯金子塔（《The Laplacian pyramid as a compact image code》）。

高斯拉普拉斯LoG（Laplace of Guassian）算子就是对高斯函数进行拉普拉斯变换：

核心思想还是高斯，这个不多叙述。

高斯差分DoG金字塔

DoG（Difference of Gaussian）其实是对高斯拉普拉斯LoG的近似，也就是对

的近似。SIFT算法建议，在某一尺度上的特征检测可以通过对两个相邻高斯尺度空间的图像相减，得到DoG的响应值图像D(x,y,σ)。然后仿照LoG方法，通过对响应值图像D(x,y,σ)进行局部最大值搜索，在空间位置和尺度空间定位局部特征点。其中：

k为相邻两个尺度空间倍数的常数。

上图中（a）是DoG的三维图，（b）是DoG与LoG的对比。

金字塔构建

构建高斯金字塔

为了得到DoG图像，先要构造高斯金字塔。我们回过头来继续说高斯金字塔~

高斯金字塔在多分辨率金字塔简单 降采样基础上加了高斯滤波，也就是对金字塔每层图像用不同参数的σ做高斯模糊，使得每层金字塔有多张高斯模糊图像。金字塔每层多张图像合称为一组（Octave），每组有多张（也叫层Interval）图像。另外，降采样时，金字塔上边一组图像的第一张图像（最底层的一张）是由前一组（金字塔下面一组）图像的倒数第三张隔点采样得到。

以下是OpenCV中构建高斯金字塔的代码，我加了相应的注释：

[cpp]  view plain copy print ? 
            
           
 // 构建nOctaves组（每组nOctaves+3层）高斯金字塔  
 void SIFT::buildGaussianPyramid( const Mat& base, vector<Mat>& pyr, int nOctaves ) const  
 {  
     vector<double> sig(nOctaveLayers + 3);  
     pyr.resize(nOctaves*(nOctaveLayers + 3));  
   
     // precompute Gaussian sigmas using the following formula:  
     //  \sigma_{total}^2 = \sigma_{i}^2 + \sigma_{i-1}^2、  
     // 计算对图像做不同尺度高斯模糊的尺度因子  
     sig[0] = sigma;  
     double k = pow( 2., 1. / nOctaveLayers );  
     for( int i = 1; i < nOctaveLayers + 3; i++ )  
     {  
         double sig_prev = pow(k, (double)(i-1))*sigma;  
         double sig_total = sig_prev*k;  
         sig[i] = std::sqrt(sig_total*sig_total - sig_prev*sig_prev);  
     }  
   
     for( int o = 0; o < nOctaves; o++ )  
     {  
         // DoG金子塔需要nOctaveLayers+2层图像来检测nOctaves层尺度  
         // 所以高斯金字塔需要nOctaveLayers+3层图像得到nOctaveLayers+2层DoG金字塔  
         for( int i = 0; i < nOctaveLayers + 3; i++ )  
         {  
             // dst为第o组（Octave）金字塔  
             Mat& dst = pyr[o*(nOctaveLayers + 3) + i];  
             // 第0组第0层为原始图像  
             if( o == 0  &&  i == 0 )  
                 dst = base;  
               
             // base of new octave is halved image from end of previous octave  
             // 每一组第0副图像时上一组倒数第三幅图像隔点采样得到  
             else if( i == 0 )  
             {  
                 const Mat& src = pyr[(o-1)*(nOctaveLayers + 3) + nOctaveLayers];  
                 resize(src, dst, Size(src.cols/2, src.rows/2),  
                        0, 0, INTER_NEAREST);  
             }  
             // 每一组第i副图像是由第i-1副图像进行sig[i]的高斯模糊得到  
             // 也就是本组图像在sig[i]的尺度空间下的图像  
             else  
             {  
                 const Mat& src = pyr[o*(nOctaveLayers + 3) + i-1];  
                 GaussianBlur(src, dst, Size(), sig[i], sig[i]);  
             }  
         }  
     }  
 }  

高斯金字塔的组数为：

代码10-17行是计算高斯模糊的系数σ，具体关系如下：

其中，σ为尺度空间坐标，s为每组中层坐标，σ0为初始尺度，S为每组层数（一般为3~5）。根据这个公式，我们可以得到金字塔组内各层尺度以及组间各图像尺度关系。

组内相邻图像尺度关系：

相邻组间尺度关系：

所以， 相邻两组的同一层尺度为2倍的关系。

最终尺度序列总结为：

o为金字塔组数，n为每组金字塔层数。

构建DoG金字塔

构建高斯金字塔之后，就是用金字塔相邻图像相减构造DoG金字塔。

下面为构造DoG的代码：

[cpp]  view plain copy print ? 
         
        
 // 构建nOctaves组（每组nOctaves+2层）高斯差分金字塔  
 void SIFT::buildDoGPyramid( const vector<Mat>& gpyr, vector<Mat>& dogpyr ) const  
 {  
     int nOctaves = (int)gpyr.size()/(nOctaveLayers + 3);  
     dogpyr.resize( nOctaves*(nOctaveLayers + 2) );  
   
     for( int o = 0; o < nOctaves; o++ )  
     {  
         for( int i = 0; i < nOctaveLayers + 2; i++ )  
         {  
             // 第o组第i副图像为高斯金字塔中第o组第i+1和i组图像相减得到  
             const Mat& src1 = gpyr[o*(nOctaveLayers + 3) + i];  
             const Mat& src2 = gpyr[o*(nOctaveLayers + 3) + i + 1];  
             Mat& dst = dogpyr[o*(nOctaveLayers + 2) + i];  
             subtract(src2, src1, dst, noArray(), CV_16S);  
         }  
     }  
 }  

这个比较简单，就是一个 subtract()函数。

至此，SIFT第一步就完成了。参见《SIFT原理与源码分析》

2.关键点搜索与定位（Keypoint localization）

由前一步《DoG尺度空间构造》，我们得到了DoG高斯差分金字塔：

如上图的金字塔，高斯尺度空间金字塔中每组有五层不同尺度图像，相邻两层相减得到四层DoG结果。关键点搜索就在这四层DoG图像上寻找局部极值点。

DoG局部极值点

寻找DoG极值点时，每一个像素点和它所有的相邻点比较，当其大于（或小于）它的图像域和尺度域的所有相邻点时，即为极值点。如下图所示，比较的范围是个3×3的立方体：中间的检测点和它同尺度的8个相邻点，以及和上下相邻尺度对应的9×2个点——共26个点比较，以确保在尺度空间和二维图像空间都检测到极值点。

在一组中，搜索从每组的第二层开始，以第二层为当前层，第一层和第三层分别作为立方体的的上下层；搜索完成后再以第三层为当前层做同样的搜索。所以每层的点搜索两次。通常我们将组Octaves索引以-1开始，则在比较时牺牲了-1组的第0层和第N组的最高层

高斯金字塔，DoG图像及极值计算的相互关系如上图所示。

关键点精确定位

以上极值点的搜索是在离散空间进行搜索的，由下图可以看到，在离散空间找到的极值点不一定是真正意义上的极值点。可以通过对尺度空间DoG函数进行曲线拟合寻找极值点来减小这种误差。

利用DoG函数在尺度空间的Taylor展开式：

则极值点为：

程序中还除去了极值小于0.04的点。如下所示：

[cpp]  view plain copy print ? 
         
        
 // Detects features at extrema in DoG scale space.  Bad features are discarded  
 // based on contrast and ratio of principal curvatures.  
 // 在DoG尺度空间寻特征点（极值点）  
 void SIFT::findScaleSpaceExtrema( const vector<Mat>& gauss_pyr, const vector<Mat>& dog_pyr,  
                                   vector<KeyPoint>& keypoints ) const  
 {  
     int nOctaves = (int)gauss_pyr.size()/(nOctaveLayers + 3);  
       
     // The contrast threshold used to filter out weak features in semi-uniform  
     // (low-contrast) regions. The larger the threshold, the less features are produced by the detector.  
     // 过滤掉弱特征的阈值 contrastThreshold默认为0.04  
     int threshold = cvFloor(0.5 * contrastThreshold / nOctaveLayers * 255 * SIFT_FIXPT_SCALE);  
     const int n = SIFT_ORI_HIST_BINS; //36  
     float hist[n];  
     KeyPoint kpt;  
   
     keypoints.clear();  
   
     for( int o = 0; o < nOctaves; o++ )  
         for( int i = 1; i <= nOctaveLayers; i++ )  
         {  
             int idx = o*(nOctaveLayers+2)+i;  
             const Mat& img = dog_pyr[idx];  
             const Mat& prev = dog_pyr[idx-1];  
             const Mat& next = dog_pyr[idx+1];  
             int step = (int)img.step1();  
             int rows = img.rows, cols = img.cols;  
   
             for( int r = SIFT_IMG_BORDER; r < rows-SIFT_IMG_BORDER; r++)  
             {  
                 const short* currptr = img.ptr<short>(r);  
                 const short* prevptr = prev.ptr<short>(r);  
                 const short* nextptr = next.ptr<short>(r);  
   
                 for( int c = SIFT_IMG_BORDER; c < cols-SIFT_IMG_BORDER; c++)  
                 {  
                     int val = currptr[c];  
   
                     // find local extrema with pixel accuracy  
                     // 寻找局部极值点，DoG中每个点与其所在的立方体周围的26个点比较  
                     // if （val比所有都大 或者 val比所有都小）  
                     if( std::abs(val) > threshold &&  
                        ((val > 0 && val >= currptr[c-1] && val >= currptr[c+1] &&  
                          val >= currptr[c-step-1] && val >= currptr[c-step] &&   
                          val >= currptr[c-step+1] && val >= currptr[c+step-1] &&   
                          val >= currptr[c+step] && val >= currptr[c+step+1] &&  
                          val >= nextptr[c] && val >= nextptr[c-1] &&   
                          val >= nextptr[c+1] && val >= nextptr[c-step-1] &&   
                          val >= nextptr[c-step] && val >= nextptr[c-step+1] &&   
                          val >= nextptr[c+step-1] && val >= nextptr[c+step] &&   
                          val >= nextptr[c+step+1] && val >= prevptr[c] &&   
                          val >= prevptr[c-1] && val >= prevptr[c+1] &&  
                          val >= prevptr[c-step-1] && val >= prevptr[c-step] &&   
                          val >= prevptr[c-step+1] && val >= prevptr[c+step-1] &&   
                          val >= prevptr[c+step] && val >= prevptr[c+step+1]) ||  
                         (val < 0 && val <= currptr[c-1] && val <= currptr[c+1] &&  
                          val <= currptr[c-step-1] && val <= currptr[c-step] &&   
                          val <= currptr[c-step+1] && val <= currptr[c+step-1] &&   
                          val <= currptr[c+step] && val <= currptr[c+step+1] &&  
                          val <= nextptr[c] && val <= nextptr[c-1] &&   
                          val <= nextptr[c+1] && val <= nextptr[c-step-1] &&   
                          val <= nextptr[c-step] && val <= nextptr[c-step+1] &&   
                          val <= nextptr[c+step-1] && val <= nextptr[c+step] &&   
                          val <= nextptr[c+step+1] && val <= prevptr[c] &&   
                          val <= prevptr[c-1] && val <= prevptr[c+1] &&  
                          val <= prevptr[c-step-1] && val <= prevptr[c-step] &&   
                          val <= prevptr[c-step+1] && val <= prevptr[c+step-1] &&   
                          val <= prevptr[c+step] && val <= prevptr[c+step+1])))  
                     {  
                         int r1 = r, c1 = c, layer = i;  
                           
                         // 关键点精确定位  
                         if( !adjustLocalExtrema(dog_pyr, kpt, o, layer, r1, c1,  
                                                 nOctaveLayers, (float)contrastThreshold,  
                                                 (float)edgeThreshold, (float)sigma) )  
                             continue;  
                           
                         float scl_octv = kpt.size*0.5f/(1 << o);  
                         // 计算梯度直方图  
                         float omax = calcOrientationHist(  
                             gauss_pyr[o*(nOctaveLayers+3) + layer],  
                             Point(c1, r1),  
                             cvRound(SIFT_ORI_RADIUS * scl_octv),  
                             SIFT_ORI_SIG_FCTR * scl_octv,  
                             hist, n);  
                         float mag_thr = (float)(omax * SIFT_ORI_PEAK_RATIO);  
                         for( int j = 0; j < n; j++ )  
                         {  
                             int l = j > 0 ? j - 1 : n - 1;  
                             int r2 = j < n-1 ? j + 1 : 0;  
   
                             if( hist[j] > hist[l]  &&  hist[j] > hist[r2]  &&  hist[j] >= mag_thr )  
                             {  
                                 float bin = j + 0.5f * (hist[l]-hist[r2]) /   
                                 (hist[l] - 2*hist[j] + hist[r2]);  
                                 bin = bin < 0 ? n + bin : bin >= n ? bin - n : bin;  
                                 kpt.angle = (float)((360.f/n) * bin);  
                                 keypoints.push_back(kpt);  
                             }  
                         }  
                     }  
                 }  
             }  
         }  
 }  

删除边缘效应

除了DoG响应较低的点，还有一些响应较强的点也不是稳定的特征点。DoG对图像中的边缘有较强的响应值，所以落在图像边缘的点也不是稳定的特征点。

一个平坦的DoG响应峰值在横跨边缘的地方有较大的主曲率，而在垂直边缘的地方有较小的主曲率。主曲率可以通过2×2的Hessian矩阵H求出：

D值可以通过求临近点差分得到。H的特征值与D的主曲率成正比，具体可参见Harris角点检测算法。

为了避免求具体的值，我们可以通过H将特征值的比例表示出来。令

为最大特征值，

为最小特征值，那么：

Tr(H)表示矩阵H的迹，Det(H)表示H的行列式。

令

表示最大特征值与最小特征值的比值，则有：

上式与两个特征值的比例有关。随着主曲率比值的增加，

也会增加。我们只需要去掉比率大于一定值的特征点。Lowe论文中去掉r=10的点。

[cpp]  view plain copy print ? 
        
       
 // Interpolates a scale-space extremum's location and scale to subpixel  
 // accuracy to form an image feature.  Rejects features with low contrast.  
 // Based on Section 4 of Lowe's paper.  
 // 特征点精确定位  
 static bool adjustLocalExtrema( const vector<Mat>& dog_pyr, KeyPoint& kpt, int octv,  
                                 int& layer, int& r, int& c, int nOctaveLayers,  
                                 float contrastThreshold, float edgeThreshold, float sigma )  
 {  
     const float img_scale = 1.f/(255*SIFT_FIXPT_SCALE);  
     const float deriv_scale = img_scale*0.5f;  
     const float second_deriv_scale = img_scale;  
     const float cross_deriv_scale = img_scale*0.25f;  
   
     float xi=0, xr=0, xc=0, contr;  
     int i = 0;  
   
     //三维子像元插值  
     for( ; i < SIFT_MAX_INTERP_STEPS; i++ )  
     {  
         int idx = octv*(nOctaveLayers+2) + layer;  
         const Mat& img = dog_pyr[idx];  
         const Mat& prev = dog_pyr[idx-1];  
         const Mat& next = dog_pyr[idx+1];  
   
         Vec3f dD((img.at<short>(r, c+1) - img.at<short>(r, c-1))*deriv_scale,  
                  (img.at<short>(r+1, c) - img.at<short>(r-1, c))*deriv_scale,  
                  (next.at<short>(r, c) - prev.at<short>(r, c))*deriv_scale);  
   
         float v2 = (float)img.at<short>(r, c)*2;  
         float dxx = (img.at<short>(r, c+1) +   
                 img.at<short>(r, c-1) - v2)*second_deriv_scale;  
         float dyy = (img.at<short>(r+1, c) +   
                 img.at<short>(r-1, c) - v2)*second_deriv_scale;  
         float dss = (next.at<short>(r, c) +   
                 prev.at<short>(r, c) - v2)*second_deriv_scale;  
         float dxy = (img.at<short>(r+1, c+1) -   
                 img.at<short>(r+1, c-1) - img.at<short>(r-1, c+1) +   
                 img.at<short>(r-1, c-1))*cross_deriv_scale;  
         float dxs = (next.at<short>(r, c+1) -   
                 next.at<short>(r, c-1) - prev.at<short>(r, c+1) +   
                 prev.at<short>(r, c-1))*cross_deriv_scale;  
         float dys = (next.at<short>(r+1, c) -   
                 next.at<short>(r-1, c) - prev.at<short>(r+1, c) +   
                 prev.at<short>(r-1, c))*cross_deriv_scale;  
   
         Matx33f H(dxx, dxy, dxs,  
                   dxy, dyy, dys,  
                   dxs, dys, dss);  
   
         Vec3f X = H.solve(dD, DECOMP_LU);  
   
         xi = -X[2];  
         xr = -X[1];  
         xc = -X[0];  
   
         if( std::abs( xi ) < 0.5f  &&  std::abs( xr ) < 0.5f  &&  std::abs( xc ) < 0.5f )  
             break;  
   
         //将找到的极值点对应成像素（整数）  
         c += cvRound( xc );  
         r += cvRound( xr );  
         layer += cvRound( xi );  
   
         if( layer < 1 || layer > nOctaveLayers ||  
            c < SIFT_IMG_BORDER || c >= img.cols - SIFT_IMG_BORDER  ||  
            r < SIFT_IMG_BORDER || r >= img.rows - SIFT_IMG_BORDER )  
             return false;  
     }  
   
     /* ensure convergence of interpolation */  
     // SIFT_MAX_INTERP_STEPS:插值最大步数，避免插值不收敛，程序中默认为5  
     if( i >= SIFT_MAX_INTERP_STEPS )  
         return false;  
   
     {  
         int idx = octv*(nOctaveLayers+2) + layer;  
         const Mat& img = dog_pyr[idx];  
         const Mat& prev = dog_pyr[idx-1];  
         const Mat& next = dog_pyr[idx+1];  
         Matx31f dD((img.at<short>(r, c+1) - img.at<short>(r, c-1))*deriv_scale,  
                    (img.at<short>(r+1, c) - img.at<short>(r-1, c))*deriv_scale,  
                    (next.at<short>(r, c) - prev.at<short>(r, c))*deriv_scale);  
         float t = dD.dot(Matx31f(xc, xr, xi));  
   
         contr = img.at<short>(r, c)*img_scale + t * 0.5f;  
         if( std::abs( contr ) * nOctaveLayers < contrastThreshold )  
             return false;  
   
         /* principal curvatures are computed using the trace and det of Hessian */  
        //利用Hessian矩阵的迹和行列式计算主曲率的比值  
        float v2 = img.at<short>(r, c)*2.f;  
         float dxx = (img.at<short>(r, c+1) +   
                 img.at<short>(r, c-1) - v2)*second_deriv_scale;  
         float dyy = (img.at<short>(r+1, c) +   
                 img.at<short>(r-1, c) - v2)*second_deriv_scale;  
         float dxy = (img.at<short>(r+1, c+1) -   
                 img.at<short>(r+1, c-1) - img.at<short>(r-1, c+1) +   
                 img.at<short>(r-1, c-1)) * cross_deriv_scale;  
         float tr = dxx + dyy;  
         float det = dxx * dyy - dxy * dxy;  
   
         //这里edgeThreshold可以在调用SIFT()时输入；  
         //其实代码中定义了 static const float SIFT_CURV_THR = 10.f 可以直接使用  
         if( det <= 0 || tr*tr*edgeThreshold >= (edgeThreshold + 1)*(edgeThreshold + 1)*det )  
             return false;  
     }  
   
     kpt.pt.x = (c + xc) * (1 << octv);  
     kpt.pt.y = (r + xr) * (1 << octv);  
     kpt.octave = octv + (layer << 8) + (cvRound((xi + 0.5)*255) << 16);  
     kpt.size = sigma*powf(2.f, (layer + xi) / nOctaveLayers)*(1 << octv)*2;  
   
     return true;  
 }  

至此，SIFT第二步就完成了。参见《SIFT原理与源码分析》

3.方向赋值（Orientation assignment）

由前一篇《关键点搜索与定位》，我们已经找到了关键点。为了实现图像旋转不变性，需要根据检测到的关键点局部图像结构为特征点方向赋值。也就是在 findScaleSpaceExtrema()函数里看到的alcOrientationHist()语句：

[cpp]  view plain copy print ? 
         
        
 // 计算梯度直方图  
 float omax = calcOrientationHist(gauss_pyr[o*(nOctaveLayers+3) + layer],  
                                                 Point(c1, r1),  
                                                 cvRound(SIFT_ORI_RADIUS * scl_octv),  
                                                 SIFT_ORI_SIG_FCTR * scl_octv,  
                                                 hist, n);  

 我们使用图像的梯度直方图法求关键点局部结构的稳定方向。 
    

梯度方向和幅值

在前文中，精确定位关键点后也找到改特征点的尺度值σ，根据这一尺度值，得到最接近这一尺度值的高斯图像：

使用有限差分，计算以关键点为中心，以3×1.5σ为半径的区域内图像梯度的幅角和幅值，公式如下：

梯度直方图

在完成关键点邻域内高斯图像梯度计算后，使用直方图统计邻域内像素对应的梯度方向和幅值。

有关直方图的基础知识可以参考《数字图像直方图》，可以看做是离散点的概率表示形式。此处方向直方图的核心是统计以关键点为原点，一定区域内的图像像素点对关键点方向生成所作的贡献。

梯度方向直方图的横轴是梯度方向角，纵轴是剃度方向角对应的梯度幅值累加值。梯度方向直方图将0°~360°的范围分为36个柱，每10°为一个柱。下图是从高斯图像上求取梯度，再由梯度得到梯度方向直方图的例图。

在计算直方图时，每个加入直方图的采样点都使用圆形高斯函数函数进行了加权处理，也就是进行高斯平滑。这主要是因为SIFT算法只考虑了尺度和旋转不变形，没有考虑仿射不变性。通过高斯平滑，可以使关键点附近的梯度幅值有较大权重，从而部分弥补没考虑仿射不变形产生的特征点不稳定。

通常离散的梯度直方图要进行插值拟合处理，以求取更精确的方向角度值。（这和《关键点搜索与定位》中插值的思路是一样的）。

关键点方向

直方图峰值代表该关键点处邻域内图像梯度的主方向，也就是该关键点的主方向。在梯度方向直方图中，当存在另一个相当于主峰值 80%能量的峰值时，则将这个方向认为是该关键点的辅方向。所以一个关键点可能检测得到多个方向，这可以增强匹配的鲁棒性。Lowe的论文指出大概有15%关键点具有多方向，但这些点对匹配的稳定性至为关键。

获得图像关键点主方向后，每个关键点有三个信息(x,y,σ,θ)：位置、尺度、方向。由此我们可以确定一个SIFT特征区域。通常使用一个带箭头的圆或直接使用箭头表示SIFT区域的三个值：中心表示特征点位置，半径表示关键点尺度（r=2.5σ）,箭头表示主方向。具有多个方向的关键点可以复制成多份，然后将方向值分别赋给复制后的关键点。如下图：

源码

[cpp] view plain copy print ?

[cpp]  view plain copy print ? 
     
    
 // Computes a gradient orientation histogram at a specified pixel  
 // 计算特定点的梯度方向直方图  
 static float calcOrientationHist( const Mat& img, Point pt, int radius,  
                                   float sigma, float* hist, int n )  
 {  
     //len：2r+1也就是以r为半径的圆（正方形）像素个数  
     int i, j, k, len = (radius*2+1)*(radius*2+1);  
   
     float expf_scale = -1.f/(2.f * sigma * sigma);  
     AutoBuffer<float> buf(len*4 + n+4);  
     float *X = buf, *Y = X + len, *Mag = X, *Ori = Y + len, *W = Ori + len;  
     float* temphist = W + len + 2;  
   
     for( i = 0; i < n; i++ )  
         temphist[i] = 0.f;  
   
     // 图像梯度直方图统计的像素范围  
     for( i = -radius, k = 0; i <= radius; i++ )  
     {  
         int y = pt.y + i;  
         if( y <= 0 || y >= img.rows - 1 )  
             continue;  
         for( j = -radius; j <= radius; j++ )  
         {  
             int x = pt.x + j;  
             if( x <= 0 || x >= img.cols - 1 )  
                 continue;  
   
             float dx = (float)(img.at<short>(y, x+1) - img.at<short>(y, x-1));  
             float dy = (float)(img.at<short>(y-1, x) - img.at<short>(y+1, x));  
   
             X[k] = dx; Y[k] = dy; W[k] = (i*i + j*j)*expf_scale;  
             k++;  
         }  
     }  
   
     len = k;  
   
     // compute gradient values, orientations and the weights over the pixel neighborhood  
     // 计算梯度、幅角和幅值  
     exp(W, W, len);   
     fastAtan2(Y, X, Ori, len, true);   
     magnitude(X, Y, Mag, len); //幅角  
       
     // 计算直方图的每个bin  
     for( k = 0; k < len; k++ )  
     {  
         int bin = cvRound((n/360.f)*Ori[k]);  
         if( bin >= n )  
             bin -= n;  
         if( bin < 0 )  
             bin += n;  
         temphist[bin] += W[k]*Mag[k];  
     }  
   
     // smooth the histogram  
     // 高斯平滑  
     temphist[-1] = temphist[n-1];  
     temphist[-2] = temphist[n-2];  
     temphist[n] = temphist[0];  
     temphist[n+1] = temphist[1];  
     for( i = 0; i < n; i++ )  
     {  
         hist[i] = (temphist[i-2] + temphist[i+2])*(1.f/16.f) +  
             (temphist[i-1] + temphist[i+1])*(4.f/16.f) +  
             temphist[i]*(6.f/16.f);  
     }  
       
     // 得到主方向  
     float maxval = hist[0];  
     for( i = 1; i < n; i++ )  
         maxval = std::max(maxval, hist[i]);  
   
     return maxval;  
 }  

这一步比较简单~参见《 SIFT原理与源码分析》。

4. 关键点描述（Keypoint descriptor）

由前一篇《方向赋值》，为找到的关键点即SIFT特征点赋了值，包含位置、尺度和方向的信息。接下来的步骤是关键点描述，即用用一组向量将这个关键点描述出来，这个描述子不但包括关键点，也包括关键点周围对其有贡献的像素点。用来作为 目标匹配的依据（所以描述子应该有较高的独特性，以保证匹配率），也可使关键点具有更多的不变特性，如光照变化、3D视点变化等。

SIFT描述子h(x,y,θ)是对关键点附近邻域内高斯图像梯度统计的结果，是一个三维矩阵，但通常用一个矢量来表示。矢量通过对三维矩阵按一定规律排列得到。

描述子采样区域

特征描述子与关键点所在尺度有关，因此对梯度的求取应在特征点对应的高斯图像上进行。将关键点附近划分成d×d个子区域，每个子区域尺寸为mσ个像元（d=4，m=3，σ为尺特征点的尺度值）。考虑到实际计算时需要双线性插值，故计算的图像区域为mσ(d+1)，再考虑旋转，则实际计算的图像区域为

，如下图所示：

源码

[cpp]  view plain copy 
      
     
 
     
    Point pt(cvRound(ptf.x), cvRound(ptf.y));  
 //计算余弦，正弦，CV_PI/180:将角度值转化为幅度值  
    float cos_t = cosf(ori*(float)(CV_PI/180));  
    float sin_t = sinf(ori*(float)(CV_PI/180));  
    float bins_per_rad = n / 360.f;  
    float exp_scale = -1.f/(d * d * 0.5f); //d:SIFT_DESCR_WIDTH 4      
    float hist_width = SIFT_DESCR_SCL_FCTR * scl;  // SIFT_DESCR_SCL_FCTR: 3   
                                                // scl: size*0.5f  
 // 计算图像区域半径mσ(d+1)/2*sqrt(2)  
 // 1.4142135623730951f 为根号2  
    int radius = cvRound(hist_width * 1.4142135623730951f * (d + 1) * 0.5f);  
    cos_t /= hist_width;  
    sin_t /= hist_width;  

区域坐标轴旋转

为了保证特征矢量具有旋转不变性，要以特征点为中心，在附近邻域内旋转θ角，即旋转为特征点的方向。

旋转后区域内采样点新的坐标为：

源码

[cpp]  view plain copy 
      
     
 
     
 //计算采样区域点坐标旋转  
     for( i = -radius, k = 0; i <= radius; i++ )  
         for( j = -radius; j <= radius; j++ )  
         {  
             /* 
              Calculate sample's histogram array coords rotated relative to ori. 
              Subtract 0.5 so samples that fall e.g. in the center of row 1 (i.e. 
              r_rot = 1.5) have full weight placed in row 1 after interpolation. 
              */  
             float c_rot = j * cos_t - i * sin_t;  
             float r_rot = j * sin_t + i * cos_t;  
             float rbin = r_rot + d/2 - 0.5f;  
             float cbin = c_rot + d/2 - 0.5f;  
             int r = pt.y + i, c = pt.x + j;  
   
             if( rbin > -1 && rbin < d && cbin > -1 && cbin < d &&  
                r > 0 && r < rows - 1 && c > 0 && c < cols - 1 )  
             {  
                 float dx = (float)(img.at<short>(r, c+1) - img.at<short>(r, c-1));  
                 float dy = (float)(img.at<short>(r-1, c) - img.at<short>(r+1, c));  
                 X[k] = dx; Y[k] = dy; RBin[k] = rbin; CBin[k] = cbin;  
                 W[k] = (c_rot * c_rot + r_rot * r_rot)*exp_scale;  
                 k++;  
             }  
         }  

计算采样区域梯度直方图

将旋转后区域划分为d×d个子区域（每个区域间隔为mσ像元），在子区域内计算8个方向的梯度直方图，绘制每个方向梯度方向的累加值，形成一个种子点。

与求主方向不同的是，此时，每个子区域梯度方向直方图将0°~360°划分为8个方向区间，每个区间为45°。即每个种子点有8个方向区间的梯度强度信息。由于存在d×d，即4×4个子区域，所以最终共有4×4×8=128个数据，形成128维SIFT特征矢量。

对特征矢量需要加权处理，加权采用mσd/2的标准高斯函数。为了除去光照变化影响，还有一步归一化处理。

源码

[cpp]  view plain copy 
      
     
 
     
 //计算梯度直方图  
     for( k = 0; k < len; k++ )  
     {  
         float rbin = RBin[k], cbin = CBin[k];  
         float obin = (Ori[k] - ori)*bins_per_rad;  
         float mag = Mag[k]*W[k];  
   
         int r0 = cvFloor( rbin );  
         int c0 = cvFloor( cbin );  
         int o0 = cvFloor( obin );  
         rbin -= r0;  
         cbin -= c0;  
         obin -= o0;  
   
         //n为SIFT_DESCR_HIST_BINS：8，即将360°分为8个区间  
         if( o0 < 0 )  
             o0 += n;  
         if( o0 >= n )  
             o0 -= n;  
           
   
         // histogram update using tri-linear interpolation  
         // 双线性插值  
         float v_r1 = mag*rbin, v_r0 = mag - v_r1;  
         float v_rc11 = v_r1*cbin, v_rc10 = v_r1 - v_rc11;  
         float v_rc01 = v_r0*cbin, v_rc00 = v_r0 - v_rc01;  
         float v_rco111 = v_rc11*obin, v_rco110 = v_rc11 - v_rco111;  
         float v_rco101 = v_rc10*obin, v_rco100 = v_rc10 - v_rco101;  
         float v_rco011 = v_rc01*obin, v_rco010 = v_rc01 - v_rco011;  
         float v_rco001 = v_rc00*obin, v_rco000 = v_rc00 - v_rco001;  
   
         int idx = ((r0+1)*(d+2) + c0+1)*(n+2) + o0;  
         hist[idx] += v_rco000;  
         hist[idx+1] += v_rco001;  
         hist[idx+(n+2)] += v_rco010;  
         hist[idx+(n+3)] += v_rco011;  
         hist[idx+(d+2)*(n+2)] += v_rco100;  
         hist[idx+(d+2)*(n+2)+1] += v_rco101;  
         hist[idx+(d+3)*(n+2)] += v_rco110;  
         hist[idx+(d+3)*(n+2)+1] += v_rco111;  
     }  

关键点描述源码

[cpp]  view plain copy 
      
     
 
     
 // SIFT关键点特征描述  
 // SIFT描述子是关键点领域高斯图像提取统计结果的一种表示  
 static void calcSIFTDescriptor( const Mat& img, Point2f ptf, float ori, float scl,  
                                int d, int n, float* dst )  
                              
 {  
     Point pt(cvRound(ptf.x), cvRound(ptf.y));  
     //计算余弦，正弦，CV_PI/180:将角度值转化为幅度值  
     float cos_t = cosf(ori*(float)(CV_PI/180));  
     float sin_t = sinf(ori*(float)(CV_PI/180));  
     float bins_per_rad = n / 360.f;  
     float exp_scale = -1.f/(d * d * 0.5f); //d:SIFT_DESCR_WIDTH 4     
     float hist_width = SIFT_DESCR_SCL_FCTR * scl;  // SIFT_DESCR_SCL_FCTR: 3   
                                                    // scl: size*0.5f  
     // 计算图像区域半径mσ(d+1)/2*sqrt(2)  
     // 1.4142135623730951f 为根号2  
     int radius = cvRound(hist_width * 1.4142135623730951f * (d + 1) * 0.5f);  
     cos_t /= hist_width;  
     sin_t /= hist_width;  
   
     int i, j, k, len = (radius*2+1)*(radius*2+1), histlen = (d+2)*(d+2)*(n+2);  
     int rows = img.rows, cols = img.cols;  
   
     AutoBuffer<float> buf(len*6 + histlen);  
     float *X = buf, *Y = X + len, *Mag = Y, *Ori = Mag + len, *W = Ori + len;  
     float *RBin = W + len, *CBin = RBin + len, *hist = CBin + len;  
   
     //初始化直方图  
     for( i = 0; i < d+2; i++ )  
     {  
         for( j = 0; j < d+2; j++ )  
             for( k = 0; k < n+2; k++ )  
                 hist[(i*(d+2) + j)*(n+2) + k] = 0.;  
     }  
   
     //计算采样区域点坐标旋转  
     for( i = -radius, k = 0; i <= radius; i++ )  
         for( j = -radius; j <= radius; j++ )  
         {  
             /* 
              Calculate sample's histogram array coords rotated relative to ori. 
              Subtract 0.5 so samples that fall e.g. in the center of row 1 (i.e. 
              r_rot = 1.5) have full weight placed in row 1 after interpolation. 
              */  
             float c_rot = j * cos_t - i * sin_t;  
             float r_rot = j * sin_t + i * cos_t;  
             float rbin = r_rot + d/2 - 0.5f;  
             float cbin = c_rot + d/2 - 0.5f;  
             int r = pt.y + i, c = pt.x + j;  
   
             if( rbin > -1 && rbin < d && cbin > -1 && cbin < d &&  
                r > 0 && r < rows - 1 && c > 0 && c < cols - 1 )  
             {  
                 float dx = (float)(img.at<short>(r, c+1) - img.at<short>(r, c-1));  
                 float dy = (float)(img.at<short>(r-1, c) - img.at<short>(r+1, c));  
                 X[k] = dx; Y[k] = dy; RBin[k] = rbin; CBin[k] = cbin;  
                 W[k] = (c_rot * c_rot + r_rot * r_rot)*exp_scale;  
                 k++;  
             }  
         }  
   
     len = k;  
     fastAtan2(Y, X, Ori, len, true);  
     magnitude(X, Y, Mag, len);  
     exp(W, W, len);  
   
       
     //计算梯度直方图  
     for( k = 0; k < len; k++ )  
     {  
         float rbin = RBin[k], cbin = CBin[k];  
         float obin = (Ori[k] - ori)*bins_per_rad;  
         float mag = Mag[k]*W[k];  
   
         int r0 = cvFloor( rbin );  
         int c0 = cvFloor( cbin );  
         int o0 = cvFloor( obin );  
         rbin -= r0;  
         cbin -= c0;  
         obin -= o0;  
   
         //n为SIFT_DESCR_HIST_BINS：8，即将360°分为8个区间  
         if( o0 < 0 )  
             o0 += n;  
         if( o0 >= n )  
             o0 -= n;  
           
   
         // histogram update using tri-linear interpolation  
         // 双线性插值  
         float v_r1 = mag*rbin, v_r0 = mag - v_r1;  
         float v_rc11 = v_r1*cbin, v_rc10 = v_r1 - v_rc11;  
         float v_rc01 = v_r0*cbin, v_rc00 = v_r0 - v_rc01;  
         float v_rco111 = v_rc11*obin, v_rco110 = v_rc11 - v_rco111;  
         float v_rco101 = v_rc10*obin, v_rco100 = v_rc10 - v_rco101;  
         float v_rco011 = v_rc01*obin, v_rco010 = v_rc01 - v_rco011;  
         float v_rco001 = v_rc00*obin, v_rco000 = v_rc00 - v_rco001;  
   
         int idx = ((r0+1)*(d+2) + c0+1)*(n+2) + o0;  
         hist[idx] += v_rco000;  
         hist[idx+1] += v_rco001;  
         hist[idx+(n+2)] += v_rco010;  
         hist[idx+(n+3)] += v_rco011;  
         hist[idx+(d+2)*(n+2)] += v_rco100;  
         hist[idx+(d+2)*(n+2)+1] += v_rco101;  
         hist[idx+(d+3)*(n+2)] += v_rco110;  
         hist[idx+(d+3)*(n+2)+1] += v_rco111;  
     }  
   
     // finalize histogram, since the orientation histograms are circular  
     // 最后确定直方图，目标方向直方图是圆的  
     for( i = 0; i < d; i++ )  
         for( j = 0; j < d; j++ )  
         {  
             int idx = ((i+1)*(d+2) + (j+1))*(n+2);  
             hist[idx] += hist[idx+n];  
             hist[idx+1] += hist[idx+n+1];  
             for( k = 0; k < n; k++ )  
                 dst[(i*d + j)*n + k] = hist[idx+k];  
         }  
     // copy histogram to the descriptor,  
     // apply hysteresis thresholding  
     // and scale the result, so that it can be easily converted  
     // to byte array  
     float nrm2 = 0;  
     len = d*d*n;  
     for( k = 0; k < len; k++ )  
         nrm2 += dst[k]*dst[k];  
     float thr = std::sqrt(nrm2)*SIFT_DESCR_MAG_THR;  
     for( i = 0, nrm2 = 0; i < k; i++ )  
     {  
         float val = std::min(dst[i], thr);  
         dst[i] = val;  
         nrm2 += val*val;  
     }  
     nrm2 = SIFT_INT_DESCR_FCTR/std::max(std::sqrt(nrm2), FLT_EPSILON);  
     for( k = 0; k < len; k++ )  
     {  
         dst[k] = saturate_cast<uchar>(dst[k]*nrm2);  
     }  
 }  

你可能感兴趣的:(opencv,sift)

android 基于OpenCV4.8微笑检测自动拍照 mmsx android 作业源码分享 android opencv
一，前言1、基于OpenCV4.8微笑检测自动拍照存储2、左侧有一个预览小框，有人脸时候会有红色框框。3、当真人入境时候，微笑。相机预览捕捉到了人的微笑，自动拍照保存。opencv库的编译就不说了。这篇有介绍：androidopencv导入进行编译_编译androidopencv-CSDN博客二、加载人脸特征和微笑特征文件faceCascade=loadCascade(R.raw.haarcasc
67-OpenCVSharp 创建实现Halcon的tile_images_offset算子（用于图像拼接，对每张图像设置偏移量）搬码驿站 #opencv 计算机视觉人工智能算法图像处理
以下是基于OpenCvSharp实现的Halcontile_images_offset算子的高性能函数。该函数不仅支持图像拼接，还允许对每张图像设置偏移量（offset），以灵活布局图像。代码中包含了详细注释和性能优化策略。为了优化运行时间和性能，我们可以从以下几个方面对代码进行改进：并行处理：利用多核CPU的能力，通过Parallel.For或其他并行技术加速图像复制操作。减少边界检查开销：在确
【视频】V4L2、ffmpeg、OpenCV中对YUV的定义郭老二视频音视频 ffmpeg opencv
1、常见的YUV格式1.1YUV420每像素16位IMC1：YYYYYYYYVV--UU–IMC3：YYYYYYYYUU--VV–每像素12位I420:YYYYYYYYUUVV=>YUV420PYV12:YYYYYYYYVVUU=>YUV420PNV12:YYYYYYYYUVUV=>YUV420SP（最受欢迎格式）NV21:YYYYYYYYVUVU=>YUV420SPIMC2：YYYYYYYYYY
20250310：OpenCV mat对象与base64互转微风❤水墨 AI模型部署 Mat转base64
代码：https://github.com/ReneNyffenegger/cpp-base64指南：https://renenyffenegger.ch/notes/development/Base64/Encoding-and-decoding-base-64-with-cpp/实操：
opencv python 光流法 weixin_34241036 人工智能 python
OpticalFlow光流法光流是由对象或相机的移动引起的两个连续帧之间的图像对象的明显运动的模式.它是2D矢量场，其中每个矢量是位移矢量，表示从第一帧到第二帧的点的移动.上图表示的是一个球在连续的5帧图像中的运动,箭头显示其位移矢量.光流法原理的基础：目标像素强度在连续帧之间不变相邻像素具有相似的运动第一帧的像素I(x,y,t),在dt时间之后的下一帧中移动距离(dx，dy),因为这些像素是相同
OpenCV-Python 光流 LeonDL168 Opencv-Python opencv python 人工智能
40.1光流由于目标对象或者摄像机的移动造成的图像对象在连续两帧图像中的移动被称为光流。它是一个2D向量场，可以用来显示一个点从第一帧图像到第二帧图像之间的移动。如下图所示（ImageCourtesy:WikipediaarticleonOpticalFlow）：OpticalFlow上图显示了一个点在连续的五帧图像间的移动。箭头表示光流场向量。光流在很多领域中都很有用：•由运动重建结构•视频压缩
【全流程】配置 Jetson Nano 摄像头使用 GStreamer 传输 RTSP 流到本地（整合版）咚叶大人 visual studio tcp/ip 硬件架构实时音视频计算机视觉
文末附录内容：【本地编译OpenCV支持GStreamer（Windows方案）】写在前面：为什么选择GStreamer？在JetsonNano这样的微机平台中，我们选择视频流传输工具时应该综合考虑硬件兼容性、延迟、资源占用和开发效率这几个方面。以下是GStreamer与其他常见几种工具做对比：工具/框架优势局限性适用场景GStreamer✅深度整合NVIDIA硬件编码（NVENC/NVDEC）✅
Python----计算机视觉处理（opencv：像素，RGB颜色，图像的存储，opencv安装，代码展示）蹦蹦跳跳真可爱589 Python opencv 图像处理计算机视觉 python opencv 人工智能
一、计算机眼中的图像像素像素是图像的基本单元，每个像素存储着图像的颜色、亮度和其他特征。一系列像素组合到一起就形成了完整的图像，在计算机中，图像以像素的形式存在并采用二进制格式进行存储。根据图像的颜色不同，每个像素可以用不同的二进制数表示。日常生活中常见的图像是RGB三原色图。RGB图上的每个点都是由红（R）、绿（G）、蓝（B）三个颜色按照一定比例混合而成的，几乎所有颜色都可以通过这三种颜色按照不
九点标定 opencv 方式实现手眼标定孙春泉 opencv 计算机视觉微信小程序
opencv获取中心点位置代码：MatSrcMat(nImgWidth,nImgHeight,CV_8UC3);UCharToMat(pSrcImg,nImgHeight,nImgWidth,24,SrcMat);MatgrayMat;cvtColor(SrcMat,grayMat,COLOR_BGR2GRAY);MatbinMat=cv::Mat::zeros(SrcMat.size(),CV_
【Python+OpenCV实战】手把手教你打造自定义视频播放器 m0_54877156 计算机视觉 python opencv
随着计算机视觉技术的发展，Python作为其主要开发语言，搭配强大的OpenCV库，为我们提供了无比丰富的功能和可能性。今天，我们将一起踏入这个奇妙的世界，通过Python和cv2来实现一款自定义的视频播放器，让你在理解基础原理的同时，也能亲手打造出属于自己的酷炫工具。首先我们需要确保安装了必要的库pipinstallopencv-python安装完毕之后我们就可以正式开始了。1.导入OpenCV
用OpenCV写个视频播放器可还行？（Python版）程序员Linc 计算机视觉 opencv 音视频 python
引言提到OpenCV，大家首先想到的可能是图像处理、目标检测，但你是否想过——用OpenCV实现一个带进度条、倍速播放、暂停功能的视频播放器？本文将通过一个实战项目，带你深入掌握OpenCV的视频处理能力，并解锁以下功能：基础播放/暂停动态倍速调节（0.5x~4x）交互式进度条实时时间戳显示文末提供完整代码，可直接运行！一、环境准备安装OpenCVpipinstallopencv-python#P
常用图像增强算法原理及 OpenCV C++ 实现埃菲尔铁塔_CV算法 opencv 计算机视觉人工智能 c++算法机器学习
一、引言图像增强是数字图像处理中的一个重要分支，其目的是改善图像的视觉效果，突出图像中的重要信息，或者将图像转换为更适合人或机器分析处理的形式。在实际应用中，图像增强技术广泛应用于医学影像、遥感图像、安防监控等领域。本文将详细介绍常用的图像增强算法原理，并给出基于OpenCVC++库的实现代码。二、图像增强算法分类图像增强算法可以分为空间域增强和频域增强两大类。空间域增强是直接对图像的像素值进行操
opencv借助ffmpeg读取sdp文件进行rtp拉流 20231019 诗筱涵 rtsp 用简单代码实现功能 OpenCV rtp
20231019ffmpeg装起来很快编译命令g++rtp_ffmpeg_test.cpp-ooutput$(pkg-config--libsopencv4)代码如下#include#include#include#includeusingnamespacestd;usingnamespacecv;intmain(intargc,char**argv){cout>frame;if(frame.em
【OpenCV C++】存图，如何以时间命名，“年月日-时分秒“产生唯一的文件名呢？“年月日-时分秒-毫秒“ 自动检查存储目录，若不存在自动创建存图 R-G-B OpenCV C++C/C++opencv c++人工智能
文章目录1生成文件名（格式:"年月日-时分秒"格式）2生成文件名（格式:"年月日-时分秒-毫秒"）3多模式存图函数4综合调用实例5注意：默认参数只能在头文件中定义，不能在实现中重复默认参数mode==1→“年月日-时分”→YYYYMMDD-HHMM的文件名；例如：20250310-1647mode==2→"年月日-时分秒-毫秒"→YYYYMMDD-HHMMSS-MMM（适用采集存储帧率搞得图片，增
SOPHON SDK解码视频流的常见调试方法算能开发者社区 SOPHON SDK常见问题 linux 人工智能
SOPHONSDK解码视频流的常见调试方法1.rtsp连接测试2.判断rtsp是否正常工作3.确认解码器是否能正常工作：（url为文件名或者rtsp连接地址）4.确认解码器和vpp的OpenCV接口是否正常工作5.解码不正确或者无法解码的最终调试手段1.rtsp连接测试ffmpeg-rtsp_transporttcp-iurl-frawvideo-y/dev/null或者ffmpeg-rtsp_t
人脸识别，dlib优化，Dlib/OpenCV交叉编译 yiyayiya557 linux 嵌入式
参考文章：GitRepo镜像使用帮助https://mirrors.tuna.tsinghua.edu.cn/help/git-repo/交叉编译Dlib+OpenCV交叉编译移植到ARM64-v8平台（编译不通过，不可用）https://blog.csdn.net/kaychangeek/article/details/80365320Qt移植到ARM64-v8平台(NXPi.MX8M)笔记（未
智能遥感新质生产力：ChatGPT、Python和OpenCV强强联合；空天地遥感数据分析的全流程；地面数据、无人机数据、卫星数据、多源数据等处理小艳加油 DeepSeek ChatGPT 遥感遥感新质生产力 ChatGPT OpenCV 遥感数据处理
通过系统化的模块设计和丰富的实战案例，深入理解和掌握遥感数据的处理与计算。不仅涵盖了从零基础入门Python编程、OpenCV视觉处理的基础知识，还将借助ChatGPT智能支持，引导您掌握遥感影像识别和分析的进阶技术。更为重要的是，通过15个经过精心设计的真实案例，深度参与地质监测、城市规划、农业分析、生态评估等不同场景下的遥感应用实践。层层递进、结构严谨，帮助您系统性掌握从数据预处理、图像增强、
opencv cuda例程 OpenCV和Cuda结合编程 weixin_44602056 opencv C++
本文转载自：https://www.fuwuqizhijia.com/linux/201704/70863.html此网页，仅保存下来供随时查看一、利用OpenCV中提供的GPU模块目前，OpenCV中已提供了许多GPU函数，直接使用OpenCV提供的GPU模块，可以完成大部分图像处理的加速操作。该方法的优点是使用简单，利用GpuMat管理CPU与GPU之间的数据传输，而且不需要关注内核函数调用参
OpenCV连续数字识别—可运行验证正冬升 OpenCV opencv 人工智能计算机视觉
前言文章开始，瞎说一点其他的东西，真的是很离谱，找了至少两三个小时，就一个简单的需求：1、利用OpenCV在Windows进行抓图2、利用OpenCV进行连续数字的检测。3、使用C++，Qt3、将检测的结果显示出来就这么简单的需求，结果网上找了各种版本硬是找不到,要是代码可能没啥问题，但是运行不了，你这运行不了，我怎么知道你到底能不能用，我代码调半天能用了，结果你跟我说最后效果不好，为啥呢？因为图
利用CUDA与OpenCV实现高效图像处理：全面指南快撑死的鱼 C++（C语言）算法大揭秘 opencv 图像处理人工智能
利用CUDA与OpenCV实现高效图像处理：全面指南前言在现代计算机视觉领域，图像处理的需求日益增加。无论是自动驾驶、安防监控，还是医疗影像分析，图像处理技术都扮演着至关重要的角色。然而，图像处理的计算量非常大，往往需要强大的计算能力来保证实时性和高效性。幸运的是，CUDA和OpenCV为我们提供了一种高效的图像处理解决方案。本篇文章将详细介绍如何结合CUDA与OpenCV，利用GPU的强大计算能
【无标题】东东就是我 opencv 计算机视觉人工智能
1.计算机视觉与图像处理计算机视觉技术涵盖从图像预处理到目标检测的全流程，是工业视觉系统的核心部分。知识点扩展OpenCV基础cv2.imread()、cv2.imshow()、cv2.imwrite()进行基本图像读取、显示、保存cv2.cvtColor()进行颜色空间转换（RGB↔GRAY，RGB↔HSV）cv2.resize()进行图像缩放cv2.flip()进行图像翻转（水平/垂直）imp
linux 下 CUDA + Opencv 编程之 CMakeLists.txt maxruan 编程图像处理 CUDA opencv linux c++cuda
CMAKE_MINIMUM_REQUIRED(VERSION2.8)PROJECT(medianFilterGPU)#CUDApackageFIND_PACKAGE(CUDAREQUIRED)INCLUDE(FindCUDA)#CUDAincludedirectoriesINCLUDE_DIRECTORIES(/usr/local/cuda/include)#OpenCVpackageFIND_P
CUDA编程之OpenCV与CUDA结合使用 byxdaz CUDA opencv 人工智能计算机视觉
OpenCV与CUDA的结合使用可显著提升图像处理性能。一、版本匹配与环境配置CUDA与OpenCV版本兼容性‌OpenCV各版本对CUDA的支持存在差异，例如OpenCV4.5.4需搭配CUDA10.0‌2，而较新的OpenCV4.8.0需使用更高版本CUDA‌。需注意部分模块（如级联检测器）可能因CUDA版本更新而不再支持‌。‌OpenCV版本CUDA版本4.5.x‌推荐CUDA11.x及以下
用OpenCV写个视频播放器可还行？（C++版）程序员Linc OpenCV opencv 音视频 c++opencv 4.11
引言提到OpenCV，大家首先想到的可能是图像处理、目标检测，但你是否想过——用OpenCV实现一个带进度条、倍速播放、暂停功能的视频播放器？本文将通过一个实战项目，带你深入掌握OpenCV的视频处理能力，并解锁以下功能：基础播放/暂停动态倍速调节（0.5x~4x）交互式进度条实时时间戳显示文末提供完整代码，可直接运行！一、环境准备安装OpenCV请参考其他博客，C++版本的OpenCV安装，每个
使用OpenCV和MediaPipe库——驼背检测（姿态监控） WenJGo AI学习之路 Python之路 opencv 人工智能计算机视觉算法 python numpy
目录驼背检测的运用1.驾驶姿态与疲劳关联分析2.行业应用案例1.教育场景痛点分析2.智能教室系统架构代码实现思路1.初始化与配置2.MediaPipe和摄像头设置3.主循环4.资源释放RGB与BGR的区别一、本质区别二、OpenCV的特殊性内存结构示意图：三、转换必要性分析转换流程图示：四、常见问题场景五、性能优化建议六、底层原理七、验证实验八、现代发展趋势整体代码效果展示驼背检测的运用1.驾驶姿
使用Python 打造专属自己的屏幕录制工具：使用NumPy、PIL和OpenCV的完整指南 LIY若依 opencv 人工智能 python 应用开发录屏软件
简介在这篇博客中，我们将介绍如何使用NumPy、PIL和OpenCV创建一个屏幕录制工具。通过逐步解析代码片段，解释每个部分的功能，最终展示完整代码。希望这篇博客能帮助你理解如何实现屏幕录制功能。依赖库在运行代码之前，请确保已安装以下依赖库：NumPyPIL（Pillow）OpenCV可以使用以下命令安装这些库：pipinstallnumpypillowopencv-python步骤1:导入必要的
Python 基于 OpenCV 视觉图像处理实战之 OpenCV 简单实战案例之八简单水彩画效果仙魁XAN Python OpenCV python opencv 图像处理水彩画效果水彩画
Python基于OpenCV视觉图像处理实战之OpenCV简单实战案例之八简单水彩画效果目录Python基于OpenCV视觉图像处理实战之OpenCV简单实战案例之八简单水彩画效果一、简单介绍二、简单图像浮雕效果实现原理三、简单水彩画效果案例实现简单步骤四、注意事项：一、简单介绍Python是一种跨平台的计算机程序设计语言。是一种面向对象的动态类型语言，最初被设计用于编写自动化脚本(shell)，
OpenCV基础：用Python生成一幅黑白图像 superdont 计算机视觉入门 python 开发语言 opencv 人工智能计算机视觉矩阵
OpenCV的基础是处理图像，而图像的基础是矩阵。因此，如何使用好矩阵时非常关键的。下面我们通过一个具体的实例来展示如何通过Python和OpenCV对矩阵进行操作，从而更好地实现对图像的处理。具体要求：使用Python：生成一幅左黑右白的灰度图像，图像大小为16×16像素。借助OpenCV库。输出数值，并显示图像。Python代码下面的程序通过OpenCV、numpy两个库实现构造矩阵，修改特征
OpenCV计算摄影学（19）非真实感渲染（Non-Photorealistic Rendering, NPR）村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述非真实感渲染（Non-PhotorealisticRendering,NPR）是一种计算机图形学技术，旨在生成具有艺术风格或其他非现实视觉效果的图像和动画。与追求照片级真实感的渲染技术不同，NPR专注于模仿各种绘画风格、手绘效果、卡通风格等，以创造具有独特美学价值
OpenCV计算摄影学（16）调整图像光照效果函数illuminationChange() 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述对选定区域内的梯度场应用适当的非线性变换，然后通过泊松求解器重新积分，可以局部修改图像的表观照明。cv::illuminationChange是OpenCV中用于调整图像光照效果的一个函数。通过这个函数，你可以修改图像中的光照分布，以达到改善图像视觉效果或者为图像
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s