SIFT算法实现理解及注释详解(基于Rob Hess源码)

Rob Hess的SIFT算法实现理解及注释

SIFT算法不用我多解释了，这是一个很强大的算法，主要用于图像配准和物体识别等领域，但是其计算量相比也比较大，性价比比较高的算法包括PCA-SIFT和SURF其中OpenCV提供了SURF算法，但是为了方便理解。这里给出了Rob Hess所实现的SIFT算法的实现以及注释，结合我自己的理解，如果，您有关于SIFT算法不理解的地方咱们可以一起交流一下。或者您认为不详细的地方提出来。

SIFT算法的主要实现在sift.c这个文件，其主要流程为：

(1)首先创建初始图像，即通过将图像转换为32位的灰度图，然后将图像使用三次插值来方大，之后通过高斯模糊处理

(2)在此基础上进行高斯金字塔的构建以及高斯差分金字塔的构建

(3)对图像进行极值点检测

(4)计算特征向量的尺度

(5)调整图像大小

(6)计算特征的方向

(7)计算描述子，其中包括计算二维方向直方图并转换直方图为特征描述子

首先给出sift算法的整体框架代码：

输入参数：

img为输入图像；

feat为所要提取的特征指针；

intvl指的是高斯金字塔和差分金字塔的层数；

sigma指的是图像初始化过程中高斯模糊所使用的参数；

contr_thr是归一化之后的去除不稳定特征的阈值；

curv_thr指的是去除边缘的特征的主曲率阈值；

img_dbl是是否将图像放大为之前的两倍；

descr_with用来计算特征描述子的方向直方图的宽度；

descr_hist_bins是直方图中的条数

 
   int _sift_features( IplImage* img, struct feature** feat, int intvls,  
                    double sigma, double contr_thr, int curv_thr,  
                    int img_dbl, int descr_width, int descr_hist_bins )  
 {  
     IplImage* init_img;  
     IplImage*** gauss_pyr, *** dog_pyr;  
     CvMemStorage* storage;  
     CvSeq* features;  
     int octvs, i, n = 0;  
   
     /* check arguments */  
     if( ! img )  
         fatal_error( "NULL pointer error, %s, line %d",  __FILE__, __LINE__ );  
   
     if( ! feat )  
         fatal_error( "NULL pointer error, %s, line %d",  __FILE__, __LINE__ );  
   
     /* build scale space pyramid; smallest dimension of top level is ~4 pixels */  
     /* 构建高斯尺度空间金字塔，顶层最小的为4像素 */  
     init_img = create_init_img( img, img_dbl, sigma );  
     octvs = log( double MIN( init_img->width, init_img->height ) ) / log(2.0) - 2;  
     //构建高斯金字塔和高斯差分金字塔  
     gauss_pyr = build_gauss_pyr( init_img, octvs, intvls, sigma );  
     dog_pyr = build_dog_pyr( gauss_pyr, octvs, intvls );  
   
     storage = cvCreateMemStorage( 0 );  
   
     //尺度空间极值点检测  
     features = scale_space_extrema( dog_pyr, octvs, intvls, contr_thr,  
         curv_thr, storage );  
       
     //画出去除低对比度的极值点  
     //draw_extrempoint(img , features);  
   
   
   
   
     //计算特征向量的尺度  
     calc_feature_scales( features, sigma, intvls );  
     if( img_dbl )  
         adjust_for_img_dbl( features );  
     //计算特征的方向  
     calc_feature_oris( features, gauss_pyr );  
     //计算描述子，包括计算二维方向直方图和转换其为特征描述子  
     compute_descriptors( features, gauss_pyr, descr_width, descr_hist_bins );  
   
     /* sort features by decreasing scale and move from CvSeq to array */  
     cvSeqSort( features, (CvCmpFunc)feature_cmp, NULL );  
     n = features->total;  
     *feat = static_cast<feature *>( calloc( n, sizeof(struct feature) ) );  
     *feat = static_cast<feature *>( cvCvtSeqToArray( features, *feat, CV_WHOLE_SEQ ) );  
   
   
   
   
     for( i = 0; i < n; i++ )  
     {  
         free( (*feat)[i].feature_data );  
         (*feat)[i].feature_data = NULL;  
     }  
   
     cvReleaseMemStorage( &storage );  
     cvReleaseImage( &init_img );  
     release_pyr( &gauss_pyr, octvs, intvls + 3 );  
     release_pyr( &dog_pyr, octvs, intvls + 2 );  
     return n;  
 }  
 
 

(1)初始化图像

输入参数：

这里不需要解释了

该函数主要用来初始化图像，转换图像为32位灰度图以及进行高斯模糊。

 
   static IplImage* create_init_img( IplImage* img, int img_dbl, double sigma )  
 {  
     IplImage* gray, * dbl;  
     float sig_diff;  
   
     gray = convert_to_gray32( img );  
     if( img_dbl )  
     {  
         sig_diff = sqrt( sigma * sigma - SIFT_INIT_SIGMA * SIFT_INIT_SIGMA * 4 );  
         dbl = cvCreateImage( cvSize( img->width*2, img->height*2 ),  
             IPL_DEPTH_32F, 1 );  
         cvResize( gray, dbl, CV_INTER_CUBIC );  
         cvSmooth( dbl, dbl, CV_GAUSSIAN, 0, 0, sig_diff, sig_diff );  
         cvReleaseImage( &gray );  
         return dbl;  
     }  
     else  
     {  
         sig_diff = sqrt( sigma * sigma - SIFT_INIT_SIGMA * SIFT_INIT_SIGMA );  
         cvSmooth( gray, gray, CV_GAUSSIAN, 0, 0, sig_diff, sig_diff );  
         return gray;  
     }  
 }  
 
 

(2)构建高斯金字塔

输入参数：

octvs是高斯金字塔的组

invls是高斯金字塔的层数

sigma是初始的高斯模糊参数，后续也通过它计算每一层所使用的sigma

 
   <span style="font-size:13px;">static IplImage*** build_gauss_pyr( IplImage* base, int octvs,int intvls, double sigma )  
 {  
     IplImage*** gauss_pyr;  
     double* sig = static_cast<double *>( calloc( intvls + 3, sizeof(double)) );  
     double sig_total, sig_prev, k;  
     int i, o;  
   
     gauss_pyr = static_cast<IplImage ***>( calloc( octvs, sizeof( IplImage** ) ) );  
     for( i = 0; i < octvs; i++ )  
         gauss_pyr[i] = static_cast<IplImage **>( calloc( intvls + 3, sizeof( IplImage* ) ) );  
   
     /* 
         precompute Gaussian sigmas using the following formula: 
         预计算每次高斯模糊的sigma 
  
         \sigma_{total}^2 = \sigma_{i}^2 + \sigma_{i-1}^2 
     */  
     sig[0] = sigma;  
     k = pow( 2.0, 1.0 / intvls );  
     for( i = 1; i < intvls + 3; i++ )  
     {  
         sig_prev = pow( k, i - 1 ) * sigma;  
         sig_total = sig_prev * k;  
         sig[i] = sqrt( sig_total * sig_total - sig_prev * sig_prev );  
     }  
       
       
     for( o = 0; o < octvs; o++ )  
         for( i = 0; i < intvls + 3; i++ )  
         {  
             //对每一层进行降采样，形成高斯金字塔的每一层  
             if( o == 0  &&  i == 0 )  
                 gauss_pyr[o][i] = cvCloneImage(base);  
   
             /* base of new octvave is halved image from end of previous octave */  
             //每一组的第一层都是通过对前面一组的最上面一层的降采样实现的  
             else if( i == 0 )  
                 gauss_pyr[o][i] = downsample( gauss_pyr[o-1][intvls] );  
   
             /* blur the current octave's last image to create the next one */  
             //每一组的其他层则使通过使用不同sigma的高斯模糊来进行处理  
             else  
             {  
                 gauss_pyr[o][i] = cvCreateImage( cvGetSize(gauss_pyr[o][i-1]),  
                     IPL_DEPTH_32F, 1 );  
                 cvSmooth( gauss_pyr[o][i-1], gauss_pyr[o][i],  
                     CV_GAUSSIAN, 0, 0, sig[i], sig[i] );  
             }  
         }  
   
     free( sig );  
     return gauss_pyr;  
 }</span>  
 
 

降采样处理

输入参数：

不解释

这就是降采样，其实就是将图像通过最近邻算法缩小为原来的一半

 
   static IplImage* downsample( IplImage* img )  
 {  
     IplImage* smaller = cvCreateImage( cvSize(img->width / 2, img->height / 2),  
         img->depth, img->nChannels );  
     cvResize( img, smaller, CV_INTER_NN );  
   
     return smaller;  
 }  
 
 

(3)构建高斯差分金字塔

输入参数：

不解释了参见上面的说明即可

实际上差分金字塔的构成是通过对相邻层的图像进行相减获得的

 
   <span style="font-size:16px;">static IplImage*** build_dog_pyr( IplImage*** gauss_pyr, int octvs, int intvls )  
 {  
     IplImage*** dog_pyr;  
     int i, o;  
   
     dog_pyr = static_cast<IplImage ***>( calloc( octvs, sizeof( IplImage** ) ) );  
     for( i = 0; i < octvs; i++ )  
         dog_pyr[i] = static_cast<IplImage **>( calloc( intvls + 2, sizeof(IplImage*) ) );  
   
     for( o = 0; o < octvs; o++ )  
         for( i = 0; i < intvls + 2; i++ )  
         {  
             dog_pyr[o][i] = cvCreateImage( cvGetSize(gauss_pyr[o][i]),  
                 IPL_DEPTH_32F, 1 );  
             cvSub( gauss_pyr[o][i+1], gauss_pyr[o][i], dog_pyr[o][i], NULL );  
         }  
   
     return dog_pyr;  
 }</span>  
 
 

(4)极值点检测

输入参数：

contr_thr是去除对比度低的点所采用的阈值

curv_thr是去除边缘特征的阈值

 
   static CvSeq* scale_space_extrema( IplImage*** dog_pyr, int octvs, int intvls,  
                                    double contr_thr, int curv_thr,  
                                    CvMemStorage* storage )  
 {  
     CvSeq* features;  
     double prelim_contr_thr = 0.5 * contr_thr / intvls;  
     struct feature* feat;  
     struct detection_data* ddata;  
     int o, i, r, c;  
   
     features = cvCreateSeq( 0, sizeof(CvSeq), sizeof(struct feature), storage );  
     for( o = 0; o < octvs; o++ )  
         for( i = 1; i <= intvls; i++ )  
             for(r = SIFT_IMG_BORDER; r < dog_pyr[o][0]->height-SIFT_IMG_BORDER; r++)  
                 for(c = SIFT_IMG_BORDER; c < dog_pyr[o][0]->width-SIFT_IMG_BORDER; c++)  
                     /* perform preliminary check on contrast */  
                     if( ABS( pixval32f( dog_pyr[o][i], r, c ) ) > prelim_contr_thr )  
                         if( is_extremum( dog_pyr, o, i, r, c ) )  
                         {  
                             feat = interp_extremum(dog_pyr, o, i, r, c, intvls, contr_thr);  
                             if( feat )  
                             {  
                                 ddata = feat_detection_data( feat );  
                                 if( ! is_too_edge_like( dog_pyr[ddata->octv][ddata->intvl],  
                                     ddata->r, ddata->c, curv_thr ) )  
                                 {  
                                     cvSeqPush( features, feat );  
                                 }  
                                 else  
                                     free( ddata );  
                                 free( feat );  
                             }  
                         }  
   
     return features;  
 }  
 
 

SIFT_IMG_BORDER是预定义的图像边缘；

通过和对比度阈值比较去掉低对比度的点；

而通过is_extremum来判断是否为极值点，如果是则通过极值点插值的方式获取亚像素的极值点的位置。

然后通过is_too_eage_like和所给的主曲率阈值判断是否为边缘点

*判断是否为极值点

其原理为:通过和高斯金字塔的上一层的9个像素+本层的除了本像素自己的其他的8个像素和下一层的9个像素进行比较看是否为这26个像素中最小的一个或者是否为最大的一个，如果是则为极值点。

 
   static int is_extremum( IplImage*** dog_pyr, int octv, int intvl, int r, int c )  
 {  
     float val = pixval32f( dog_pyr[octv][intvl], r, c );  
     int i, j, k;  
   
     /* check for maximum */  
     if( val > 0 )  
     {  
         for( i = -1; i <= 1; i++ )  
             for( j = -1; j <= 1; j++ )  
                 for( k = -1; k <= 1; k++ )  
                     if( val < pixval32f( dog_pyr[octv][intvl+i], r + j, c + k ) )  
                         return 0;  
     }  
   
     /* check for minimum */  
     else  
     {  
         for( i = -1; i <= 1; i++ )  
             for( j = -1; j <= 1; j++ )  
                 for( k = -1; k <= 1; k++ )  
                     if( val > pixval32f( dog_pyr[octv][intvl+i], r + j, c + k ) )  
                         return 0;  
     }  
   
     return 1;  
 }  
 
 

*获取亚像素的极值点的位置

 
   static struct feature* interp_extremum( IplImage*** dog_pyr, int octv, int intvl,  
                                         int r, int c, int intvls, double contr_thr )  
 {  
     struct feature* feat;  
     struct detection_data* ddata;  
     double xi, xr, xc, contr;//分别为亚像素的intval,row,col的偏移offset，和对比度  
     int i = 0;  
   
     while( i < SIFT_MAX_INTERP_STEPS )//重新确定极值点并重新定位的操作只能循环 5次  
     {  
         interp_step( dog_pyr, octv, intvl, r, c, &xi, &xr, &xc );  
         if( ABS( xi ) < 0.5  &&  ABS( xr ) < 0.5  &&  ABS( xc ) < 0.5 )//如果满足条件就停止寻找  
             break;  
         //否则继续寻找极值点  
         c += cvRound( xc );  
         r += cvRound( xr );  
         intvl += cvRound( xi );  
   
         if( intvl < 1  ||  
             intvl > intvls  ||  
             c < SIFT_IMG_BORDER  ||  
             r < SIFT_IMG_BORDER  ||  
             c >= dog_pyr[octv][0]->width - SIFT_IMG_BORDER  ||  
             r >= dog_pyr[octv][0]->height - SIFT_IMG_BORDER )  
         {  
             return NULL;  
         }  
   
         i++;  
     }  
       
     //确保极值点是经过最大5步找到的  
     /* ensure convergence of interpolation */  
     if( i >= SIFT_MAX_INTERP_STEPS )  
         return NULL;  
       
     //获取找到的极值点的对比度  
     contr = interp_contr( dog_pyr, octv, intvl, r, c, xi, xr, xc );  
     //判断极值点是否小于某一个阈值  
     if( ABS( contr ) < contr_thr / intvls )  
         return NULL;  
     //若小于，则认为是极值点  
     feat = new_feature();  
     ddata = feat_detection_data( feat );  
     feat->img_pt.x = feat->x = ( c + xc ) * pow( 2.0, octv );  
     feat->img_pt.y = feat->y = ( r + xr ) * pow( 2.0, octv );  
     ddata->r = r;  
     ddata->c = c;  
     ddata->octv = octv;  
     ddata->intvl = intvl;  
     ddata->subintvl = xi;  
   
     return feat;  
 }  
 
 

*获取亚像素位置中所用到的函数

 
   static void interp_step( IplImage*** dog_pyr, int octv, int intvl, int r, int c,  
                          double* xi, double* xr, double* xc )  
 {  
     CvMat* dD, * H, * H_inv, X;  
     double x[3] = { 0 };  
       
   
     //计算三维偏导数  
     dD = deriv_3D( dog_pyr, octv, intvl, r, c );  
     //计算三维海森矩阵  
     H = hessian_3D( dog_pyr, octv, intvl, r, c );  
     H_inv = cvCreateMat( 3, 3, CV_64FC1 );  
     cvInvert( H, H_inv, CV_SVD );  
     cvInitMatHeader( &X, 3, 1, CV_64FC1, x, CV_AUTOSTEP );  
   
     cvGEMM( H_inv, dD, -1, NULL, 0, &X, 0 );  
   
     cvReleaseMat( &dD );  
     cvReleaseMat( &H );  
     cvReleaseMat( &H_inv );  
   
     *xi = x[2];  
     *xr = x[1];  
     *xc = x[0];  
 }  
 
 

*计算三维偏导数

计算在x和y方向上的偏导数，高斯差分尺度空间金字塔中像素的尺度

实际上在离散数据中计算偏导数是通过相邻像素的相减来计算的

比如说计算x方向的偏导数dx，则通过该向所的x方向的后一个减去前一个然后除以2即可求的dx

 
    static CvMat* deriv_3D( IplImage*** dog_pyr, int octv, int intvl, int r, int c )  
 {  
     CvMat* dI;  
     double dx, dy, ds;  
   
     dx = ( pixval32f( dog_pyr[octv][intvl], r, c+1 ) -  
         pixval32f( dog_pyr[octv][intvl], r, c-1 ) ) / 2.0;  
     dy = ( pixval32f( dog_pyr[octv][intvl], r+1, c ) -  
         pixval32f( dog_pyr[octv][intvl], r-1, c ) ) / 2.0;  
     ds = ( pixval32f( dog_pyr[octv][intvl+1], r, c ) -  
         pixval32f( dog_pyr[octv][intvl-1], r, c ) ) / 2.0;  
   
     dI = cvCreateMat( 3, 1, CV_64FC1 );  
     cvmSet( dI, 0, 0, dx );  
     cvmSet( dI, 1, 0, dy );  
     cvmSet( dI, 2, 0, ds );  
   
     return dI;  
 }  
 
  

*计算三维海森矩阵

不需要讲什么，其实就是计算二次导数，计算方法也和一次导数的计算如出一辙。

然后将结果放入到一个矩阵中去。

 
    static CvMat* hessian_3D( IplImage*** dog_pyr, int octv, int intvl, int r, int c )  
 {  
     CvMat* H;  
     double v, dxx, dyy, dss, dxy, dxs, dys;  
   
     v = pixval32f( dog_pyr[octv][intvl], r, c );  
     dxx = ( pixval32f( dog_pyr[octv][intvl], r, c+1 ) +   
             pixval32f( dog_pyr[octv][intvl], r, c-1 ) - 2 * v );  
     dyy = ( pixval32f( dog_pyr[octv][intvl], r+1, c ) +  
             pixval32f( dog_pyr[octv][intvl], r-1, c ) - 2 * v );  
     dss = ( pixval32f( dog_pyr[octv][intvl+1], r, c ) +  
             pixval32f( dog_pyr[octv][intvl-1], r, c ) - 2 * v );  
     dxy = ( pixval32f( dog_pyr[octv][intvl], r+1, c+1 ) -  
             pixval32f( dog_pyr[octv][intvl], r+1, c-1 ) -  
             pixval32f( dog_pyr[octv][intvl], r-1, c+1 ) +  
             pixval32f( dog_pyr[octv][intvl], r-1, c-1 ) ) / 4.0;  
     dxs = ( pixval32f( dog_pyr[octv][intvl+1], r, c+1 ) -  
             pixval32f( dog_pyr[octv][intvl+1], r, c-1 ) -  
             pixval32f( dog_pyr[octv][intvl-1], r, c+1 ) +  
             pixval32f( dog_pyr[octv][intvl-1], r, c-1 ) ) / 4.0;  
     dys = ( pixval32f( dog_pyr[octv][intvl+1], r+1, c ) -  
             pixval32f( dog_pyr[octv][intvl+1], r-1, c ) -  
             pixval32f( dog_pyr[octv][intvl-1], r+1, c ) +  
             pixval32f( dog_pyr[octv][intvl-1], r-1, c ) ) / 4.0;  
   
     H = cvCreateMat( 3, 3, CV_64FC1 );  
     cvmSet( H, 0, 0, dxx );  
     cvmSet( H, 0, 1, dxy );  
     cvmSet( H, 0, 2, dxs );  
     cvmSet( H, 1, 0, dxy );  
     cvmSet( H, 1, 1, dyy );  
     cvmSet( H, 1, 2, dys );  
     cvmSet( H, 2, 0, dxs );  
     cvmSet( H, 2, 1, dys );  
     cvmSet( H, 2, 2, dss );  
   
     return H;  
 }  
 
  

*计算插入像素的对比度

 
    static double interp_contr( IplImage*** dog_pyr, int octv, int intvl, int r,  
                             int c, double xi, double xr, double xc )  
 {  
     CvMat* dD, X, T;  
     double t[1], x[3] = { xc, xr, xi };  
   
     cvInitMatHeader( &X, 3, 1, CV_64FC1, x, CV_AUTOSTEP );  
     cvInitMatHeader( &T, 1, 1, CV_64FC1, t, CV_AUTOSTEP );  
     dD = deriv_3D( dog_pyr, octv, intvl, r, c );  
     cvGEMM( dD, &X, 1, NULL, 0, &T,  CV_GEMM_A_T );  
     cvReleaseMat( &dD );  
   
     return pixval32f( dog_pyr[octv][intvl], r, c ) + t[0] * 0.5;  
 }  
 
  

其中cvGEMM是矩阵的通用计算函数，至于CV_GEMM_A_T是计算dD的转置矩阵放入T中

*去除边缘相应
通过计算所在特征向量的主曲率半径来判断特征是边缘的从而导致不稳定
即去除边缘响应

 
    static int is_too_edge_like( IplImage* dog_img, int r, int c, int curv_thr )  
 {  
     double d, dxx, dyy, dxy, tr, det;  
   
     /* principal curvatures are computed using the trace and det of Hessian */  
     d = pixval32f(dog_img, r, c);  
     dxx = pixval32f( dog_img, r, c+1 ) + pixval32f( dog_img, r, c-1 ) - 2 * d;  
     dyy = pixval32f( dog_img, r+1, c ) + pixval32f( dog_img, r-1, c ) - 2 * d;  
     dxy = ( pixval32f(dog_img, r+1, c+1) - pixval32f(dog_img, r+1, c-1) -  
             pixval32f(dog_img, r-1, c+1) + pixval32f(dog_img, r-1, c-1) ) / 4.0;  
     tr = dxx + dyy;  
     det = dxx * dyy - dxy * dxy;  
   
     /* negative determinant -> curvatures have different signs; reject feature */  
     if( det <= 0 )  
         return 1;  
   
     if( tr * tr / det < ( curv_thr + 1.0 )*( curv_thr + 1.0 ) / curv_thr )  
         return 0;  
     return 1;  
 }  
 
  

(4)计算特征向量的尺度

实际上是通过最初的sigma来获得每一层每一组的尺度

 
    static void calc_feature_scales( CvSeq* features, double sigma, int intvls )  
 {  
     struct feature* feat;  
     struct detection_data* ddata;  
     double intvl;  
     int i, n;  
   
     n = features->total;  
     for( i = 0; i < n; i++ )  
     {  
         feat = CV_GET_SEQ_ELEM( struct feature, features, i );  
         ddata = feat_detection_data( feat );  
         intvl = ddata->intvl + ddata->subintvl;  
         feat->scl = sigma * pow( 2.0, ddata->octv + intvl / intvls );  
         ddata->scl_octv = sigma * pow( 2.0, intvl / intvls );  
     }  
 }  
 
  

(5)调整图像特征坐标、尺度、点的坐标大小为原来的一半

 
    static void adjust_for_img_dbl( CvSeq* features )  
 {  
     struct feature* feat;  
     int i, n;  
   
     n = features->total;  
     for( i = 0; i < n; i++ )  
     {  
         feat = CV_GET_SEQ_ELEM( struct feature, features, i );  
         feat->x /= 2.0;  
         feat->y /= 2.0;  
         feat->scl /= 2.0;  
         feat->img_pt.x /= 2.0;  
         feat->img_pt.y /= 2.0;  
     }  
 }  
 
  

(6)给每一个图像特征向量计算规范化的方向

 
    static void calc_feature_oris( CvSeq* features, IplImage*** gauss_pyr )  
 {  
     struct feature* feat;  
     struct detection_data* ddata;  
     double* hist;  
     double omax;  
     int i, j, n = features->total;  
       
   
     //遍历整个检测出来的特征点，计算每个特征点的直方图，然后平滑直方图去除突变，然后找到每一个特征点的主方向，并加入到好的方向特征数组中去  
     for( i = 0; i < n; i++ )  
     {  
         feat = static_cast<feature *>( malloc( sizeof( struct feature ) ) );  
         cvSeqPopFront( features, feat );  
         ddata = feat_detection_data( feat );  
         //计算给定的某个像素的灰度方向直方图  
         hist = ori_hist( gauss_pyr[ddata->octv][ddata->intvl],  
                         ddata->r, ddata->c, SIFT_ORI_HIST_BINS,  
                         cvRound( SIFT_ORI_RADIUS * ddata->scl_octv ),  
                         SIFT_ORI_SIG_FCTR * ddata->scl_octv );  
         for( j = 0; j < SIFT_ORI_SMOOTH_PASSES; j++ )  
             smooth_ori_hist( hist, SIFT_ORI_HIST_BINS );  
         omax = dominant_ori( hist, SIFT_ORI_HIST_BINS );  
   
         //描述子向量元素门限化  
         add_good_ori_features( features, hist, SIFT_ORI_HIST_BINS,  
                                 omax * SIFT_ORI_PEAK_RATIO, feat );  
         free( ddata );  
         free( feat );  
         free( hist );  
     }  
 }  
 
  

*对所给像素计算灰度方向直方图
以关键点为中心的邻域窗口内采样，并用直方图统计邻域像素的梯度
方向。梯度直方图的范围是0～360度，其中每10度一个柱，总共36个柱

 
    static double* ori_hist( IplImage* img, int r, int c, int n, int rad, double sigma)  
 {  
     double* hist;  
     double mag, ori, w, exp_denom, PI2 = CV_PI * 2.0;  
     int bin, i, j;  
   
     hist = static_cast<double *>( calloc( n, sizeof( double ) ) );  
     exp_denom = 2.0 * sigma * sigma;  
     for( i = -rad; i <= rad; i++ )  
         for( j = -rad; j <= rad; j++ )  
             if( calc_grad_mag_ori( img, r + i, c + j, &mag, &ori ) )  
             {  
                 w = exp( -( i*i + j*j ) / exp_denom );  
                 bin = cvRound( n * ( ori + CV_PI ) / PI2 );  
                 bin = ( bin < n )? bin : 0;  
                 hist[bin] += w * mag;  
             }  
   
     return hist;  
 }  
 
  

*计算所给像素的梯度大小和方向
每一个小格都代表了特征点邻域所在的尺度空间的一个像素，箭头方向代表了像素梯
度方向，箭头长度代表该像素的幅值也就是梯度的值

 
    static int calc_grad_mag_ori( IplImage* img, int r, int c, double* mag, double* ori )  
 {  
     double dx, dy;  
   
     if( r > 0  &&  r < img->height - 1  &&  c > 0  &&  c < img->width - 1 )  
     {  
         dx = pixval32f( img, r, c+1 ) - pixval32f( img, r, c-1 );  
         dy = pixval32f( img, r-1, c ) - pixval32f( img, r+1, c );  
         *mag = sqrt( dx*dx + dy*dy );  
         *ori = atan2( dy, dx );  
         return 1;  
     }  
   
     else  
         return 0;  
 }  
 
  

*对方向直方图进行高斯模糊
使用高斯函数对直方图进行平滑，减少突变的影响。

 
    static void smooth_ori_hist( double* hist, int n )  
 {  
     double prev, tmp, h0 = hist[0];  
     int i;  
   
     prev = hist[n-1];  
     for( i = 0; i < n; i++ )  
     {  
         tmp = hist[i];  
         hist[i] = 0.25 * prev + 0.5 * hist[i] +   
             0.25 * ( ( i+1 == n )? h0 : hist[i+1] );  
         prev = tmp;  
     }  
 }  
 
  

*在直方图中找到主方向的梯度
利用关键点邻域像素的梯度方向分布特性为每个关键点指定方向参数，使算子具备
旋转不变性。

 
    static double dominant_ori( double* hist, int n )  
 {  
     double omax;  
     int maxbin, i;  
   
     omax = hist[0];  
     maxbin = 0;  
     for( i = 1; i < n; i++ )  
         if( hist[i] > omax )  
         {  
             omax = hist[i];  
             maxbin = i;  
         }  
     return omax;  
 }  
 
  

*将大于某一个梯度大小阈值的特征向量加入到直方图中去

n为方向的个数

 
    <span style="font-size:18px;">mag_thr描述子向量门限一般取0.2</span>

 
    static void add_good_ori_features( CvSeq* features, double* hist, int n,  
                                    double mag_thr, struct feature* feat )  
 {  
     struct feature* new_feat;  
     double bin, PI2 = CV_PI * 2.0;  
     int l, r, i;  
   
     for( i = 0; i < n; i++ )  
     {  
         l = ( i == 0 )? n - 1 : i-1;  
         r = ( i + 1 ) % n;  
           
   
         //描述子向量门限化，一般门限取0.2  
         if( hist[i] > hist[l]  &&  hist[i] > hist[r]  &&  hist[i] >= mag_thr )  
         {  
             bin = i + interp_hist_peak( hist[l], hist[i], hist[r] );  
             bin = ( bin < 0 )? n + bin : ( bin >= n )? bin - n : bin;  
             new_feat = clone_feature( feat );  
             new_feat->ori = ( ( PI2 * bin ) / n ) - CV_PI;  
             cvSeqPush( features, new_feat );  
             free( new_feat );  
         }  
     }  
 }  
 
  

(7)计算特征描述子

 
    static void compute_descriptors( CvSeq* features, IplImage*** gauss_pyr, int d, int n)  
 {  
     struct feature* feat;  
     struct detection_data* ddata;  
     double*** hist;  
     int i, k = features->total;  
   
     for( i = 0; i < k; i++ )  
     {  
         feat = CV_GET_SEQ_ELEM( struct feature, features, i );  
         ddata = feat_detection_data( feat );  
         //计算二维方向直方图  
         hist = descr_hist( gauss_pyr[ddata->octv][ddata->intvl], ddata->r,  
             ddata->c, feat->ori, ddata->scl_octv, d, n );  
         //将二维方向直方图转换为特征描述子  
         hist_to_descr( hist, d, n, feat );  
         release_descr_hist( &hist, d );  
     }  
 }  
 
  

*计算二维方向直方图

 
    static double*** descr_hist( IplImage* img, int r, int c, double ori,  
                              double scl, int d, int n )  
 {  
     double*** hist;  
     double cos_t, sin_t, hist_width, exp_denom, r_rot, c_rot, grad_mag,  
         grad_ori, w, rbin, cbin, obin, bins_per_rad, PI2 = 2.0 * CV_PI;  
     int radius, i, j;  
   
     hist = static_cast<double ***>( calloc( d, sizeof( double** ) ) );  
     for( i = 0; i < d; i++ )  
     {  
         hist[i] =static_cast<double **>( calloc( d, sizeof( double* ) ) );  
         for( j = 0; j < d; j++ )  
             hist[i][j] = static_cast<double *>( calloc( n, sizeof( double ) ) );  
     }  
   
     cos_t = cos( ori );  
     sin_t = sin( ori );  
     bins_per_rad = n / PI2;  
     exp_denom = d * d * 0.5;  
     hist_width = SIFT_DESCR_SCL_FCTR * scl;  
     radius = hist_width * sqrt(2.0) * ( d + 1.0 ) * 0.5 + 0.5;  
     for( i = -radius; i <= radius; i++ )  
         for( j = -radius; j <= radius; j++ )  
         {  
             /* 
             即将坐标移至关键点主方向 
             计算采用的直方图数组中相对于方向旋转的坐标 
             Calculate sample's histogram array coords rotated relative to ori. 
             Subtract 0.5 so samples that fall e.g. in the center of row 1 (i.e. 
             r_rot = 1.5) have full weight placed in row 1 after interpolation. 
             */  
             c_rot = ( j * cos_t - i * sin_t ) / hist_width;  
             r_rot = ( j * sin_t + i * cos_t ) / hist_width;  
             rbin = r_rot + d / 2 - 0.5;  
             cbin = c_rot + d / 2 - 0.5;  
   
             if( rbin > -1.0  &&  rbin < d  &&  cbin > -1.0  &&  cbin < d )  
                 if( calc_grad_mag_ori( img, r + i, c + j, &grad_mag, &grad_ori ))  
                 {  
                     grad_ori -= ori;  
                     while( grad_ori < 0.0 )  
                         grad_ori += PI2;  
                     while( grad_ori >= PI2 )  
                         grad_ori -= PI2;  
   
                     obin = grad_ori * bins_per_rad;  
                     w = exp( -(c_rot * c_rot + r_rot * r_rot) / exp_denom );  
                     interp_hist_entry( hist, rbin, cbin, obin, grad_mag * w, d, n );  
                 }  
         }  
   
     return hist;  
 }  
 
  

*插入一个entry进入到方向直方图中从而形成特征描述子

这个，我也不怎么明白。。。

 
    static void interp_hist_entry( double*** hist, double rbin, double cbin,  
                                double obin, double mag, int d, int n )  
 {  
     double d_r, d_c, d_o, v_r, v_c, v_o;  
     double** row, * h;  
     int r0, c0, o0, rb, cb, ob, r, c, o;  
   
     r0 = cvFloor( rbin );  
     c0 = cvFloor( cbin );  
     o0 = cvFloor( obin );  
     d_r = rbin - r0;  
     d_c = cbin - c0;  
     d_o = obin - o0;  
   
     /* 
     The entry is distributed into up to 8 bins.  Each entry into a bin 
     is multiplied by a weight of 1 - d for each dimension, where d is the 
     distance from the center value of the bin measured in bin units. 
     */  
     for( r = 0; r <= 1; r++ )  
     {  
         rb = r0 + r;  
         if( rb >= 0  &&  rb < d )  
         {  
             v_r = mag * ( ( r == 0 )? 1.0 - d_r : d_r );  
             row = hist[rb];  
             for( c = 0; c <= 1; c++ )  
             {  
                 cb = c0 + c;  
                 if( cb >= 0  &&  cb < d )  
                 {  
                     v_c = v_r * ( ( c == 0 )? 1.0 - d_c : d_c );  
                     h = row[cb];  
                     for( o = 0; o <= 1; o++ )  
                     {  
                         ob = ( o0 + o ) % n;  
                         v_o = v_c * ( ( o == 0 )? 1.0 - d_o : d_o );  
                         h[ob] += v_o;  
                     }  
                 }  
             }  
         }  
     }  
 }  
 
  

*将二维直方图转换为特征描述子

实际上是归一化描述子和转换为整数

 
    static void hist_to_descr( double*** hist, int d, int n, struct feature* feat )  
 {  
     int int_val, i, r, c, o, k = 0;  
   
     for( r = 0; r < d; r++ )  
         for( c = 0; c < d; c++ )  
             for( o = 0; o < n; o++ )  
                 feat->descr[k++] = hist[r][c][o];  
   
     feat->d = k;  
     normalize_descr( feat );  
     for( i = 0; i < k; i++ )  
         if( feat->descr[i] > SIFT_DESCR_MAG_THR )  
             feat->descr[i] = SIFT_DESCR_MAG_THR;  
     normalize_descr( feat );  
   
     /* convert floating-point descriptor to integer valued descriptor */  
     for( i = 0; i < k; i++ )  
     {  
         int_val = SIFT_INT_DESCR_FCTR * feat->descr[i];  
         feat->descr[i] = MIN( 255, int_val );  
     }  
 }  
 
  

*归一化描述子

 
    static void normalize_descr( struct feature* feat )  
 {  
     double cur, len_inv, len_sq = 0.0;  
     int i, d = feat->d;//为描述子长度128维

你可能感兴趣的:(c,算法,ini,Build,border,features)

现代 JavaScript (ES6+) 入门到实战（六）：异步的终极形态 - async/await 的优雅魔法程序员阿超的博客 ES6+完全进化指南：从 ES5 到现代 JS javascript es6 开发语言
在上一篇，我们用Promise把“回调地狱”改造成了优雅的链式调用。这已经是一个巨大的进步了。但是，当逻辑复杂时，一长串的.then()仍然会降低代码的可读性，我们的大脑依然需要切换到“异步模式”去理解代码。有没有一种方法，能让我们像写同步代码（一行接一行）那样去写异步代码呢？答案是肯定的！ES7(ES2017)带来了async/await，它被誉为JavaScript异步编程的“终极解决方案”。
人工智能-基础篇-10-什么是卷积神经网络CNN（网格状数据处理：输入层，卷积层，激活函数，池化层，全连接层，输出层等） weisian151 人工智能人工智能 cnn 神经网络
卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种专为处理网格状数据（如图像、视频、音频）设计的深度学习模型。它通过模拟生物视觉机制，从原始数据中自动提取多层次的特征，最终实现高效的分类、检测或生成任务。1、核心概念与原理1、生物视觉启发局部感受野：模仿人类视觉皮层神经元仅响应局部区域刺激的特性，每个神经元关注输入数据的局部区域（如图像的一小块区域）。权值共享：同一
Docker 安装Immich教程 Roc-xb Docker docker 容器运维
Immich是一个开源的自托管照片和视频管理平台，专为帮助用户存储、管理、和分享个人媒体库而设计。Immich的目标是提供一个类似GooglePhotos的替代方案，但不依赖于第三方服务，用户可以完全控制自己的数据。本章教程，记录如何用Docker部署安装Immich，使用的操作系统的Ubuntu，已安装好了Docker。一、前期准备工作1、创建目录mkdir./immich-app&&cd./i
3 大语言模型预训练数据-3.2 数据处理-3.2.2 冗余去除——2.SimHash算法文本去重实战案例：新闻文章去重场景
SimHash算法文本去重实战案例：新闻文章去重场景一、案例背景与目标二、具体实现步骤与示例1.**待去重文本示例**2.**步骤1：文本预处理与特征提取**3.**步骤2：特征向量化与哈希映射**4.**步骤3：特征向量聚合**5.**步骤4：降维生成SimHash值**6.**步骤5：计算汉明距离与去重判断**三、工程化实现代码（Python简化示例）四、案例总结与优化点一、案例背景与目标假设
什么是 A/B 测试？茫茫人海一粒沙人工智能
一，什么是A/B测试？A/B测试的基本思想是：将用户随机分成两组，分别使用不同的版本，观察结果差异是否显著。A组：使用旧版本（或基线方案）B组：使用新版本（或新模型）然后对比它们的表现，例如：点击率（CTR）转化率（ConversionRate）用户停留时长任务完成率微调后模型的自动应答准确率、满意度等二，为什么叫A/B？A代表“控制组”（ControlGroup）：通常是当前线上正在运行的版本B
python系列教程246——多态人工智能AI技术 python系列教程 python 开发语言
朋友们，如需转载请标明出处：https://blog.csdn.net/jiangjunshow声明：在人工智能技术教学期间，不少学生向我提一些python相关的问题，所以为了让同学们掌握更多扩展知识更好地理解AI技术，我让助理负责分享这套python系列教程，希望能帮到大家！由于这套python教程不是由我所写（有时候有空也会参与编写），所以不如我的人工智能教程风趣幽默，学起来比较枯燥；但它的知
Linux PXE高效批量网络装机城南云小白 linux
目录一、PXE概念1.PXE基本概念2.优点3.实现PXE的前提条件4.搭建PXE远程安装服务器二、搭建PXE远程安装服务器1.安装并启用TFTP服务2.安装并启用DHCP服务3.准备Linux内核、初始化镜像文件4.准备PXE引导程序5.安装FTP服务，准备CentOS7安装源6.配置启动菜单文件7.关闭防火墙，验证PXE网络安装三、实现Kickstart无人值守安装1.安装system-con
从快递配送看 AutoGen 主题订阅机制：四种通信场景的全解析佑瞻 AutoGen 人工智能 AutoGen
在多智能体系统开发中，我们常常面临这样的困惑：如何让不同智能体之间实现精准高效的消息传递？就像快递公司需要将包裹准确送达不同地址一样，AutoGen框架通过主题（Topic）与订阅（Subscription）机制构建了智能体通信的"物流网络"。今天，我们将以快递公司的业务场景为例，深入解析四种典型的广播模式，帮助你彻底掌握智能体通信的核心技术。一、智能体通信与快递配送的类比框架1.1核心概念映射快
借助antd-design-x-vue实现接入通义千问大语言模型的对话功能（附源码）
说在前面现在大模型如此火热，想必你跟我也有同样的想法，实现一个自己的AI对话框，相比Dify等组件分享出来的对话框，自己实现起来可以更加灵活和适应需求。虽然Element,Antd都发布了各自的对话框组件，我说句实话，这个理解起来真没之前那种Button,Card这些组件来的简单，下面分享我的一个小Demo。功能拆解首先，官方帮我们实现了一个小的原型，附带了几乎所有的功能，地址如下：ant-des
ES6 新特性从入门到精通：100 + 代码示例带你轻松掌握（附图解教程）北泽别胡说新手保护期从0到1学前端 javascript 前端开发语言 es6
本文针对JavaScript新手系统讲解ES6核心语法，涵盖变量声明、箭头函数、解构赋值、类与继承、Promise等核心模块。通过150+行带注释代码，结合「传统写法对比」和「新手避坑指南」，帮助读者3小时掌握ES6关键特性，快速应用于项目开发。一、ES6入门：为什么必须学习ES6？1.1ES6的革命性升级代码简洁性：箭头函数、模板字符串等语法减少冗余代码逻辑清晰性：class类、模块化语法让代码
多模态大语言模型arxiv论文略读（145）胖头鱼爱算法 #mllm_arxiv 语言模型人工智能自然语言处理论文笔记论文阅读
ReasoningLimitationsofMultimodalLargeLanguageModels.AcasestudyofBongardProblems➡️论文标题：ReasoningLimitationsofMultimodalLargeLanguageModels.AcasestudyofBongardProblems➡️论文作者：MikołajMałkiński,SzymonPawlo
Javascript：ES6+概念详解善良的小乔人工智能 javascript es6 开发语言
Javascript：ES6+概念详解善良的小乔一.基础概念什么是ES6+？ES6+（或ES2015+）是JavaScript语言的现代版本，包含了从2015年ES6（ECMAScript2015）开始的一系列更新。这些更新引入了新的语法糖、内置对象和API，显著提升了代码的可读性、简洁性和开发效率。什么是ECMAScript？ECMAScript是JavaScript的标准化规范（由ECMA国际
多模态大语言模型arxiv论文略读（138）胖头鱼爱算法 #mllm_arxiv 语言模型人工智能自然语言处理论文笔记深度学习
UnderstandingtheRoleofLLMsinMultimodalEvaluationBenchmarks➡️论文标题：UnderstandingtheRoleofLLMsinMultimodalEvaluationBenchmarks➡️论文作者：BotianJiang,LeiLi,XiaonanLi,ZhaoweiLi,XiachongFeng,LingpengKong,QiLiu,
选择排序算法详解老一岁排序算法数据结构算法
时间复杂度：O(n²)——无论数据初始排列如何，都需要进行n(n-1)/2次比较空间复杂度：O(1)——原地排序，不需要额外存储空间稳定性：不稳定排序（可能改变相同元素的相对位置）适用场景：小规模数据排序，或对内存使用要求严格的场景前言一、算法概述选择排序（SelectionSort）是一种简单直观的排序算法，其基本思想是：每次从未排序的部分中选择最小（或最大）的元素，放到已排序部分的末尾。这种排
多模态大语言模型arxiv论文略读（140）
SemiHVision:EnhancingMedicalMultimodalModelswithaSemi-HumanAnnotatedDatasetandFine-TunedInstructionGeneration➡️论文标题：SemiHVision:EnhancingMedicalMultimodalModelswithaSemi-HumanAnnotatedDatasetandFine-T
如何实现聊天模型响应流式处理 yunwu12777 langchain
在现代人工智能应用中，流式处理聊天模型的响应成为一种常见需求，特别是在需要实时输出或大规模处理时。本文将详细介绍如何在Python中实现聊天模型的同步和异步流式处理，使用langchain库中提供的ChatAnthropic模型作为示例。技术背景介绍流式处理是指从模型逐步获取输出，而不是等待整个输出完成。这对于处理长文本生成或需要动态响应的应用场景特别有用。langchain库中的聊天模型实现了R
本地运行大型语言模型(LLM)的实践指南 yunwu12777 语言模型人工智能自然语言处理
技术背景介绍近年来，项目如llama.cpp、Ollama、GPT4All等的流行标志着在本地设备上运行大型语言模型（LLM）的需求日益增长。选择在本地运行LLM，至少有两个重要的好处：隐私和成本。隐私上，数据不需要发送到第三方，避免了商业服务条款的限制；成本方面，无需支付推理费用，尤其是对于那些需要大量计算的应用，如长时间的模拟和总结。核心原理解析在本地运行LLM，需要准备以下几个条件：开源LL
CNN-GRU混合模型学习笔记 weixin_54372988 cnn gru 学习
GRU学习笔记CNN：卷积神经网络GRU（GateRecurrentUnit），门控循环单元CNN：卷积神经网络3个组成部分：1.卷积层——提取图像局部特征2.池化层——降维（防止过拟合）3.全连接层——输出结果一个卷积核扫完整张图片，得到每个小区域的特征值具体应用中通常有多个卷积核CNN可能有多层结构，如LeNet-5：卷积层–池化层–卷积层–池化层–卷积层–全连接层处理时间序列（1D序列）：（
宝塔+fastadmin：给项目添加定时任务+log日志自定义添加 25号底片~ php 后端配置（宝塔）php
一、定时任务脚本编写1.使用shebang声明执行器#!/usr/bin/envphp这是Unix/Linux系统中脚本文件的标准开头。表示这个脚本使用系统环境变量中的php来执行。2.定义ThinkPHP入口路径并加载框架define('APP_PATH',__DIR__.'/../../application/');require__DIR__.'/../../thinkphp/start.p
Centos7.9 使用宝塔部署Python3.12 .0 cceyatao python 宝塔 python3.12 python项目管理器
使用宝塔安装Python3.12运行之后提示ImportError:Nomodulenamed_ssl，因为服务器有python2.7的项目正在运行，所以需要新建python3.12.0因为CentOS7默认的OpenSSL1.0.x较旧,不满足Python3.12的要求（需要1.1.1或更高）1、安装OpenSSL：CentOS7默认OpenSSL可能较旧（1.0.x）。安装OpenSSL1.1
银行家算法后会无期77 算法算法
文章目录银行家算法概述银行贷款案例A再次申请50万，能批准吗？B再次申请40万，能批准吗？或者C申请20万，能批准吗？安全序列和不安全序列多维度资源分配操作系统资源分配银行家算法总结数据结构银行家算法的步骤安全性算法步骤死锁的避免银行家算法概述银行家算法（Banker’sAlgorithm）是一个避免死锁（Deadlock）的著名算法，是由艾兹格·迪杰斯特拉在1965年为T.H.E系统设计的一种避
解决在Nuxt3+naiveUi中打包出现vueuc导入方式问题报错张苹果博客前端
在nuxt3+naiveui项目中打包出现vueuc导入方式问题报错，导致页面访问500。错误描述[nuxt][requesterror][unhandled][500]Namedexport'VBinder'notfound.Therequestedmodule'vueuc'isaCommonJSmodule,whichmaynotsupportallmodule.exportsasnamede
python中解决Chrome中文字体显示为方框的问题张苹果博客 python chrome 开发语言
当您在CentOS或RHEL系统上处理中文内容时，可能会遇到字体显示为方框或乱码的情况。这是因为系统默认没有安装中文字体包。本指南将详细介绍如何正确安装和配置中文字体。原文地址：python中解决Chrome中文字体显示为方框的问题-张苹果博客字体显示问题示例如下：在CentOS/RHEL上安装中文字体的正确方法1.使用yum安装中文字体#安装文泉驿中文字体sudoyuminstall-ywqy-
Vue3音乐播放器组件，可显示歌词张苹果博客 vue 前端 1024程序员节
在线体验地址原文可体验1，安装npminstallapple-music-player或yarnaddapple-music-player2，在main.ts中引入import{createApp}from'vue'importAppfrom'./App.vue'importAppleMusicPlayerfrom'apple-music-player'createApp(App).use(App
fastapi使用gunicorn还是uvicorn 程序员的战歌 Python fastapi
Uvicorn在单进程上使用异步协程是有优势的，但是如果接口方法是同步的则走的多进程模式，也就是workers的数量，这个时候uvicorn不如gunicorn，性能上会有些限制。uvicornmain:app--host0.0.0.0--port8000--workers4Gunicorn是一个使用WSGI标准的应用服务器。Flask和Django可以直接使用Gunicorn运行，但是FastA
ZooKeeper深度面试指南二搬砖的小熊猫 zookeeper 面试分布式
一、Chroot特性：多租户隔离的命名空间功能原理Chroot（ChangeRoot）是ZooKeeper3.2.0引入的关键特性，允许客户端将操作限制在指定子树下。客户端连接时通过路径后缀（如127.0.0.1:2181/app1）设置命名空间，所有操作（如创建节点/config）实际映射为/app1/config，实现物理集群内的逻辑隔离。应用场景多应用共享集群：不同业务（支付/订单）共用Zo
TVFEMD-CPO-TCN-BiLSTM多输入单输出模型微光-沫年 matlab 回归机器学习
47-TVFEMD-CPO-TCN-BiLSTM多输入单输出模型适合单变量，多变量时间序列预测模型（可改进，加入各种优化算法）时变滤波的经验模态分解TVFEMD时域卷积TCN双向长短期记忆网络BiLSTM时间序列预测模型另外以及有TCN-BILSTMTCN-LSTMTCN-BiLSTM-ATTENTION等！（此不包含在内，另算的！）Matlab代码！
CPO-CNN-GRU-Attention、CNN-GRU-Attention、CPO-CNN-GRU、CNN-GRU四模型多变量时序预测对比 Matlab科研辅导帮 cnn gru 人工智能
✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。个人主页：Matlab科研工作室个人信条：格物致知，求助可私信。内容介绍多变量时序预测在诸多领域扮演着至关重要的角色，例如金融、气象和工业控制等。近年来，深度学习方法在时序预测任务中取得了显著的进展。本文旨在系统地比较四种基于卷积神经网络（CNN）和循环神经网络（GRU）的不同架构，包
小米路由安装frpc zngw ssh frp
一、起因家里部署了Nas，在出租屋里直接使用frp访问外网服务器转发的是可以用，但是，流量得多贵啊，还有中间商赚带宽。于是想了一下，在出租屋的路由上部署frp客户端，使用xtcp协议，打洞直连，速度快还不需要流量。二、流程前提条件：一台公网frps服务器家里Nas，已经配置好SMB文件共享（端口445）、WebDav（端口80，可选端口443），其他自行发挥。出租屋解锁SSH的小米路由，我家是小米
Python包管理新纪元：极速工具 uv 完全指南（2025最新版） coder_风逝 Python数据挖掘分析 python uv 开发语言
作为Python开发者，你是否还在忍受pip缓慢的依赖解析速度？是否厌倦了在virtualenv、pip-tools和poetry之间来回切换？今天我要向大家介绍一款革命性的工具—uv，它将彻底改变你的Python开发体验！一、uv是什么？uv是由打造了Ruff（Python超速Linter）的Astral团队开发的全新Python包管理工具，基于Rust编写，旨在成为"Python界的Cargo
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR