在opencv中,强分类器阈值是如何确定的?虚警率是怎么计算的?

在opencv中,强分类器阈值的确定实在函数icvCreateCARTStageClassifier中,具体强分类器的阈值的求解方式和虚警率的计算如下

CvIntHaarClassifier* icvCreateCARTStageClassifier(
       CvHaarTrainingData* data,        // 训练样本数据,包括图片的大小,数量,积分图,权重,类别等数据
       CvMat* sampleIdx,                // 训练样本序列,不一定与积分图的顺序一致
       CvIntHaarFeatures* haarFeatures, // 全部HAAR特征
       float minhitrate,                // 最小正检率
       float maxfalsealarm,             // 最大误检率          
       int   symmetric,                 // HAAR特征是否对称
       float weightfraction,            // 样本剔除比例(用于剔除小权值样本,以加快训练速度)
       int numsplits,                   // 每个弱分类器特征个数(一般为1)
       CvBoostType boosttype,           // adaboost类型,一般使用的是DAB
       CvStumpError stumperror,         // Discrete AdaBoost(DAB)中的阈值计算方式
       int maxsplits )                  // 弱分类器最大个数
{
               .................
        

        //我把上面强分类器的count个弱分类器的求解省略了
    
        numpos = 0;  //在data中正样本的数量对于程序来说是不知道的,那就需要在程序中求出
  
         /*确定强分类器的阈值threshold
          *遍历sampleIdx中所有样本,但是只需计算每个正样本的弱分类器置信度和,具体来说,
          *也就是,对于每个正样本,遍历上面求出的所有求出count(在这里是seq->total)个
          *弱分类器的置信度并求和,这样共得到numpos个正样本的置信度和,把他们升序排列,
          *然后就可以求阈值了,阈值为:
          *threshold = eval.data.fl[(int) ((1.0F - minhitrate) * numpos)]。
          *这个阈值的含义是根据需要的最小击中率,可以先求出正样本的漏检率,然后乘以正样
          *本的数量,这个值转化为int型,就是正样本中漏检的数量,那么对于上面刚排好序第几
          *个正样本的弱分类器的置信度和。
          */
        for( i = 0; i < numsamples; i++ )  
        {  
            // 获得样本序号,可能与积分图中样本顺序不一致,所以要求出其序号  
            idx = icvGetIdxAt( sampleIdx, i );  
  
            // 如果样本为正样本  
            if( data->cls.data.fl[idx] == 1.0F )  
            {  
                // 初始化置信度值  
                eval.data.fl[numpos] = 0.0F;  
  
                // 遍历seq中所有弱分类器  
                for( j = 0; j < seq->total; j++ )  
                {  
                    // 获取弱分类器  
                    classifier = *((CvCARTHaarClassifier**) cvGetSeqElem( seq, j ));  
  
                    // 累积当前正样本的弱分类器置信度和  
                    eval.data.fl[numpos] += classifier->eval(   
                        (CvIntHaarClassifier*) classifier,  
                        (sum_type*) (data->sum.data.ptr + idx * data->sum.step),  
                        (sum_type*) (data->tilted.data.ptr + idx * data->tilted.step),  
                        data->normfactor.data.fl[idx] );  
                }  
                /* eval.data.fl[numpos] = 2.0F * eval.data.fl[numpos] - seq->total; */  
                numpos++;  
            }  
        }  
  
        // 对弱分类器输出置信度和进行排序  
        icvSort_32f( eval.data.fl, numpos, 0 );  
  
        // 计算阈值,应该是大于threshold则为正类,小于threshold则为负类  
        threshold = eval.data.fl[(int) ((1.0F - minhitrate) * numpos)];  
  
        numneg = 0;  
        numfalse = 0;  
  
         /*确定强分类器的虚警率falsealarm
          *遍历sampleIdx中所有样本,但是只需计算每个负样本的弱分类器置信度和,具体来说,
          *也就是,对于每个负样本,遍历上面求出的所有求出count(在这里是seq->total)个
          *弱分类器的置信度并求和,然后和上面所求强分类器的阈值相比较,即:
          *if( sum_stage >= (threshold - CV_THRESHOLD_EPS) )  
                {  
                    numfalse++;  
                }  
          *这样就可以计算出被分类错误的负样本的数量了
          */
        for( i = 0; i < numsamples; i++ )  
        {  
            idx = icvGetIdxAt( sampleIdx, i );  
  
            // 如果样本为负样本  
            if( data->cls.data.fl[idx] == 0.0F )  
            {  
                numneg++;  
                sum_stage = 0.0F;  
  
                // 遍历seq中所有弱分类器  
                for( j = 0; j < seq->total; j++ )  
                {  
                   classifier = *((CvCARTHaarClassifier**) cvGetSeqElem( seq, j ));  
  
                   // 累积当前负样本的分类器输出结果  
                   sum_stage += classifier->eval( (CvIntHaarClassifier*) classifier,  
                        (sum_type*) (data->sum.data.ptr + idx * data->sum.step),  
                        (sum_type*) (data->tilted.data.ptr + idx * data->tilted.step),  
                        data->normfactor.data.fl[idx] );  
                }  
                /* sum_stage = 2.0F * sum_stage - seq->total; */  
  
                // 因为小于threshold为负类,所以下面是分类错误的情况  
                if( sum_stage >= (threshold - CV_THRESHOLD_EPS) )  
                {  
                    numfalse++;  
                }  
            }  
        }  
  
        // 计算虚警率  
        falsealarm = ((float) numfalse) / ((float) numneg);  


                     ...............

}

 
 

你可能感兴趣的:(adaboost,强分类器阈值,虚警率,opencv源码分析)