苏源流

[学习opencv]bow 算法实现图片分类bag of word

BOW其实就是bag of word的缩写，在OpenCV中关于此框架的有3个类。

第一个是一个基类，算是BOW训练的类型，

class BOWTrainer

{

public:

BOWTrainer(){}

virtual ~BOWTrainer(){}

void add( const Mat &descriptors);

const vector &getDescriptors() const;

int descriptorsCount() const;

virtual void clear();

virtual Mat cluster() const = 0;

virtual Mat cluster( const Mat &descriptors );

protected:

…

}

第二个类别是我们在应用的时候真正的BOW训练的接口类别叫做BOWKmeansTrainer, 此类继承来自 BOWTrainer类别（不知道这么说对不对，C++还在学习中）

class BOWKmeansTrainer : public BOWTrainer

{

public:

BOWKmeansTrainer( int clusterCount, const TermCriteria &termcrit = TermCriteria()，

int attempts = 3, int flags = KMEANS_PP_CENTERS)；

virtual ~BOWKmeansTrainer(){}；

virtual Mat cluster() const；

virtual Mat cluster( const Mat &descriptors ) const;

protected:

…

}

利用此类先定义一个 bowTraining;

BOWKmeansTrainer bowTraining(1000); //定义聚类中心1000个，其余的默认参数；

然后，将得到的特征，例如SIFT特征，将每一副图的SIFT特征利用add函数加入到bowTraining中去。

for(int i=0; i

bowTraining.add( descriptors( i ) )；

将所有的特征加进去后，就可以进行聚类训练了：

Mat dictionary = bowTraining.cluster(); 这一步的时间根据特征的维度以及定义的词典中心的个数相关。

或者，将得到的特征合并成一个矩阵，这里贴出OpenCV的BOW内部合成矩阵的代码

      int descCount = 0;
      for( size_t i = 0; i < descriptors.size(); i++ )
            descCount += descriptors[i].rows;

      Mat mergedDescriptors( descCount, descriptors[0].cols, descriptors[0].type() );
      for( size_t i = 0, start = 0; i < descriptors.size(); i++ )
      {
            Mat submut = mergedDescriptors.rowRange((int)start, (int)(start + descriptors[i].rows));
            descriptors[i].copyTo(submut);
            start += descriptors[i].rows;
      }

同样：Mat dictionary = bowTraining.cluster( mergedDescriptors );

得到词典后，就要利用另一个类来进行图像BOW特征的提取----BOWImgDescriptorExtractor

class BOWImgDescriptorExtractor

{

public:

BOWImgDescriptorExtractor( const Ptr &dextractor, const Ptr & dmatcher );

virtual ~BOWImgDescriptorExtractor(){}

void setVocabulary( const Mat& vocabulary );

const Mat& getVocabulary() const;

void compute( const Mat& image, vector & keypoints,

Mat& imgDescriptor,

vector >* pointIdxOfClusters = 0,

Mat* descriptors = 0 );

int descriptorSize() const;

int descriptorType() const;

protected:

…

}

利用上面这BOW的第三个类别定义一个变量；

Ptr extractor = DescriptorMatcher::create("SIFT"); //引号里面修改特征种类。

Ptr matcher = DescriptorExtractor::create("BruteForce"); //引号里面修改匹配类型;

BOWImgDescriptorExtractor bowDE(extractor, matcher);

前面两个定义是为了方便初始化类的定义，在BOW图像特征定义完成后，便可以对每一副图片提取BOW的特征。

bowDE.setVocabulary(dictionary); //dictionary是通过前面聚类得到的词典；

for(int i=0; i

{

vector keypoints;

SiftFeatureDetector detector;

detector.detect(pictures[i], keypoints);

bowDE.compute(pictures[i], keypoints, descriptors);

}

这样，整个BOW特征提取过程就结束了。

_____________________________

_______________________________

过程简介

提取训练集中图片的feature
将这些feature聚成n类。这n类中的每一类就相当于是图片的"单词"，所有的n个类别构成"词汇表"。实现中n取1000，如果训练集很大，应增大取值。
对训练集中的图片构造bag of words，就是将图片中的feature归到不同的类中，然后统计每一类的feature的频率。这相当于统计一个文本中每一个单词出现的频率。
训练一个多类分类器，将每张图片的bag of words作为feature vector，将该张图片的类别作为label。
对于未知类别的图片，计算它的bag of words，使用训练的分类器进行分类。

步骤详解

提取feature并进行聚类

这一步用于提取待训练中所有图片的特征值并保存到一个vocab_descriptors(vector数组)中, 再使用bowtrainer对vocab_descriptors进行聚类的出单词本vocab(Mat 类型)


Mat vocab_descriptors;
// 遍历每一张图片，提取SURF特征值，存入到vocab_descriptors中
multimap ::iterator i=train_set.begin();
for(;i!=train_set.end();i++)
{
  vectorkp;//关键点
  Mat templ=(*i).second; //图片
  Mat descrip; //特征值

  //featureDectre是surf算法提取特征值
  featureDecter->detect(templ,kp);
  featureDecter->compute(templ,kp,descrip);

  //push_back(Mat);在原来的Mat的最后一行后再加几行,元素为Mat时， 其类型和列的数目 必须和矩阵容器是相同的
  vocab_descriptors.push_back(descrip);
}
//将每一副图的surf特征加入到bowTraining中去,就可以进行聚类训练了
vocab=bowtrainer->cluster(vocab_descriptors);

构造bag of words

这一步根据每张图片的特征点，统计这张图片各个类别出现的频率，作为这张图片的bag of words, 使用bowDescriptorExtractor根据上一步获取到的vocab进行setVocabulary,把vocab传递给它，然后用一张图片的特征点作为输入，就能计算每一类的特征点的频率


// 遍历每一张图片，提取SURF关键点，统计每一类的特征点频率
multimap ::iterator i=train_set.begin();
for(;i!=train_set.end();i++)
{
  vectorkp; //关键点
  string cate_nam=(*i).first; //类别名称, 根据文件夹目录名称
  Mat tem_image=(*i).second; //对应的图片
  Mat imageDescriptor; //统计出来的特征点频率

  featureDecter->detect(tem_image,kp);
  bowDescriptorExtractor->compute(tem_image,kp,imageDescriptor);

  //push_back(Mat);在原来的Mat的最后一行后再加几行,元素为Mat时， 其类型和列的数目 必须和矩阵容器是相同的
  //allsamples_bow的value的Mat中, 每一行都表示一张图片的bag of words
  allsamples_bow[cate_nam].push_back(imageDescriptor);
}

训练分类器

使用的分类器是svm，用经典的1 vs all方法实现多类分类。对每一个类别都训练一个二元分类器。训练好后，对于待分类的feature vector，使用每一个分类器计算分在该类的可能性，然后选择那个可能性最高的类别作为这个feature vector的类别


stor_svms=new Ptr[categories_size]; //初始化一个svm训练器
for(int i=0;i::iterator itr = allsamples_bow.begin(); itr != allsamples_bow.end(); ++itr ) 
  {
    if ( itr -> first == category_name[i] ) {
      continue;
    }
    tem_Samples.push_back( itr -> second );
    Mat response( itr -> second.rows, 1, CV_32SC1, Scalar::all( -1 ) );
    responses.push_back( response );
  }
  //设置训练参数
  stor_svms[i] = SVM::create();
  stor_svms[i]->setType(SVM::C_SVC);
  stor_svms[i]->setKernel(SVM::LINEAR);
  stor_svms[i]->setGamma(3);
  stor_svms[i]->setTermCriteria(TermCriteria(CV_TERMCRIT_ITER, 100, 1e-6));

  stor_svms[i]->train( tem_Samples, ROW_SAMPLE, responses); //关键步骤, 进行svm训练器的构建

}

对未知图片分类

使用某张待分类图片的bag of words作为feature vector输入，使用每一类的分类器计算判为该类的可能性，然后使用可能性最高的那个类别作为这张图片的类别。


Mat input_pic=imread(train_pic_path); //获取待分类图片

// 提取BOW描述子
vectorkp;
Mat test;
featureDecter->detect(input_pic,kp);
bowDescriptorExtractor->compute(input_pic,kp,test);
int sign=0;
float best_score = -2.0f;
for(int i=0;ipredict( test, noArray(), true );
    float classValue = stor_svms[i]->predict( test, noArray(), false );
    sign = ( scoreValue < 0.0f ) == ( classValue < 0.0f )? 1 : -1;
  }
  curConfidence = sign * stor_svms[i]->predict( test, noArray(), true );

  if(curConfidence>best_score)
  {
    best_score=curConfidence;
    prediction_category=cate_na;
  }
}
cout<<"这张图属于:"<

 
    
  完整源码 
  
 #include 
 #include 
 #include 
 #include 
 #include 
 #include 
 #include 
 #include 
 #include 
 #include 
 #include 
 #include 
 #include 
 #include 
 #include 
  using namespace cv;
 using namespace cv::xfeatures2d;
 using namespace std;
 using namespace cv::ml; 
  #define DATA_FOLDER "data/"
 #define TRAIN_FOLDER "data/train_images/"
 #define TEMPLATE_FOLDER "data/templates/"
 #define TEST_FOLDER "data/test_image"
 #define RESULT_FOLDER "data/result_image/" 
  
 class categorizer
 {
 private :
     // //从类目名称到数据的map映射
     // map result_objects;    
     //存放所有训练图片的BOW
     map allsamples_bow;
     //从类目名称到训练图集的映射，关键字可以重复出现
     multimap train_set;
     // 训练得到的SVM
   Ptr *stor_svms;
     //类目名称，也就是TRAIN_FOLDER设置的目录名
     vector category_name;
     //类目数目
     int categories_size;
     //用SURF特征构造视觉词库的聚类数目
     int clusters;
     //存放训练图片词典
     Mat vocab; 
      Ptr featureDecter;
     Ptr bowtrainer;
     Ptr descriptorMacher;
   Ptr bowDescriptorExtractor; 
      //构造训练集合
     void make_train_set();
     // 移除扩展名，用来讲模板组织成类目
     string remove_extention(string); 
  public:
     //构造函数
     categorizer(int);
     // 聚类得出词典
     void bulid_vacab();
     //构造BOW
     void compute_bow_image();
     //训练分类器
     void trainSvm();
     //将测试图片分类
     void category_By_svm();
 }; 
  // 移除扩展名，用来讲模板组织成类目
 string categorizer::remove_extention(string full_name)
 {
     //find_last_of找出字符最后一次出现的地方
     int last_index=full_name.find_last_of(".");
     string name=full_name.substr(0,last_index);
     return name;
 } 
  // 构造函数
 categorizer::categorizer(int _clusters)
 {
     cout<<"开始初始化..."<     clusters=_clusters;
     //初始化指针
     int minHessian = 400;
     featureDecter = SURF::create( minHessian );
     bowtrainer = new BOWKMeansTrainer(clusters);
     descriptorMacher = BFMatcher::create();
     bowDescriptorExtractor = new BOWImgDescriptorExtractor(featureDecter,descriptorMacher); 
      // //boost库文件 遍历数据文件夹  directory_iterator(p)就是迭代器的起点，无参数的directory_iterator()就是迭代器的终点。
     // boost::filesystem::directory_iterator begin_iter(TEMPLATE_FOLDER);
     // boost::filesystem::directory_iterator end_iter;
     // //获取该目录下的所有文件名
     // for(;begin_iter!=end_iter;++begin_iter)
     // {
     //     //文件的路径 data/templates/airplanes.jpg
     //     string filename=string(TEMPLATE_FOLDER)+begin_iter->path().filename().string();
     //     //文件夹名称 airplanes
     //     string sub_category =remove_extention(begin_iter->path().filename().string());
     //     //读入模板图片
     //     if(begin_iter->path().filename().string() != ".DS_Store") {
     //         Mat image=imread(filename);
     //         Mat templ_image;
     //         //存储原图模板
     //         result_objects[sub_category]=image;
     //     }
     // }
     cout<<"初始化完毕..."<     //读取训练集
     make_train_set();
 } 
  //构造训练集合
 void categorizer::make_train_set()
 {
     cout<<"读取训练集..."<     string categor;
     //递归迭代rescursive 直接定义两个迭代器：i为迭代起点（有参数），end_iter迭代终点
     for(boost::filesystem::recursive_directory_iterator i(TRAIN_FOLDER),end_iter;i!=end_iter;i++)
     {
         // level == 0即为目录，因为TRAIN__FOLDER中设置如此
         if(i.level()==0)
         {
             // 将类目名称设置为目录的名称
             if((i->path()).filename().string() != ".DS_Store") {
                 categor=(i->path()).filename().string();
                 category_name.push_back(categor);
             }
         }
         else
         {
             // 读取文件夹下的文件。level 1表示这是一副训练图，通过multimap容器来建立由类目名称到训练图的一对多的映射
             string filename=string(TRAIN_FOLDER)+categor+string("/")+(i->path()).filename().string();
             if((i->path()).filename().string() != ".DS_Store") {
                 Mat temp=imread(filename,CV_LOAD_IMAGE_GRAYSCALE);
                 pair p(categor,temp);
                 //得到训练集
                 train_set.insert(p);
             }
         }    
     }
     categories_size=category_name.size();
     cout<<"发现 "< } 
  // 训练图片feature聚类，得出词典
 void categorizer::bulid_vacab()
 {
     FileStorage vacab_fs(DATA_FOLDER "vocab.xml",FileStorage::READ); 
      //如果之前已经生成好，就不需要重新聚类生成词典
     if(vacab_fs.isOpened())
     {
         cout<<"图片已经聚类，词典已经存在.."<         vacab_fs.release();
     }else
     {
         Mat vocab_descriptors;
         // 对于每一幅模板，提取SURF算子，存入到vocab_descriptors中
         multimap ::iterator i=train_set.begin();
         for(;i!=train_set.end();i++)
         {
             vectorkp;
             Mat templ=(*i).second;
             Mat descrip;
             featureDecter->detect(templ,kp); 
              featureDecter->compute(templ,kp,descrip);
             //push_back(Mat);在原来的Mat的最后一行后再加几行,元素为Mat时， 其类型和列的数目 必须和矩阵容器是相同的
             vocab_descriptors.push_back(descrip);
         }
         // vocab_descriptors.convertTo(vocab_descriptors, CV_32F);
         cout << "训练图片开始聚类..." << endl;
         //将每一副图的ORB特征加入到bowTraining中去,就可以进行聚类训练了
         // 对ORB描述子进行聚类
         vocab=bowtrainer->cluster(vocab_descriptors);
         cout<<"聚类完毕，得出词典..."< 
  
        //以文件格式保存词典
         FileStorage file_stor(DATA_FOLDER "vocab.xml",FileStorage::WRITE);
         file_stor<<"vocabulary"<         file_stor.release();
     }
 } 
  //构造bag of words
 void categorizer::compute_bow_image()
 {
     cout<<"构造bag of words..."<     FileStorage va_fs(DATA_FOLDER "vocab.xml",FileStorage::READ);
     //如果词典存在则直接读取
     if(va_fs.isOpened())
     {
         Mat temp_vacab;
         va_fs["vocabulary"] >> temp_vacab;
         bowDescriptorExtractor->setVocabulary(temp_vacab);
         va_fs.release();
     }
     else
     {
         //对每张图片的特征点，统计这张图片各个类别出现的频率，作为这张图片的bag of words
         bowDescriptorExtractor->setVocabulary(vocab);
     } 
      //如果bow.txt已经存在说明之前已经训练过了，下面就不用重新构造BOW
     string bow_path=string(DATA_FOLDER)+string("bow.txt");
     boost::filesystem::ifstream read_file(bow_path);
     // //如BOW已经存在，则不需要构造
     if(read_file.is_open())
     {
         cout<<"BOW 已经准备好..."<     }
     else{
         // 对于每一幅模板，提取SURF算子，存入到vocab_descriptors中
         multimap ::iterator i=train_set.begin();
         for(;i!=train_set.end();i++)
         {
             vectorkp;
             string cate_nam=(*i).first;
             Mat tem_image=(*i).second;
             Mat imageDescriptor;
             featureDecter->detect(tem_image,kp);
             bowDescriptorExtractor->compute(tem_image,kp,imageDescriptor);
             //push_back(Mat);在原来的Mat的最后一行后再加几行,元素为Mat时， 其类型和列的数目 必须和矩阵容器是相同的
             allsamples_bow[cate_nam].push_back(imageDescriptor);
         }
         //简单输出一个文本，为后面判断做准备
         boost::filesystem::ofstream ous(bow_path);
         ous<<"flag";
         cout<<"bag of words构造完毕..."<     }
 } 
  //训练分类器 
  void categorizer::trainSvm()
 {
     int flag=0;
     for(int k=0;k     {
         string svm_file_path=string(DATA_FOLDER) + category_name[k] + string("SVM.xml");
         FileStorage svm_fil(svm_file_path,FileStorage::READ);
         //判断训练结果是否存在
         if(svm_fil.isOpened())
         {
             svm_fil.release();
             continue;
         }
         else
         {
             flag=-1;
             break;
         }
     }
     //如果训练结果已经存在则不需要重新训练
     if(flag!=-1)
     {
         cout<<"分类器已经训练完毕..."<     }else 
      {
         stor_svms=new Ptr[categories_size]; 
          cout<<"训练分类器..."<         for(int i=0;i         {
             Mat tem_Samples( 0, allsamples_bow.at( category_name[i] ).cols, allsamples_bow.at( category_name[i] ).type() );
             Mat responses( 0, 1, CV_32SC1 );
             tem_Samples.push_back( allsamples_bow.at( category_name[i] ) );
             Mat posResponses( allsamples_bow.at( category_name[i]).rows, 1, CV_32SC1, Scalar::all(1) );
             responses.push_back( posResponses );
             
             for ( map::iterator itr = allsamples_bow.begin(); itr != allsamples_bow.end(); ++itr )
             {
                 if ( itr -> first == category_name[i] ) {
                     continue;
                 }
                 tem_Samples.push_back( itr -> second );
                 Mat response( itr -> second.rows, 1, CV_32SC1, Scalar::all( -1 ) );
                 responses.push_back( response );
             }
       //设置训练参数
             stor_svms[i] = SVM::create();
       stor_svms[i]->setType(SVM::C_SVC);
       stor_svms[i]->setKernel(SVM::LINEAR);
             stor_svms[i]->setGamma(3);
       stor_svms[i]->setTermCriteria(TermCriteria(CV_TERMCRIT_ITER, 100, 1e-6));
             stor_svms[i]->train( tem_Samples, ROW_SAMPLE, responses);
             //存储svm
             string svm_filename=string(DATA_FOLDER) + category_name[i] + string("SVM.xml");
             cout<             stor_svms[i]->save(svm_filename.c_str());
         }
         cout<<"分类器训练完毕..."<     }
 } 
  
 //对测试图片进行分类 
  void categorizer::category_By_svm()
 {
     cout<<"物体分类开始..."<     Mat gray_pic;
     Mat threshold_image;
     string prediction_category;
     float curConfidence; 
      boost::filesystem::directory_iterator begin_train(TEST_FOLDER);
     boost::filesystem::directory_iterator end_train; 
      for(;begin_train!=end_train;++begin_train)
     {
         
         //获取该目录下的图片名
         string train_pic_name=(begin_train->path()).filename().string();
         string train_pic_path=string(TEST_FOLDER)+string("/")+(begin_train->path()).filename().string();
         
         //读取图片
         if((begin_train->path()).filename().string() == ".DS_Store") {
             continue;
         }
         Mat input_pic=imread(train_pic_path);
         cvtColor(input_pic,gray_pic,CV_BGR2GRAY);
     
         // 提取BOW描述子
         vectorkp;
         Mat test;
         featureDecter->detect(gray_pic,kp);
         bowDescriptorExtractor->compute(gray_pic,kp,test);
         int sign=0;
         float best_score = -2.0f;
         for(int i=0;i         {    
             string cate_na=category_name[i];
             string f_path=string(DATA_FOLDER)+cate_na + string("SVM.xml");
             FileStorage svm_fs(f_path,FileStorage::READ);
             //读取SVM.xml
             if(svm_fs.isOpened())
             {
                 svm_fs.release();
                 Ptr st_svm = Algorithm::load(f_path.c_str());
                 if(sign==0)
                 {
                     float score_Value = st_svm->predict( test, noArray(), true );
                     float class_Value = st_svm->predict( test, noArray(), false );
                     sign = ( score_Value < 0.0f ) == ( class_Value < 0.0f )? 1 : -1;
                 }
                 curConfidence = sign * st_svm->predict( test, noArray(), true );
             }
             else
             {            
                 if(sign==0)
                 {
                     float scoreValue = stor_svms[i]->predict( test, noArray(), true );
                     float classValue = stor_svms[i]->predict( test, noArray(), false );
                     sign = ( scoreValue < 0.0f ) == ( classValue < 0.0f )? 1 : -1;
                 }
                 curConfidence = sign * stor_svms[i]->predict( test, noArray(), true );
             }
             if(curConfidence>best_score)
             {
                 best_score=curConfidence;
                 prediction_category=cate_na;
             }
         }
         //将图片写入相应的文件夹下
         boost::filesystem::directory_iterator begin_iterater(RESULT_FOLDER);
         boost::filesystem::directory_iterator end_iterator;
         //获取该目录下的文件名
         for(;begin_iterater!=end_iterator;++begin_iterater)
         { 
              if(begin_iterater->path().filename().string()==prediction_category)
             {
                 string filename=string(RESULT_FOLDER)+prediction_category+string("/")+train_pic_name;
                 imwrite(filename,input_pic);
             }
         }
         cout<<"这张图属于:"<     }
 } 
  
 int main(void)
 {
     int clusters=1000;
     categorizer c(clusters);
     //特征聚类
     c.bulid_vacab();
     //构造BOW
     c.compute_bow_image();
     //训练分类器
     c.trainSvm();
     //将测试图片分类
     c.category_By_svm();
     return 0;
 } 
  __________________________ 
  __________________________ 
  采用SIFT+BOW来进行实现。关于SIFT特征提取的介绍很多，一般都比较复杂难懂，尤其是对我这种数学不怎么好的人。看了几天还是很朦胧。OpenCV中有对图像SIFT特征提取的函数，下面给出提取的过程： 
       image = imread(path);
     //sift关键点检测
     SiftFeatureDetector detector;
     detector.detect(image, keyPoints);
     //sift关键点描述，角度，强度等
     SiftDescriptorExtractor extractor;
     extractor.compute(image, keyPoints, descriptor); 
        另外函数的头文件是：#include ，之前的版本是放在#include "opencv2/features2d/features2d.hpp"中的。还是多注意一下吧。 
  实现原理： 
  BOW模型的处理过程： 
          1.SIFT特征提取。SIFT 特征提取是求出图像的关键点信息，包括角度，大小以及强度。关键点，也就是能够代表图像关键信息的部分，这也是Bag of words中单词的组成。一个图像通常有很多的关键点。 
          2.聚类。我们将每幅图像中的关键点信息添加到词袋中，并定义聚类中心的数量N。然后将词袋中的关键点通过Kmeans算法聚类到N个类中。同时得到这N个类的中心点组成N*128的dictionary，每个中心都可以代表这个类。 
          3.求图像的直方图。将图像的关键点信息重新放到词包中，根据落在每个类中关键点的数量来得到图像的直方图，大小为1*N。将每幅图像进行处理，得到图像在BOW模型下的特征。 
          4.图像匹配。将测试图像进行相同的处理，同样也得到1*N的特征。根据测试图像与训练图像特征之间的距离，并将距离较小的图像作为检索的结果。 
  实现过程： 
            OpenCV中已经对步骤中的过程进行了封装，我们只需要简单的调用就可以。上面的代码中我们已经完成了第一步。 
            第二步和第三步BOW模型的实现，我们可以采用调用函数BOWKmeansTrainer进行实现。 
         int clusterNum =260;
     //clusterNum代表有多少词
     BOWKMeansTrainer trainer(clusterNum); 
            同时需要将提取到的SIFT特征描述添加到trainer中 
        //descriptor是每幅图像的sift关键点描述
         trainer.add(descriptor); 
          所有图像的descriptor添加完成后，进行聚类得到dictionary，也就是聚类的中心。 
        Mat dictionary = trainer.cluster(); 
          接下来需要得到每幅图像直方图。过程如下 
          Ptr extractor = DescriptorExtractor::create("SIFT");
     Ptr matcher = DescriptorMatcher::create("BruteForce");
     BOWImgDescriptorExtractor bowDE(extractor, matcher);
     bowDE.setVocabulary(dictionary); 
          对每幅图像图像进行如下操作： 
                        Mat BOWdescriptor;
             //sift关键点检测
             vector keyPoints;
             SiftFeatureDetector detector;
             detector.detect(curImg, keyPoints);
             //BOWdecriptor表示每个图像的bow码本，即直方图，大小为1*clusterNum
             bowDE.compute(curImg, keyPoints, BOWdescriptor);
             //归一化
             normalize(BOWdescriptor, BOWdescriptor, 1.0, 0.0, NORM_MINMAX); 
         得到的BOWdescriptor就是每个图像的直方图表示，可用做图像检索的特征。最简单的方法就是求测试图像的直方图与训练图像之间的欧明距离，得到检索图像。不过检索的方式不一样，效率和质量也不同。 
  过程中长的姿势： 
         刚开始写的时候，不知道怎么求图像的码本，就不停的翻看OpenCV中关于函数BOWImgDescriptorExtractor：：compute的解释，刚开始看的是中文解释，看了很久也没有看懂，后面找到了英文的注释，顿时就明白了。看来还是要英语好啊！！！！下面给出英语版的，中文的就算了。。。 
  BOWImgDescriptorExtractor：：compute 
  Computes an image descriptor using the set visual vocabulary. 
  C++: void BOWImgDescriptorExtractor::compute(const Mat& image, vector& keypoints, Mat& imgDescriptor, vector>* pointIdxsOfClusters=0, Mat*descriptors=0 )¶
     Parameters:      
          image – Image, for which the descriptor is computed.
         keypoints – Keypoints detected in the input image.
         imgDescriptor – Computed output image descriptor.
         pointIdxsOfClusters – Indices of keypoints that belong to the cluster. This means that pointIdxsOfClusters[i] are keypoint indices that belong to the i -th cluster (word of vocabulary) returned if it is non-zero.
         descriptors – Descriptors of the image keypoints that are returned if they are non-zero.

霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
OpenCV图片操作100例：从入门到精通指南（1）总有刁民想爱朕ha opencv 计算机视觉人工智能
OpenCV图片操作100例：从入门到精通指南本文整理了100个OpenCV实用技巧，涵盖图像处理各个领域，助你轻松掌握计算机视觉核心技能！一、入门必备：基础操作1.图像读写与显示importcv2#读取图像（BGR格式）img=cv2.imread('image.jpg')#显示图像cv2.imshow('示例图片',img)cv2.waitKey(0)#按任意键退出cv2.destroyAll
OpenCV图片操作100例：从入门到精通指南（3）总有刁民想爱朕ha opencv 人工智能计算机视觉
高效学习路径：1️⃣分阶段学习：入门：1-20例（基础操作）进阶：21-50例（图像处理）高级：51-100例（计算机视觉）2️⃣项目驱动学习：证件照背景替换（1-15例）停车场车位检测（30-45例）视频运动追踪（70-85例）3️⃣性能优化技巧：#使用UMat加速图像处理umat_img=cv2.UMat(img)processed=cv2.GaussianBlur(umat_img,(5,5
OpenCV入门到精通：AI视觉处理的完整指南 AI云原生与云计算技术学院人工智能 opencv 计算机视觉 ai
OpenCV入门到精通：AI视觉处理的完整指南关键词：OpenCV、计算机视觉、图像预处理、目标检测、AI视觉应用摘要：本文是一份面向AI视觉爱好者的OpenCV完整学习指南。从OpenCV的核心概念讲起，结合生活案例、代码示例和项目实战，逐步拆解图像读取/显示、灰度化、边缘检测、目标检测等关键技术。无论你是想入门计算机视觉的新手，还是希望用OpenCV解决实际问题的开发者，都能通过本文掌握从理论
CNN 猫狗识别：从理论到实战的深度解析爱熬夜的小古 cnn 深度学习人工智能
在计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetwork，CNN）凭借其强大的特征提取和模式识别能力，成为图像分类任务的主流技术。猫狗识别作为经典的图像分类问题，不仅能帮助我们理解CNN的工作原理，还能为实际应用提供技术支持。本文将深入探讨CNN在猫狗识别中的应用，从理论基础到实战代码，带你全面掌握这项技术。一、CNN基础理论概述（一）CNN的核心组件卷积层：是CNN的
OpenCV入门到精通：从基础到实战的全面指南
摘要：本文旨在为初学者和有一定经验的开发者提供OpenCV从入门到精通的全面指南。文章首先介绍了OpenCV的基本概念和安装方法，然后深入讲解了图像处理基础、特征检测与匹配、视频处理与分析等核心内容，最后通过实战案例展示了OpenCV在计算机视觉任务中的应用。关键词：OpenCV；图像处理；特征检测；视频分析；实战案例引言OpenCV（OpenSourceComputerVisionLibrary
【人工智能面经第五期：模型训练与优化核心面试深度问答】码上有前 Pytorch Python 深度学习人工智能面试职场和发展
作者：“码上有前”文章简介：人工智能面经欢迎小伙伴们点赞、收藏⭐、留言模型训练与优化核心面试深度问答摘要围绕模型训练与优化的训练技巧（正则化、迁移学习）和数据工程（数据增强、标注质量）展开，通过20个关键问题，解析正则化协同策略、迁移学习适配场景、数据增强实践等核心要点，助力读者掌握人工智能与计算机视觉岗位面试中模型训练优化的知识体系，明晰技术原理与实际应用的关联。目录训练技巧-正则化策略相关问题
机器学习手写字体识别系统：技术演进与应用实践万能小贤哥机器学习人工智能
引言：手写字体识别的技术定位与价值在信息处理领域，人工录入手写文本的低效性与机器识别的高效性形成鲜明对比。例如，医疗处方的人工处理需约5分钟/张，而采用手写字体识别技术可将时间缩短至10秒/张，显著提升处理效率。作为计算机视觉与人工智能的重要分支，手写字体识别技术通过将手写文本转换为可编辑电子文本，不仅大幅减少人工输入时间和错误，降低人工处理成本，还能在大量数据处理时保持高于人工录入的准确性，是人
【论文阅读笔记】TimesURL: Self-supervised Contrastive Learning for Universal Time Series 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
TimesURL:Self-supervisedContrastiveLearningforUniversalTimeSeriesRepresentationLearning摘要学习适用于多种下游任务的通用时间序列表示，并指出这在实际应用中具有挑战性但也是有价值的。最近，研究人员尝试借鉴自监督对比学习（SSCL）在计算机视觉（CV）和自然语言处理（NLP）中的成功经验，以解决时间序列表示的问题。
异物检测的计算机视觉算法技术路线思绪漂移计算机视觉算法人工智能
异物检测的计算机视觉算法技术路线在现代智能监测系统中，异物检测有着其必要性和运维重要性，通过计算机视觉算法，可以实时识别各种异常物体，为设备安全运行提供有力保障。本文将介绍异物检测的主要技术路线。一、分类识别适应场景分类识别技术主要适用于已知目标类别的异物检测场景。在运维环境中，这类场景包括：固定区域内的障碍物监测（如轨道区域的石块、工具、动物等）关键部件的异物附着检测（如固定装置上的杂物）安全通
【AI大模型】深入解析预训练：大模型时代的核心引擎我爱一条柴ya 学习AI记录深度学习人工智能 ai python AI编程算法
预训练已成为现代人工智能，尤其是自然语言处理和计算机视觉领域的基石技术。它彻底改变了模型开发范式，催生了BERT、GPT等革命性模型。本文将系统阐述预训练的核心概念、原理、方法、应用及挑战。一、预训练的本质：为何需要它？核心问题：数据标注的瓶颈监督学习依赖海量高质量标注数据，获取成本极高（时间、金钱、专业知识）。对于复杂任务（如理解语义、生成文本），标注难度呈指数级上升。标注数据稀缺导致模型泛化能
OpenCvSharp 实现环形文字识别OCR实例（C#） XisVisual_Basic ocr c#计算机视觉 C#
近年来，随着计算机视觉和图像处理的不断发展，光学字符识别（OCR）技术也变得愈发成熟。OCR技术可以将图像中的文字转换为可编辑和可搜索的文本，为人们带来了极大的便利。在本篇文章中，我们将介绍如何使用OpenCvSharp库来实现环形文字的识别。首先，在使用OpenCvSharp之前，我们需要确保已经在项目中引用了该库，并添加相应的命名空间。usingOpenCvSharp;接下来，我们需要准备一张
Python|OpenCV-实现识别弧形文字(17) 写python的鑫哥 OpenCV入门与进阶 python opencv 人工智能计算机视觉弧形文字环形文字识别
前言本文是该专栏的第19篇，后面将持续分享OpenCV计算机视觉的干货知识，记得关注。我们知道，OCR可以识别文字方面的需求，但是如果遇到那些目标文字是“弧形文字”，需要怎么去识别呢？遇到想要识别“弧形文字”的需求，这个时候你可以借助于Opencv+OCR技术来实现。而本文，笔者将针对上述问题需求，利用OpenCV结合OCR来实现“弧形文字”的识别。废话不多说，具体的细节部分以及详细的解决方案，跟
【小白入门必看】一文读懂深度学习计算机视觉技术及学习路线
一、什么是计算机视觉？计算机视觉，其实就是教机器怎么像我们人一样，用摄像头看看周围的世界，然后理解它。比如说，它能认出这是个苹果，或者那边有辆车。除此之外，还能把拍到的照片或者视频转换成有用的信息，帮我们做决定。整个过程就是为了让机器能看懂图像，然后根据这些图像来做出聪明的选择。二、计算机视觉实现起来难吗？人类依赖视觉，找辆汽车轻而易举，毕竟汽车那么大，一眼就能看出来，所以常误以为计算机视觉简单，
计算机视觉：Transformer的轻量化与加速策略 xcLeigh 计算机视觉CV 计算机视觉 transformer 人工智能 AI 策略
计算机视觉：Transformer的轻量化与加速策略一、前言二、Transformer基础概念回顾2.1Transformer架构概述2.2自注意力机制原理三、Transformer轻量化策略3.1模型结构优化3.1.1减少层数和头数3.1.2优化Patch大小3.2参数共享与剪枝3.2.1参数共享3.2.2剪枝3.3知识蒸馏四、Transformer加速策略4.1模型量化4.2.2TPU加速4.
【机器学习】解密计算机视觉：CNN、目标检测与图像识别核心技术（第25天）吴师兄大模型 0基础实现机器学习入门到精通机器学习计算机视觉 cnn 人工智能目标检测图像识别 pytorch
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
人体坐姿检测系统开发实战（YOLOv8+PyTorch+可视化） Loving_enjoy 计算机学科论文创新点人工智能深度学习迁移学习经验分享
本文将手把手教你构建智能坐姿检测系统，结合目标检测与姿态估计技术，实现不良坐姿的实时识别与预警###一、项目背景与价值现代人每天平均坐姿时间超过8小时，不良坐姿会导致：-脊椎压力增加300%-颈椎病发病率提升45%-腰椎间盘突出风险增加60%本系统通过计算机视觉技术实时监测坐姿状态，对驼背、侧倾、前倾等不良姿势进行智能识别和预警。相较于传统传感器方案，我们的视觉方案具有非接触、低成本、易部署的优势
魔都AI医疗哪家强？全景揭秘科技创新与未来钱景！
引言上海作为中国科技创新的先锋城市，正在AI医疗领域崭露头角。根据2024年12月的数据，上海拥有34家专注于AI药物研发的公司，占全国预临床研究的60%和临床试验的47%。这些公司利用深度学习、大语言模型（LLM）和计算机视觉等技术，革新药物发现、医疗影像分析和数据治理，推动医疗行业的智能化转型。从全球首个人工智能医院“AgentHospital”到AI驱动的诊断系统，上海的AI医疗生态正在重塑
语义分割模型的轻量化与准确率提升研究 pk_xz123456 仿真模型深度学习算法 transformer 深度学习人工智能算法数据结构
语义分割模型的轻量化与准确率提升研究1.引言语义分割是计算机视觉领域的核心任务之一，它要求模型为图像中的每个像素分配一个类别标签。随着深度学习的发展，语义分割模型在多个领域得到了广泛应用，如自动驾驶、医学影像分析、遥感图像解译等。然而，现有的语义分割模型往往面临两个主要挑战：模型复杂度高导致难以部署在资源受限的设备上，以及准确率仍有提升空间以满足实际应用需求。本文将从模型轻量化和准确率提升两个角度
Python深度学习实践：建立端到端的自动驾驶系统 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：建立端到端的自动驾驶系统1.背景介绍自动驾驶系统是当今科技领域最具挑战性和前景的应用之一。它融合了计算机视觉、深度学习、规划与控制等多个领域的先进技术,旨在实现车辆的自主感知、决策和操控。随着人工智能技术的不断发展,越来越多的公司和研究机构投入了大量资源来开发自动驾驶系统。Python作为一种高效、易学且开源的编程语言,在这一领域扮演着重要角色。本文将探讨如何利用Pyth
从0开始学习计算机视觉--Day08--卷积神经网络
之前我们提到，神经网络是通过全连接层对输入做降维处理，将输入的向量通过矩阵和激活函数进行降维，在神经元上输出激活值。而卷积神经网络中，用卷积层代替了全连接层。不同的是，这里的输入不再需要降维，而是可以保留输入的空间结构，例如输入的是32×32×3的图片，在全连接层中是3072×1的向量，而卷积层里则保持不变。这里的改变的地方是对于同样的WX的函数形式，这里是把5×5×3的权重矩阵（也叫卷积核）向量
Python打卡：Day40
#先继续之前的代码importtorchimporttorch.nnasnnimporttorch.optimasoptimfromtorch.utils.dataimportDataLoader,Dataset#DataLoader是PyTorch中用于加载数据的工具fromtorchvisionimportdatasets,transforms#torchvision是一个用于计算机视觉的库，
BigQuery对象引用（ObjectRef）全面指南：一站式整合结构化与非结构化多模态数据分析
引言企业需要同时管理有组织表格中的结构化数据，以及日益增长的非结构化数据（如图片、音频和文档）。传统上，联合分析这些多样化数据类型非常复杂，通常需要使用不同的工具。非结构化媒体通常需要导出到专门的服务进行处理（如图片分析需计算机视觉服务，音频需语音转文本引擎），这会造成数据孤岛，阻碍全局分析视角的建立。以虚构的电商支持系统为例：结构化的工单信息存储在BigQuery表中，而相关的支持通话录音或损坏
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
多模态大模型的技术应用与未来展望：重构AI交互范式的新引擎 zhaoyi_he 重构人工智能
一、引言：为什么多模态是AI发展的下一场革命？过去十年，深度学习推动了计算机视觉和自然语言处理的飞跃，但两者的发展路径长期割裂。随着生成式AI和大模型时代的到来，**多模态大模型（MultimodalFoundationModels）**以统一的建模方式处理图像、文本、音频、视频等多源数据，重塑了“感知-认知-决策”链条，为AGI迈出关键一步。OpenAI的GPT-4o、Google的Gemini
OpenCV 图像操作：颜色识别、替换与水印添加
目录引言代码实现1.导入必要的库2.图像加法3.图像直接相加4.颜色加权加法5.HSV颜色空间转换概念作用6.查找颜色范围对应的像素点7.与运算-生成掩膜8.添加水印9.主函数总结引言在计算机视觉领域，OpenCV是一个强大的库，提供了丰富的图像操作功能。本文将详细介绍如何使用OpenCV进行图像加法、颜色加权加法、HSV颜色空间转换、颜色范围查找、与运算生成掩膜以及添加水印等操作，并给出相应的P
YOLO学习笔记｜从YOLOv5到YOLOv11：技术演进与核心改进北斗猿 YOLO学习从零到1 YOLO 目标检测算法 python 计算机视觉
从YOLOv5到YOLOv11：技术演进与核心改进深度解析一、YOLO系列发展概述YOLO（YouOnlyLookOnce）目标检测算法自2016年诞生以来，凭借其"单次检测"的独特理念和卓越的实时性能，持续引领着计算机视觉领域的技术革新。从JosephRedmon的初代YOLO到AlexeyBochkovskiy的YOLOv4，再到Ultralytics团队的YOLOv5及后续系列，这一算法家族
《卷积神经网络到Vision Transformer：计算机视觉的十年架构革命》 HeartException 人工智能学习
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站题目《卷积神经网络到VisionTransformer：计算机视觉的十年架构革命》展开深度解析，全文采用技术演进史+架构对比+产业影响的三段式结构，附关键数据与趋势预测：卷积神经网络到VisionTransformer：计算机视觉的十年架构革命副标题：从局部感知到全局建模，一场改变AI视觉基石的
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs

[学习opencv]bow 算法实现图片分类bag of word

过程简介

步骤详解

提取feature并进行聚类

构造bag of words

训练分类器

对未知图片分类

完整源码

你可能感兴趣的:(计算机视觉,位姿测量,视觉导航,运动估计)