lphbtm

(学习笔记)第六章非刚性人脸跟踪——annotation(标记)

2013年08月17日 ⁄ 综合 ⁄ 共 24921字 ⁄ 字号小中大 ⁄ 评论关闭

id="iframeu1788635_0" src="http://pos.baidu.com/acom?rdid=1788635&dc=2&di=u1788635&dri=0&dis=0&dai=2&ps=236x888&dcb=BAIDU_UNION_define&dtm=BAIDU_DUP_SETJSONADSLOT&dvi=0.0&dci=-1&dpt=none&tsr=0&tpr=1454375655835&ti=(%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0)%E7%AC%AC%E5%85%AD%E7%AB%A0%20%E9%9D%9E%E5%88%9A%E6%80%A7%E4%BA%BA%E8%84%B8%E8%B7%9F%E8%B8%AA%E2%80%94%E2%80%94annotation(%E6%A0%87%E8%AE%B0)%20%7C%20%E5%AD%A6%E6%AD%A5%E5%9B%AD&ari=1&dbv=2&drs=1&pcs=1325x579&pss=1325x256&cfv=18&cpl=20&chi=1&cce=true&cec=UTF-8&tlm=1454346855<u=http%3A%2F%2Fwww.xuebuyuan.com%2F1354389.html<r=http%3A%2F%2Fwww.baidu.com%2Flink%3Furl%3D9A2jRnobVD1LeSgb3wCMsLVrPAtSLZqyDeCNRMM-mg7Vu3O3X3gfnRQj-UOwrLGH%26wd%3D%26eqid%3D812c69d2000cd3a40000000256b00418&ecd=1&psr=1366x768&par=1366x728&pis=-1x-1&ccd=32&cja=true&cmi=41&col=zh-CN&cdo=-1&tcn=1454375656&qn=4ffeacfb9a436ed1&tt=1454375655820.31.109.125" width="336" height="280" align="center,center" vspace="0" hspace="0" marginwidth="0" marginheight="0" scrolling="no" frameborder="0" allowtransparency="true" style="margin: 0px; padding: 0px; border-width: 0px; background-color: transparent; vertical-align: bottom;">

一、工具

非刚性人脸跟踪，也就是所谓的asm(active shape model)。

准备的材料，搜先到网站上下载标记用的图片和工具：

http://code.google.com/p/muct/downloads/list

1、下载图像数据文件即： muct-a-jpg-v1.tar.gz到 muct-e-jpg-v1.tar.gz即a,b,c,d,e五个压缩文件。例如直接在D盘根目录下解压会生成一个新的文件夹jpg，5个均解压后共3755张图片。

2、下载muct-landmarks-v1.tar.gz文件，将其加压到和图片同样的目录，这里采用解压到D盘的根目录。

3、下载Mastering OpenCV的随书代码（资料源内有)，第六章，Chapter6_NonRigidFaceTracking。

4、新建OpenCV工程，将annotate.cpp做为主程序，并将其用到的头文件和源文件引入到工程。在调试——命令行参数输入格式如下：

./annotate -m $mdir -d $odir 这里的$mdir是存储图像数据所在目录的文件的目录，$odir是要输出的 annotations.yaml文档的路径，该文档包含的数据是以ft_data对象存储的。

例如我输入的命令行参数为：./annotate -m D:/ -d D:/result_landmarks

二、知识普及：.

ASM是基于点分布的模型。点分布模型（Point Distribution Model,PDM)

ASM模型的建立的第一步就是标记图像的特征.

为建立表情完备的模型，训练集中的图像数目应为一百幅以上，且包含不同变化类型的人脸图像:

1)不同性别、年龄、长相尽可能具有代表性。

2)不同表情的图像

3)不同姿态的图像

为了得到最好的效果，图像集应当详细说明环境的类型（即身份，光照，到相机的距离，捕捉设备以及其他）

收集关于形状变化的信息，需要图像中相应的点的位置等信息，在脸部轮廓，以及眉毛，眼睛，鼻子，嘴巴的轮廓和瞳孔等位置的选取一定数目分布均匀的特征点，这样一来，每个形状都可以通过一组标定点来描述。特征点的选取奔着如下的选取原则：

1)一是关键特征点的选取就是那些肉眼直接分辨出的特征点。

2)二是这些特征点之间尽可能的均匀的分布一些特征点。

3)三是特征点的密度要适当使其能够表现形状的全貌和细节。

对于训练集的每幅图像，我们通过目测确定出每个点在形状中的位置，这个过程就叫做训练集的标定。能够准确的指定标定点的位置对于下面的整个过程是非常重要的。在形状标定上，每一幅图像的相应标定点的位置次序必须严格一致。比如，第一幅图像是逆时针顺序标定的，后面的所有图像必须按照一致的顺序进行，绝不能出现顺时针标定，并且每个点在人脸的相对位置也要始终保存一致，否则，也会影响模型的精确性。

幸运地是，对于MUCT数据库，我们不需要对每个图像进行特征点的标定，因为它已经给出了对外使用的接口，即特征点的坐标位置；

在muct-landmarks文件夹下存在四个文件：

1)muct76.shape shape文件(www.milbo.users.sonic.net/stasm)

2)muct76.rda R数据文件(www.r-project.org/)

3)muct76.csv 逗号分割值

4)muct76-opencv.csv 逗号分割值,针对opencv的坐标系即原点在左上方。

注意：这些文件的坐标系统和stasm使用的一样.(即(0,0)点在图像的中心，向左移动x增加，向上移动y增加。而一个例外是muct76-opencv.csv，这里的格式是opencv中的格式，即原点在左上方，向左移动x增加，向下移动y增加)

无效的点用坐标（0，0）标记，"无效的点”是那些被其他面部特征遮挡的点，这指得是鼻子后面或者脸侧面，这些特征点的位置不容易估计。相反的，头发或者眼镜后的特征点位置是通过标记者估计的。

因此任何坐标为(0,0)的点应当被忽视。无效的点只会出现在相机画面b和c上。除非你的程序知道如何处理这些无效的点，否者你应当只使用相机画面a,d,和e

Note that subjects 247 and 248 are identical twins. 注意:247和248是孪生双胞胎。

三、程序

运行程序效果如下：

为了方便下面的理解，我们将76个点的相对位置标记处理，由于点比较靠近，标记的效果不是太好，当然也可以通过人脸检测，人眼检测然后找到人眼矩形区域，然后在计算相对位置，接着放大图像，进行标记，这里为了简单，不再进行上述步骤：

下面我们分析一下代码以及实现:

1、ft_data.cpp

我们数据的导入，输出，以及简单处理和画出都是通过ft_data类来完成的，该类有如下的数据成员，用来存储操作的数据。（这里ft_data是face tracking data)

  vector symmetry;                    //indices of symmetric points//对称点的索引,即vector存储的是对称点的索引
  vector connections;               //indices of connected points //存储的为联通点索引
  vector imnames;                  //images//图像的名字
  vector > points;         //points//图像中的点集

从左到右，第一个是原始图像，第二个是面部特征标记(76个点),第三个为用彩色标记出两边对称的点（symmery)，第四个是镜像图像(flip)，第五个是面部特征的连通性(connections)

1、symmetry；这里的vector symmery;成员是存储的点值所在的索引，即0，1，2，3，.....75。例如，假如点p1在点序列（76个）中的位置为3，与之相对称的点p2(关于面部对称，类似与左眼和由于是对称的）在序列中的位置为15，那么symmery[2]存储是15，symmery[14]存储的为3.这需要我们在程序运行的时候，手动的点击图像上的点形成对称点。

2、connections；存储连通性，Vec2i类型为Vec存储两个整数对的容器。例如我们将一个正数对(23,15)存储到vector connections中，利用Vec2i的构造函数构造一个Vec2i类型的对象 Vec2i v2(23,15);然后利用connectons.pushback(v2);访问采用connections[0]获取Vec2i对象，然后connections[0][0]得到23,connections[0][1]得到15.

3、imnames；是存储的图像名字，（假设图像前几个图像不存在无效点）则：

imnames[0]==i000qa-fn

imnames[1]==i000qb-fn

imnames[2]==i000qc-fn......

4、points；是存储的点集，例如通过points[0]可以访问第一个图像的点集序列，点集中的顺序（容器中的位置顺序）是由加载的muct-landmarks文件夹下的 muct76-opencv.csv中的点的顺序决定的，这个顺序并不影响我们的使用。即一个图像有76个特征点，每个图像的特征点均是按照同样的相对位置进行排序的，例如我们看muct-landmarks文件夹下的muct76-opencv.csv，我们程序读取的时候就是对每个图像的76个点相对应的顺序读取的，如表格中第图像的i000qa-fn的第一个坐标为(x00,y00)=(201,348),然后我们可以通过points访问到该点，首先它是第一个图片（如果想上面提到的，它不存在无效的点，即被存储到了points中,如果为无效的点，则不会被存储到points中),通过points[0]访问到这个图像的点集序列,通过points[0][0]，访问到这个(x00,y00)，points[0][1]=(x01,y01)等等。

2、ft_data数据的生成

我们要理解ft_data数据成员的含义，最好的方法就是看看这些数据成员的数据是通过什么样的方式生成的。数据生成是通过annotations.cpp来实现的，该类在实现时，直接后跟着示例化了一个annotation对象。

annotation类的数据成员：

  int idx;                       //index of image to annotate//用来标记的图像索引
  int pidx;                      //index of point to manipulate//用来操作的点的索引，用来操作对称性
  Mat image;                     //current image to display //用来显示的当前图像
  Mat image_clean;               //clean image to display//用来显示的清新图像,原图像的副本
  ft_data data;                  //annotation data//标记数据
  const char* wname;             //display window name//显示的窗口名字
  vector instructions;   //annotation instructions//操作说明，窗口左上角的提示

首先从annotation的主函数入手，即看一下ft_data类四个数据成员：symmetry ,connections,imnames,points 的数据形成过程：

1、部分main函数，完成的功能是读入csv文件中的数据，包括图像的名字和这些图像的特征点的位置，也即points点数据和imnames数据的形成的函数

  //parse cmd line options
  if(parse_help(argc,argv)){//检测命令行参数中是否输入了-h和-help即帮组指令
    cout << "usage: ./annotate [-v video] [-m muct_dir] [-d output_dir]" 
     << endl; return 0;
  }
  string odir = parse_odir(argc,argv);
  string ifile; int type = parse_ifile(argc,argv,ifile);//type==2表示输入的为MUCT数据，type==1表示输入的为视频文件
  string fname = odir + "annotations.yaml"; //file to save annotation data to//保存标记数据的文件

  //get data
  namedWindow(annotation.wname); //annotation这个为类定义时实例化了一个对象
  if(type == 2){ //MUCT data
    string lmfile = ifile + "muct-landmarks/muct76-opencv.csv";//ifile是muct-landmarks文件夹所在的根目录
    ifstream file(lmfile.c_str()); //lmfile表示landmarks文件
    if(!file.is_open()){
      cerr << "Failed opening " << lmfile << " for reading!" << endl; return 0;
    }
	//从csv文件中读取图片名和标记的坐标
    string str; getline(file,str);//获取文件流到string对象，获取csv文件中的第一行，不用抛弃
    while(!file.eof()){  //如果没有遇到文件结束符
      getline(file,str); if(str.length() == 0)break; //获取csv中的数据行，没有则break
      muct_data d(str,ifile); if(d.name.length() == 0)continue;
      annotation.data.imnames.push_back(d.name);//存储图像的名字
      annotation.data.points.push_back(d.points);//存储图像上特征点的坐标
    }
    file.close();
    annotation.data.rm_incomplete_samples();//去除不完整的样本
  }

说明：rm_imcomplete_sampes()函数用来去除下列条件的点：

1)图像中点的数目没有达到所有图像的中最多点的数目的图像。这里的用途就是去除点的数目小于76的图像的特征数据（或者说图像）

2)“无效的点”,即x和y至少有一个小于等于0的点。从相机b,c采集来的图像才存在这样的无效点，我们的程序可以处理这样的无效点。

该函数定义在ft_data.cpp文件夹下，是ft_data的成员函数。

//==============================================================================
void
ft_data::
rm_incomplete_samples()//去掉不完整的样本
{
  int n = points[0].size(),N = points.size();
  for(int i = 1; i < N; i++)n = max(n,int(points[i].size()));//从所有图像中找出最大点集数量，以此为参照
  for(int i = 0; i < int(points.size()); i++){
    if(int(points[i].size()) != n){//如果大小小于最大的，则移除掉
      points.erase(points.begin()+i); imnames.erase(imnames.begin()+i); i--;
    }else{//否则，相当于分类，在进行第二次过滤，将点集中坐标（x,y)两个有其一小于等于0的点的，即所谓的“无效点”
      int j = 0;
      for(; j < n; j++){
    if((points[i][j].x <= 0) || (points[i][j].y <= 0))break;
      }
      if(j < n){//移除“无效点”所在的点集和图片的路径
    points.erase(points.begin()+i); imnames.erase(imnames.begin()+i); i--;
      }
    }
  }
}
//==============================================================================

2、main函数中部分代码，connections数据的形成

 //annotate connectivity //标记连通性
  setMouseCallback(annotation.wname,pc_MouseCallback,0);//设置鼠标回调函数
  annotation.set_connectivity_instructions();
  annotation.set_current_image(0);
  annotation.draw_instructions();
  annotation.idx = 0;
  while(1){ annotation.draw_connections(); 
    imshow(annotation.wname,annotation.image); if(waitKey(0) == 'q')break;
  }
  save_ft(fname.c_str(),annotation.data);

connections数据的形成主要是通过我们手动添加的。这里通过一个交互的方式来实现，即通过鼠标回调函数，该函数定义如下：

void pc_MouseCallback(int event, int x, int y, int /*flags*/, void* /*param*/)//pc 表示point connections点的连通
{ //这里Vec2i(first,second),first是指当前的点，second是其后的点。
  if(event == CV_EVENT_LBUTTONDOWN){//鼠标左键事件
    int imin = annotation.find_closest_point(Point2f(x,y));//鼠标点击位置最邻近的点，返回的是该点在点序列中的位置
    if(imin >= 0){ //add connection//增加连通
      int m = annotation.data.connections.size();//获取 vector connections的大小
      if(m == 0)annotation.data.connections.push_back(Vec2i(imin,-1));//如果是第一个数据，压入两个点的序号，即第一个点与-1关联
      else{
    if(annotation.data.connections[m-1][1] < 0)//1st connecting point chosen,//选择最后一个连通点
      annotation.data.connections[m-1][1] = imin;//如果有一个关联到了,则修改(imin,-1)中的-1为现在的-1
    else annotation.data.connections.push_back(Vec2i(imin,-1));//没有关联则还是压入，imin，
      }
      annotation.draw_connections(); //画出连通性
      imshow(annotation.wname,annotation.image); //展示图像
    }
  }
}

说明:

1)该回调函数的理解，即也就是ft_data数据成员connection的形成过程，可以通过运行工程，手工操作亲自体验，不然不好理解。

2)find_closest_point(Point2f(x,y))是找到鼠标点击位置最临近的特征点，当然这个函数也有阈值约束的当如果发现对临近的距离小于10像素（为默认，当然你可以修改），则表示没有选中。

3)连通性的增加都是获取connections容器的最后一个来处理的。

if   (如果存在与鼠标所点位置匹配的特征点)
则  {
            获取所存连通性容器的最后一个连通关系；
           if(如果是第一次增加连通性)
           { 
               将当前该特征点和一个-1进行匹配——并将其存储到连通性容器中。
           }
           else  //不是第一次
           {
                if(如果最后容器中存储的最后一个点,匹配的是-1)
                 {
                     将容器中存储的最后一个特征点和当前该特征点匹配;//至少修改
                 }
                else//如果最后一个有了匹配
                {
                     将该当前特征点和-1匹配——并且将器存储到连通性容器中
                 }

                   画出连通性;
                   展示图像；
          }//end_else 
        
}//end_if

4)存在如下的情况：

1、第一次鼠标点击图像中的一个特征点，则也是第一次存储两个点的连通性，则存储一个<当前特征点,-1>的对象;

2、当第二次鼠标点击图像中的另外一个特征点时，算法找到先前的最后一个特征点，发现他没有匹配的，则修改为<上一次的特征点,当前特征点>

3、我们在想：1)连通性在connection容器中的创建没有先后顺序，即连通性对在容器中的位置没有约束。

2)如果我们上一次点击的特征点和这一次点击的特征点是同一个特征点如何处理？这里好像没有处理的（现在我还没发现)，其实没有相应的处理也是可以理解的,假如我们要连通两个点，即两个点之间有连线，如果还有一个点离着这两个点很近，如果我们不小心本应该连接a点和b点，结果连接成了a点和c点，因此程序无法判别我们的意图，所有在进行手工标记连通性时要格外的细心，如果不小心标错了，则重新运行程序标定。

我们可能会想对于:<特征点，-1>这样的连通性，它是怎么画出的呢？即我们看一下上面annotation.draw_connections()函数的实现：

  void
  draw_connections(){
    int m = data.connections.size();
    if(m == 0)this->draw_points();//如果没有连通性，则调用ft_data的draw_points只画出那些特征点
    else{
      if(data.connections[m-1][1] < 0){//如果该点没有下一个点
    int i = data.connections[m-1][0];//获取第一个点的位置。
    data.connections[m-1][1] = i;//将第一个点赋给第一个点，即本身，为了直接调用下面的画图函数
    data.draw_connect(image,idx); this->draw_points();
    circle(image,data.points[idx][i],1,CV_RGB(0,255,0),2,CV_AA);//用绿色标识最后一个点，
    data.connections[m-1][1] = -1;//画完后，在修改到起始数据，
      }else{data.draw_connect(image,idx); this->draw_points();}
    }
  }

说明:

其一,从上面的代码我们可以看出，将出现<特征点,-1>的情况时，它做了如下的处理即转换为<特征点,特征点(同样的)>即要画线的两个点是同一个点。

其二，该函数实际只是简单的处理一下输入的数据，相当于打包一下，实际的画图还是调用ft_data类的draw_conncect函数来完成。下面我们看一下ft_data::draw_connect函数：

void
ft_data::
draw_connect(Mat &im,//im画布
         const int idx,//图像的索引，也就是图像点集的索引
         const bool flipped,//我们在标记annotation.cpp初始化数据时，这里采用默认值，false
         const Scalar color,//默认值Scalar(255,0,0)
         const vector &con)//默认值vector()一个空对象
{
  if((idx < 0) || (idx >= (int)imnames.size()))return;
  int n = connections.size();//连通的大小
  if(con.size() == 0){    //我们调用时采用的为默认的参数的函数，con.size()==0
    for(int i = 0; i < n; i++){
      int j = connections[i][0],k = connections[i][1];//获取要连接的两个的位置
      if(!flipped)line(im,points[idx][j],points[idx][k],color,1);//如果不翻转，则直接画出，采用默认蓝色
      else{
    Point2f p(im.cols - 1 - points[idx][symmetry[j]].x,
          points[idx][symmetry[j]].y);
    Point2f q(im.cols - 1 - points[idx][symmetry[k]].x,
          points[idx][symmetry[k]].y);
    line(im,p,q,color,1);//如果翻转，则计算翻转后的点在画出
      }
	}
  }else{
    int m = con.size();
    for(int j = 0; j < m; j++){
      int i = con[j]; if((i < 0) || (i >= n))continue;
      int k = connections[i][0],l = connections[i][1];
      if(!flipped)line(im,points[idx][k],points[idx][l],color,1);
      else{
    Point2f p(im.cols - 1 - points[idx][symmetry[k]].x,
          points[idx][symmetry[k]].y);
    Point2f q(im.cols - 1 - points[idx][symmetry[l]].x,
          points[idx][symmetry[l]].y);
    line(im,p,q,color,1);
      }
    }
  }
}

说明:

我们在annotation.cpp中使用的是带有默认参数的draw_connect函数，即此时的con对象是一个空的，即我们只关心满足if(con.size()==0)的条件内的语句，即上面带有注释的语句。

3、main函数中symmetry 数据的生成

同样的symmetry数据的生成也是通过交互式界面，我们手动标记两个点的的对称型的，我们首先看一下在main函数中的代码:

//annotate symmetry//标记对称性
  setMouseCallback(annotation.wname,ps_MouseCallback,0);
  annotation.initialise_symmetry(0);
  annotation.set_symmetry_instructions();
  annotation.set_current_image(0);
  annotation.draw_instructions();
  annotation.idx = 0; annotation.pidx = -1;
  while(1){ annotation.draw_symmetry(); 
    imshow(annotation.wname,annotation.image); if(waitKey(0) == 'q')break;
  }
  save_ft(fname.c_str(),annotation.data);

上述鼠标回调函数调用ps_MouseCallback()函数，该函数定义如下：

void ps_MouseCallback(int event, int x, int y, int /*flags*/, void* /*param*/)//ps 表示point symmetry点的对称
{ 
  if(event == CV_EVENT_LBUTTONDOWN){//监听左键事件
    int imin = annotation.find_closest_point(Point2f(x,y));//找到鼠标点击位置临近的点
    if(imin >= 0){//如果找到了
      if(annotation.pidx < 0)annotation.pidx = imin;//如果标记点的索引小于0，则把当前点的给标记点
      else{
    annotation.data.symmetry[annotation.pidx] = imin;//否则把当前点作为标记点的对称点
    annotation.data.symmetry[imin] = annotation.pidx;//并且将当前点的对称点设置为上一次标记的点
    annotation.pidx = -1;//完成一次点的匹配，回复到初始状态
      }      
      annotation.draw_symmetry(); 
      imshow(annotation.wname,annotation.image); 
	}//if
  }//if
}

说明：

上面程序完成的功能是存储与之对称的点的位置。例如vector symmetry中，symmetry[0]的值是一点在序列中的相对位置，这里假设值为5，则(0,5)即为一对对称点，0和5是点在序列，或者说是容器中以0开始的相对位置。那么，symmetry[5]的结果自然就是0了。

附函数annotation.cpp中代码，带有部分注释:

/*****************************************************************************
*   Non-Rigid Face Tracking
******************************************************************************
*   by Jason Saragih, 5th Dec 2012
*   http://jsaragih.org/
******************************************************************************
*   Ch6 of the book "Mastering OpenCV with Practical Computer Vision Projects"
*   Copyright Packt Publishing 2012.
*   http://www.packtpub.com/cool-projects-with-opencv/book
*****************************************************************************/
/*
  annotate: annotation tool
  Jason Saragih (2012)
*/
#include "opencv_hotshots/ft/ft.hpp"
#include 
#include 
#include 
//==============================================================================
class annotate{
public:
  int idx;                       //index of image to annotate//用来标记的图像索引
  int pidx;                      //index of point to manipulate//用来操作的点的索引，用来操作对称性
  Mat image;                     //current image to display //用来显示的当前图像
  Mat image_clean;               //clean image to display//用来显示的清新图像,原图像的副本
  ft_data data;                  //annotation data//标记数据
  const char* wname;             //display window name//显示的窗口名字
  vector instructions;   //annotation instructions//操作说明，窗口左上角的提示
  
  annotate(){wname = "Annotate"; idx = 0; pidx = -1;}//默认构造函数

  int
  set_current_image(const int idx = 0){
    if((idx < 0) || (idx > int(data.imnames.size())))return 0;
    image = data.get_image(idx,2); return 1;
  }
  void
  set_clean_image(){
    image_clean = image.clone();
  }
  void
  copy_clean_image(){
    image_clean.copyTo(image);
  }
  void
  draw_instructions(){
    if(image.empty())return;
    this->draw_strings(image,instructions);
  }
  void
  draw_points(){
    data.draw_points(image,idx);
  }
  void
  draw_chosen_point(){
    if(pidx >= 0)circle(image,data.points[idx][pidx],1,CV_RGB(0,255,0),2,CV_AA);
  }
  void
  draw_connections(){
    int m = data.connections.size();
    if(m == 0)this->draw_points();//如果没有连通性，则调用ft_data的draw_points只画出那些特征点
    else{
      if(data.connections[m-1][1] < 0){//如果该点没有下一个点
    int i = data.connections[m-1][0];//获取第一个点的位置。
    data.connections[m-1][1] = i;//将第一个点赋给第一个点，即本身，为了直接调用下面的画图函数
    data.draw_connect(image,idx); this->draw_points();
    circle(image,data.points[idx][i],1,CV_RGB(0,255,0),2,CV_AA);//用绿色标识最后一个点，
    data.connections[m-1][1] = -1;//画完后，在修改到起始数据，
      }else{data.draw_connect(image,idx); this->draw_points();}
    }
  }
  void
  draw_symmetry(){
    this->draw_points(); this->draw_connections();
    for(int i = 0; i < int(data.symmetry.size()); i++){
      int j = data.symmetry[i];
      if(j != i){
    circle(image,data.points[idx][i],1,CV_RGB(255,255,0),2,CV_AA);
    circle(image,data.points[idx][j],1,CV_RGB(255,255,0),2,CV_AA);
      }
    }
    if(pidx >= 0)circle(image,data.points[idx][pidx],1,CV_RGB(0,255,0),2,CV_AA);
  }
  void
  set_capture_instructions(){
    instructions.clear();
    instructions.push_back(string("Select expressive frames."));
    instructions.push_back(string("s - use this frame"));
    instructions.push_back(string("q - done"));
  }
  void
  set_pick_points_instructions(){
    instructions.clear();
    instructions.push_back(string("Pick Points"));
    instructions.push_back(string("q - done"));
  }
  void
  set_connectivity_instructions(){
    instructions.clear();
    instructions.push_back(string("Pick Connections"));
    instructions.push_back(string("q - done"));
  }
  void
  set_symmetry_instructions(){
    instructions.clear();
    instructions.push_back(string("Pick Symmetric Points"));
    instructions.push_back(string("q - done"));
  }
  void
  set_move_points_instructions(){
    instructions.clear();
    instructions.push_back(string("Move Points"));
    instructions.push_back(string("p - next image"));
    instructions.push_back(string("o - previous image"));
    instructions.push_back(string("q - done"));
  }
  void
  initialise_symmetry(const int index){
    int n = data.points[index].size(); data.symmetry.resize(n);
    for(int i = 0; i < n; i++)data.symmetry[i] = i;
  }
  void
  replicate_annotations(const int index){
    if((index < 0) || (index >= int(data.points.size())))return;
    for(int i = 0; i < int(data.points.size()); i++){
      if(i == index)continue;
      data.points[i] = data.points[index];
    }
  }
  int
  find_closest_point(const Point2f p,
             const double thresh = 10.0){
    int n = data.points[idx].size(),imin = -1; double dmin = -1;
    for(int i = 0; i < n; i++){
      double d = norm(p-data.points[idx][i]);
      if((imin < 0) || (d < dmin)){imin = i; dmin = d;}
    }
    if((dmin >= 0) && (dmin < thresh))return imin; else return -1;
  }
protected:
  void
  draw_strings(Mat img,
           const vector &text){
    for(int i = 0; i < int(text.size()); i++)this->draw_string(img,text[i],i+1);
  }
  void
  draw_string(Mat img, 
          const string text,
          const int level)
  {
    Size size = getTextSize(text,FONT_HERSHEY_COMPLEX,0.6f,1,NULL);
    putText(img,text,Point(0,level*size.height),FONT_HERSHEY_COMPLEX,0.6f,
        Scalar::all(0),1,CV_AA);
    putText(img,text,Point(1,level*size.height+1),FONT_HERSHEY_COMPLEX,0.6f,
        Scalar::all(255),1,CV_AA);
  }
}annotation;
//==============================================================================
void pp_MouseCallback(int event, int x, int y, int /*flags*/, void* /*param*/)
{ 
  if(event == CV_EVENT_LBUTTONDOWN){
    annotation.data.points[0].push_back(Point2f(x,y));
    annotation.draw_points(); imshow(annotation.wname,annotation.image); 
  }
}
//==============================================================================
void pc_MouseCallback(int event, int x, int y, int /*flags*/, void* /*param*/)//pc 表示point connections点的连通
{ //这里Vec2i(first,second),first是指当前的点，second是其后的点。
  if(event == CV_EVENT_LBUTTONDOWN){//鼠标左键事件
    int imin = annotation.find_closest_point(Point2f(x,y));//找到点击的最临近的点在
    if(imin >= 0){ //add connection
      int m = annotation.data.connections.size();//获取 vector connections的大小
      if(m == 0)annotation.data.connections.push_back(Vec2i(imin,-1));//如果是第一个数据，压入两个点的序号，即第一个点与-1关联
      else{
    if(annotation.data.connections[m-1][1] < 0)//1st connecting point chosen,//选择最后一个连通点
      annotation.data.connections[m-1][1] = imin;//如果有一个关联到了,则修改(imin,-1)中的-1为现在的-1
    else annotation.data.connections.push_back(Vec2i(imin,-1));//没有关联则还是压入，imin，
      }
      annotation.draw_connections(); //画出连通性
      imshow(annotation.wname,annotation.image); //展示图像
    }
  }
}
//==============================================================================
void ps_MouseCallback(int event, int x, int y, int /*flags*/, void* /*param*/)//ps 表示point symmetry点的对称
{ 
  if(event == CV_EVENT_LBUTTONDOWN){//监听左键事件
    int imin = annotation.find_closest_point(Point2f(x,y));//找到鼠标点击位置临近的点
    if(imin >= 0){//如果找到了
      if(annotation.pidx < 0)annotation.pidx = imin;//如果标记点的索引小于0，则把当前点的给标记点
      else{
    annotation.data.symmetry[annotation.pidx] = imin;//否则把当前点作为标记点的对称点
    annotation.data.symmetry[imin] = annotation.pidx;//并且将当前点的对称点设置为上一次标记的点
    annotation.pidx = -1;//完成一次点的匹配，回复到初始状态
      }      
      annotation.draw_symmetry(); 
      imshow(annotation.wname,annotation.image); 
	}//if
  }//if
}
//==============================================================================
void mv_MouseCallback(int event, int x, int y, int /*flags*/, void* /*param*/)
{ 
  if(event == CV_EVENT_LBUTTONDOWN){
    if(annotation.pidx < 0){
      annotation.pidx = annotation.find_closest_point(Point2f(x,y));
    }else annotation.pidx = -1;
    annotation.copy_clean_image();
    annotation.draw_connections();
    annotation.draw_chosen_point();
    imshow(annotation.wname,annotation.image); 
  }else if(event == CV_EVENT_MOUSEMOVE){
    if(annotation.pidx >= 0){
      annotation.data.points[annotation.idx][annotation.pidx] = Point2f(x,y);
      annotation.copy_clean_image();
      annotation.draw_connections();
      annotation.draw_chosen_point();
      imshow(annotation.wname,annotation.image); 
    }
  }
}
//==============================================================================
class muct_data{   //从来读取csv中数据的类，存储图片名字和索引，以及图片对应的点集
public:
  string name;              //图片的名字
  string index;            //图片的索引
  vector points;   //图片中特征点的坐标

  muct_data(string str,//str存储的为从流中读取的每一行
        string muct_dir){   //构造函数，这里muct_dir传入的是muct-landmarks文件夹所在的根目录，我这里为"D:/"
    size_t p1 = 0,p2;
    
    //set image directory//设置图像路径
    string idir = muct_dir; if(idir[idir.length()-1] != '/')idir += "/";//如果输入的路径后面没有"/",则加上"/"
    idir += "jpg/";//即这就是为什么要求注释工具文件夹muct-landmarks和jpg文件夹在同一目录。

    //get image name//获取图像的名字
    p2 = str.find(",");//寻找逗号的位置
    if(p2 == string::npos){cerr << "Invalid MUCT file" << endl; exit(0);}//如果没有找到则输出无效 muct file
    name = str.substr(p1,p2-p1);//从起始位置开始的到逗号之前的str的部分，即从0到','
  
    if((strcmp(name.c_str(),"i434xe-fn") == 0) || //corrupted data//损坏的数据
       (name[1] == 'r'))name = "";                //ignore flipped images//忽略翻转的图像
    else{
      name = idir + str.substr(p1,p2-p1) + ".jpg"; p1 = p2+1;//获取图像路径，并且获取图像名字的下一个位置
      
      //get index
      p2 = str.find(",",p1);//找到从p1开始的下一个逗号
      if(p2 == string::npos){cerr << "Invalid MUCT file" << endl; exit(0);}//如果没有找到，则说明是无效的数据，即没有坐标信息
      index = str.substr(p1,p2-p1); p1 = p2+1;
      
      //get points//获取点的坐标信息
      for(int i = 0; i < 75; i++){//0-74共75个
    p2 = str.find(",",p1);//p2用来存储','逗号的位置，p1用来存储逗号的下一个位置
    if(p2 == string::npos){cerr << "Invalid MUCT file" << endl; exit(0);}
    string x = str.substr(p1,p2-p1); p1 = p2+1;//获取x坐标
    p2 = str.find(",",p1);
    if(p2 == string::npos){cerr << "Invalid MUCT file" << endl; exit(0);}
    string y = str.substr(p1,p2-p1); p1 = p2+1;//获取y坐标
    points.push_back(Point2f(atoi(x.c_str()),atoi(y.c_str())));
      }
      p2 = str.find(",",p1);//最后一个单独处理
      if(p2 == string::npos){cerr << "Invalid MUCT file" << endl; exit(0);}
      string x = str.substr(p1,p2-p1); p1 = p2+1;
      string y = str.substr(p1,str.length()-p1);//最后一个不需要find逗号,
      points.push_back(Point2f(atoi(x.c_str()),atoi(y.c_str())));
    }
  }
};
//==============================================================================
bool
parse_help(int argc,char** argv)//检测是否输入了-h和-help指令
{
  for(int i = 1; i < argc; i++){
    string str = argv[i];
    if(str.length() == 2){if(strcmp(str.c_str(),"-h") == 0)return true;}
    if(str.length() == 6){if(strcmp(str.c_str(),"--help") == 0)return true;}
  }return false;
}
//==============================================================================
string 
parse_odir(int argc,char** argv)//parse从语法上分析，函数功能是找到命令行输入目的输出目录
{
  string odir = "data/";
  for(int i = 1; i < argc; i++){
    string str = argv[i];
    if(str.length() != 2)continue;
    if(strcmp(str.c_str(),"-d") == 0){
      if(argc > i+1){odir = argv[i+1]; break;}//寻找目的目录
    }
  }
  if(odir[odir.length()-1] != '/')odir += "/";//如果你输入的参数目录中的最后没有'/'则我们在后面追加一个，更安全
  return odir;
}
//==============================================================================
int 
parse_ifile(int argc,//从参数中寻找输入的文件名
        char** argv,
        string& ifile)
{
  for(int i = 1; i < argc; i++){
    string str = argv[i];
    if(str.length() != 2)continue;
    if(strcmp(str.c_str(),"-m") == 0){ //MUCT data//寻找明命令行中的-m，进而寻找到输入的命令行参数中要输入的muct数据的地址
      if(argc > i+1){ifile = argv[i+1]; return 2;}//找到了返回结束
    }
    if(strcmp(str.c_str(),"-v") == 0){ //video file 这里我们不用视频文件，所以略去
      if(argc > i+1){ifile = argv[i+1]; return 1;}
    }
  }
  ifile = ""; return 0;
}
//==============================================================================
int main(int argc,char** argv)
{
  //parse cmd line options
  if(parse_help(argc,argv)){//检测命令行参数中是否输入了-h和-help即帮组指令
    cout << "usage: ./annotate [-v video] [-m muct_dir] [-d output_dir]" 
     << endl; return 0;
  }
  string odir = parse_odir(argc,argv);
  string ifile; int type = parse_ifile(argc,argv,ifile);//type==2表示输入的为MUCT数据，type==1表示输入的为视频文件
  string fname = odir + "annotations.yaml"; //file to save annotation data to//保存标记数据的文件

  //get data
  namedWindow(annotation.wname); //annotation这个为类定义时实例化了一个对象
  if(type == 2){ //MUCT data
    string lmfile = ifile + "muct-landmarks/muct76-opencv.csv";//ifile是muct-landmarks文件夹所在的根目录
    ifstream file(lmfile.c_str()); //lmfile表示landmarks文件
    if(!file.is_open()){
      cerr << "Failed opening " << lmfile << " for reading!" << endl; return 0;
    }
	//从csv文件中读取图片名和标记的坐标
    string str; getline(file,str);//获取文件流到string对象，获取csv文件中的第一行，不用抛弃
    while(!file.eof()){  //如果没有遇到文件结束符
      getline(file,str); if(str.length() == 0)break; //获取csv中的数据行，没有则break
      muct_data d(str,ifile); if(d.name.length() == 0)continue;
      annotation.data.imnames.push_back(d.name);//存储图像的名字
      annotation.data.points.push_back(d.points);//存储图像上特征点的坐标
    }
    file.close();
    annotation.data.rm_incomplete_samples();//去除不完整的样本
  }else{
    //open video stream//我们的type==2，是处理的图片库不是视频文件，故这里略过
    VideoCapture cam; 
    if(type == 1)cam.open(ifile); else cam.open(0);
    if(!cam.isOpened()){
      cout << "Failed opening video file." << endl
       << "usage: ./annotate [-v video] [-m muct_dir] [-d output_dir]" 
       << endl; return 0;
    }
    //get images to annotate//获取图像用来标记
    annotation.set_capture_instructions();//初始化标记的instructions对象
    while(cam.get(CV_CAP_PROP_POS_AVI_RATIO) < 0.999999){
      Mat im,img; cam >> im; annotation.image = im.clone(); 
      annotation.draw_instructions();
      imshow(annotation.wname,annotation.image); int c = waitKey(10);
      if(c == 'q')break;
      else if(c == 's'){
    int idx = annotation.data.imnames.size(); char str[1024]; 
    if     (idx < 10)sprintf(str,"%s00%d.png",odir.c_str(),idx);
    else if(idx < 100)sprintf(str,"%s0%d.png",odir.c_str(),idx);
    else               sprintf(str,"%s%d.png",odir.c_str(),idx);
    imwrite(str,im); annotation.data.imnames.push_back(str);
    im = Scalar::all(255); imshow(annotation.wname,im); waitKey(10);
      }
	}
    if(annotation.data.imnames.size() == 0)return 0;
    annotation.data.points.resize(annotation.data.imnames.size());

    //annotate first image
    setMouseCallback(annotation.wname,pp_MouseCallback,0);
    annotation.set_pick_points_instructions();
    annotation.set_current_image(0);
    annotation.draw_instructions();
    annotation.idx = 0;
    while(1){ annotation.draw_points();
      imshow(annotation.wname,annotation.image); if(waitKey(0) == 'q')break;
    }
    if(annotation.data.points[0].size() == 0)return 0;
    annotation.replicate_annotations(0);
  }


  //从这里开始，上面的属于处理视频图像的
  save_ft(fname.c_str(),annotation.data);
  
  //annotate connectivity //标记连通性
  setMouseCallback(annotation.wname,pc_MouseCallback,0);//设置鼠标回调函数
  annotation.set_connectivity_instructions();
  annotation.set_current_image(0);
  annotation.draw_instructions();
  annotation.idx = 0;
  while(1){ annotation.draw_connections(); 
    imshow(annotation.wname,annotation.image); if(waitKey(0) == 'q')break;
  }
  save_ft(fname.c_str(),annotation.data); 

  //annotate symmetry//标记连通性
  setMouseCallback(annotation.wname,ps_MouseCallback,0);
  annotation.initialise_symmetry(0);
  annotation.set_symmetry_instructions();
  annotation.set_current_image(0);
  annotation.draw_instructions();
  annotation.idx = 0; annotation.pidx = -1;
  while(1){ annotation.draw_symmetry(); 
    imshow(annotation.wname,annotation.image); if(waitKey(0) == 'q')break;
  }
  save_ft(fname.c_str(),annotation.data); 

  //annotate the rest
  if(type != 2){
    setMouseCallback(annotation.wname,mv_MouseCallback,0);
    annotation.set_move_points_instructions();
    annotation.idx = 1; annotation.pidx = -1;
    while(1){
      annotation.set_current_image(annotation.idx);
      annotation.draw_instructions();
      annotation.set_clean_image();
      annotation.draw_connections();
      imshow(annotation.wname,annotation.image); 
      int c = waitKey(0);
      if     (c == 'q')break;
      else if(c == 'p'){annotation.idx++; annotation.pidx = -1;}
      else if(c == 'o'){annotation.idx--; annotation.pidx = -1;}
      if(annotation.idx < 0)annotation.idx = 0;
      if(annotation.idx >= int(annotation.data.imnames.size()))
    annotation.idx = annotation.data.imnames.size()-1;
    }
  }
  save_ft(fname.c_str(),annotation.data); destroyWindow("Annotate"); return 0;
}
//==============================================================================

你可能感兴趣的:(机器视觉,图像处理,opencv)

Opencv之计算机视觉一闭月之泪舞计算机视觉计算机视觉 opencv python
一、环境准备使用opencv库来实现简单的计算机视觉。需要安装两个库：opencv-python和opencv-contrib-python，版本可以自行选择，注意不同版本的opencv中的某些函数名和用法可能不同pipinstallopencv-python==3.4.18.65-ihttps://pypi.tuna.tsinghua.edu.cn/simplepipinstallopencv-
OpenCV 4.2.0与扩展模块安装与应用指南土城三富
本文还有配套的精品资源，点击获取简介：OpenCV4.2.0是一个先进的计算机视觉库，包含了图像处理、计算机视觉和机器学习算法。本压缩包包含OpenCV核心库和扩展模块（opencv_contrib），版本均为4.2.0。该版本引入了性能增强、API优化以及对深度学习框架和硬件加速技术的更新支持。扩展模块提供了额外的实验性算法和功能，有助于研究和开发新算法。指南详细介绍了如何安装和配置这些库，并提
OpenCV ML 模块使用指南 ice_junjun OpenCV opencv 人工智能计算机视觉
一、模块概述OpenCV的ML模块提供了丰富的机器学习算法，可用于解决各种计算机视觉和数据分析问题。本指南将详细介绍该模块中主要的机器学习算法，包括支持向量机（SVM）、K均值聚类（K-Means）和神经网络（ANN），并结合图像分类和聚类分析这两个典型应用场景进行代码实现与解释。二、主要函数及类详解（一）支持向量机（SVM）：cv.ml.SVM_create()功能支持向量机（SVM）是一种强大
opencv对图像处理 syfirst1111 图像处理 opencv 计算机视觉
形态学转换：基于图像形状的操作，通常在二进制图像上执行。腐蚀、膨胀：腐蚀：求局部最小值，原图高亮部分被蚕食膨胀：求局部最大值，原图高亮部分部分扩张img=cv.imread(path)kenel=np.ones((5,5),np.uint8)#创建核结构img2=cv.erode(img,kenel)#腐蚀去噪img1=cv.dilate(img,kenel)#膨胀目标增大，填充孔洞图像平滑（去噪
OpenCV图像处理基础2 指尖下的技术 OpenCV opencv 图像处理计算机视觉
接着上一篇OpenCV图像处理基础1继续说。图像阈值处理1、简单阈值处理ret,thresholded_image=cv2.threshold(image,thresh,maxval,cv2.THRESH_BINARY)thresh是阈值，maxval是最大值。2、自适应阈值处理thresholded_image=cv2.adaptiveThreshold(image,maxval,cv2.ADA
初始OpenCV 指尖下的技术 OpenCV opencv 人工智能计算机视觉
OpenCV是一个功能强大、应用广泛的计算机视觉库，它为开发人员提供了丰富的工具和算法，可以帮助他们快速构建各种视觉应用。随着计算机视觉技术的不断发展，OpenCV也将会继续发挥重要的作用。OpenCV提供了大量的计算机视觉算法和图像处理工具，广泛应用于图像和视频的处理、分析以及机器学习领域。所以学习人计算机视觉或者图像处理方面的知识，OpenCV是一个要重点学习的工具库。首先介绍一下OpenCV
【2017-2025】Adobe Photoshop【PS】软件下载安装 adkjcbqvblq adobe photoshop ui
获取安装包https://pan.baidu.com/s/1NLUthiAyC2chlSEwbf1LRQ?pwd=4ppq1.起源与发展1.1初试啼声AdobePhotoshop的历史可以追溯到1987年，当时由托马斯·诺尔（ThomasKnoll）和他的兄弟约翰·诺尔（JohnKnoll）共同开发。托马斯在父亲的帮助下，开始了图像处理的编程尝试。他们的初始产品是一个用于Mac系统的程序，最初名为
GStreamer —— 3.2、Qt+GStreamer+OpenCV制作图像处理播放器(对每帧图像处理)，支持本地mp4文件、rtsp流、usb摄像头等（可跨平台，附源码）信必诺 GStreamer Qt GStreamer Qt
运行效果介绍本项目是一个结合了Qt、GStreamer和OpenCV的跨平台图像处理播放器项目。该
人脸识别的一些代码饿了就干饭 CV相关人脸识别
1、cv2入门函数imread及其相关操作2、（详解）opencv里的cv2.resize改变图片大小Python3、机器学习之人脸识别face_recognition使用4、使用face_recognition进行人脸校准5、简单的人脸识别通用流程示意图（这个看着写的挺好的）6、face_recognition和图像处理中left、top、right、bottom解释7、使用pillow库对图片
【人工智能】大模型的幻觉问题：DeepSeek 的解决策略与实践蒙娜丽宁 Python杂谈人工智能人工智能
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界大语言模型（LLM）的“幻觉”问题，即模型生成与事实不符或脱离上下文的内容，是限制其广泛应用的关键挑战之一。本文深入探讨了幻觉问题的成因，包括训练数据的偏差、推理过程中的过度泛化以及缺乏外部验证机制。以DeepSeek系列模型为研究对象，我们分析了其在解
深度学习与目标检测系列(三) 本文约(4万字) | 全面解读复现AlexNet | Pytorch | 小酒馆燃着灯深度学习目标检测 pytorch AlexNet 人工智能
文章目录解读Abstract-摘要翻译精读主要内容1.Introduction—前言翻译精读主要内容：本文主要贡献：2.TheDataset-数据集翻译精读主要内容：ImageNet简介：图像处理方法：3.TheArchitecture—网络结构3.1ReLUNonlinearity—非线性激活函数ReLU翻译精读传统方法及不足本文改进方法本文的改进结果3.2TrainingonMultipleG
Windows配置opencv详细教程吃旺旺雪饼的小男孩环境配置 windows opencv 人工智能计算机视觉
Windows配置opencv1.安装CMakeCMake安装步骤：2.安装VisualStudioVisualStudio安装步骤：3.下载OpenCV源码下载步骤：4.配置OpenCV使用CMake4.1.配置CMakeGUI4.2.配置选项5.使用VisualStudio编译OpenCV5.1.打开VisualStudio项目5.2.编译OpenCV6.配置开发环境（VisualStudio
车牌识别技术揭秘：如何用 C# 实现自动车牌识别系统威哥说编程 c#开发语言
车牌识别（LicensePlateRecognition，LPR）是一项计算机视觉技术，用于自动识别车辆的车牌号码。在实际应用中，车牌识别技术被广泛用于停车场管理、交通监控和安防系统等领域。实现车牌识别系统的关键步骤包括图像预处理、车牌检测、字符分割、字符识别等。C#中可以通过结合OpenCV、EmguCV、TesseractOCR等工具来实现车牌识别系统。一、所需工具和库EmguCV：这是一个封
10.2 如何解决从复杂 PDF 文件中提取数据的问题？墨染辉大语言模型 pdf
10.2如何解决从复杂PDF文件中提取数据的问题？解决方案：嵌入式表格检索解释：嵌入式表格检索是一种专门针对从复杂PDF文件中的表格提取数据的技术。它结合了表格识别、解析和语义理解，使得从复杂结构的表格中检索信息成为可能。具体步骤：表格检测和识别：目标：在PDF页面中准确地定位和识别表格区域。方法：使用计算机视觉和深度学习技术，如卷积神经网络（CNN）或其他先进的图像处理算法。效果：能够检测出页面
用Python实现SFM 薄辉 python opencv 计算机视觉人工智能图像处理
SFM(结构化光流法)是一种用于解决三维重建问题的方法，它可以根据许多二维图像和它们之间的相对位置，估计出三维场景的深度和摄像机的姿态。在Python中，你可以使用OpenCV库来实现SFM。下面是一个简单的例子，展示了如何使用OpenCV库的cv2.sfm_create函数来实现SFM：importcv2#读入图像，存入列表images中images=[]foriinrange(1,11):im
cv2 orb 图像拼接_图像拼接Opencv源码重构是佐罗而非索隆 cv2 orb 图像拼接
请看赵春江https://me.csdn.net/zhaocj的主页，他已经对Opencv图像拼接流程中的代码做了很详细的解释。前人栽树，后人乘凉。一.本文所做的事1.重构了Opencv图像拼接的源代码，整个代码是面向过程的；2.在赵春江源码分析基础上，对一些细节部分进行说明。代码链接：https://github.com/mhhai/ImageStitch二.特征点检测一切起源于这段代码Ptrf
OpenCV图像拼接（2）基于羽化（feathering）技术的图像融合算法拼接类cv::detail::FeatherBlender 村北头的码农 OpenCV opencv 算法人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::detail::FeatherBlender是OpenCV中用于图像拼接的一个类，它属于stitching模块的一部分。这个类实现了基于羽化（feathering）技术的图像融合算法，用于平滑地混合重叠区域中的图像，从而生成无缝的全景图。主要特点羽化技术：
OpenCV图像拼接（1）自动校准之校准旋转相机的函数calibrateRotatingCamera() 村北头的码农 OpenCV opencv 人工智能
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::detail::calibrateRotatingCamera是OpenCV中用于校准旋转相机的函数。它特别适用于那种相机相对于一个固定的场景进行纯旋转运动的情况，比如在全景拼接过程中。此函数可以从一系列单应性矩阵（HomographyMatrices）中
17-OpenCVSharp 中实现 Halcon 的 Points_Harris算子（Harris 角点检测）观视界 #opencv 人工智能计算机视觉图像处理矩阵
专栏地址：《OpenCV功能使用详解200篇》《OpenCV算子使用详解300篇》《Halcon算子使用详解300篇》内容持续更新，欢迎点击订阅在OpenCVSharp中实现类似于Halcon中的Points_Harris算子，实际上就是实现Harris角点检测算法。Harris角点检测算法是用于检测图像中的角点特征，可以用来进行图像匹配、物体识别等任务。Halcon提供的Points_Harri
并查集：从连通性检测到动态合并的算法艺术六七_Shmily 数据结构与算法分析算法
并查集：从连通性检测到动态合并的算法艺术（C++实现）一、并查集：算法世界的隐形支柱在算法竞赛和工程实践中，并查集（DisjointSetUnion，DSU）是解决动态连通性问题的终极武器。它能在近乎常数时间内完成集合的合并与查询操作，广泛应用于社交网络、图像处理、编译器优化等领域。本文将深入剖析并查集的核心原理，并通过实战案例揭示其精妙之处。二、并查集的三重核心1.数据结构设计classDSU{
深度学习的颠覆性发展：从卷积神经网络到Transformer AI天才研究院 AI大模型应用入门实战与进阶 ChatGPT 大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍深度学习是人工智能的核心技术之一，它通过模拟人类大脑中的神经网络学习从大数据中抽取知识，从而实现智能化的自动化处理。深度学习的发展历程可以分为以下几个阶段：2006年，GeoffreyHinton等人开始研究卷积神经网络（ConvolutionalNeuralNetworks，CNN），这是深度学习的第一个大突破。CNN主要应用于图像处理和语音识别等领域。2012年，AlexKrizh
实测 Gemini 2.0 Flash 图像生成：多模态 AI 的创作力边界 python
近日，Google发布了Gemini2.0Flash的实验性图像生成功能（Gemini2.0Flash(ImageGeneration)Experimental）。我也第一时间体验了这一功能，再次感受到AI技术对传统图像处理工具的颠覆性冲击。本文从主要功能、安装方法、应用场景，并通过实际测试展示其能力，希望帮助大家更好地了解和使用这一工具。引言Gemini2.0Flash的实验性图像生成功能于20
gralloc usage flags Damon_X gralloc
下面这些示例主要说明了grallocusageflags在图像处理和多媒体应用中如何影响性能和正确性。让我们逐个详细分析每个问题的根因和修复方案，并深入解析gralloc标志对缓存管理和数据流的影响。✅Example1:长曝光快照耗时异常问题描述症状：长曝光快照（longexposuresnapshot）在某些内存优化后，拍摄时间异常变长。根因：第三方算法在多个快照帧上执行，耗时约1.2秒。Buf
【OpenGL】实现三维空间漫游和立方体、球体贴图 a9c93f2300 圖形學 3d
图像处理引用文件stb_image.h访问镜像下载：https://gitee.com/mirrors/stb-image主函数main.cpp#include#include#defineSTB_IMAGE_IMPLEMENTATION#include#include#include#include#include#include#includeconstGLfloatPI=3.14159265
人工智能之数学基础：线性子空间每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习线性代数线性子空间线性空间
本文重点在前面的课程中，我们学习了线性空间，本文我们我们在此基础上学习线性子空间。在应用中，线性子空间的概念被广泛应用于信号处理、机器学习、图像处理等领域。子空间的性质子空间是线性空间的一部分，它需要满足下面的性质：设V是数域F上的线性空间，W是V的一个非空子集。如果W对于V中的加法运算和数乘运算也构成F上的一个线性空间，则称W为V的线性子空间（或称向量子空间）。具体来说，设V是一个线性空间，W是
YOLO魔改之频率分割模块（FDM）清风AI YOLO算法魔改系列 YOLO 人工智能计算机视觉目标检测 python 深度学习
目标检测原理目标检测是一种将目标分割和识别相结合的图像处理技术，旨在从图像中定位并识别特定目标。深度学习方法，如FasterR-CNN和YOLO系列，已成为主流解决方案。这些方法通常采用两阶段或单阶段策略，通过卷积神经网络(CNN)提取特征并进行分类和定位。在小目标检测中，为克服分辨率低和特征不明显的问题，模型设计中会特别注重特征融合和多尺度处理，以增强对小目标的感知能力。YOLOv8基础YOLO
Adobe Lightroom Classic（简称LRC）图像编辑和管理软件下载安装与使用 xczrFDG adobe
AdobeLightroomClassic（LRC）软件简介AdobeLightroomClassic（简称LRC）是一款强大的图像编辑和管理软件，专为摄影师和图像处理爱好者设计。LRC不仅提供了一系列的编辑工具，还集成了强大的照片管理和组织功能，使用户能够高效地处理和发布摄影作品。该软件是AdobeCreativeCloud的一部分，适用于各类用户，无论是业余爱好者还是专业摄影师。安装包http
OpenCV 图像几何变换：旋转，缩放，斜切奈何小洪 OPENCV opencv 图像旋转缩放
几何变换几何变换可以看成图像中物体（或像素）空间位置改变，或者说是像素的移动。几何运算需要空间变换和灰度级差值两个步骤的算法，像素通过变换映射到新的坐标位置，新的位置可能是在几个像素之间，即不一定为整数坐标。这时就需要灰度级差值将映射的新坐标匹配到输出像素之间。最简单的插值方法是最近邻插值，就是令输出像素的灰度值等于映射最近的位置像素，该方法可能会产生锯齿。这种方法也叫零阶插值，相应比较复杂的还有
OpenCV旋转估计（2）用于自动检测波浪校正类型的函数autoDetectWaveCorrectKind() 村北头的码农 OpenCV opencv 人工智能计算机视觉
操作系统：ubuntu22.04OpenCV版本：OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::detail::autoDetectWaveCorrectKind是OpenCV中用于自动检测波浪校正类型的函数，它根据输入的旋转矩阵集合来决定使用哪种波浪校正模式。波浪校正（WaveCorrection）是图像拼接过程中的一部分，主要用于纠正由于相机在拍
【机器视觉】少量样本图片情况下的图片识别技术方案 yuanpan 机器学习人工智能计算机视觉
在只有少量图片样本的情况下，进行图像识别是一个具有挑战性的任务。以下是一些应对小样本问题的有效方案：1.数据增强（DataAugmentation）通过对现有样本进行各种变换来生成更多的训练数据，例如：几何变换：旋转、缩放、平移、翻转等。颜色变换：调整亮度、对比度、饱和度等。噪声添加：高斯噪声、椒盐噪声等。裁剪和填充：随机裁剪图像的一部分或填充边缘。工具：Keras：ImageDataGenera
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc

(学习笔记)第六章 非刚性人脸跟踪——annotation(标记)