Mason_Mao

opencv中grabcut算法解读

opencv库函数：

grabCut( InputArray _img, InputOutputArray _mask, Rect rect, InputOutputArray _bgdModel, InputOutputArray _fgdModel, int iterCount, int mode )

参数说明：

img——待分割的源图像，必须是8位3通道（CV_8UC3）图像，在处理的过程中不会被修改；
mask——掩码图像，如果使用掩码进行初始化，那么mask保存初始化掩码信息；在执行分割的时候，也可以将用户交互所设定的前景与背景保存到mask中，然后再传入grabCut函数；在处理结束之后，mask中会保存结果。mask只能取以下四种值：

GC_BGD（=0），背景；

GC_FGD（=1），前景；

GC_PR_BGD（=2），可能的背景；

GC_PR_FGD（=3），可能的前景。

rect——用于限定需要进行分割的图像范围，只有该矩形窗口内的图像部分才被处理；
bgdModel——背景模型，如果为null，函数内部会自动创建一个bgdModel；bgdModel必须是单通道浮点型（CV_32FC1）图像，且行数只能为1，列数只能为13x5；
fgdModel——前景模型，如果为null，函数内部会自动创建一个fgdModel；fgdModel必须是单通道浮点型（CV_32FC1）图像，且行数只能为1，列数只能为13x5；
iterCount——迭代次数，必须大于0；
mode——用于指示grabCut函数进行什么操作，可选的值有：

GC_INIT_WITH_RECT（=0），用矩形窗初始化GrabCut；

GC_INIT_WITH_MASK（=1），用掩码图像初始化GrabCut；

GC_EVAL（=2），执行分割。

函数：

grabcut算法是一种基于图论的图像分割方法，首先要定义一个Gibbs能量函数，然后求解这个函数的min-cut，这个min-cut就是前景背景的分割像素集合。

能量函数的定义 :

其中U函数部分表示能量函数的区域数据项，V函数表示能量函数的光滑项(边界项)。

k-means算法：

K-means算法的相关描述：

　　聚类是一种无监督的学习，它将相似的对象归到同一簇中。聚类的方法几乎可以应用所有对象，簇内的对象越相似，聚类的效果就越好。K-means算法中的k表示的是聚类为k个簇，means代表取每一个聚类中数据值的均值作为该簇的中心，或者称为质心，即用每一个的类的质心对该簇进行描述。

　　聚类和分类最大的不同在于，分类的目标是事先已知的，而聚类则不一样，聚类事先不知道目标变量是什么，类别没有像分类那样被预先定义出来，所以，聚类有时也叫无监督学习。

　　聚类分析试图将相似的对象归入同一簇，将不相似的对象归为不同簇，那么，显然需要一种合适的相似度计算方法，我们已知的有很多相似度的计算方法，比如欧氏距离，余弦距离，汉明距离等。事实上，我们应该根据具体的应用来选取合适的相似度计算方法。

K-means算法虽然比较容易实现，但是其可能收敛到局部最优解，且在大规模数据集上收敛速度相对较慢。

K-means算法的工作流程：

随机确定k个初始点的质心。
将数据集中的每一个点分配到一个簇中，即为每一个点找到距其最近的质心，并将其分配给该质心所对应的簇。
每一个簇的质心更新为该簇所有点的平均值。
重复1~3步骤直到质心收敛或则是最大迭代次数。

最小割与最大流算法（mincut & maxflow）

首先介绍Mincut问题：

一个有向图，并有一个源顶点（source vertex）和目标顶点（target vertex）.边的权值为正,又称之为容量（capacity）.如下图：

一个st-cut(简称割cut)会把有向图的顶点分成两个不相交的集合，其中s在一个集合中，t在另外一个集合中（在图像分割中，你可以将s理解成前景，t理解成背景）。

这个割的容量（capacity of the cut）就是A到B所有边的容量和。注意这里不包含B到A的。参见下面几幅图。最小割问题就是要找到割容量最小的情况。

可以想象成某某国家要控制网络，使得国民不能跟外面联络，S代表某个国家，t代表其余的世界。而每条边上代表着是带宽，带宽越大，肯定建设成本也越大，在进行cut的时候当然希望能达到完全断开的效果但又能破坏越少的基建设施,这就是最小割问题。

Maxflow

接着介绍maxflow问题。跟mincut问题类似，maxflow要处理的情况也是一个有向图，并有一个原顶点（source vertex）和目标（target vertex）.边的权值为正,又称之为容量（capacity）.如下图：

一个st-flow(简称flow)是为每条边附一个值，这个值需要满足两个条件：

0<=边的flow <<边的capacity
除了s和t外，每个顶点的inflow要等于outflow

见下图，其实这个很好理解，可以想象成水管或者电流，一个flow的值（value of the flow）就是t的inflow.Maxflow就是找到这个最大值。

后面会发现Mincut和maxflow的问题是对偶的，解出了maxflow也就知道了mincut的解。现在先介绍一种解maxflow的算法Ford-Fulkerson,为了方便，简称FF算法。

（1）初始化，所有边的flow都初始化为0

（2）沿着增广路径增加flow。增广路径是一条从s到t的无向路径，但也有些条件，可以经过没有满容量的前向路径（s到t）或者是不为空的反向路径(t->s)

grabcut.cpp:



/*M///
//
//  IMPORTANT: READ BEFORE DOWNLOADING, COPYING, INSTALLING OR USING.
//
//  By downloading, copying, installing or using the software you agree to this license.
//  If you do not agree to this license, do not download, install,
//  copy or use the software.
//
//
//                        Intel License Agreement
//                For Open Source Computer Vision Library
//
// Copyright (C) 2000, Intel Corporation, all rights reserved.
// Third party copyrights are property of their respective owners.
//
// Redistribution and use in source and binary forms, with or without modification,
// are permitted provided that the following conditions are met:
//
//   * Redistribution's of source code must retain the above copyright notice,
//     this list of conditions and the following disclaimer.
//
//   * Redistribution's in binary form must reproduce the above copyright notice,
//     this list of conditions and the following disclaimer in the documentation
//     and/or other materials provided with the distribution.
//
//   * The name of Intel Corporation may not be used to endorse or promote products
//     derived from this software without specific prior written permission.
//
// This software is provided by the copyright holders and contributors "as is" and
// any express or implied warranties, including, but not limited to, the implied
// warranties of merchantability and fitness for a particular purpose are disclaimed.
// In no event shall the Intel Corporation or contributors be liable for any direct,
// indirect, incidental, special, exemplary, or consequential damages
// (including, but not limited to, procurement of substitute goods or services;
// loss of use, data, or profits; or business interruption) however caused
// and on any theory of liability, whether in contract, strict liability,
// or tort (including negligence or otherwise) arising in any way out of
// the use of this software, even if advised of the possibility of such damage.
//
//M*/
 
#include "precomp.hpp"
#include "gcgraph.hpp"
#include 
 
using namespace cv;
 
/*
This is implementation of image segmentation algorithm GrabCut described in
"GrabCut — Interactive Foreground Extraction using Iterated Graph Cuts".
Carsten Rother, Vladimir Kolmogorov, Andrew Blake.
 */
 
/*
 GMM - Gaussian Mixture Model
*/
class GMM
{
public:
    static const int componentsCount = 5;
 
    GMM( Mat& _model );
    double operator()( const Vec3d color ) const;
    double operator()( int ci, const Vec3d color ) const;
    int whichComponent( const Vec3d color ) const;
 
    void initLearning();
    void addSample( int ci, const Vec3d color );
    void endLearning();
 
private:
    void calcInverseCovAndDeterm( int ci );
    Mat model;
    double* coefs;
    double* mean;
    double* cov;
 
    double inverseCovs[componentsCount][3][3]; //协方差的逆矩阵
    double covDeterms[componentsCount];  //协方差的行列式
 
    double sums[componentsCount][3];
    double prods[componentsCount][3][3];
    int sampleCounts[componentsCount];
    int totalSampleCount;
};
 
//背景和前景各有一个对应的GMM（混合高斯模型）
GMM::GMM( Mat& _model )
{
    //一个像素的（唯一对应）高斯模型的参数个数或者说一个高斯模型的参数个数
    //一个像素RGB三个通道值，故3个均值，3*3个协方差，共用一个权值
    const int modelSize = 3/*mean*/ + 9/*covariance*/ + 1/*component weight*/;
    if( _model.empty() )
    {
        //一个GMM共有componentsCount个高斯模型，一个高斯模型有modelSize个模型参数
        _model.create( 1, modelSize*componentsCount, CV_64FC1 );
        _model.setTo(Scalar(0));
    }
    else if( (_model.type() != CV_64FC1) || (_model.rows != 1) || (_model.cols != modelSize*componentsCount) )
        CV_Error( CV_StsBadArg, "_model must have CV_64FC1 type, rows == 1 and cols == 13*componentsCount" );
 
    model = _model;
 
    //注意这些模型参数的存储方式：先排完componentsCount个coefs，再3*componentsCount个mean。
    //再3*3*componentsCount个cov。
    coefs = model.ptr(0);  //GMM的每个像素的高斯模型的权值变量起始存储指针
    mean = coefs + componentsCount; //均值变量起始存储指针
    cov = mean + 3*componentsCount;  //协方差变量起始存储指针
 
    for( int ci = 0; ci < componentsCount; ci++ )
        if( coefs[ci] > 0 )
             //计算GMM中第ci个高斯模型的协方差的逆Inverse和行列式Determinant
             //为了后面计算每个像素属于该高斯模型的概率（也就是数据能量项）
             calcInverseCovAndDeterm( ci );
}
 
//计算一个像素（由color=（B,G,R）三维double型向量来表示）属于这个GMM混合高斯模型的概率。
//也就是把这个像素像素属于componentsCount个高斯模型的概率与对应的权值相乘再相加，
//具体见论文的公式（10）。结果从res返回。
//这个相当于计算Gibbs能量的第一个能量项（取负后）。
double GMM::operator()( const Vec3d color ) const
{
    double res = 0;
    for( int ci = 0; ci < componentsCount; ci++ )
        res += coefs[ci] * (*this)(ci, color );
    return res;
}
 
//计算一个像素（由color=（B,G,R）三维double型向量来表示）属于第ci个高斯模型的概率。
//具体过程，即高阶的高斯密度模型计算式，具体见论文的公式（10）。结果从res返回
double GMM::operator()( int ci, const Vec3d color ) const
{
    double res = 0;
    if( coefs[ci] > 0 )
    {
        CV_Assert( covDeterms[ci] > std::numeric_limits::epsilon() );
        Vec3d diff = color;
        double* m = mean + 3*ci;
        diff[0] -= m[0]; diff[1] -= m[1]; diff[2] -= m[2];
        double mult = diff[0]*(diff[0]*inverseCovs[ci][0][0] + diff[1]*inverseCovs[ci][1][0] + diff[2]*inverseCovs[ci][2][0])
                   + diff[1]*(diff[0]*inverseCovs[ci][0][1] + diff[1]*inverseCovs[ci][1][1] + diff[2]*inverseCovs[ci][2][1])
                   + diff[2]*(diff[0]*inverseCovs[ci][0][2] + diff[1]*inverseCovs[ci][1][2] + diff[2]*inverseCovs[ci][2][2]);
        res = 1.0f/sqrt(covDeterms[ci]) * exp(-0.5f*mult);
    }
    return res;
}
 
//返回这个像素最有可能属于GMM中的哪个高斯模型（概率最大的那个）
int GMM::whichComponent( const Vec3d color ) const
{
    int k = 0;
    double max = 0;
 
    for( int ci = 0; ci < componentsCount; ci++ )
    {
        double p = (*this)( ci, color );
        if( p > max )
        {
            k = ci;  //找到概率最大的那个，或者说计算结果最大的那个
            max = p;
        }
    }
    return k;
}
 
//GMM参数学习前的初始化，主要是对要求和的变量置零
void GMM::initLearning()
{
    for( int ci = 0; ci < componentsCount; ci++)
    {
        sums[ci][0] = sums[ci][1] = sums[ci][2] = 0;
        prods[ci][0][0] = prods[ci][0][1] = prods[ci][0][2] = 0;
        prods[ci][1][0] = prods[ci][1][1] = prods[ci][1][2] = 0;
        prods[ci][2][0] = prods[ci][2][1] = prods[ci][2][2] = 0;
        sampleCounts[ci] = 0;
    }
    totalSampleCount = 0;
}
 
//增加样本，即为前景或者背景GMM的第ci个高斯模型的像素集（这个像素集是来用估
//计计算这个高斯模型的参数的）增加样本像素。计算加入color这个像素后，像素集
//中所有像素的RGB三个通道的和sums（用来计算均值），还有它的prods（用来计算协方差），
//并且记录这个像素集的像素个数和总的像素个数（用来计算这个高斯模型的权值）。
void GMM::addSample( int ci, const Vec3d color )
{
    sums[ci][0] += color[0]; sums[ci][1] += color[1]; sums[ci][2] += color[2];
    prods[ci][0][0] += color[0]*color[0]; prods[ci][0][1] += color[0]*color[1]; prods[ci][0][2] += color[0]*color[2];
    prods[ci][1][0] += color[1]*color[0]; prods[ci][1][1] += color[1]*color[1]; prods[ci][1][2] += color[1]*color[2];
    prods[ci][2][0] += color[2]*color[0]; prods[ci][2][1] += color[2]*color[1]; prods[ci][2][2] += color[2]*color[2];
    sampleCounts[ci]++;
    totalSampleCount++;
}
 
//从图像数据中学习GMM的参数：每一个高斯分量的权值、均值和协方差矩阵；
//这里相当于论文中“Iterative minimisation”的step 2
void GMM::endLearning()
{
    const double variance = 0.01;
    for( int ci = 0; ci < componentsCount; ci++ )
    {
        int n = sampleCounts[ci]; //第ci个高斯模型的样本像素个数
        if( n == 0 )
            coefs[ci] = 0;
        else
        {
            //计算第ci个高斯模型的权值系数
            coefs[ci] = (double)n/totalSampleCount;
 
            //计算第ci个高斯模型的均值
            double* m = mean + 3*ci;
            m[0] = sums[ci][0]/n; m[1] = sums[ci][1]/n; m[2] = sums[ci][2]/n;
 
            //计算第ci个高斯模型的协方差
            double* c = cov + 9*ci;
            c[0] = prods[ci][0][0]/n - m[0]*m[0]; c[1] = prods[ci][0][1]/n - m[0]*m[1]; c[2] = prods[ci][0][2]/n - m[0]*m[2];
            c[3] = prods[ci][1][0]/n - m[1]*m[0]; c[4] = prods[ci][1][1]/n - m[1]*m[1]; c[5] = prods[ci][1][2]/n - m[1]*m[2];
            c[6] = prods[ci][2][0]/n - m[2]*m[0]; c[7] = prods[ci][2][1]/n - m[2]*m[1]; c[8] = prods[ci][2][2]/n - m[2]*m[2];
 
            //计算第ci个高斯模型的协方差的行列式
            double dtrm = c[0]*(c[4]*c[8]-c[5]*c[7]) - c[1]*(c[3]*c[8]-c[5]*c[6]) + c[2]*(c[3]*c[7]-c[4]*c[6]);
            if( dtrm <= std::numeric_limits::epsilon() )
            {
                //相当于如果行列式小于等于0，（对角线元素）增加白噪声，避免其变
                //为退化（降秩）协方差矩阵（不存在逆矩阵，但后面的计算需要计算逆矩阵）。
                // Adds the white noise to avoid singular covariance matrix.
                c[0] += variance;
                c[4] += variance;
                c[8] += variance;
            }
             
            //计算第ci个高斯模型的协方差的逆Inverse和行列式Determinant
            calcInverseCovAndDeterm(ci);
        }
    }
}
 
//计算协方差的逆Inverse和行列式Determinant
void GMM::calcInverseCovAndDeterm( int ci )
{
    if( coefs[ci] > 0 )//计算第ci个高斯模型的权值系数
    {
        //取第ci个高斯模型的协方差的起始指针
        double *c = cov + 9*ci;
        double dtrm =
              covDeterms[ci] = c[0]*(c[4]*c[8]-c[5]*c[7]) - c[1]*(c[3]*c[8]-c[5]*c[6])
                                + c[2]*(c[3]*c[7]-c[4]*c[6]);
 
        //在C++中，每一种内置的数据类型都拥有不同的属性, 使用库可以获
        //得这些基本数据类型的数值属性。因为浮点算法的截断，所以使得，当a=2，
        //b=3时 10*a/b == 20/b不成立。那怎么办呢？
        //这个小正数（epsilon）常量就来了，小正数通常为可用给定数据类型的
        //大于1的最小值与1之差来表示。若dtrm结果不大于小正数，那么它几乎为零。
        //所以下式保证dtrm>0，即行列式的计算正确（协方差对称正定，故行列式大于0）。
        CV_Assert( dtrm > std::numeric_limits::epsilon() );
        //三阶方阵的求逆
        inverseCovs[ci][0][0] =  (c[4]*c[8] - c[5]*c[7]) / dtrm;
        inverseCovs[ci][1][0] = -(c[3]*c[8] - c[5]*c[6]) / dtrm;
        inverseCovs[ci][2][0] =  (c[3]*c[7] - c[4]*c[6]) / dtrm;
        inverseCovs[ci][0][1] = -(c[1]*c[8] - c[2]*c[7]) / dtrm;
        inverseCovs[ci][1][1] =  (c[0]*c[8] - c[2]*c[6]) / dtrm;
        inverseCovs[ci][2][1] = -(c[0]*c[7] - c[1]*c[6]) / dtrm;
        inverseCovs[ci][0][2] =  (c[1]*c[5] - c[2]*c[4]) / dtrm;
        inverseCovs[ci][1][2] = -(c[0]*c[5] - c[2]*c[3]) / dtrm;
        inverseCovs[ci][2][2] =  (c[0]*c[4] - c[1]*c[3]) / dtrm;
    }
}
 
//计算beta，也就是Gibbs能量项中的第二项（平滑项）中的指数项的beta，用来调整
//高或者低对比度时，两个邻域像素的差别的影响的，例如在低对比度时，两个邻域
//像素的差别可能就会比较小，这时候需要乘以一个较大的beta来放大这个差别，
//在高对比度时，则需要缩小本身就比较大的差别。
//所以我们需要分析整幅图像的对比度来确定参数beta，具体的见论文公式（5）。
/*
  Calculate beta - parameter of GrabCut algorithm.
  beta = 1/(2*avg(sqr(||color[i] - color[j]||)))
*/
static double calcBeta( const Mat& img )
{
    double beta = 0;
    for( int y = 0; y < img.rows; y++ )
    {
        for( int x = 0; x < img.cols; x++ )
        {
            //计算四个方向邻域两像素的差别，也就是欧式距离或者说二阶范数
            //（当所有像素都算完后，就相当于计算八邻域的像素差了）
            Vec3d color = img.at(y,x);
            if( x>0 ) // left  >0的判断是为了避免在图像边界的时候还计算，导致越界
            {
                Vec3d diff = color - (Vec3d)img.at(y,x-1);
                beta += diff.dot(diff);  //矩阵的点乘，也就是各个元素平方的和
            }
            if( y>0 && x>0 ) // upleft
            {
                Vec3d diff = color - (Vec3d)img.at(y-1,x-1);
                beta += diff.dot(diff);
            }
            if( y>0 ) // up
            {
                Vec3d diff = color - (Vec3d)img.at(y-1,x);
                beta += diff.dot(diff);
            }
            if( y>0 && x(y-1,x+1);
                beta += diff.dot(diff);
            }
        }
    }
    if( beta <= std::numeric_limits::epsilon() )
        beta = 0;
    else
        beta = 1.f / (2 * beta/(4*img.cols*img.rows - 3*img.cols - 3*img.rows + 2) ); //论文公式（5）
 
    return beta;
}
 
//计算图每个非端点顶点（也就是每个像素作为图的一个顶点，不包括源点s和汇点t）与邻域顶点
//的边的权值。由于是无向图，我们计算的是八邻域，那么对于一个顶点，我们计算四个方向就行，
//在其他的顶点计算的时候，会把剩余那四个方向的权值计算出来。这样整个图算完后，每个顶点
//与八邻域的顶点的边的权值就都计算出来了。
//这个相当于计算Gibbs能量的第二个能量项（平滑项），具体见论文中公式（4）
/*
  Calculate weights of noterminal vertices of graph.
  beta and gamma - parameters of GrabCut algorithm.
 */
static void calcNWeights( const Mat& img, Mat& leftW, Mat& upleftW, Mat& upW,
                            Mat& uprightW, double beta, double gamma )
{
    //gammaDivSqrt2相当于公式（4）中的gamma * dis(i,j)^(-1)，那么可以知道，
    //当i和j是垂直或者水平关系时，dis(i,j)=1，当是对角关系时，dis(i,j)=sqrt(2.0f)。
    //具体计算时，看下面就明白了
    const double gammaDivSqrt2 = gamma / std::sqrt(2.0f);
    //每个方向的边的权值通过一个和图大小相等的Mat来保存
    leftW.create( img.rows, img.cols, CV_64FC1 );
    upleftW.create( img.rows, img.cols, CV_64FC1 );
    upW.create( img.rows, img.cols, CV_64FC1 );
    uprightW.create( img.rows, img.cols, CV_64FC1 );
    for( int y = 0; y < img.rows; y++ )
    {
        for( int x = 0; x < img.cols; x++ )
        {
            Vec3d color = img.at(y,x);
            if( x-1>=0 ) // left  //避免图的边界
            {
                Vec3d diff = color - (Vec3d)img.at(y,x-1);
                leftW.at(y,x) = gamma * exp(-beta*diff.dot(diff));
            }
            else
                leftW.at(y,x) = 0;
            if( x-1>=0 && y-1>=0 ) // upleft
            {
                Vec3d diff = color - (Vec3d)img.at(y-1,x-1);
                upleftW.at(y,x) = gammaDivSqrt2 * exp(-beta*diff.dot(diff));
            }
            else
                upleftW.at(y,x) = 0;
            if( y-1>=0 ) // up
            {
                Vec3d diff = color - (Vec3d)img.at(y-1,x);
                upW.at(y,x) = gamma * exp(-beta*diff.dot(diff));
            }
            else
                upW.at(y,x) = 0;
            if( x+1=0 ) // upright
            {
                Vec3d diff = color - (Vec3d)img.at(y-1,x+1);
                uprightW.at(y,x) = gammaDivSqrt2 * exp(-beta*diff.dot(diff));
            }
            else
                uprightW.at(y,x) = 0;
        }
    }
}
 
//检查mask的正确性。mask为通过用户交互或者程序设定的，它是和图像大小一样的单通道灰度图，
//每个像素只能取GC_BGD or GC_FGD or GC_PR_BGD or GC_PR_FGD 四种枚举值，分别表示该像素
//（用户或者程序指定）属于背景、前景、可能为背景或者可能为前景像素。具体的参考：
//ICCV2001“Interactive Graph Cuts for Optimal Boundary & Region Segmentation of Objects in N-D Images”
//Yuri Y. Boykov Marie-Pierre Jolly
/*
  Check size, type and element values of mask matrix.
 */
static void checkMask( const Mat& img, const Mat& mask )
{
    if( mask.empty() )
        CV_Error( CV_StsBadArg, "mask is empty" );
    if( mask.type() != CV_8UC1 )
        CV_Error( CV_StsBadArg, "mask must have CV_8UC1 type" );
    if( mask.cols != img.cols || mask.rows != img.rows )
        CV_Error( CV_StsBadArg, "mask must have as many rows and cols as img" );
    for( int y = 0; y < mask.rows; y++ )
    {
        for( int x = 0; x < mask.cols; x++ )
        {
            uchar val = mask.at(y,x);
            if( val!=GC_BGD && val!=GC_FGD && val!=GC_PR_BGD && val!=GC_PR_FGD )
                CV_Error( CV_StsBadArg, "mask element value must be equel"
                    "GC_BGD or GC_FGD or GC_PR_BGD or GC_PR_FGD" );
        }
    }
}
 
//通过用户框选目标rect来创建mask，rect外的全部作为背景，设置为GC_BGD，
//rect内的设置为 GC_PR_FGD（可能为前景）
/*
  Initialize mask using rectangular.
*/
static void initMaskWithRect( Mat& mask, Size imgSize, Rect rect )
{
    mask.create( imgSize, CV_8UC1 );
    mask.setTo( GC_BGD );
 
    rect.x = max(0, rect.x);
    rect.y = max(0, rect.y);
    rect.width = min(rect.width, imgSize.width-rect.x);
    rect.height = min(rect.height, imgSize.height-rect.y);
 
    (mask(rect)).setTo( Scalar(GC_PR_FGD) );
}
 
//通过k-means算法来初始化背景GMM和前景GMM模型
/*
  Initialize GMM background and foreground models using kmeans algorithm.
*/
static void initGMMs( const Mat& img, const Mat& mask, GMM& bgdGMM, GMM& fgdGMM )
{
    const int kMeansItCount = 10;  //迭代次数
    const int kMeansType = KMEANS_PP_CENTERS; //Use kmeans++ center initialization by Arthur and Vassilvitskii
 
    Mat bgdLabels, fgdLabels; //记录背景和前景的像素样本集中每个像素对应GMM的哪个高斯模型，论文中的kn
    vector bgdSamples, fgdSamples; //背景和前景的像素样本集
    Point p;
    for( p.y = 0; p.y < img.rows; p.y++ )
    {
        for( p.x = 0; p.x < img.cols; p.x++ )
        {
            //mask中标记为GC_BGD和GC_PR_BGD的像素都作为背景的样本像素
            if( mask.at(p) == GC_BGD || mask.at(p) == GC_PR_BGD )
                bgdSamples.push_back( (Vec3f)img.at(p) );
            else // GC_FGD | GC_PR_FGD
                fgdSamples.push_back( (Vec3f)img.at(p) );
        }
    }
    CV_Assert( !bgdSamples.empty() && !fgdSamples.empty() );
     
    //kmeans中参数_bgdSamples为：每行一个样本
    //kmeans的输出为bgdLabels，里面保存的是输入样本集中每一个样本对应的类标签（样本聚为componentsCount类后）
    Mat _bgdSamples( (int)bgdSamples.size(), 3, CV_32FC1, &bgdSamples[0][0] );
    kmeans( _bgdSamples, GMM::componentsCount, bgdLabels,
            TermCriteria( CV_TERMCRIT_ITER, kMeansItCount, 0.0), 0, kMeansType );
    Mat _fgdSamples( (int)fgdSamples.size(), 3, CV_32FC1, &fgdSamples[0][0] );
    kmeans( _fgdSamples, GMM::componentsCount, fgdLabels,
            TermCriteria( CV_TERMCRIT_ITER, kMeansItCount, 0.0), 0, kMeansType );
 
    //经过上面的步骤后，每个像素所属的高斯模型就确定的了，那么就可以估计GMM中每个高斯模型的参数了。
    bgdGMM.initLearning();
    for( int i = 0; i < (int)bgdSamples.size(); i++ )
        bgdGMM.addSample( bgdLabels.at(i,0), bgdSamples[i] );
    bgdGMM.endLearning();//得到每个高斯模型的协方差逆矩阵，即计算inverseCovs[componentsCount][3][3]
 
    fgdGMM.initLearning();
    for( int i = 0; i < (int)fgdSamples.size(); i++ )
        fgdGMM.addSample( fgdLabels.at(i,0), fgdSamples[i] );
    fgdGMM.endLearning();
}
 
//论文中：迭代最小化算法step 1：为每个像素分配GMM中所属的高斯模型，kn保存在Mat compIdxs中
/*
  Assign GMMs components for each pixel.
*/
static void assignGMMsComponents( const Mat& img, const Mat& mask, const GMM& bgdGMM,
                                    const GMM& fgdGMM, Mat& compIdxs )
{
    Point p;
    for( p.y = 0; p.y < img.rows; p.y++ )
    {
        for( p.x = 0; p.x < img.cols; p.x++ )
        {
            Vec3d color = img.at(p);
            //通过mask来判断该像素属于背景像素还是前景像素，再判断它属于前景或者背景GMM中的哪个高斯分量
            compIdxs.at(p) = mask.at(p) == GC_BGD || mask.at(p) == GC_PR_BGD ?
                bgdGMM.whichComponent(color) : fgdGMM.whichComponent(color);
        }
    }
}
 
//论文中：迭代最小化算法step 2：从每个高斯模型的像素样本集中学习每个高斯模型的参数
/*
  Learn GMMs parameters.
*/
static void learnGMMs( const Mat& img, const Mat& mask, const Mat& compIdxs, GMM& bgdGMM, GMM& fgdGMM )
{
    bgdGMM.initLearning();
    fgdGMM.initLearning();
    Point p;
    for( int ci = 0; ci < GMM::componentsCount; ci++ )
    {
        for( p.y = 0; p.y < img.rows; p.y++ )
        {
            for( p.x = 0; p.x < img.cols; p.x++ )
            {
                if( compIdxs.at(p) == ci )
                {
                    if( mask.at(p) == GC_BGD || mask.at(p) == GC_PR_BGD )
                        bgdGMM.addSample( ci, img.at(p) );
                    else
                        fgdGMM.addSample( ci, img.at(p) );
                }
            }
        }
    }
    bgdGMM.endLearning();
    fgdGMM.endLearning();
}
 
//通过计算得到的能量项构建图，图的顶点为像素点，图的边由两部分构成，
//一类边是：每个顶点与Sink汇点t（代表背景）和源点Source（代表前景）连接的边，
//这类边的权值通过Gibbs能量项的第一项能量项来表示。
//另一类边是：每个顶点与其邻域顶点连接的边，这类边的权值通过Gibbs能量项的第二项能量项来表示。
/*
  Construct GCGraph
*/
static void constructGCGraph( const Mat& img, const Mat& mask, const GMM& bgdGMM, const GMM& fgdGMM, double lambda,
                       const Mat& leftW, const Mat& upleftW, const Mat& upW, const Mat& uprightW,
                       GCGraph& graph )
{
    int vtxCount = img.cols*img.rows;  //顶点数，每一个像素是一个顶点
    int edgeCount = 2*(4*vtxCount - 3*(img.cols + img.rows) + 2);  //边数，需要考虑图边界的边的缺失
    //通过顶点数和边数创建图。这些类型声明和函数定义请参考gcgraph.hpp
    graph.create(vtxCount, edgeCount);
    Point p;
    for( p.y = 0; p.y < img.rows; p.y++ )
    {
        for( p.x = 0; p.x < img.cols; p.x++)
        {
            // add node
            int vtxIdx = graph.addVtx();  //返回这个顶点在图中的索引
            Vec3b color = img.at(p);
 
            // set t-weights           
            //计算每个顶点与Sink汇点t（代表背景）和源点Source（代表前景）连接的权值。
            //也即计算Gibbs能量（每一个像素点作为背景像素或者前景像素）的第一个能量项
            double fromSource, toSink;
            if( mask.at(p) == GC_PR_BGD || mask.at(p) == GC_PR_FGD )
            {
                //对每一个像素计算其作为背景像素或者前景像素的第一个能量项，作为分别与t和s点的连接权值
                fromSource = -log( bgdGMM(color) );
                toSink = -log( fgdGMM(color) );
            }
            else if( mask.at(p) == GC_BGD )
            {
                //对于确定为背景的像素点，它与Source点（前景）的连接为0，与Sink点的连接为lambda
                fromSource = 0;
                toSink = lambda;
            }
            else // GC_FGD
            {
                fromSource = lambda;
                toSink = 0;
            }
            //设置该顶点vtxIdx分别与Source点和Sink点的连接权值
            graph.addTermWeights( vtxIdx, fromSource, toSink );
 
            // set n-weights  n-links
            //计算两个邻域顶点之间连接的权值。
            //也即计算Gibbs能量的第二个能量项（平滑项）
            if( p.x>0 )
            {
                double w = leftW.at(p);
                graph.addEdges( vtxIdx, vtxIdx-1, w, w );
            }
            if( p.x>0 && p.y>0 )
            {
                double w = upleftW.at(p);
                graph.addEdges( vtxIdx, vtxIdx-img.cols-1, w, w );
            }
            if( p.y>0 )
            {
                double w = upW.at(p);
                graph.addEdges( vtxIdx, vtxIdx-img.cols, w, w );
            }
            if( p.x0 )
            {
                double w = uprightW.at(p);
                graph.addEdges( vtxIdx, vtxIdx-img.cols+1, w, w );
            }
        }
    }
}
 
//论文中：迭代最小化算法step 3：分割估计：最小割或者最大流算法
/*
  Estimate segmentation using MaxFlow algorithm
*/
static void estimateSegmentation( GCGraph& graph, Mat& mask )
{
    //通过最大流算法确定图的最小割，也即完成图像的分割
    graph.maxFlow();
    Point p;
    for( p.y = 0; p.y < mask.rows; p.y++ )
    {
        for( p.x = 0; p.x < mask.cols; p.x++ )
        {
            //通过图分割的结果来更新mask，即最后的图像分割结果。注意的是，永远都
            //不会更新用户指定为背景或者前景的像素
            if( mask.at(p) == GC_PR_BGD || mask.at(p) == GC_PR_FGD )
            {
                if( graph.inSourceSegment( p.y*mask.cols+p.x /*vertex index*/ ) )
                    mask.at(p) = GC_PR_FGD;
                else
                    mask.at(p) = GC_PR_BGD;
            }
        }
    }
}
 
//最后的成果：提供给外界使用的伟大的API：grabCut
/*
****参数说明：
    img——待分割的源图像，必须是8位3通道（CV_8UC3）图像，在处理的过程中不会被修改；
    mask——掩码图像，如果使用掩码进行初始化，那么mask保存初始化掩码信息；在执行分割
        的时候，也可以将用户交互所设定的前景与背景保存到mask中，然后再传入grabCut函
        数；在处理结束之后，mask中会保存结果。mask只能取以下四种值：
        GCD_BGD（=0），背景；
        GCD_FGD（=1），前景；
        GCD_PR_BGD（=2），可能的背景；
        GCD_PR_FGD（=3），可能的前景。
        如果没有手工标记GCD_BGD或者GCD_FGD，那么结果只会有GCD_PR_BGD或GCD_PR_FGD；
    rect——用于限定需要进行分割的图像范围，只有该矩形窗口内的图像部分才被处理；
    bgdModel——背景模型，如果为null，函数内部会自动创建一个bgdModel；bgdModel必须是
        单通道浮点型（CV_32FC1）图像，且行数只能为1，列数只能为13x5；
    fgdModel——前景模型，如果为null，函数内部会自动创建一个fgdModel；fgdModel必须是
        单通道浮点型（CV_32FC1）图像，且行数只能为1，列数只能为13x5；
    iterCount——迭代次数，必须大于0；
    mode——用于指示grabCut函数进行什么操作，可选的值有：
        GC_INIT_WITH_RECT（=0），用矩形窗初始化GrabCut；
        GC_INIT_WITH_MASK（=1），用掩码图像初始化GrabCut；
        GC_EVAL（=2），执行分割。
*/
void cv::grabCut( InputArray _img, InputOutputArray _mask, Rect rect,
                  InputOutputArray _bgdModel, InputOutputArray _fgdModel,
                  int iterCount, int mode )
{
    Mat img = _img.getMat();
    Mat& mask = _mask.getMatRef();
    Mat& bgdModel = _bgdModel.getMatRef();
    Mat& fgdModel = _fgdModel.getMatRef();
 
    if( img.empty() )
        CV_Error( CV_StsBadArg, "image is empty" );
    if( img.type() != CV_8UC3 )
        CV_Error( CV_StsBadArg, "image mush have CV_8UC3 type" );
 
    GMM bgdGMM( bgdModel ), fgdGMM( fgdModel );//初始化背景前景GMM模型bgdModel、fgdModel变成1*13的0向量。
    Mat compIdxs( img.size(), CV_32SC1 );
 
    if( mode == GC_INIT_WITH_RECT || mode == GC_INIT_WITH_MASK )
    {
        if( mode == GC_INIT_WITH_RECT )
            initMaskWithRect( mask, img.size(), rect );//初始化mask，rect外面初始化为GCD_BGD,里面初始化为GCD_PR_FGD
        else // flag == GC_INIT_WITH_MASK
            checkMask( img, mask );
        initGMMs( img, mask, bgdGMM, fgdGMM );
    }
 
    if( iterCount <= 0)
        return;
 
    if( mode == GC_EVAL )
        checkMask( img, mask );
 
    const double gamma = 50;//image是一个常量值50
    const double lambda = 9*gamma;
    const double beta = calcBeta( img );
 
    Mat leftW, upleftW, upW, uprightW;
    calcNWeights( img, leftW, upleftW, upW, uprightW, beta, gamma );
 
    for( int i = 0; i < iterCount; i++ )
    {
        GCGraph graph;
        assignGMMsComponents( img, mask, bgdGMM, fgdGMM, compIdxs );//通过mask来判断该像素属于背景像素还是前景像素，再判断它属于前景或者背景GMM中的哪个高斯分量
        learnGMMs( img, mask, compIdxs, bgdGMM, fgdGMM );
        constructGCGraph(img, mask, bgdGMM, fgdGMM, lambda, leftW, upleftW, upW, uprightW, graph );
        estimateSegmentation( graph, mask );
    }
}

你可能感兴趣的:(opecv)

基于qt和opencv实现人脸识别打卡系统_基于opencv+qt的人脸识别考勤系统设计 2401_87556704 qt opencv 开发语言
1、项目源码https://github.com/SagapoZ/FaceRecognition2、由于github传太大的文件下载太慢因此opecv的库我放在csdn上了。https://download.csdn.net/download/weixin_42127499/11609330一、功能描述1、通过识别人脸来实现每日打开的记录2、可以录制人员信息并且采集人脸信息进行特征模型训练3、使用
ubuntu 18.04安裝QT+PCL+VTK+Opencv czx鑫 PCL ubuntu qt opencv
资源qt5.14.1:qt5.14.1.runopencv4.5.5:opecv4.5.5压缩包1.国内换中科大源，加快下载速度cd/etc/apt/sudogeditsources.list替换成如下内容debhttps://mirrors.ustc.edu.cn/ubuntu/bionicmainrestricteduniversemultiversedeb-srchttps://mirror
c++人脸特征保存到本地_vs2017 dlib19.3 opencv3.41 C++ 环境配置人脸特征点识别陈陈陈陈的小白sir c++人脸特征保存到本地
身为一个.net程序员经过两天的采坑终于把人脸特征检测的项目跑通了，然后本文将以dlib项目中人脸特征检测工程为例，讲解dlib与opencv在vs2017C++项目中的编译与运行路径配置。1、项目建立首先建立一个C++控制台项目，然后根据自己的开发平台选择编译环境我是win1064位系统所以我选择x64。建立控制台项目编译环境选择X642、Opecv3.4.1安装配置下载最新版本3.4.11、配
python调用astra进行人脸检测（使用CascadeClassifier）谢大旭三维重建 python python opencv
1、简述方法：使用opecv中，CascadeClassifier级联分类器实现人脸检测，CascadeClassifier就是opencv下objdetect模块中用来做目标检测的级联分类器的一个类，它可以帮助我们检测例如车牌、眼睛、人脸等物体。它的大概原理就是判别某个物体是否属于某个分类。以人脸为例，我们可以把眼睛、鼻子、眉毛、嘴巴等属性定义成一个分类器，如果检测到一个模型符合定义人脸的所有属
YOLOV8 C++ opecv_dnn模块部署我变成了柴犬 YOLO c++dnn
废话不多说:opencv>=4.7.0opencv编译不做解释，需要的话翻看别的博主的编译教程代码饱含V5,V7,V8部署内容头文件yoloV8.h#pragmaonce#include#includeusingnamespacestd;usingnamespacecv;usingnamespacecv::dnn;structDetection{intclass_id{0};//结果类别idflo
opecv Mat 转 BufferImage 月与禾 java opencv
记录一下publicstaticImagetoBufferedImage(Matm){inttype=10;if(m.channels()>1){type=5;}intbufferSize=m.channels()*m.cols()*m.rows();byte[]b=newbyte[bufferSize];m.get(0,0,b);BufferedImageimage=newBufferedIma
在ubuntu18.04下安装opencv3.4.5 XJ0927
博主①：https://blog.csdn.net/weixin_44354586/article/details/89388500博主②https://blog.csdn.net/Ding_0110M/article/details/88083741opecv下载地址：https://opencv.org/releases/page/3/Ubuntu18.04下查看Opencv安装的版本号：ht
cuda编程day001 Little__Black 人工智能深度学习 linux
一、环境：①、linuxcuda-11.3opecv4.8.0不知道头文件和库文件路径，用命令查找：#find/usr/local-namecuda.h2>/dev/null#查询cuda头文件路径/usr/local/cuda-11.3/targets/x86_64-linux/include/cuda.h#find/usr/local-namelibcudart.so2>/dev/null#查
使用visual studio 配置opencv(c++失败版) etcix 为c++使用cmake 使用opencv opencv c++
##下载1.visualstudio2019(适配windows102019)2.opencv(去github下)##vs安装选项1.选c++桌面就行，其他可以默认---##配置opencv1.这时要新建一个桌面引导项目，控制台程序，进入项目，找到属性配置器(不同vs版本有差异)2.在启动按钮旁边默认为debugx86吧（这里好像一旦配置好了opencv，后续不能配置release版本的opecv
opecv入门:K近邻算法 AI路漫漫 opencv从入门到放弃 opencv
K近邻算法机器学习算法是从数据中产生模型，也就是进行学习的算法，我们提供经验给算法，它可以根据经验产生模型，面对新的情况时，模型就会给我们提供判断（预测）结果。从数据中学得模型的过程称为学习或者训练，在训练过程中使用的数据称为训练数据，每个样本称为训练样本，训练样本所组成的集合称为训练集。如果希望获取一个模型，除了数据还有给样本贴上对应的标签，例如，（（个子高、腿长、体重轻），好苗子）就是拥有标签
Java调用opencv实现图片去水印 τNeverMindζ java java opencv
opencv实现图片去水印案例Java调用opencv实现图片去水印环境安装配置IDEA下开发配置测试案例Java调用opencv实现图片去水印最近项目中遇到个需求，图片去水印下载，由于上传时并未保存原图url，查找了相关资料，基本上都是通过设置RGB色值去水印，测试过后效果并不理想，会将图片中颜色跟RGB色值相同的也给去掉，在朋友的推荐下，使用了opecv这款开源软件，而Java调用opencv
编译android平台使用的opencv Bleach3 android opencv
本文是在ubuntu上编译androidnativeso库首先去https://opencv.org/releases/下载opencv源码，这里用的是4.6.0版本。解压后进入opecv-4.6.0根目录mkdirbuild&&cdbuild新建脚本build.sh，内容如下：exportANDROID_NDK=/你的目录xxx/Android/Sdk/ndk/23.1.7779620/cmak
Linux学习笔记（三）源码编译OpeCV&PCL 胜者为王，自然而然。笔记 linux 学习 opencv
1、源码编译OpeCVopencv—GitHubopencv_contrib-GitHubopencv-releasesopencv_contrib-releases1.1、下载源码mkdir~/opencv_env;cd~/opencv_envgitclone-b3.4https://github.com/opencv/opencv.gitgitclone-b3.4https://github.
修改vs2012默认的库目录及包含目录的方法 wuyeyoulan23 vc++Visual Studio 2012 VC Windows win32
vs2012及vs2010里的库目录及包含目录不在像之前的版本那样，修改一次目录可以直接包含在所有的解决方案里，比如用到有关OPENGL或者OPECV函数的库，就必须在每个解决方案里包含一次库目录及包含目录，这样相当麻烦，在这种情况下，我们可以修改包含目录及库目录的默认值，方法如下（此针对vs2012）：首先打开vs2012，新建一个解决方案，找到vs2012的菜单，在VIEW-otherwind
opencv VS 环境搭建读取显示图像访问像素 FeboReigns opencv opencv 计算机视觉人工智能
1.opencv下载Releases-OpenCV这两个都可以，一个是安装包，一个是压缩吧，安装包也就是个解压的东西，没啥区别，若下载速度慢考虑，不然就等等。解压之后：source是opencv源码build是opecv的源码生成的lib和dll库2.配置环境将这个目录放在系统环境变量中，目的是我们在运行程序的时候能自动加载下面的dll,不然每次都得把dll复制到自己的工程目录下面加完记得依次点确
java OpenCv Mat 类的基本操作（3）我是大头鸟 opencv opencv java
对初学者来说,我们总是希望通过Opencv实现一些功能，当我们去研究一个陌生的东西，我们总是想着利用他去实现某一个功能比如Opencv，我们很容易利用他去进行人脸识别，人脸识别也有很多的方式比如利用opecv自带的算法：但是这对我们来说仅仅是皮毛，也是opencv用来检验的测试用例我们不能拿它做出什么东西，甚至我们连人物识别都不知道怎样做，我们学习新的知识，不能仅仅做知识的搬运工，我们应该从砌砖开
Ubuntu18.04环境下cuda10.0+opecv4.1.0安装江南theone opencv ubuntu cuda
前言：本文章结合CSDN多篇文章内容，并根据个人实际情况进行修改原文链接：https://blog.csdn.net/lihe4151021/article/details/90237681https://blog.csdn.net/dulingwen/article/details/90607767https://blog.csdn.net/weixin_44003563/article/det
opencv没有提示 the_wolf_spice python 开发语言 opencv
使用opecv没有智能提示可以去打开python里面的Lib\site-packages找到cv2w的文件
opecv学习笔记一——opencv环境搭建（环境配置）终成大师 opencv c++机器学习
本人所用版本VS2019+opencv3.4.7希望此篇笔记对你有所帮助,如您有不同意见请私信我，谢谢！步骤如下：设置环境变量我的电脑——属性——高级系统设置——环境变量——系统变量——Path——编辑填写bin所在路径例如我的:E:\opencv\build\x64\vc15\bin动态链接库将如图所示的后缀类型为.dll的三个文件分别复制到C:\Windows\System32和C:\Wind
openCv java Mat和MatOfByte的之间的相互转换 (4) 我是大头鸟 opencv opencv java MatOfByte Mat
因为opecncv是和图片打交道的，我个人觉得图片在计算机中存储的方式一般都是字节，Opecv中图片和矩阵之间是通过对象Mat产生的关联我们很容易将图片转换成为MatMatsrc=Imgcodecs.imread(path,0);这个是一种方式如何将字节转换成为Mat首先我们获取一个图片并且将图片转换成为byteFilefile=newFile("D:\\svnp\\MyYan\\res\\dra
opencv4.5.2 + opecv contrib4.5.2编译落花逐流水 opencv
先下载opencv4.5.2和opencv4.5.2contrib源码参考只是简单看一下，毕竟我已经编译过n多次opencv了。之前一直编译的都是动态库，后来就习惯编译静态库了。注意事项：with-protobuf去掉，因为可能编译不过。WITH_SHARED_LIB,去掉勾选，因为要编译静态库。关掉BUILD_opencv_hdf5勾选上BUILD_opencv_world因为不喜欢太多静态库。
使用Cmake封装API接口成Package方法搞算法的狮子 c++开发语言
本文是个人探究API封装成Package以让他人像使用OpeCV，PCL等第三方库那样方便时所总结的经验。一、CmakeLists.txt的编写1、基本工程实现cmake_minimum_required(VERSIONx.x)#最小Cmake版本要求projiect()#工程名称find_package()#引入第三方库add_library()#编译代码为库文件，SHARED标志可以指定为动态
多个摄像头，Qt 5.14 版本如何使用opecv打开对应的摄像头，并进行录像 crushFlower QT C++qt 开发语言 opencv 图像处理计算机视觉
Qt版本5.14.2Windows下Qt不支持摄像头录像，所以得使用opencv进行录像。官方解释：Windows使用Qt的demo录制视频按钮也是灰色.。解决方案：1、多个摄像头，可以用Qt的QCameraInfo::availableCameras()去遍历摄像头名称，然后获取到摄像序列。2、使用opencv库打开摄像头，录制。
OpeCV图像处理---基本图像容器Mat 逐夸父 OpenCV学习
前沿翻译：OpenCV_tutorials（2.1Mat---TheBasicImagecontainer）版本：3.0.0需要：C++知识第一次翻译，不好的地方多多斧正。学习图像处理都是从冈萨雷斯的数字图像处理开始的，学习OpenCV第一步都得熟悉图像在内存中的存储吧，图像在内存中存储都是以Mat类对象存储。以前的1.0.0版本的OpenCV中存储是用C语言中的struct。这带来很大的问题就是
opecv图像处理（一）基本操作 qq_43222384 数字图像处理
opecv图像基本操作"""imageshow，read,save"""importcv2importnumpyasnp#读取显示图像img=cv2.imread("cat.jpg")cv2.imshow("cat",img)#获取图片属性print(img.shape)print(img.size)print(img.dtype)#exit()#创建复制图像#emptymage=np.zeros
AttributeError: module cv2.face has no attribute 'createEigenFaceRecognizer' shen_lan1234 opencv python face
python3.x中用opecv3做人脸识别有两种模块找不到的报错解决方法。第一种报错：说cv2中没有faceAttributeError:module‘cv2’hasnoattribute‘face’第二种报错：有face，但说face中没有‘createEigenFaceRecognizer’AttributeError:module‘cv2.face’hasnoattribute‘creat
[3] opencv: python求图像上多条曲线中最长及最短曲线小旺的尾巴 opencv python opencv
opecv计算轮廓,各阶矩,轮廓面积;通过面积近似得到较长的曲线原始输入图片：blackline.jpg计算图像中最长与最短曲线，并获取其重心坐标。代码：importcv2importnumpyasnpdefcalc_coordinate_area(contour):M=cv2.moments(contour)#计算轮廓的各阶矩,字典#print(M)#计算重心cx=int(M['m10']/M[
【opencv学习笔记】显示图像雪韵凌枫 Opencv opencv 图像处理
了解opencv已有一段时间，可一直没静下心来系统学，现在正赶上暑假，想把之前的学习做个总结，同时进行更深入的学习。我用的是VS2010+opecv2.48版本，之前装的时候遇到问题已经总结出来，现在opencv3.0已经出来有一段时间了，和2.0系列也有很大的改动，等有空再进行总结。今天主要来说说入门级的一个小程序——显示图像，同时对之前一些疑惑的细节问题进行说明。我们最先开始接触的是这样的一段
opencv初级教程（C++版本）帕帕尼
Opecv介绍：OpenCV是一个基于BSD许可（开源）发行的跨平台计算机视觉和机器学习软件库，可以运行在Linux、Windows、Android和MacOS操作系统上。它轻量级而且高效——由一系列C函数和少量C++类构成，同时提供了Python、Ruby、MATLAB等语言的接口，实现了图像处理和计算机视觉方面的很多通用算法。OpenCV用C++语言编写，它具有C++，Python，Java和
libtorch opecv c++ cmake clion yuanzhoulvpi cpp c++opencv libtorch
使用clion写c++，使用cmake编译opencv和libtorch，使用的是window11系统。其中项目名称叫torch_use0124libtorch文件夹路径为:C:/Users/yuanz/Downloads/cpp_library/libtorchopencv文件夹路径为:C:/Users/yuanz/Downloads/cpp_library/opencvcmake_minimu
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key