GMM图像分割

GMM即高斯混合模型,GMM加上贝叶斯就能对图像进行分割。

在说高斯混合模型之前,得先认识单高斯模型,即高斯分布(正态分布),由图可知,以某个点为例,它的高斯分布含义:离该点越近其权重越大影响越大,越远其权重越小影响越小,中心点的大小要受到周围点的影响。比如  5 _ 10 _ _ 6,以10为中心点的高斯分布,_代表距离,因为5离10更近,权值更大,设为0.8,则5变成5*0.8=4。因为6离10更远,权值更小,设为0.4,则6变成6*0.4=2.4。


高斯分布
对于GMM高斯混合模型:图中是一个直方图,我用曲线去大概模拟走势,可以看到为凹凸曲线,仔细想想,是不是像一个个单高斯分布组合起来的?GMM高斯混合模型就是一个个单高斯分布组合的。可以用来拟合直方图。


直方图



混合高斯模型去拟合直方图


图像处理知识:对于图像明显的类别,在其直方图上可以明显看出,若直方图上存在两个波峰,则图像分为两类。

贝叶斯:贝叶斯就是一个概率估计算法,就是估计一个东西最有可能属于哪类。


图像分割:对于上图,由直方图可以认为图像分为两类,即A和B类。现在要判断每个像素点属于哪一类。以K像素点为例,我们能从经验认为,它有很大概率属于A类。 如何对每个像素点都能自动分类呢?用贝叶斯算法,关于贝叶斯算法,可以自查资料,这样就把图像每个像素点都找到属于自己的类别。

以上都是自己对于GMM算法的个人理解。

// GMM——图像分割.cpp: 定义控制台应用程序的入口点。
//

#include
using namespace cv;
using namespace ml;

int main(int arc, char** argv) {
        Mat src = imread("C:/Users/zhang/Desktop/1.png");
        imshow("input", src);

        int width = src.cols;
        int height = src.rows;
        int dims = src.channels();
        int pointsCount = width * height;//总共数据点的个数

        Mat points(pointsCount, dims, CV_64FC1);//输入数据,与原图像有着相同通道 
        Mat labels;//输出数据,为各个数据点最终的分类索引
        int k = 3;//分别个数
        Scalar color[] = { //每个分类的颜色
                Scalar(0,0,255), 
                Scalar(0,255,0), 
                Scalar(255,0,0)
        };

        //将图像转换为数据点
        int index = 0;
        for (int i = 0; i < height; i++) {
                for (int j = 0; j < width; j++) {
                        //把RGB图像的三个通道的各个像素点值分别赋给points的三个通道
                        index = i * width + j;
                        points.at(index, 0) = src.at(i, j)[0];
                        points.at(index, 1) = src.at(i, j)[1];
                        points.at(index, 2) = src.at(i, j)[2];
                }
        }
        //GMM分割(基于高斯混合模型的期望最大值)
        TermCriteria criteria = TermCriteria(TermCriteria::COUNT + TermCriteria::EPS, 100, 0.1);
        //10代表最大循环数目,1.0代表阈值
        Ptr em = EM::create();
        em->setClustersNumber(k);//分类个数
        em->setCovarianceMatrixType(EM::COV_MAT_SPHERICAL);//协方差矩阵类型
        em->setTermCriteria(criteria);//停止条件
        em->trainEM(points, noArray(), labels, noArray());
        //第一个:表示输入的数据集合,可以一维或者多维数据,类型是Mat类型,
        //第二个:可选项,输出一个矩阵,里面包含每个样本的似然对数值,如果不需要则为noArray()
        //第三个:labels表示计算之后各个数据点的最终的分类索引,是一个INT类型的Mat对象,类型和长宽与原图像一致
        //第四个://可选项,输出一个矩阵,里面包含每个隐性变量的后验概率,如果不需要则为noArray()

        //将数据点转换为图像并显示
        Mat result = Mat::zeros(src.size(), CV_8UC3);
        for (int i = 0; i < height; i++) {
                for (int j = 0; j < width; j++) {
                        index = i * width + j;
                        int label = labels.at(index, 0);////每个像素点的标签
                        //把每个像素点对应的标签所对应的颜色赋给新图像
                        result.at(i, j)[0] = color[label][0];
                        result.at(i, j)[1] = color[label][1];
                        result.at(i, j)[2] = color[label][2];
                }
        }
        imshow("output", result);
        waitKey(0);
        return 0;
}
结果:分为3类


 

你可能感兴趣的:(Python)