GMM即高斯混合模型,GMM加上贝叶斯就能对图像进行分割。
在说高斯混合模型之前,得先认识单高斯模型,即高斯分布(正态分布),由图可知,以某个点为例,它的高斯分布含义:离该点越近其权重越大影响越大,越远其权重越小影响越小,中心点的大小要受到周围点的影响。比如 5 _ 10 _ _ 6,以10为中心点的高斯分布,_代表距离,因为5离10更近,权值更大,设为0.8,则5变成5*0.8=4。因为6离10更远,权值更小,设为0.4,则6变成6*0.4=2.4。
高斯分布
对于GMM高斯混合模型:图中是一个直方图,我用曲线去大概模拟走势,可以看到为凹凸曲线,仔细想想,是不是像一个个单高斯分布组合起来的?GMM高斯混合模型就是一个个单高斯分布组合的。可以用来拟合直方图。
直方图
混合高斯模型去拟合直方图
图像处理知识:对于图像明显的类别,在其直方图上可以明显看出,若直方图上存在两个波峰,则图像分为两类。
贝叶斯:贝叶斯就是一个概率估计算法,就是估计一个东西最有可能属于哪类。
图像分割:对于上图,由直方图可以认为图像分为两类,即A和B类。现在要判断每个像素点属于哪一类。以K像素点为例,我们能从经验认为,它有很大概率属于A类。 如何对每个像素点都能自动分类呢?用贝叶斯算法,关于贝叶斯算法,可以自查资料,这样就把图像每个像素点都找到属于自己的类别。
以上都是自己对于GMM算法的个人理解。
// GMM——图像分割.cpp: 定义控制台应用程序的入口点。
//
#include
using namespace cv;
using namespace ml;
int main(int arc, char** argv) {
Mat src = imread("C:/Users/zhang/Desktop/1.png");
imshow("input", src);
int width = src.cols;
int height = src.rows;
int dims = src.channels();
int pointsCount = width * height;//总共数据点的个数
Mat points(pointsCount, dims, CV_64FC1);//输入数据,与原图像有着相同通道
Mat labels;//输出数据,为各个数据点最终的分类索引
int k = 3;//分别个数
Scalar color[] = { //每个分类的颜色
Scalar(0,0,255),
Scalar(0,255,0),
Scalar(255,0,0)
};
//将图像转换为数据点
int index = 0;
for (int i = 0; i < height; i++) {
for (int j = 0; j < width; j++) {
//把RGB图像的三个通道的各个像素点值分别赋给points的三个通道
index = i * width + j;
points.at
points.at
points.at
}
}
//GMM分割(基于高斯混合模型的期望最大值)
TermCriteria criteria = TermCriteria(TermCriteria::COUNT + TermCriteria::EPS, 100, 0.1);
//10代表最大循环数目,1.0代表阈值
Ptr em = EM::create();
em->setClustersNumber(k);//分类个数
em->setCovarianceMatrixType(EM::COV_MAT_SPHERICAL);//协方差矩阵类型
em->setTermCriteria(criteria);//停止条件
em->trainEM(points, noArray(), labels, noArray());
//第一个:表示输入的数据集合,可以一维或者多维数据,类型是Mat类型,
//第二个:可选项,输出一个矩阵,里面包含每个样本的似然对数值,如果不需要则为noArray()
//第三个:labels表示计算之后各个数据点的最终的分类索引,是一个INT类型的Mat对象,类型和长宽与原图像一致
//第四个://可选项,输出一个矩阵,里面包含每个隐性变量的后验概率,如果不需要则为noArray()
//将数据点转换为图像并显示
Mat result = Mat::zeros(src.size(), CV_8UC3);
for (int i = 0; i < height; i++) {
for (int j = 0; j < width; j++) {
index = i * width + j;
int label = labels.at
//把每个像素点对应的标签所对应的颜色赋给新图像
result.at
result.at
result.at
}
}
imshow("output", result);
waitKey(0);
return 0;
}
结果:分为3类