k-means 算法接受输入量 k ;然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小
1. 算法基本步骤
(1) 从 n个数据对象任意选择 k 个对象作为初始聚类中心;
(2) 根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分;
(3) 重新计算每个(有变化)聚类的均值(中心对象);
(4) 计算标准测度函数,当满足一定条件,如函数收敛时,则算法终止;如果条件不满足则回到步骤(2)。
2.OpenCV 函数使用
int cvKMeans2(const CvArr* samples, //输入样本的浮点矩阵,每个样本一行
int nclusters,//所给定的聚类数目
CvArr* labels, //输出整数向量:每个样本对应的类别标识
CvTermCriteria termcrit, //指定聚类的最大迭代次数和/或精度(两次迭代引起的聚类中心的移动距离)
int attempts=1, CvRNG* rng=0,int flags=0,
CvArr* centers=0,double* compactness=0);
下面还用到了函数CvMat* cvReshape( const CvArr* arr, CvMat* header, int new_cn, int new_rows=0 );
arr 输入的数组. header 被添充的矩阵头 new_cn 新的通道数.new_cn = 0 意味着不修改通道数 new_rows 新的行数。
如果new_rows = 0保持原行数不修改否则根据 new_cn 值修改输出数组 函数 cvReshape 初始化 CvMat 头header 以便于让头指向修改后的形状(但数据保持原样)-也就是说修改通道数,修改行数或者两者者改变。
#include "cxcore.h"
#include "highgui.h"
void main()
{
IplImage* img = cvLoadImage( "test.jpg", 1);//三通道图像
int total= img->height*img->width;
int cluster_num = 2;
CvMat *row = cvCreateMat( img->height,img->width,CV_32FC3 );
cvConvert(img,row);//转一下类型!
CvMat *clusters = cvCreateMat( total, 1, CV_32SC1 );
cvReshape(row,row,0,total);//修改矩阵的形状,每个数据一行,使row指向修改后的数据,不修改通道数
cvKMeans2( row, cluster_num, clusters,cvTermCriteria( CV_TERMCRIT_EPS+CV_TERMCRIT_ITER, 10, 1.0 ));
cvReshape(clusters,clusters,0,img->width);//聚类完的结果再reshape回来方便看
int i=0,j=0;
CvScalar s;
IplImage* resImg = cvCreateImage( cvSize(img->width,img->height), 8, 1 );//生成用来显示结果的图像
s=cvGet2D(img,i,j);
for(i=0;iheight;i++)
{
for (j=0;jwidth;j++)
{
if (clusters->data.i[i*img->width+j]==1)
{
s.val[0]=255;
s.val[1]=255;
s.val[2]=255;
cvSet2D(resImg,i,j,s);//注意循环顺序
}
else
{
s.val[0]=0;
s.val[1]=0;
s.val[2]=0;
cvSet2D(resImg,i,j,s);
}
}
}
cvShowImage( "original", img );
cvShowImage( "clusters", resImg );
int key = cvWaitKey(0);
cvReleaseImage(&img);//记得释放内存
cvReleaseImage (&resImg);
cvReleaseMat(&row);
cvReleaseMat(&clusters);
}
结果如下所示: