matlab实现Kmeans聚类

K-means聚类的建模与求解

1.建模前准备

建模前,我们小组通过阅读文献,研究讨论了K-means的实现原理和应用场景,认为K-means算法在求解用户出行分区信息上具有可行性。

2.模型建立

       通过对问题的分析,我们将k-means聚类模型建立如下:

matlab实现Kmeans聚类_第1张图片

 

3.模型求解及检验

       我们分别通过调用matlab的K-means函数方法以及底层实现K-means方法,实现了k-means算法。

       对于借助matlab函数的k-means函数实现的方式,我们最终得到的聚类结果如下:

matlab实现Kmeans聚类_第2张图片

 

图4 Kmeans结果图(调用函数)

       对于底层实现K-means的方式,我们得到的聚类结果如下:

matlab实现Kmeans聚类_第3张图片

 

图5 Kmeans结果图(底层实现)

       将两组数据进行对比分析,我们可以发现:

  1. 共性:相邻地区的点往往处于同一个类下,说明我们的K-means算法从实验效果上来看具有可行性。
  2. 异性:两组聚类效果并不完全一致。我们小组通过讨论分析,我们意识到K-means算法对于初始类的选择尤为敏感,而两种实现方式的初始类选择不同,所以聚类结果有略微差距。

4.项目代码

function [index,C,sumd,dim]=K_means(data,k,threshold,N)
%设定最大的迭代次数
iter=0;
dim=size(data);%计算样本维度
index=zeros(dim(1),1);
dist=zeros(k,1);
C = data(randperm(dim(1), k), :);%随机选择K个聚类中心
while 1
    sumd=zeros(dim(1),1);
    for i=1:dim(1)
        for j=1:k
            X=[data(i,:);C(j,:)];
            dist(j)=get_distance(X,2)  %计算样本点与聚类中心点之间的欧氏距离
        end
        [d,idx]=min(dist);
        sumd(i)=d;
        index(i)=idx;
    end
    new_C=zeros(k,dim(2));%新的类中心
    c=0;
    for i=1:k
        count=0;
        for j=1:dim(1)
            if index(j)==i
                count=count+1;
                new_C(i,:)=new_C(i,:)+data(j,:);
            end
        end
        new_C(i, :) = new_C(i, :) / count;   %¾聚类中心求均值
        Y = [new_C(i, :);C(i, :)];
        if get_distance(Y, 2)<= threshold
            c = c + 1;
        end
    end
    iter = iter + 1;
    if c == k
        break
    elseif iter > N  %大于迭代次数就退出
        break
    else
        C = new_C;
    end
end
end
 
function dist = get_distance(X,p)
%计算两点之间的相似度
dim = size(X);
sum = 0;
for i = 1:dim(2)
    sum = sum + abs(X(1,i)-X(2,i))^p; 
end
dist = sum^(1/p);
end
 
 
function r=plot_data(data,index,k)
figure
color_index=[[1,0,0],[0,1,0],[0,0,1],[0.5,0.5,0.5],[0,0,0],[1,1,0],[0.5,0.16,0.16],[0,1,1],[0.63,0.13,0.94],[1,0,1]];
for j=1:k
 for i=1:length(data(:,1))
     if index(i)==j
         plot(data(i,1),data(i,2),'color',color_index(j))
     end
 end
end
end

你可能感兴趣的:(matlab,matlab,聚类,kmeans)