满意答案
许位11
2013.04.29
采纳率:46% 等级:12
已帮助:8662人
function group=Kmeans(k,mid)
%K均值聚类算法
person=load('sample.txt','height','weight');%从文本文件读入数据放入person结构体中
% person=person(1:10,:);
num=size(person,1);%获得person结构体大小
for i=1:k%赋初始值,划分为k类,每类只有选定的k个对象中的一个对象,每类的中心为选定的k个对象的值
class{i}(1)=mid(i);
middle(i,1)=person(mid(i),1);
middle(i,2)=person(mid(i),2);
end
distance=ComputDistance(person,middle,num,k);%计算每个样本跟各类中心的距离
temp=cell(size(class));
flag=isSL(temp,class,k);
while flag==0%当分类不收敛的时候
temp=class;
class=cell(size(temp));
for i=1:num
[value,index]=min(distance(i,:)); %找到每个样本距离哪个类最近
dtemp=[i];
class{index}=[class{index},dtemp]; %将该样本划分到距离最近的类中
end
middle=ComputMid(person,class,k);%重新计算各类中心点
distance=ComputDistance(person,middle,num,k);%重新计算各样本与各类的距离
flag=isSL(temp,class,k);%判断当前类有没有变化
end
celldisp(class)
for i=1:k
group{i}=person(class{i}(:),:);
end
for i=1:k
covMat=cov(group{i});
fprintf('第%d类的均值向量为:\n',i);
disp(middle(i,:))
fprintf('第%d类的协方差矩阵为:\n',i);
disp(covMat)
end
function m=ComputMid(person,class,k)
%计算各类中心点
%结果返回到m矩阵中
for i=1:k
length=size(class{i},1);
csum1=0;
csum2=0;
for j=1:length
csum1=csum1+person(class{i}(j),1);
csum2=csum2+person(class{i}(j),2);
end
m(i,1)=csum1/length;
m(i,2)=csum2/length;
% m(i,1)=sum(person(class{i}(:),1))/size(class{i},1);
% m(i,2)=sum(person(class{i}(:),2))/size(class{i},1);
end
function d=ComputDistance(person,middle,num,k)
%计算每个样本跟各类中心的距离
%结果返回到d矩阵中
for i=1:num
for j=1:k
d(i,j)=sqrt((person(i,1)-middle(j,1)).^2+(person(i,2)-middle(j,2)).^2);
end
end
function flag=isSL(temp,class,k)
%判断当前类有没有变化即是否收敛
%有变化则返回0,否则返回1
for i=1:k
if size(temp{i},1)==size(class{i},1)
for j=1:size(class{i},1)
if temp{i}(j)~=class{i}(j)
flag=0;
return;
end
end
flag=1;
else
flag=0;
return;
end
end
53分享举报