从理论,设计程序和代码实现等方面,说明如何通过数据挖掘中K-均值聚类算法,利用Matlab的灵活编程功能进行探索性和优化性综合实验.以实验教学实践说明,为将创新思维和动手能力培养贯穿于实验教学的始终,利用Matlab仿真K-均值聚类具有较好的实际意义.
聚类是将数据集按照数据的相似性进行重新组合而成为多个类的过程。聚类与分类不同: 分类是一种监督学习方法, 在分类之前已经知道数据类的特性; 聚类是一种非监督学习方法, 在聚类之前不知道数据类的特性。在数据挖掘的实验教学中, 教师往往只重视聚类算法本身, 并没有真正理解聚类的本质, 只将聚类算法写成固定形式, 甚至只把不能变化的程序和预先给定的分好的数组进行聚类, 错误理解了聚类的本质,没有将灵活的算法和聚类的思想融入实验中。没有达到在实验中培养学生创新思想和能力的目的。
正在上传…重新上传取消
function []=show(X,cidx,ctrs,varargin)
%{
show[X,cidx,ctrs] X为输入原始数据的矩阵,cidx,ctrs为k_meansnD返回的结果,
它们分别是n次迭代的分组和质心坐标。
show[X,cidx,ctrs,stp] 显示迭代次数为stp时候的分组情况。
%}
if nargin<3
error('there is not enough input arguments >.<#~ ')
elseif nargin==3
idx=cidx(:,end); %如果输入变量是3个,idx赋成cidx的最后一列,也就是最后的分组情况。
ctr=ctrs(:,:,end); %ctr被赋成ctrs的最后一页,也就是最后得到的质心坐标。
elseif nargin==4
stp=varargin{1};
idx=cidx(:,stp);
ctr=ctrs(:,:,stp);
elseif nargin>4
error('there is too many input arguments >.<#~ ')
end %end if
k=size(ctrs,1);
C=jet(k);
d=size(X,2);
if d==2
for i=1:k
plot(X(idx==i,1),X(idx==i,2),'.','color',C(i,:));
hold on;
plot(ctr(i,1),ctr(i,2),'kx')
hold on;
end %end for
hold off;
elseif d==3
for i=1:k
plot3(X(idx==i,1),X(idx==i,2),X(idx==i,3),'.','color',C(i,:));
hold on;
plot3(ctr(i,1),ctr(i,2),ctr(i,3),'kx')
hold on;
end %end for
hold off;
end %end if
grid on
end %end function
部分理论引用网络文献,若有侵权联系博主删除。