吴恩达老师机器学习笔记K-means聚类算法(一)

今天接着学习聚类算法

以后坚决要八点之前起床学习!不要浪费每一个早晨。

K-means聚类算法聚类过程如下:

吴恩达老师机器学习笔记K-means聚类算法(一)_第1张图片
原理基本就是先从样本中随机选择聚类中心,计算样本到聚类中心的距离,选择样本最近的中心作为该样本的类别。最后某一类样本的坐标平均值作为新聚类中心的坐标,如此往复。
原始数据如下:
吴恩达老师机器学习笔记K-means聚类算法(一)_第2张图片
代码如下:

load('ex7data2');
[m n]=size(X);
x=zeros(m,n+1);
x(1:m,1:n)=X;
Z_min=9999999; 
y=zeros(m,1); % 最优类别结果
for iter=1:100 % 选择最优的聚类的结果
    start=round(rand(3,1)*(m-1)+1); % 随机化聚类中心
    start_centre=X(start,:);
    Z_sum=0;
    for j=1:200 % 判断样本距离最近的中心
        for i=1:m
            Z=sum((x(i,1:n)-start_centre(:,1:n)).^2,2);
            [min_value,min_index]=min(Z);
            x(i,n+1)=min_index;
        end
        for i=1:3 % 聚类数量选择3类
            start_centre(i,:)=mean(X(x(:,n+1)==i,:)); % 生成新的聚类中心
        end
    end
    for i=1:m % 计算成本函数
        Z_sum=sum((x(i,1:n)-start_centre(x(i,n+1),1:n)).^2,2)+Z_sum;
    end
    if Z_min>Z_sum % 选取成本最小的结果作为最优结果
       Z_min=Z_sum;
       y=x(:,n+1);      
    end       
end
scatter(X(:,1),X(:,2),8,y,'filled');

最后聚类结果如下:
吴恩达老师机器学习笔记K-means聚类算法(一)_第3张图片
这次代码非常的简单了。。。。

你可能感兴趣的:(小白的机器学习)