聚类分析小结

聚类分析分为自顶而下和自底而上的聚类方式。

聚类分析可以分为变量之间的聚类(用来进行降维,可以用函数计算变量之间的相关系数)和样本之间的聚类

样本之间的聚类:

1.首先进行计算样本之间的距离,常见的距离有欧氏距离,马氏距离等。

2.进行聚类,首先以每个样本单独为一类,然后计算出类间距离,也就是样本之间的距离。选择最小的两类聚为一类,重新计算每一类之间的距离,反复进行操作,直到最后只剩下一类为止。(类y与类之间距离常见的聚类方式有:最短距离,最长距离,重心距离,离差平方和距离)

matlab对应的操作函数:

A = []; %在A中输入数据

dis = pdist(A,"method") %根据不同的距离之间的计算方法计算样本之间的距离。

squareform(dis) %可以将距离转化为矩阵的形式,方便观察

z1 = linkage(dis,"method") %根据不同的类间距离进行分类,对应的结果为n-1行3列的数据,前两列表示哪几个点进行了聚类,而第三列表示聚类时之间的距离。

dendrogram(z1)%画出相对于的树形聚类图

你可能感兴趣的:(数学建模小结,#,评价类问题,matlab)