【数学建模】-聚类模型学习笔记之系统(层次)聚类

学习来源:清风老师
于晶贤‐辽宁石油化工大学‐聚类分析之系统聚类法

系统聚类的合并算法通过计算两类数据点间的距离,对最为接近的两类数据点进行组合,并反复迭代这一过程,直到将所有数据点合成一类,并生成聚类谱系图。

系统(层次)聚类算法流程

  1. 将每个对象看作一类,计算两两之间的最小距离
  2. 将距离最小的两个类合并成一个新类
  3. 重新计算新类与所有类之间的距离
  4. 重复二三两步,直到所有类最后合并成一类
  5. 结束

【数学建模】-聚类模型学习笔记之系统(层次)聚类_第1张图片

如何分类

【数学建模】-聚类模型学习笔记之系统(层次)聚类_第2张图片
【数学建模】-聚类模型学习笔记之系统(层次)聚类_第3张图片
【数学建模】-聚类模型学习笔记之系统(层次)聚类_第4张图片
【数学建模】-聚类模型学习笔记之系统(层次)聚类_第5张图片

分类准则

【数学建模】-聚类模型学习笔记之系统(层次)聚类_第6张图片

样品与样品之间的常用距离

【数学建模】-聚类模型学习笔记之系统(层次)聚类_第7张图片

指标与指标之间的常用“距离”

【数学建模】-聚类模型学习笔记之系统(层次)聚类_第8张图片
【数学建模】-聚类模型学习笔记之系统(层次)聚类_第9张图片

夹角与夹角之间的常用距离

具体选择什么方法-解释的通
【数学建模】-聚类模型学习笔记之系统(层次)聚类_第10张图片

重心法

【数学建模】-聚类模型学习笔记之系统(层次)聚类_第11张图片

最短距离法

【数学建模】-聚类模型学习笔记之系统(层次)聚类_第12张图片

最长距离法

【数学建模】-聚类模型学习笔记之系统(层次)聚类_第13张图片

组间平均链接法

【数学建模】-聚类模型学习笔记之系统(层次)聚类_第14张图片

组内平均链接法

【数学建模】-聚类模型学习笔记之系统(层次)聚类_第15张图片

最短距离系统聚类法

【数学建模】-聚类模型学习笔记之系统(层次)聚类_第16张图片

【数学建模】-聚类模型学习笔记之系统(层次)聚类_第17张图片
【数学建模】-聚类模型学习笔记之系统(层次)聚类_第18张图片

【数学建模】-聚类模型学习笔记之系统(层次)聚类_第19张图片

聚类的谱系图

【数学建模】-聚类模型学习笔记之系统(层次)聚类_第20张图片
优点:根据谱系图自己决定分为多少类

最长距离系统聚类(结果)

【数学建模】-聚类模型学习笔记之系统(层次)聚类_第21张图片

聚类分析需要注意的问题

  1. 对于一个实际问题要根据分类的目的来选取指标,指标选取的不同分类结果一般也不同。
  2. 样品间距离定义方式的不同,聚类结果一般也不同。
  3. 聚类方法的不同,聚类结果一般也不同(尤其是样品特别多的时候)。最好能通过各种方法找出其中的共性。
  4. 要注意指标的量纲,量纲差别太大会导致聚类结果不合理。
  5. 聚类分析的结果可能不令人满意,因为我们所做的是一个数学的处理,对于结果我们要找到一个合理的解释

SPSS操作

【数学建模】-聚类模型学习笔记之系统(层次)聚类_第22张图片
【数学建模】-聚类模型学习笔记之系统(层次)聚类_第23张图片
【数学建模】-聚类模型学习笔记之系统(层次)聚类_第24张图片
【数学建模】-聚类模型学习笔记之系统(层次)聚类_第25张图片

聚类结果

【数学建模】-聚类模型学习笔记之系统(层次)聚类_第26张图片

用图形估计聚类数量

【数学建模】-聚类模型学习笔记之系统(层次)聚类_第27张图片

聚类系数折线图

【数学建模】-聚类模型学习笔记之系统(层次)聚类_第28张图片

根据图来解释

(1)根据聚合系数折线图可知,当类别数为5时, 折线的下降趋势趋缓,故可将类别数设定为5.
(2)从图中可以看出, K值从1到5时,畸变程度变化最大。超过5以后,畸变程度变化显著降低。因此肘部就是 K=5,故可将类别数设定 为5.(当然,K=3也可以解释)

示意图

只要当指标个数为2或者3的时候才能画图

【数学建模】-聚类模型学习笔记之系统(层次)聚类_第29张图片
【数学建模】-聚类模型学习笔记之系统(层次)聚类_第30张图片

【数学建模】-聚类模型学习笔记之系统(层次)聚类_第31张图片
【数学建模】-聚类模型学习笔记之系统(层次)聚类_第32张图片
【数学建模】-聚类模型学习笔记之系统(层次)聚类_第33张图片
【数学建模】-聚类模型学习笔记之系统(层次)聚类_第34张图片

你可能感兴趣的:(数学建模,聚类,学习,算法)