数据挖掘-聚类分析

聚类分析

聚类是把数据按照相似性归纳成若干类别,同一类中的数据彼此相似,不同类中的数据相异。聚类分析可以建立抽象概念,发现数据的分布模式,探索可能的数据属性之间的相互关系。


1.K均值聚类

基本思路是把数据分配给最近中心的类中。

数据挖掘-聚类分析_第1张图片
数据挖掘-聚类分析_第2张图片
数据挖掘-聚类分析_第3张图片


2.层次聚类

基本思想是按照某种方法进行层次分解。有自底向上的凝聚和自顶向下分裂两种方法。

数据挖掘-聚类分析_第4张图片
数据挖掘-聚类分析_第5张图片
数据挖掘-聚类分析_第6张图片


3.密度聚类

基本思想是过滤低密度区域,发现稠密点的聚类。

数据挖掘-聚类分析_第7张图片
数据挖掘-聚类分析_第8张图片
数据挖掘-聚类分析_第9张图片


4.网格聚类

基本思想是在量化后的网格空间结构中进行聚类。

数据挖掘-聚类分析_第10张图片
数据挖掘-聚类分析_第11张图片
数据挖掘-聚类分析_第12张图片
数据挖掘-聚类分析_第13张图片


总结一下各种聚类的几何特征:K均值聚类是线性的,层次聚类是凸面的,密度聚类可以是凹面的,网格聚类是网格的。


数据挖掘-聚类分析_第14张图片

你可能感兴趣的:(数据挖掘)