9 特色聚类

特色聚类

1 BIRCH聚类概述

1.1 BIRCH 聚类特点

BIRCH 聚类借鉴层次聚类的思路,采用欧氏距离、绝对距离、组间平均链锁法以及类内离差平方变化度量观测与小类、小类与小类的距并依距离最近原则指派观测到相应的类中。适用于聚类变量均为数值型的情况。

特色在于:

  • 有效解决了计算资源,尤其是内存空间有限条件下的高维大数据集的聚类问题

  • 能够实现在线数据的动态聚类

  • 从聚类角度进行噪声数据的识别

1.2 聚类特征和聚类特征树

1.2.1 聚类特征

无论采用哪种距离测度,只依据关于观测或小类的很少几个统计量,可快速准确地计算距离并完成类的指派。 同时,只需知道关于类的很少几个统计量,可掌握类的相关信息, 如类质心、类内观测的离散程度等。BIRCH 称这些统计量为聚类特征

1.2.2 聚类特征树

聚类特征树有如下特点:

  • 利用树形结构反映聚类结果的层次关系

  • 聚类特征树的规模取决于两个参数:分支因子B 和阈值T

1.3 BIRCH聚类的R语言实现


9 特色聚类_第1张图片

你可能感兴趣的:(R语言,聚类,数据挖掘)