DBSCAN

    K-Means算法主要针对那种类圆形区域数据的聚类。而密度聚类可以弥补这个缺点,可用于任何形状的聚类。这个算法需要我们调节两个参数,半径sigma最小数目m先介绍该算法的一些概念。

  • 核心对象:对于一个对象它的sigma领域内至少有m个对象,那我们就称之为核心对象。

  • 直接密度可达:如果一个对象处在一个核心对象的sigma领域内,那称这两个对象直接密度可达。

  • 密度可达(相连):如果一个对象ab直接密度可达,对象bc也是直接密度可达,那么我们称ac是密度可达的,也称这两个对象是密度相连的。

    DBSCAN的算法就是我们先找到一个核心对象,从它出发,确定若干个直接密度可达的对象,再从这若干个对象出发,寻找它们直接密度可达的点,直至最后没有可添加的对象了,那么一个簇的更新就完成了。我们也可以说,簇其实就是所有密度可达的点的集合。DBSCAN_第1张图片

DBSCAN_第2张图片DBSCAN_第3张图片

DBSCAN_第4张图片

    参考链接:

    https://www.jianshu.com/p/e8dd62bec026

    https://blog.csdn.net/itplus/article/details/10088625

你可能感兴趣的:(聚类)