基于密度的聚类之DBSCAN算法

DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)

1.名词解释

给出半径:Eps;

给出某个点的Eps邻域内点的个数的阈值:MinPts。


核心点(core point):该点的给定邻域内的点的个数≥MinPts;

边界点(border point):不是核心点,但落在核心点的邻域内;

噪声点(noise point):除了核心点和边界点以外的点。


Eps邻域:与某个点的距离小于等于Eps的所有点的集合;

直接密度可达:对于样本集合D,如果样本点q在p的Eps领域内,并且p为核心对象,那么对象q从对象p直接密度可达;

密度可达:对于样本集合D,给定一串样本点p1,p2….pn,p= p1,q= pn,假如对象pi从pi-1直接密度可达,那么对象q从对象p密度可达。


2.DBSCAN算法流程

输入:Eps,MinPts,样本集合D

输出:生成的簇

(下面的步骤来自《数据挖掘导论》[美]Pang-Ning Tan,Michael Steinbach,Vipin Kumar 著,范明,范宏建等译

基于密度的聚类之DBSCAN算法_第1张图片




你可能感兴趣的:(机器学习与数据挖掘)