详解基于密度的聚类算法——DBSCAN

详解基于密度的聚类算法——DBSCAN_第1张图片

 

今天给大家介绍另外一种聚类算法,也是我们日常使用频率非常高的一种聚类方法——基于密度的聚类算法。

基于密度的聚类算法是通过计算样本的紧密程度来实现对样本类别的划分,在样本空间中聚集密度大的就会划分到一个类别中,理论上能够找出任何形状的聚类

密度聚类并不需要事先设定聚类簇的数量,算法会根据数据的密度分布情况自行决定聚类簇的个数,同时,还能够有效识别明显的噪声点(离群点)。

DBSCAN是一种非常经典的基于密度的聚类算法,DBSCAN算法可以找到样本点的全部密集区域,并把这些密集区域当做一个一个的聚类簇,今天我们就来一起盘一盘这个算法。

在具体学习DBSCAN算法原理前,我们先来了解一些算法相关的基本概念:

一、DBSCAN算法相关基本概念

1、关于密度的核心思想

DBSCAN通过计算样本间的密度,找到样本的全部聚集区域,并把这些聚集区域作为最终的聚类簇结果。各别的离群点并不会对最终结果产生影响(如图中紫色点)。

详解基于密度的聚类算法——DBSCAN_第2张图片

2、算法的两个核心参数

(1)邻域半径eps

DBSCAN会以各数据点为圆心&#x

你可能感兴趣的:(白话机器学习,机器学习,算法,聚类,密度,DBSCAN)