2018.11.28——DBSCAN用于聚类、异常点检测

 

一.简介(类似于传销,用某个数据q去发展下线p,p再去发展下线

DBSCAN是聚类算法,优于kmeans,首选DBSCAN。

DBSCAN基于密度的、带有噪音的聚类。

2018.11.28——DBSCAN用于聚类、异常点检测_第1张图片

二.算法需要记住的概念

①相关概念:核心点

数据q为圆心,r(超参)为半径画圆,圆内数据多余m个(超参),那么数据q为核心点。如下图:

2018.11.28——DBSCAN用于聚类、异常点检测_第2张图片

②相关概念:直接密度可达;密度可达

2018.11.28——DBSCAN用于聚类、异常点检测_第3张图片

======================密度可达=================

2018.11.28——DBSCAN用于聚类、异常点检测_第4张图片

三.算法参数

参数:半径,半径内点的个数。不需要设置kmeans中的k值,自动聚成簇。到底聚成多少堆,由算法实际聚出来的。

半径r的经验值是:突变点,点q到所有点的距离d1、d2、d3、……dn,从小到大进行排序,突然d4变的很大,d3就作为半径。

 

 

你可能感兴趣的:(2018.11.28——DBSCAN用于聚类、异常点检测)