机器学习算法二之DBSCAN聚类原理与实现(二维及三维)

前言

随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。

1.算法原理

DBSCAN是一种基于密度的空间聚类算法,是一种无监督的ML聚类算法。它可以替KMeans和层次聚类等流行的聚类算法。该算法将具有足够密度的区域划分为簇,并在具有噪声的空间数据库中发现任意形状的簇,它将簇定义为密度相连的点的最大集合。

KMeans vs DBSCAN
K均值需要预先输入类别数目,抗干扰能力较差,而基于密度聚类不需要预先输入,在任意大小和形状的集群中表现效果良好,对噪点不敏感,下边是两种算法区别:
机器学习算法二之DBSCAN聚类原理与实现(二维及三维)_第1张图片
相关变量

Epsilon (ɛ):最大半径(距离)
minPts:归为一类的最小点数
核心点:核心数据点在其近邻距离内至少有的最小的数据点个数。
边界点:边界数据点位于郊区,就像它们属于近邻点一样。(比如w/在epsilon距离内的核心点),但需要小于minPts。
离群点:这些点不是近邻点,也不是边界点。这些点位于低密度地区。

你可能感兴趣的:(机器学习算法,立体视觉与三维重建,聚类,算法,机器学习)