实战案例——使用DBSCAN实现经纬度聚类

在我们日常应用密度聚类分析时,最常用的一类应用场景就是基于位置信息的聚类,它可以帮助我们找到哪些样本点(一般是经度、纬度)在地理空间维度上具有关联性。

今天就为大家介绍一下如何使用DBSCAN算法实现经纬度聚类。

本案例中,我们仍然使用sklearn库中封装好的DBSCAN聚类算法来实现,这个算法封装在sklearn.cluster包下

下面我们来看一下这个函数的具体用法

class sklearn.cluster.DBSCAN(eps=0.5, *, min_samples=5, metric='euclidean', metric_params=None)

sklearn

函数常用的参数主要有4个:

1、eps:即我们上一篇文章中所介绍的邻域半径,默认值为0.5

2、min_samples:对应算法中的MinPts,即密度阈值,只有当邻域半径eps内的点的个数大于最少点数目MinPts时,我们定义为属于密集分布

3、metric:计算点之间的

你可能感兴趣的:(白话机器学习,聚类,机器学习,python,经纬度)