聚类算法——kmeans&Dbscan

1、聚类概念

聚类算法——kmeans&Dbscan_第1张图片
两种算法如下:
k指定多少就会得到多少簇,比如上图若k=3,就会把这图上的点聚成三堆。
质心是为了迭代。
标准化:使x,y上的数据都在比较小的范围浮动
优化:对于每一簇,样本上的点到中心点的距离越小越好
聚类算法——kmeans&Dbscan_第2张图片
流程:
1、无监督学习不清楚哪个点属于哪一簇的,初始化两个点k=2。
2、遍历并判断样本上的点到红点和蓝点距离,谁小就是属于对应的簇(c)。
3、质心是随机选择的,接着更新质心(d),
4、做步骤2
5、做步骤3
聚类算法——kmeans&Dbscan_第3张图片
优缺点:
聚类算法——kmeans&Dbscan_第4张图片
迭代可视化展示
DBSCAN算法:
默认指定半径r,阈值minPts聚类算法——kmeans&Dbscan_第5张图片
核心点:能发展下线。
边界点:不能发展下线。
离群点:没有点能发展到这个点。
聚类算法——kmeans&Dbscan_第6张图片
工作流程:
提前指定参数D、半径r、阈值MinPts
1、所有数据都是未访问到的
2、随机选择一个点p并标记
3、判读p点半径r领域的对象是否多余指定的阈值
4、创建簇C,并把点p添加其中
5、N为点p的r半径领域内的其他点的对象集合
6、遍历N中的每个点
7、如是遍历的点先前未访问,标记其点已访问。
8、判断访问的点的r领域的点是否多余阈值,是的话,把这些点添加到N,一直发展下线,直至点不再是核心对象。
聚类算法——kmeans&Dbscan_第7张图片
聚类算法——kmeans&Dbscan_第8张图片聚类算法——kmeans&Dbscan_第9张图片

你可能感兴趣的:(机器学习经典算法,算法,聚类,kmeans,DBSCAN)