快速聚类使用自适应密度峰值检测总结。

聚类存在的缺陷

1.聚类方法普遍存在的局限性包括算法收敛速度慢、对一些固有参数的预规范不稳定、对离群值缺乏鲁棒性等

2.大多数传统的聚类算法都受到速度和可伸缩性的限制,难以处理数千万次读取的数据。

3.流行的聚类方法对大数据的其他限制还包括一些内在参数的预规范的不稳定性和对异常值的鲁棒性的缺乏。

总结:改进了求密度的公式、使用了非参数多变量密度核估计。


核估计量公式


快速聚类使用自适应密度峰值检测总结。_第1张图片


快速聚类使用自适应密度峰值检测总结。_第2张图片
展开带入。。

hl求的方法很重要


hl的求解公式

然后根据ADC1和ADC2自动确定核心点。


快速聚类使用自适应密度峰值检测总结。_第3张图片

其他的就同原作者相同了。

你可能感兴趣的:(快速聚类使用自适应密度峰值检测总结。)