Density Peak改进(PCA/KNN)

参考文献:Study on Density Peaks Based on K-Nearest Neighbors and Principal Component Analysis (KBS2016 C类期刊)

1、改进:

  • DPC(Density Peak Clustering)考虑的是数据的全局结构,在计算局部密度 ρ 时未考虑数据的局部特征,因此在目睹不均匀时,DPC效果不好(如Jain数据集) <—-KNN
  • 当数据是高维时,DPC效果不好、因为在高位数据中有许多维是不相关的,这些不相关的维会使DPC将其当作噪声。维度越高,距离度量会变得越来越没有意义 <—–PCA

2、方法
先使用PCA降维,再根据DPC聚类, ρ 的计算借助于KNN:
这里写图片描述
其中,KNN(xi)表示xi的k的最近邻,k=p*N(N表示节点数,p表示percentage)

3、效果
改进后,在flame数据集上,效果明显变好
Density Peak改进(PCA/KNN)_第1张图片

你可能感兴趣的:(clustering,dp,KNN,PCA,Data,Mining,Papers)