python(经典)数据标准化方法、聚类方法、分类方法总结:

(一)数据标准化的方法:
(1)离差标准化(最大最小值标准化)
(2)标准差标准化、
(3)归一化标准化
(4)二值化标准化
(5)独热编码标准化
为什么要进行数据标准化?什么时候需要进行数据标准化,什么时候不需要进行数据标准化?博主这里分析另一篇关于什么时候需要数据标准化的链接 https://blog.csdn.net/data_bug/article/details/87695229

(二)聚类的方法:
(1)划分法(k-means算法(k-均值算法),k-MEDOIDS算法(k-中心),CLARANS算法)
(2)层次分析方法(BIRCH算法,cure算法)
(3)基于密度的方法(DBSCAN算法,DENCLUS算法)
(4)基于网格的方法(STING算法,CLIOUE算法(聚类高维空间))
聚类模型评价的指标:
(1) 兰德系数(ARI评价法),需要真实值,最佳值为1,python里的sklearm函数adjust_rand_score
(2)互信息(AMI评价法),需要真实值,最佳值为1,python里的sklearm函数adj

你可能感兴趣的:(python,聚类,分类)