使用 k-means 聚类算法对多维属性数据进行分类

python数据分析与挖掘 — 代码修正与项目练习:

https://blog.csdn.net/O_tongwandou/article/details/81952264

k-means高维聚类:

https://www.cnblogs.com/icydengyw/p/13591990.html

python代码实现TSNE降维数据可视化教程:

https://www.jb51.net/article/181578.htm

sklearn中的降维PCA与TSNE:

https://blog.csdn.net/qq_27584277/article/details/80770047

同为降维工具,二者的主要区别在于,

所在的包不同(也即机制和原理不同)

from sklearn.decomposition import PCA
from sklearn.manifold import TSNE

因为原理不同,导致,tsne 保留下的属性信息,更具代表性,也即最能体现样本间的差异;
TSNE 运行极慢,PCA 则相对较快;
因此更为一般的处理,尤其在展示(可视化)高维数据时,常常先用 PCA 进行降维,再使用 tsne:

data_pca = PCA(n_components=50).fit_transform(data)
data_pca_tsne = TSNE(n_components=2).fit_transform(data_pca)




转载https://blog.csdn.net/lanchunhui/article/details/64923702

几种常见的聚类评价指标:

https://zhuanlan.zhihu.com/p/343667804

聚类效果好坏的评价指标(附代码):

https://zhuanlan.zhihu.com/p/57342770

聚类 | 超详细的性能度量和相似度方法总结:

https://blog.csdn.net/fengdu78/article/details/103951665

聚类︱python实现 六大 分群质量评估指标(兰德系数、互信息、轮廓系数):

https://blog.csdn.net/sinat_26917383/article/details/70577710

聚类结果不好怎么办_人脸聚类常用评价指标:

https://blog.csdn.net/weixin_39628271/article/details/111007803

周志华西瓜书提到对聚类性能的指标:
外部指标和内部指标
使用 k-means 聚类算法对多维属性数据进行分类_第1张图片
使用 k-means 聚类算法对多维属性数据进行分类_第2张图片

你可能感兴趣的:(机器学习,聚类,k-means)