用R语言对高维数据进行降维聚类展示

1.为什么要降维
*维数灾难:在给定精度下,准确地对某些变量的函数进行估计,所需样本量会随着样本维数的增加而呈指数形式增长。
*降维的意义:克服维数灾难,获取本质特征,节省存储空间,去除无用噪声,实现数据可视化
2.强烈推荐几篇博客:
https://www.douban.com/note/469279998/
http://bindog.github.io/blog/2016/06/04/from-sne-to-tsne-to-largevis
http://blog.sina.com.cn/s/blog_594168770102wbsn.html
http://blog.csdn.net/brunowuestelle/article/details/46698241
http://blog.sina.com.cn/s/blog_b623d3f40102v2zg.html

我降维的目的很单纯,就是为了可视化,因为高维数据无法展示。
代码我就不贴了,自己百度去吧(可以先看看我推荐的这几篇博客),哈哈。不过我可以提醒一下,t-SNE降维效果比PCA好太多了,应该是目前降维效果最好的算法了。

3d作图包:rgl

最后贴几张聚类效果图
用R语言对高维数据进行降维聚类展示_第1张图片
用R语言对高维数据进行降维聚类展示_第2张图片
用R语言对高维数据进行降维聚类展示_第3张图片

你可能感兴趣的:(r语言,数据可视化,数据挖掘,R)