2019-01-22 无监督学习问题----维数约减

第二种无监督学习问题----维数约减

使用维数约简的原因:数据压缩。数据压缩不仅通过压缩数据使得数据占用更少的计算机内存和硬盘空间,它还能给算法提速。

具体:将非常冗余的多维特征向量进行映射成少维度的特征变量。

举例:二维数据降到一维/三维数据降到二维

通过把所有原始的样本映射到这条绿线上,来近似原始的数据集。那么就只需要一个数字来确定这条线上一个点的位置。(表示长度的单位厘米、英寸,两个特征向量整合成一个)

2019-01-22 无监督学习问题----维数约减_第1张图片
维数约减

把所有数据投影到一个二维平面上 

2019-01-22 无监督学习问题----维数约减_第2张图片
维数约减

你可能感兴趣的:(2019-01-22 无监督学习问题----维数约减)