降维(一)

动机一:压缩数据(Data Compression)

现假设有如下数据集,横坐标为特征变量x1,其单位为厘米(cm);纵坐标为特征变量x2,其单位为英寸(inches)。

降维(一)_第1张图片

我们知道这两个特征变量均为长度计量单位,同时使用不免重复。因此,我们需要将这个二维数据集降为一维数据集。

对于该问题降维的具体做法为:先找到一条合适的直线,然后将数据投影到这条直线上,最后我们将这些投影到直线上的数据用z(i)标识。

降维可以将对存储、内存占用空间减半,使得运行这些数据的算法运行得更快。

下图为三维数据集降为二维数据集的例子。

降维(一)_第2张图片
动机二:数据可视化

我们将数据可视化能让我们更为直观地找寻一个更好的解决方案。但对于维度较高的数据集,我们将其可视化是不可能的。因此,我们可以通过降维使得数据集可视化。

你可能感兴趣的:(降维(一))