PCA聚类算法

1.可以参考文章:

   自己去搜索相关的介绍,我只是写一些需要注意的地方,PCA的训练只考虑x,不需要考虑y

2.PCA与线性回归的区别:

    线性回归有一个拟合值,它的误差是红线代表线性回归的误差

PCA聚类算法_第1张图片

但是对于PCA算法来说:

PCA聚类算法_第2张图片

3.数据处理:

    特征什么的进行归一化(或者叫做特征缩放)

4.在数学上面的表示(奇异值分解)SVD

    在matlab里面或者octave里面有一个现成的svd()函数:

在这里的Sigma代表一个协方差矩阵,对于svd的讲解,可以参考:https://blog.csdn.net/xiaocong1990/article/details/54909126PCA聚类算法_第3张图片

     Z=X*Ureduce     这个有可能是这样写的,根据维度的关系自己去横向一下

    5.PCA的应用

(1)对监督算法进行加速,比如减少输入的维度

(2)减少存储的空间,压缩文件,可视化,加速训练

        注意:不能用于下列的应用:

        (1)不能用于防止过拟合

        (2)不能滥用PCA算法,只有在数据太大或者训练太慢的时候,才考虑使用PCA,如果不适用PCA也能训练什么的,可以不使用PCA,PCA选择K的值(保证选择的特征的方差什么的占包分之90多的维度值)什么的也是比较麻烦的


你可能感兴趣的:(ML)