python机器学习笔记五

1.PCA中的白化

在一些算法中还需要一个与之相关的预处理步骤,这个预处理过程称为白化(一些文献中也叫sphering)。举例来说,假设训练数据是图像,由于图像中相邻像素之间具有很强的相关性,所以用于训练时输入是冗余的。白化的目的就是降低输入的冗余性;更正式的说,我们希望通过白化过程使得学习算法的输入具有如下性质:(i)特征之间相关性较低;(ii)所有特征具有相同的方差。

参考链接:http://deeplearning.stanford.edu/wiki/index.php/%E7%99%BD%E5%8C%96

2.PolynomialFeatures

在建模过程中多次用到过sklearn.preprocessing.PolynomialFeatures,可以理解为专门生成多项式特征,并且多项式包含的是相互影响的特征集,比如:一个输入样本是2维的。形式如[a,b] ,则二阶多项式的特征集如下[1,a,b,a^2,ab,b^2]

参考链接:https://blog.csdn.net/cherdw/article/details/71243102

3.先验概率\后验概率

(1)先验概率:是指根据以往经验和分析得到的概率,人在未知条件下对事件发生可能性猜测的数学表示

 (2)后验概率:事情已经发生,要求这件事情发生的原因是由某个因素引起的可能性的大小

参考链接:https://www.cnblogs.com/yemanxiaozu/p/7680761.html


你可能感兴趣的:(Python机器学习)