scikit-learn机器学习——第十章 复习题

1.什么是PCA算法?它的作用是什么?

Principal Component Analysis,主成分分析法。把高纬度数据在损失最小的情况下转换为低维度数据的算法。

2.PCA算法的计算过程是怎么样的?

归一化和缩放

计算协方差矩阵的特征向量

数据降维和恢复

3.PCA算法的物理含义是什么?

投影

4.是否可以用PCA算法来解决过拟合问题?为什么?

可以,减少了特征的个数,就减少了模型的参数,即复杂度

5.怎么样确定PCA算法是的k参数?

画出数据还原率和选择特征k个数的曲线图,按照数据还原的要求,取k值。

6.矩阵叉乘的物理意义是什么?

迁移,变换,运动

7.登录kaggle.com,从www.kaggle.com/c/digit-recognizer/data下载数字手写识别数据集,并对这个数据集进行训练,把训练结果提交到kaggle.com上。

你可能感兴趣的:(机器学习)