模型

监督学习
分类 k-近邻算法、决策树、贝叶斯、逻辑回归(LR)、支持向量机(SVM)
回归 线性回归、岭回归
标注 隐马尔可夫模型(HMM)

无监督学习
聚类 k-means

如果想要预测目标变量的值,则可以选择监督学习算法。
如果不想预测目标变量的值,则可以选择无监督算法。

如果目标变量是离散型,如是/否、1/2/3,A/B/C/或者红/黑/黄等,则可以选择分类算法;如果目标变量是连续的数值,如0.0~100.0、-999~999等,则需要选择回归算法

交叉验证

训练集与测试集的分割可以使用cross_validation中的train_test_split方法

  • 没有看懂呢

**

estimator的工作流程

**
fit方法用于从训练集中学习模型参数
transform用学习到的参数转换数据

你可能感兴趣的:(机器学习)