机器学习之转换器和估计器

1️⃣、转换器

想一下之前做的特征工程的步骤?

  • 1 实例化 (实例化的是一个转换器类(Transformer))
  • 2 调用fit_transform(对于文档建立分类词频矩阵,不能同时调用)

我们把特征工程的接口称之为转换器,其中转换器调用有这么几种形式

  • fit_transform
  • fit
  • transform
    • 实例化一个转换器
transfer = StandardScaler()
  • 传入数据,进行转换
data = transfer.fit_transform(data)
from sklearn.preprocessing import StandardScaler
transfer = StandardScaler()
a = [[1,2,3],[4,5,6]]
transfer.fit_transform(a)
transfer.fit(a)  # 先计算均值,标准差
transfer.transform(a)  # 转换把均值,标准差保存在transfer中
b = [[7, 8, 9], [10, 11, 12]]
transfer.transform(b)  # 打印出来的结果还是按照 a 的均值标准差的形式。
transfer.fit_transform(b)  # 用fit_transform就生成了自己的均值、标准差,来进行运算

2️⃣、估计器

在sklearn中,估计器(estimator)是一个重要的角色,是一类实现了算法的API

  • sklearn 估计器是进行机器学习的面向对象

  • 1 用于分类的估计器:

    • sklearn.neighbors k-近邻算法
    • sklearn.naive_bayes 贝叶斯
    • sklearn.linear_model.LogisticRegression 逻辑回归
    • sklearn.tree 决策树与随机森林
  • 2 用于回归的估计器:

    • sklearn.linear_model.LinearRegression 线性回归
    • sklearn.linear_model.Ridge 岭回归
  • 3 用于无监督学习的估计器

    • sklearn.cluster.KMeans 聚类

1、估计器的流程,步骤

​ ①、实例化一个估计器

	estimator = KNeighborsClassifier()

​ ②、传入训练数据集,进行机器训练

	estimator.fit(x_train, y_train)

​ ③、模型评估

方法1:

	  y_predict = estimator.predict(x_test)
      y_predict==y_test

​ 方法2:计算模型准确率

	  estimator.score(x_test,y_test)

你可能感兴趣的:(机器学习)