sklearn转换器和估计器

1. 转化器

一般就是实例化一个转化器再调用转化器,具体的语句为:

transfer=,      transfer.fit_transform

fit()的作用是计算每一列的平均值、标准差

transform()就是将上一步计算出的结果带入(x-mean) / std进行最终的转换,进行标准化

fit_transform就是直接进行标准化

2. 估计器

(1)用于分类的估计器

sklearn.neighbors k近邻算法、sklearn.native_bayes 贝叶斯

sklearn.linear_model.LogisticRegression 逻辑回归

(2)用于回归的估计器

sklearn.linear_model.LinearRegression 线性回归

sklearn.linear_model.Ridge 岭回归

(3)用于无监督学习的估计器

sklearn.cluster.KMeans 聚类

具体的工作流程如下:

a.实例化一个estimator

b.estimator.fit(x_train,y_train) 计算----调用完毕,模型生成

c.模型评估:

直接比对真实值和预测值

y_predict = estimator.predict(x_test)、y_test == y_predict

计算准确率

accuracy = estimator.score(x_test,y_test)

3. K-近邻算法

3.1原理

如果一个样本在特征空间总的K个最相近的特征空间中最邻近的样本中的大多数属于某一个类别,则该样本也属于这个类别

可以通过欧氏距离、曼哈顿距离、明可夫斯基距离计算样本之间的距离

3.2基本语句

sklearn.neighbor.KNeighborsClassifier(n_neighbors=5, algorithm='auto')

n_neighbors:int型,k_neighbors查询默认使用的邻居数;

algorithm:{‘auto’,‘ball_tree’,‘kd_tree’}之一

3.3实例化演示

具体步骤为:获取数据、数据集划分、特征工程:标准化、KNN预估器流程、模型评估

你可能感兴趣的:(sklearn转换器和估计器)