07-转换器与估计器

"""sklearn中
fit_transform():输入数据,直接转换
    =fit():输入数据,不转换,可以计算平均值、方差等
    +transform():进行数据的转换,将数据转换成值

转换器:
    实例化
    fit_transform
    fit
    transform
"""

"""转换器"""
from sklearn.preprocessing import StandardScaler
s = StandardScaler()
data = s.fit_transform([[1,2,3],[4,5,6]])
print(data) #将数据进行了标准化(因为用的是StandardScaler
data = s.fit([[1,2,3],[4,5,6]])
print(data) #是一个StandardScaler类
print(type(data))
print(s.transform([[1,2,3],[4,5,6]]))   #之前的fit+这里的transform后,结果和上面的fit_transform相同

data = s.fit([[2,3,4],[5,6,7]]) #fit的数据不一样,标准差和平均值就不一样
#说明fit就是计算平均值和标准差
print(s.transform([[1,2,3],[4,5,6]]))   #用2和4的平均值和标准差对1和4进行了转化
#这里的transform后的数据和前一个transform的数据不一样,就是因为标准不一样


"""估计器
转换器实现了特征工程的api,估计器实现了算法的api
"""
"""
1. 用于分类的估计器:
    sklearn.neighbors k-邻近算法
    sklearn.naive_bayes 贝叶斯
    sklearn.liner_model.LogisticRegression 逻辑回归
    sklearn.tree    决策树与随机森林
    
2. 用于回归的估计器:
    sklearn.linear_model.LinearRegression 线性回归
    sklearn.linear_model.Ridge 岭回归
    
难点在于每个算法api当中的参数

3. 估计器的使用流程:
    1. 调用fit(x_train, y_train), 训练数据
    2. 输入测试集的数据x_test, y_test
        1. y_predict = predict(x_test), 预测测试集的结果
        2. 预测的准确率:score(x_test, y_test),得出准确率
        
"""

你可能感兴趣的:(07-转换器与估计器)