sklearn建模

模型搭建

1.首先我们要明白我们的任务是分类还是回归任务,在这里应该属于回归任务
2.明白任务后,后面得划分数据集,主要有以下几种划分方法:留出法,k折交叉验证法
3.模型选择及创建,在这里选择逻辑回归模型

from sklearn.model_selection import train_test_split
from sklearn.datasets import load_digits
from sklearn.linear_model import LogisticRegression
LR = LogisticRegression(C=1.0, penalty='l1', tol=0.01)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)
LR.fit(X_train,y_train)
LR.predict(X_test)
LR.score(X_test,y_test)

4.模型评价,主要用到ROC曲线来进行评价
ROC曲线的横坐标为假阳性率(FPR);纵坐标为真阳性率(,TPR)。FPR和TPR的计算方法分别为:
FPR=FP/(FP+TN),
TPR=TP/(TP+FN),
ROC通过曲线与坐标轴围成的面积,来判断模型好坏,面积越接近1,越好。

你可能感兴趣的:(笔记)