使用scikit-learn构建模型

一、使用scikit-learn构建模型
1.加载datasets模块中数据集
使用scikit-learn构建模型_第1张图片
使用scikit-learn构建模型_第2张图片使用scikit-learn构建模型_第3张图片

2.将数据集划分为训练集和测试集使用scikit-learn构建模型_第4张图片
使用scikit-learn构建模型_第5张图片
使用scikit-learn构建模型_第6张图片
使用scikit-learn构建模型_第7张图片使用scikit-learn构建模型_第8张图片

3.使用sklearn转换器进行数据预处理与降维
使用scikit-learn构建模型_第9张图片
使用scikit-learn构建模型_第10张图片
使用scikit-learn构建模型_第11张图片使用scikit-learn构建模型_第12张图片

使用scikit-learn构建模型_第13张图片
使用scikit-learn构建模型_第14张图片
使用scikit-learn构建模型_第15张图片
二、构建并评估聚类模型
1.使用sklearn估计器构建聚类模型
使用scikit-learn构建模型_第16张图片
使用scikit-learn构建模型_第17张图片
使用scikit-learn构建模型_第18张图片
使用scikit-learn构建模型_第19张图片使用scikit-learn构建模型_第20张图片使用scikit-learn构建模型_第21张图片

2.评价聚类模型使用scikit-learn构建模型_第22张图片

轮廓系数法不能数据较大,会报错,计算量太大,无法在电脑上运行,可改用指数评价法使用scikit-learn构建模型_第23张图片
三、构建并评估分类模型
1.使用sklearn估计器构建分类模型
使用scikit-learn构建模型_第24张图片
使用scikit-learn构建模型_第25张图片使用scikit-learn构建模型_第26张图片使用scikit-learn构建模型_第27张图片使用scikit-learn构建模型_第28张图片
使用scikit-learn构建模型_第29张图片
使用scikit-learn构建模型_第30张图片

2.评价分类模型TP(True Positives)意思就是被分为了正样本,而且分对了。
TN(True Negatives)意思就是被分为了负样本,而且分对了,
FP(False Positives)意思就是事实上这个样本是负样本,但是你当成正的了。(误报)
FN(False Negatives)意思就是事实上这个样本是正样本,但是你没识别出来。(漏报)

precision(精确度)
Precision=TP/(TP+FP)
precision可以理解为“模型认为正确且确实是正确的样本占模型认为正确的所有样本的概率”

recall(召回率)
Recall=TP/(TP+FN)
recall可以理解为“模型认为是正确且确实是真确的样本占所有正确的样本的概率”

F1值
用来衡量二分类模型精确度的一种指标。它同时兼顾了分类模型的准确率和召回率。F1分数可以看作是模型准确率和召回率的一种加权平均,它的最大值是1,最小值是0。

使用scikit-learn构建模型_第31张图片
绘制roc曲线
(tpr,fpr,thershold)

tpr:根据不同阈值得到一组tpr值。

fpr:根据不同阈值的到一组fpr值,与tpr一一对应。(这两个值就是绘制ROC曲线的关键)

thresholds:选择的不同阈值,按照降序排列。
使用scikit-learn构建模型_第32张图片

四、构建并评价回归模型
1.使用sklearn估计器构建回归模型在这里插入图片描述
使用scikit-learn构建模型_第33张图片
使用scikit-learn构建模型_第34张图片使用scikit-learn构建模型_第35张图片
使用scikit-learn构建模型_第36张图片使用scikit-learn构建模型_第37张图片

2.评价回归模型使用scikit-learn构建模型_第38张图片
使用scikit-learn构建模型_第39张图片

你可能感兴趣的:(python)