python cross_validation——交叉验证后加载训练好的模型用来预测时报错'need fit'

题外话:这个场景其实很常见,基于k_fold训练的cross_val_score和cross_val_predict往往是将已知lable数据的一部分当成测试集,另一部分为训练集,用正确概率来评估当前的estimator性能(前者)以及返回所有数据的预测值(后者)。但是当我们有未知lable的待预测数据出现时,如何直接调用已经训练出来的模型就很关键了,显然我们不能再让其中任何一部分作为训练集。

joblib.dump下载训练好的模型到本地

python cross_validation——交叉验证后加载训练好的模型用来预测时报错'need fit'_第1张图片

joblib.load加载训练好的模型

python cross_validation——交叉验证后加载训练好的模型用来预测时报错'need fit'_第2张图片

其实加载的时候笔者就有点感觉到不对了,因为clf.predict并没有联想出来,但是也只能硬打然后看运行报错了

python ERROR: This SVC instance is not fitted yet. Call 'fit' before using clf.predict()

也就是说,它想告诉我在预测之前,我的clf是没有进行拟合(fit)的。大胆推测一下,之前的cross_val_score是没有fit的,这一点stack overflow证实了我的猜想:

这是人家的提问,她认为cross_val_score 是拟合的,因为没拟合的时候python并没有报错

python cross_validation——交叉验证后加载训练好的模型用来预测时报错'need fit'_第3张图片

下面是高分回答,也就是说cross_val_score的运行过程中是没有拟合的,它会返回给你你的estimator的性能如何。所以当你对当前的estimator感到满意时,你就需要在预测之前fit一下。

 

python cross_validation——交叉验证后加载训练好的模型用来预测时报错'need fit'_第4张图片

下面是拟合处理以后的结果:

python cross_validation——交叉验证后加载训练好的模型用来预测时报错'need fit'_第5张图片

 

python cross_validation——交叉验证后加载训练好的模型用来预测时报错'need fit'_第6张图片

在给患者评分的场景中,被测试的两个true value都为1的患者都被预测为1

 

 

你可能感兴趣的:(python)