如何利用python中的sklearn.externals 模块保存加载训练模型

前提:在做模型训练的时候,尤其是在训练集上做交叉验证,通常想要将模型保存下来,然后放到独立的测试集上进行测试,本文主要介绍如何利用python中的sklearn.externals 模块保存训练模型,并在测试集进行使用。

#建立模型

from sklearn.ensemble import RandomForestClassifier
X  ---- 特征变量,y ----- 目标变量
clf = RandomForestClassifier(random_state=0, n_jobs = -1)
clf.fit(X, y)  
## 通过joblib的dump可以将模型保存到本地,clf是训练的分类器

from sklearn.externals import joblib
joblib.dump(clf, "RandomForestClassifier_model.m")
#模型从本地调回
clf = joblib.load("RandomForestClassifier_model.m")
#在测试集上测试

clf.predit(testing_X)    # testing_X为测试集

你可能感兴趣的:(python)