跟着机器学习实战写代码,决策树这里有一段是保存决策树,使用pickle模块保存,原书是基于2.7的,在3.6上有坑,在这里跟大家分享下。
'''
def storeTree(inputTree, filename):
import pickle
fw = open(filename, 'w')
pickle.dump(inputTree,fw)
fw.close()
def grabTree(filename):
import pickle
fr = open(filename, )
print(pickle.load(fr))
'''
这是原代码,跑完会告诉你2进制文件无法打开a bytes-like object is required, not 'str',第一步在上面储存的函数里将w改为wb,二进制写模式。这样改完不够还需要在下面读的文件里加上rb,已二进制文件读取。除此之外还不够,还有一个最隐蔽的,open的时候有4中模式,默认是第三模式,这里要想正确读出只能选择0模式,即ASCII模式。0:ASCII协议,所序列化的对象使用可打印的ASCII码表示;1:老式的二进制协议;2:2.3版本引入的新二进制协议,较以前的更高效。其中协议0和1兼容老版本的python。protocol默认值为3。
改完之后就可以用了,新代码在下面
'''
def storeTree(inputTree, filename):
import pickle
fw = open(filename, 'wb')
pickle.dump(inputTree,fw,0)
fw.close()
def grabTree(filename):
import pickle
fr = open(filename, 'rb')
print(pickle.load(fr))
'''