机器学习实战--使用朴素贝叶斯过滤垃圾邮件

在邮件分类过程中,代码报错,提示:UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 199: illegal multibyte sequence,错误原因出现不能解码的字符。

解决办法:email\ham\23.txt,找到SciFinance?,把?替换成空格即可。

你可能感兴趣的:(机器学习实战)