解决:UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xa0‘ in position 707: illegal multibyte

遇到这种问题先看看编码是否统一,如果确定所有的编码都统一为utf-8还遇到该错误。那么也许文本中真的有无法解析的特殊字符。

错误其实编译器提示已经很明确了。
将错误翻译为中文:
编码错误:‘gbk’编解码器不能在位置707中编码字符’\xa0’:非法多字节。
可以看到是’\xa0’字符编码失败。在utf-8中’\xa0’其实是html中的特定空格符号 。
在编译器中可以看到:
在这里插入图片描述
所以我们只需要将’\xa0’从字符串中去除就可以了

str.replace(u'\xa0', '')

你可能感兴趣的:(python)