解决'utf8'编解码器无法解码字节0xa5(0xa3也可以)

在解析网页,或者一些特殊的字符串编码解码转换时经常出现类似

UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xa5 in position 108: ordinal not in range(128)或者UnicodeDecodeError: 'utf8' codec can't decode byte 0xa3 in position 17: invalid start byte  的问题。经过查阅大量的资料,也没有一个统一的、简单的、完整的解决之道,经过尝试几次之后,发现在程序开头添加一下几行代码,可以解决该问题:

import sys
reload(sys)
sys.setdefaultencoding("ISO-8859-1")  #此种方式行不通,可将编码方式设为sys.setdefaultencoding("utf-8") 

你可能感兴趣的:(python与爬虫)