UnicodeDecodeError: 'gb2312' codec can't decode byte 0xe5 in position 3922:

在爬取的时候,网页给的解码方法是gb2312,但解码还是失败了。看了一下,是解码繁体字的时候失败了。
恰好繁体字内容需要读取,不能将错误ignore。
将解码格式换成,GB18030就可以完美解码。

你可能感兴趣的:(UnicodeDecodeError: 'gb2312' codec can't decode byte 0xe5 in position 3922:)