解决UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xe7‘ in position 295: illegal multibyte seq
错误代码:
with open("baidu.html",'w+') as f:
f.write(results.text)
正确代码:
with open("baidu.html",'w+',encoding="utf-8") as f:
f.write(results.text)
在抓取网页上面的一些源代码的时候,将uft-8的编码写入文档,并输出的时候,出现这了这个报错,说gbk无法编码\xbb
查找相关资料:
1.str转bytes叫encode,bytes转str叫decode
2.字符就是unicode字符,字符串就是unicode字符数组
原来,open()函数的默认编码不是utf-8,修改编码方式即可
write()函数涉及的问题,那就是它的参数必须是str,不能是bytes,也就是说f.write(result)中的result参数如果是bytes需要先decode成str(比如result.decode(‘utf-8’)),才能使用open()函数的encoding