UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xe7‘ in position 295: illegal multibyte seq

解决UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xe7‘ in position 295: illegal multibyte seq
错误代码:


with open("baidu.html",'w+') as f:
    f.write(results.text)

正确代码:


with open("baidu.html",'w+',encoding="utf-8") as f:
    f.write(results.text)

在抓取网页上面的一些源代码的时候,将uft-8的编码写入文档,并输出的时候,出现这了这个报错,说gbk无法编码\xbb

查找相关资料:

1.str转bytes叫encode,bytes转str叫decode

2.字符就是unicode字符,字符串就是unicode字符数组

原来,open()函数的默认编码不是utf-8,修改编码方式即可

write()函数涉及的问题,那就是它的参数必须是str,不能是bytes,也就是说f.write(result)中的result参数如果是bytes需要先decode成str(比如result.decode(‘utf-8’)),才能使用open()函数的encoding

你可能感兴趣的:(爬虫,python)