UnicodeEncodeError: 'gbk' codec can't encode character '\ufb01' in position 2620: illegal multibyte sequence
问题的原因在于Python 3里面字符串的默认编码是Unicode
的
取的网页上面的内容,在代码里面是存在字符串变量里的,Windows下面新建的文本文件默认的编码是gbk
(Windows简体中文版的系统默认编码就是gbk
),当把从网页上读取的内容写到文本文件里面去的时候,意味着把一个unicode
的字符序列写入到一个编码是gbk
的文件,最后就出错了,解决方法就是在打开一个文件的时候,指定文件的编码,让它以指定的编码打开:
原文地址:https://blog.csdn.net/zheng_integer/article/details/55670918
with open('e:/test.txt', encoding='utf-8') as f:
f.write(content)