解决UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 5: illegal multibyte 问题

这个是我在准备用HTMLParser解析一段html的时候出错的,在网上查了一下,原来是print()函数自身有限制,不能完全打印所有的unicode字符,所以只要规定一下print的打印的默认编码就行了:

import io
import sys
import urllib.request
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='utf8') #改变标准输出的默认编码
编码名称 用途
utf8 所有语言
gbk 简体中文
gb2312 简体中文
gb18030 简体中文
big5 繁体中文
big5hkscs 繁体中文

你可能感兴趣的:(python)