UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 35: illegal multibyte sequ

我们在Windows 上使用python 时,控制台打印数据,比如打开文件或者从URL地址获取数据分析,会出现:

UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 35: illegal multibyte sequ

这是因为控制台是gbk编码的,unicode字符串中包含一些gbk中无法显示的字符。我们只要替换掉不能正常显示的字符,

xa0 表示空格,我们可以替换成空字符或者换行,可以自行设置加上 

.replace('\xa0','\n\n') 替换为换行   或者 .replace('\xa0','') 替换为空

或者多个空格替换为一个换行 .replace('\xa0'*8,'\n\n')

代码:

print(texts[0].text)

结果:

UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 35: illegal multibyte sequ_第1张图片

修改后的代码:

print(texts[0].text.replace('\xa0'*8,'\n\n'))

执行结果正常,没有再报错。

你可能感兴趣的:(Python)