我们在Windows 上使用python 时,控制台打印数据,比如打开文件或者从URL地址获取数据分析,会出现:
UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 35: illegal multibyte sequ
这是因为控制台是gbk编码的,unicode字符串中包含一些gbk中无法显示的字符。我们只要替换掉不能正常显示的字符,
xa0 表示空格,我们可以替换成空字符或者换行,可以自行设置加上
.replace('\xa0','\n\n') 替换为换行 或者 .replace('\xa0','') 替换为空
或者多个空格替换为一个换行 .replace('\xa0'*8,'\n\n')
代码:
print(texts[0].text)
结果:
修改后的代码:
print(texts[0].text.replace('\xa0'*8,'\n\n'))
执行结果正常,没有再报错。