UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 0: illegal multibyte seque

 

        html = response.read()
        str_html = html.decode()
        f = open('baidu.html', 'w+')
        for values in str_html:
            f.write(values)
        f.close()


上面代码编译的时候出现了:UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 0: illegal multibyte seque

 

对比了一下,应该f的编码格式是GBK的,但是其它的是UTF-8的。所以指定一下编码格式即可。。

 

  f = open('baidu.html', 'w+',encoding='utf-8')

2019.10.24,继续更新编码相关的。

问题有点类似,所以放在一起总结:

UnicodeEncodeError: 'ascii' codec can't encode character u'\u548c' in position 0: ordinal not in range(128)

除了上面的编码解决外,还可以使用PYTHONIOENCODING

在运行python命令前添加参数 PYTHONIOENCODING=utf-8 python test.py

参考文章

第三种方法:

import sys 
reload(sys)
sys.setdefaultencoding('utf8')

我的code:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
#from codecs import open
import codecs
import sys 
#reload(sys)
#sys.setdefaultencoding('utf8')
sys.path.append("/usr/lib/python2.7/site-packages/") 


from pypinyin import pinyin,lazy_pinyin,Style
import pypinyin

def chinese2pinyin( words ):
    print('hello')
    print(pinyin(u'中心', style=Style.NORMAL))
    list = lazy_pinyin(words)
    print list


if __name__ == '__main__':
    print('start: ')
    s = '中国'
    chinese2pinyin(s.decode('utf-8'))

 

你可能感兴趣的:(python)