html = response.read()
str_html = html.decode()
f = open('baidu.html', 'w+')
for values in str_html:
f.write(values)
f.close()
上面代码编译的时候出现了:UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position 0: illegal multibyte seque
对比了一下,应该f的编码格式是GBK的,但是其它的是UTF-8的。所以指定一下编码格式即可。。
f = open('baidu.html', 'w+',encoding='utf-8')
2019.10.24,继续更新编码相关的。
问题有点类似,所以放在一起总结:
UnicodeEncodeError: 'ascii' codec can't encode character u'\u548c' in position 0: ordinal not in range(128)
除了上面的编码解决外,还可以使用PYTHONIOENCODING
在运行python命令前添加参数 PYTHONIOENCODING=utf-8 python test.py
参考文章
第三种方法:
import sys
reload(sys)
sys.setdefaultencoding('utf8')
我的code:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
#from codecs import open
import codecs
import sys
#reload(sys)
#sys.setdefaultencoding('utf8')
sys.path.append("/usr/lib/python2.7/site-packages/")
from pypinyin import pinyin,lazy_pinyin,Style
import pypinyin
def chinese2pinyin( words ):
print('hello')
print(pinyin(u'中心', style=Style.NORMAL))
list = lazy_pinyin(words)
print list
if __name__ == '__main__':
print('start: ')
s = '中国'
chinese2pinyin(s.decode('utf-8'))