sys.setdefaultencoding('uft8')

#!/usr/bin/env python
# -*- coding: utf-8 -*-
#作用是定义源代码的编码. 如果没有定义, 此源码中是不可以包含中文字符串的.

import sys
reload(sys)
sys.setdefaultencoding('utf8') #是设置默认的string的编码格式
  • 我们在交互式命令行中看看解码,编码和字符集的关系
>>> str='中文'
>>> print str
中文
>>> str
'\xe4\xb8\xad\xe6\x96\x87'
>>> type(str)

>>> str.decode('utf8')
u'\u4e2d\u6587'
>>> print u'\u4e2d\u6587' 
中文
>>> str.encode('utf8')
'\xe4\xb8\xad\xe6\x96\x87'
>>> print '\xe4\xb8\xad\xe6\x96\x87'
中文
>>>str2=str.decode('utf8').encode('gb2312')
>>> print str2

 >>> str2
'\xd6\xd0\xce\xc4'
>>> str2.decode('gb2312')
u'\u4e2d\u6587'
>>> str3=str.encode('gb2312')
>>> print str3


 >>> str3
'\xd6\xd0\xce\xc4'
>>> str3.decode('gb2312')
u'\u4e2d\u6587'

你可能感兴趣的:(sys.setdefaultencoding('uft8'))