python3的编码和解码

python中的编码和解码

python3的编码和解码_第1张图片

Python3中默认使用Unicode,显示为我们能看到的明文

In [6]: s = '我是中国人'                                                        

In [7]: s                                                                       
Out[7]: '我是中国人'

进行编码

In [13]: s = '我是中国人'                                                                                                                                                          
#使用utf-8的方式进行编码
In [14]: s.encode('utf-8')                                                                                                                                                         
Out[14]: b'\xe6\x88\x91\xe6\x98\xaf\xe4\xb8\xad\xe5\x9b\xbd\xe4\xba\xba'

进行解码

#用什么编的就要用什么来解码
In [15]: a = s.encode('utf-8')                                                         

In [16]: a.decode('utf-8')                                                             
Out[16]: '我是中国人'

utf-8转gbk

In [17]: s = '我是中国人'                                                              

In [18]: a = s.encode('utf-8')                                                         

In [19]: b = a.decode('utf-8')                                                         

In [20]: c = b.encode('gbk')                                                           

In [21]: c                                                                             
Out[21]: b'\xce\xd2\xca\xc7\xd6\xd0\xb9\xfa\xc8\xcb'

In [22]: a                                                                             
Out[22]: b'\xe6\x88\x91\xe6\x98\xaf\xe4\xb8\xad\xe5\x9b\xbd\xe4\xba\xba'

In [23]: import chardet                                                                

In [24]: chardet.detect(c)                                                             
Out[24]: {'encoding': 'GB2312', 'confidence': 0.99, 'language': 'Chinese'}

你可能感兴趣的:(python基础)