第二模块 3.2 字符编码的转换

1 编码与解码

s.encode("utf-8")  编码以utf-8 编码成2进制

s.decode("utf-8)   以2进制解码成unicode

>>> s_utf8 = s.encode("utf-8")
>>> s_utf8
b'\xe4\xbd\xa0\xe5\xa5\xbd\xe6\x9c\xaa\xe6\x9d\xa5'
>>> s_utf8.decode("utf-8")
'你好未来'

第二模块 3.2 字符编码的转换_第1张图片

 

 2 编码的转换   

    把文字从一种编码转换成另外一种, 从gbk 转成utf-8

    为什么要进行编码的转换

    windows   gbk

           文件: gbk 文件

    linux/mac   utf-8

           文件: utf-8

    gbk ---> unicode-----> utf-8 

    unicode  : 万国码

                   跟所有的编码之间, 有映射关系

    

f = open("byte.txt", "rb")
s = f.read()
f.close()
s_unicode = s.decode("gbk")  # 转成 unicode
s_utf8 = s_unicode.encode("utf-8")
f = open("byte.txt",'wb')
f.write(s_utf8)
f.close()

 

你可能感兴趣的:(第二模块 3.2 字符编码的转换)