第四章

Unicode 字符 utf-8编码方式 4位 32字节

unicode三明治:1.解码输入的字节序列(bytes>str)2.只处理文本 3.编码输出的文本。

编码方式不一样 长度是不一样的 len()

nfc 最少码位构成的等价字符串
nfd 基字符串和单独的组合字符

你可能感兴趣的:(第四章)