python术语(Unicode)

名称 意思
ASCII 美国标准信息交换码
BMP 基本多文种平面(第零平面)
BOM 字节顺序标记(标识字节顺序的字符)
CJK/CJKW 中文-日文-韩文(和越南语)的缩写
Code point 类似于 ASCII 值,代表 Unicode 字符的值,范围在 range(1114112)或者说0x000000 到 0x10FFFF.
Octet 八位二进制数的位组
UCS 通用字符集
UCS2 UCS 的双字节编码方式(见 UTF-16)
USC4 UCS 的四字节编码方式
UTF Unicode 或者 UCS 的转换格式.
UTF-8 八位 UTF 转换格式(无符号字节序列, 长度为一到四个字节)
UTF-16 16 位 UTF 转换格式(无符号字节序列,通常是 16 位长[两个字节],见 UCS2)

你可能感兴趣的:(unicode)