字符编码

1 ASCII:American Standard Code for Information Interchange

  • 0~32:用作控制字符
  • 00000000-01111111:其他字符

2 GB2312标准

  • 00000000 00000000:大概能存储7000左右汉字

2.1 GBK:GB2312的拓展

  • 扩展大概多出20000左右字符,包含繁体字、假名、罗马字符

2.2 GB18030:包含很多少数名族字符


3 ISO:国际标准化组织

UCS:Universal Multi-Octet Coded Character Set
UCS俗称Unicode


4 UTF:Unicode Transfer Format

  • UTF有UTF8和UTF16,最常用的是UTF8,指的是每八位传输
  • UTF8表示一个字符用多少个字节不固定
  • 举例:
    • 如果一个字符只占一个字节,表示0xxxxxxx
    • 如果一个字符占两个字节,表示110xxxxx 10xxxxxx
    • 如果一个字符占三个字节,表示1110xxxx 10xxxxxx 10xxxxxx
    • 如果一个字符占四个字节,表示11111xxx 10xxxxxx 10xxxxxx 10xxxxxx

--

5 正确的写入写出方式

字符编码_第1张图片
image.png

你可能感兴趣的:(字符编码)