2019-05-30

day_3

2019/5/30 星期四 16:21:48

字符编码

**Unicode**用3个字节(6个16进制数来表示一个字符)第一个字节表示平面,总共只有00到10共17个平面, 其他表示字符的码值,ASCII码对应下图第一行(128),中文的utf-8码用三个字节表示.(对应第三行).

因此utf-8就是Unicode的一种实现,指用一个或多个8位变量(构成的数组)来表示Unicode编码,而对应的utf-16就是用一个或多个16位值表示Unicode编码,相应的utf-32就是用32位值来表示,因此用1个基本类型变量就可以表示.

> 这里的基本数据类型的所占字节是不同的,Java中byte是1字节,short是2字节,char也是2字节,int是4字节,long是8字节.而C中,unsigned char是1字节, unsigned int是2字节.

![我是描述](https://ws1.sinaimg.cn/large/6e53563fly1g3jgsulxhnj20mr0d6gm2.jpg)

你可能感兴趣的:(2019-05-30)