ASCII和Unicode

java中的字符采用unicode编码,每个字符占2个字节,最多可以容纳65536个字符,字符即基本类型char,unicode编码,及每一个字符都对应一个数字,一般都是用16进制来表示。

ASCII共有256个
ASCII码占用一个字节,可以有0~255共256个取值。前128个为常用的字符如运算符,字母 ,数字等 键盘上可以显示的后 128个为 特殊字符是键盘上找不到的字符。
ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是现今最通用的单字节编码系统,并等同于国际标准ISO/IEC 646。

例如A,在ascll中是65占用一个字节是8位,及0100 0001,unicode与ascii相兼容,
A在unicode用16进制表示是/u0041,换成二进制是0000 0000 0100 0001,也就是说ascii主要用十进制表示,unicode主要用16进制表示。
如果想要知道一个字符在Unicode表中的顺序,可以将它转换为int类型,如


    public class UnicodeTest {

    public static void main(String[] args) {
        // TODO Auto-generated method stub
        char c='李';
        System.out.println("c的unicode编码:"+(int)c);
        int num=26446;
        System.out.println("unicode编码为26446的字符为: "+(char)num);
        
    }

}


output:
c的unicode编码:26446
unicode编码为26446的字符为李

你可能感兴趣的:(ASCII和Unicode)