关于Java程序的编码

java的comments, identifiers, char类型数据 和 string literals使用unicode(utf-16,固定两字节)编码,所有其他elements in a program written in the Java programming language are formed from only ASCII characters

单个char 16位只能表示unicode字符集基本多文种平面(Basic Multilingual Plane, BMP,从U+0000至U+D7FF以及从U+E000至U+FFFF的码位)中的字符,当表示辅助平面(Supplementary Planes,从U+10000到U+10FFFF的码位)中的字符时需要使用两个char表示(称作 代理对 surrogate pair),如要显示字符:

' '

System.out.println("\uD840\uDC87"); 



你可能感兴趣的:(java)