java的8种基本数据类型包括:byte、short、int、long、char、float、double、boolean。
Unicode编码是Java语言和XML的基础。
一、数据类型
1、二进制
二进制只由0和1组成。
在二进制中“逢二进一”,例如:0+0=0、0+1=1、1+1=10(进位了)
2、bit (比特、位)
数据在计算机中或在网络的物理层中传输都是0100110101这样的代码,其中每一个都叫做 1bit (比特,位)。
11110000:8bit (因此1bit的值范围是0到1,一个二进制数值就是1bit)
3、byte (字节)
byte是Java中的基本数据类型。1个byte占1个字节。1byte=8bit
8bit的范围是:00000000~11111111 即:0~255。所以一个无符号的byte范围是0~255
4、short
1个short占2个字节,16个bit
5、int
1个int占4个字节,32个bit
6、long
1个long占8个字节,64个bit
7、char
1个char占2个字节
键盘上的任意一个字母或者符号都占一个字节、但是汉字是占两个字节。
因此用char存储字母或字符有点浪费空间,可以使用byte,因为一个byte正好占1个字节
但是要想存储汉字就只能用char了,char占两个字节正好存储一个汉字。
8、float
1个float占4个字节
9、double
1个double占8个字节
二、字符集
Java使用unicode编码方式,最大程度的实现了多语言的支持。但是由于一些具体的原因,我们还需要了解Java编程中的编码处理方式,否则还会出现乱码的情况。
按字符集出现的先后顺序排列:
ASCII码:只使用了一个8位字节中的低7位,总共是127个编码位。这样的方案很快就不够使用了。 (针对局部地区或少数语言文字)
ISO-8859-1(Latin1 - 西欧字符):西欧语言。(针对局部地区或少数语言文字)
GB2312:中文信息处理的国家标准。(针对局部地区或少数语言文字)
GBK:对GB2312的扩充。 中日韩汉字,简、繁体字融于一库。(针对局部地区或少数语言文字)
Unicode(统一码):简称为UCS,世界各国通用。就是将世界上所有的文字用2个字节统一进行编码。
UCS-2,即2个字节编码。
UCS-4是为了防止将来2个字节不够用才开发的。即4个字节编码。
UTF-8:Unicode是一种编码方案,UTF-8是Unicode的一种实现,可以用于真正的流式传输。