java的基本数据类型

java的8种基本数据类型包括:byte、short、int、long、char、float、double、boolean。

Unicode编码是Java语言和XML的基础。

 

一、数据类型

 

1、二进制

二进制只由0和1组成。

在二进制中“逢二进一”,例如:0+0=0、0+1=1、1+1=10(进位了)

 

2、bit (比特、位)

数据在计算机中或在网络的物理层中传输都是0100110101这样的代码,其中每一个都叫做 1bit (比特,位)。

11110000:8bit (因此1bit的值范围是0到1,一个二进制数值就是1bit)

 

3、byte (字节)

byte是Java中的基本数据类型。1个byte占1个字节。1byte=8bit

8bit的范围是:00000000~11111111  即:0~255。所以一个无符号的byte范围是0~255

 

4、short

1个short占2个字节,16个bit

 

5、int

1个int占4个字节,32个bit

 

6、long

1个long占8个字节,64个bit

 

7、char

1个char占2个字节

键盘上的任意一个字母或者符号都占一个字节、但是汉字是占两个字节。

因此用char存储字母或字符有点浪费空间,可以使用byte,因为一个byte正好占1个字节

但是要想存储汉字就只能用char了,char占两个字节正好存储一个汉字。

 

8、float

1个float占4个字节

 

9、double

1个double占8个字节

 

二、字符集

Java使用unicode编码方式,最大程度的实现了多语言的支持。但是由于一些具体的原因,我们还需要了解Java编程中的编码处理方式,否则还会出现乱码的情况。

 

按字符集出现的先后顺序排列:

ASCII码:只使用了一个8位字节中的低7位,总共是127个编码位。这样的方案很快就不够使用了。 (针对局部地区或少数语言文字)
ISO-8859-1(Latin1 - 西欧字符):西欧语言。(针对局部地区或少数语言文字)

GB2312:中文信息处理的国家标准。(针对局部地区或少数语言文字)

GBK:对GB2312的扩充。 中日韩汉字,简、繁体字融于一库。(针对局部地区或少数语言文字)

Unicode(统一码):简称为UCS,世界各国通用。就是将世界上所有的文字用2个字节统一进行编码。
                               UCS-2,即2个字节编码。

                               UCS-4是为了防止将来2个字节不够用才开发的。即4个字节编码。

UTF-8:Unicode是一种编码方案,UTF-8是Unicode的一种实现,可以用于真正的流式传输。

 

 

 

 

 


 

 

 

你可能感兴趣的:(java,编程,xml)