一、概述
我们通过编程解决一个具体问题时,首先要做的工作是用各种“数据结构”表示问题中的实体对象,而后才能着手研究描述具体业务逻辑的算法。这也正印证了”程序 = 数据结构 + 算法“。而这里的数据结构,便对应着各种数据类型。
数据类型指的是一组值以及相关的一组操作。Java中有两大类数据类型:一类是原始(primitive)数据类型,包括boolean、int、double等等;还有一类是引用类型,也就是类(class),包括Java类库提供给我们的类和我们自己使用关键字class定义的类。Java中的类按功能来分又可以分为抽象数据类型和静态代码库。
二、原始数据类型
1. 声明与初始化
原始数据类型作为变量使用的场景主要有两种:
一是作为局部变量使用,这时我们必须声明并且初始化后才能使用,否则会报错:
public static void main() { int a; int b = a + 1; //错误,局部变量a没有初始化 ... }
第二种场景是作为实例变量或类变量使用,这时声明后若不初始化系统会“隐式初始化”(具体来说是整型初始化为0,浮点型初始化为0.0,布尔型初始化为false):
public class Counter { private int id; private int count; public Counter(int id) { //在构造器中没有显示初始化count,count在新创建的对象中会被系统隐式初始化为0 this.id = id; } ... }
2. 原始类型数组
在上面我们提到过,Java中除了原始数据类型便是引用类型,因此Java中的数组是一种引用类型。引用类型与原始数据类型的本质区别在于:引用类型变量存放的是一个引用,这里的引用也就是内存地址。 考虑下面的代码片段:
... int a = 12345; int b = a; b = 123456; //a的值不变,仍为12345 ... int[] d = {1, 2, 3}; int[] e = d; e[0] = 0; //改变了e的同时也改变了d,即现在d = {0, 2, 3} ...
在上面的代码中,”int b = a"这句会创建一个a的副本,并把它赋值给b,由于是原始数据类型,所以修改b的值不会影响到a。
而“int e = d”同样也先创建一个d的副本,再把他赋值给e,然而d的值实际上是整型数组的引用(也就是地址),所以e的值也变成了同一个整型数组的地址。所以通过e对该整形数组做的改变会反映到d上。这个现象叫做起别名,也就是内存中同一个整型数组现在有不只一个变量存放着它的地址,这俩变量都能对它就行修改。
三、引用类型
正如上文提到的,Java中的引用类型变量的值是一个引用,也就是实际对象的地址。Java中的引用类型也就是我们常说的类(class),类主要有两种用途:一是用来描述一种抽象数据类型(Abstract Data Type,ADT);另一种是用来容纳一组静态方法,也就是用做静态代码库(比如,Java类库中的Math类)。
1. 内存模型
Java中的引用类型的内存占用情况,不如原始类型来的直观。原始类型变量不需要保存除了它本身的值之外的任何信息。而一个Java对象往往占用了更多的内存,它需要保存它的所有实例变量以及一些额外信息(包括指向对象的类的引用、垃圾收集信息、同步信息)。考虑以下的Java类:
public class Rect { private int l; private int w; ... }
一个Rect类型的对象在一个典型的64位机器上会占用24字节的内存,其中包括8字节的指向Rect类的引用、8字节的垃圾收集信息及同步信息和两个int类型的实例变量各占4字节。
2. 相等性
“==”运算符对两个对象默认比较行为是检测他们的标识(即引用)是否相等。而在多数情况下,我们对两个对象相等的定义是,这两个对象的状态(各个实例变量的值)相等。要想实现这种我们想要的行为,只需要重写equals()方法。
这个方法定义在Object类(一切Java类的父类),Java标准要求这个方法的实现必须接受一个Object类型参数,并满足以下性质:
(1)自反性:即x.equals(x)必须返回true
(2)对称性:x.equals(y)与y.equals(x)的返回结果必须相同
(3)传递性:若x.equals(y), y.equals(z)均返回true,那么x.equals(z)也必须返回true
(4)一致性:若x与y引用的对象没变,那么无论多少次调用x.equals(y)都应返回一致的结果
(5)非空性:对于任何的非空引用x,x.equals(null)总是返回false
拿以上提到的Rect类为例:
public class Rect { private int w; private int l; public Rect(int w, int l) { ... } public boolean equals(Object otherObject) { if (otherObjcet == null) { return false; } else if (this == otherObject) { return true; //标识相同,直接返回true } if (this.getClass() != otherObject.getClass()) { return false; } Rect rect = (Rect) otherObject; if ((this.getW() == rect.getW()) && ((this.getL() == rect.getL())) { return true; } return false; } }
这里需要注意的是,在实际应用中,不同对象的相等性定义往往是具体场景而定,这里我们定义两个矩形对象相等是指两者的长和宽分别相等。
3.不变性
在Java中,用final修饰的数据类型具有“不变性”。而这个不变性对于原始数据类型和引用类型来说有着不同的含义。对于原始数据类型变量来说,所谓的不变性是指它的值不可改变;对于引用类型变量来说,不变性指的是它所引用的对象不可发生改变,但是它所引用的对象的内容可以改变。另外,final修饰的类不可以再派生子类。比如以下代码段:
public Class Test { public static final int a = 5; //a的值将一直为5,不可更改 public final double[] b; //double数组对象b的标识(引用)不可边,但是它指向的double数组可以更改 ... }
关于Java的数据类型还有很多值得讨论的东西,这里只是抛砖引玉,欢迎大家一起探讨:)