[TOC]
深入理解 Java 泛型
概述
泛型的本质是参数化类型,通常用于输入参数、存储类型不确定的场景。相比于直接使用 Object 的好处是:编译期强类型检查、无需进行显式类型转换。
类型擦除
Java 中的泛型是在编译器这个层次实现的,在生成的Java字节代码中是不包含泛型中的类型信息的。使用泛型的时候加上的类型参数,会被编译器在编译的时候去掉。这个过程就称为类型擦除 type erasure。
public class Test {
public static void main(String[] args) {
List strList = new ArrayList<>();
List intList = new ArrayList<>();
System.out.println(strList.getClass().getName());
System.out.println(intList.getClass().getName());
}
}
上面这一段代码,运行后输出如下,可知在运行时获取的类型信息是不带具体类型的:
java.util.ArrayList
java.util.ArrayList
类型擦除也是 Java 的泛型实现方式与 C++ 模板机制实现方式之间的重要区别。这就导致:
泛型类并没有自己独有的Class类对象,只有List.class。
运行时无法获得泛型的真实类型信息。
比如在 反序列化 Json 串至 List 字符串时,需要这么做:
public class Test {
public static final ObjectMapper mapper = new ObjectMapper();
public static void main(String[] args) throws IOException {
JavaType javaType = getCollectionType(ArrayList.class, String.class);
List lst = mapper.readValue("[\"hello\",\"world\"]", javaType);
System.out.println(lst);
}
// 获取泛型的Collection Type
public static JavaType getCollectionType(Class> collectionClass, Class>... elementClasses) {
return mapper.getTypeFactory().constructParametricType(collectionClass, elementClasses);
}
}
Debug 发现 getCollectionType 方法输出的是 CollectionType 对象,里面存储了元素类型 _elementType。这就相当于把 List 的元素类型 String.class 作为参数,提供给了 Jackson 去反序列化。而下面的做法会编译失败:
public class Test {
public static final ObjectMapper mapper = new ObjectMapper();
public static void main(String[] args) throws IOException {
List lst = mapper.readValue("[\"hello\",\"world\"]", List.class); // 编译错误
System.out.println(lst);
}
}
泛型不是协变的
在 Java 语言中,数组是协变的,也就是说,如果 Integer 扩展了 Number,那么不仅 Integer 是 Number,而且 Integer[] 也是 Number[],在要求 Number[] 的地方完全可以传递或者赋予 Integer[]。(更正式地说,如果 Number是 Integer 的超类型,那么 Number[] 也是 Integer[]的超类型)。您也许认为这一原理同样适用于泛型类型 —— List< Number> 是 List< Integer> 的超类型,那么可以在需要 List< Number> 的地方传递 List< Integer>。不幸的是,情况并非如此。为啥呢?这么做将破坏要提供的类型安全泛型。
对于数组来说,下面的代码会有运行时错误:
public class Test {
public static void main(String[] args) {
String[] strArray = new String[3];
Object[] objArray = strArray;
objArray[0] = 1;// 运行时错误:Exception in thread "main" java.lang.ArrayStoreException: java.lang.Integer
}
}
而集合这么写就会有编译错误:
public class Test {
public static void main(String[] args) {
List strList = new ArrayList<>();
// 编译 Error:(14, 32) java: 不兼容的类型: java.util.List无法转换为java.util.List
List objList = strList;
}
}
数组能够协变而泛型不能协变的另一个后果是,不能实例化泛型类型的数组(new List< String>[3] 是不合法的),除非类型参数是一个未绑定的通配符(new List< ?>[3]是合法的)。具体可以运行下面的代码看看:
public class Test {
public static void main(String[] args) {
// 编译正常
List>[] lsa2 = new List>[10];
// 编译 Error:(14, 30) java: 创建泛型数组
List[] lsa = new List[10];
}
}
构造延迟
因为运行时不能区分 List< String> 和 List< Integer>(运行时都是 List),用泛型类型参数标识类型的变量的构造就成了问题。运行时缺乏类型信息,这给泛型容器类和希望创建保护性副本的泛型类提出了难题。比如:
不能使用类型参数访问构造函数
您不能使用类型参数访问构造函数,因为在编译的时候还不知道要构造什么类,因此也就不知道使用什么构造函数。使用泛型不能表达“T必须拥有一个拷贝构造函数(copy constructor)”(甚至一个无参数的构造函数)这类约束,因此不能使用泛型类型参数所表示的类的构造函数。
public class Test {
public void doSomething(T param) {
T copy = new T(param); // 编译错误:Error:(13, 22) java: 意外的类型,需要: 类,找到: 类型参数T
}
}
不能使用 clone 方法
为什么呢?因为 clone() 在 Object 中是 protected 保护访问的,调用 clone() 必须通过将 clone() 改写为 public 公共访问的类方法来完成。但是 T 的 clone() 是否为 public 是无法确定的,因此调用其 clone 也是非法的。
public class Test {
public void doSomething(T param) {
T copy = (T) param.clone(); // 编译 Error:(13, 27) java: clone()在java.lang.Object中访问protected
}
}
不能创建泛型数组
不能实例化用类型参数表示的类型数组。编译器不知道 T 到底表示什么类型,因此不能实例化 T 数组。
public class Test {
public void doS() {
T[] t = new T[5];
}
}
那么 ArrayList 是如何存储数据的呢?请看下面的源代码,是用 Object 数组存储的,所以在获取元素时要做显示类型转换(在 elementData 方法中):
public class ArrayList extends AbstractList
implements List, RandomAccess, Cloneable, java.io.Serializable
{
transient Object[] elementData; // Object 数组存储数据
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity);
}
}
public E get(int index) {
rangeCheck(index);
return elementData(index);
}
@SuppressWarnings("unchecked")
E elementData(int index) {
return (E) elementData[index];
}
}
通配符 extends 和 super
在泛型不是协变中提到,在使用 List< Number> 的地方不能传递 List< Integer>,那么有没有办法能让他两兼容使用呢?答案是:有,可以使用通配符。
泛型中 ? 可以用来做通配符,单纯 ? 匹配任意类型。< ? extends T > 表示类型的上界是 T,参数化类型可能是 T 或 T 的子类:
public class Test {
static class Food {}
static class Fruit extends Food {}
static class Apple extends Fruit {}
public static void main(String[] args) throws IOException {
List extends Fruit> fruits = new ArrayList<>();
fruits.add(new Food()); // compile error
fruits.add(new Fruit()); // compile error
fruits.add(new Apple()); // compile error
fruits = new ArrayList(); // compile success
fruits = new ArrayList(); // compile success
fruits = new ArrayList(); // compile error
fruits = new ArrayList extends Fruit>(); // compile error: 通配符类型无法实例化
Fruit object = fruits.get(0); // compile success
}
}
从上面代码中可以看出来,赋值是参数化类型为 Fruit 和其子类的集合都可以成功,通配符类型无法实例化。为啥上面代码中的 add 全部编译失败了呢?因为 fruits 集合并不知道实际类型是 Fruit、Apple 还是 Food,所以无法对其赋值。
除了 extends 还有一个通配符 super,< ? super T > 表示类型的下界是 T,参数化类型可以是 T 或 T 的超类:
public class Test {
static class Food {}
static class Fruit extends Food {}
static class Apple extends Fruit {}
public static void main(String[] args) throws IOException {
List super Fruit> fruits = new ArrayList<>();
fruits.add(new Food()); // compile error
fruits.add(new Fruit()); // compile success
fruits.add(new Apple()); // compile success
fruits = new ArrayList(); // compile success
fruits = new ArrayList(); // compile error
fruits = new ArrayList(); // compile success
fruits = new ArrayList super Fruit>(); // compile error: 通配符类型无法实例化
Fruit object = fruits.get(0); // compile error
}
}
看上面代码可知,super 通配符类型同样不能实例化,Fruit 和其超类的集合均可赋值。这里 add 时 Fruit 及其子类均可成功,为啥呢?因为已知 fruits 的参数化类型必定是 Fruit 或其超类 T,那么 Fruit 及其子类肯定可以赋值给 T。
归根到底,还是“子类对象可以赋值给超类引用,而反过来不行”这一规则导致 extends 和 super 通配符在 add 操作上表现如此的不同。同样地,也导致 super 限定的 fruits 中 get 到的元素不能赋值给 Fruit 引用,而 extends 则可以。
总结一下就是:
extends 可用于的返回类型限定,不能用于参数类型限定。
super 可用于参数类型限定,不能用于返回类型限定。
带有 super 超类型限定的通配符可以向泛型对易用写入,带有 extends 子类型限定的通配符可以向泛型对象读取。
运行时泛型参数类型获取
虽然 Java 的泛型在编译期间有类型擦除,但是如果真的需要在运行时知道泛型参数的类型,应该如何做呢?
额外保存参数类型
在上面“类型擦除”中提到了 Jackson 反序列化泛型类型,将参数类型信息显式保存下来。
public class TestJackson {
public static final ObjectMapper mapper = new ObjectMapper();
public static void main(String[] args) throws IOException {
JavaType javaType = getCollectionType(ArrayList.class, String.class);
List lst = mapper.readValue("[\"hello\",\"world\"]", javaType);
System.out.println(lst);
}
// 获取泛型的Collection Type
public static JavaType getCollectionType(Class> collectionClass, Class>... elementClasses) {
return mapper.getTypeFactory().constructParametricType(collectionClass, elementClasses);
}
}
经过 Debug 发现,getCollectionType 返回的对象实际类型是 CollectionType:
Debug JavaType 信息
CollectionType 和 JavaType 之间的继承关系,可以看下面的代码:
public final class CollectionType extends CollectionLikeType {
}
public class CollectionLikeType extends TypeBase {
protected final JavaType _elementType;
}
public abstract class TypeBase extends JavaType implements JsonSerializable {
protected final JavaType _superClass;
protected final JavaType[] _superInterfaces;
protected final TypeBindings _bindings;
}
注解处理器
我们可以使用注解处理器,在编译期间获取泛型真实类型,并保存到类文件中,详见 Java 注解:注解处理器获取泛型真实类型。
这个方法的本质也是“额外保存参数类型”,只不过方法不同罢了。
signature 属性
Java泛型的擦除并不是对所有使用泛型的地方都会擦除的,部分地方会保留泛型信息。比如 java.lang.reflect.Field 类中有一个 signature 属性保存了泛型的参数类型信息,通过 Field 的 getGenericType 方法即可得到。当然,这种方法仅限于类中的 属性,对于方法中的局部变量无能为力。
public final class Field extends AccessibleObject implements Member {
private transient String signature;
private String getGenericSignature() {return signature;}
public Type getGenericType() {
if (getGenericSignature() != null)
return getGenericInfo().getGenericType();
else
return getType();
}
}
运行时能够获取泛型参数类型,根源在于字节码中还是包含了这些信息的,对于下面这样一个类:
public class Pojo {
private String str;
private List intList;
private int i;
}
使用 javac Pojo.java 命令编译之后,使用 javap -verbose Pojo.class 命令查看其字节码信息,可以看到常量池中,紧跟 intList 属性存储的就是其 Signature。
Constant pool:
#1 = Methodref #3.#21 // java/lang/Object."":()V
#2 = Class #22 // Pojo
#3 = Class #23 // java/lang/Object
#4 = Utf8 str
#5 = Utf8 Ljava/lang/String;
#6 = Utf8 intList
#7 = Utf8 Ljava/util/List;
#8 = Utf8 Signature
#9 = Utf8 Ljava/util/List;
#10 = Utf8 i
#11 = Utf8 I
Field 可以获取到泛型参数信息,类似地 Class 也是可以的。下面直接上代码看如何获取吧。
示例: Field
public class Pojo {
private List intList;
}
public class Test {
public static void main(String[] args) throws NoSuchFieldException {
Field intListField = Pojo.class.getDeclaredField("intList");
Type genericType = intListField.getGenericType();
Class> parameterType = (Class>) ((ParameterizedType) genericType).getActualTypeArguments()[0];
System.out.println(parameterType);
}
}
执行以后,输出:
class java.lang.Integer
示例:Class
public abstract class AbsClass {
protected final Type _type;
public AbsClass() {
Type superClass = getClass().getGenericSuperclass();
_type = ((ParameterizedType) superClass).getActualTypeArguments()[0];
}
public Type getParameterizeType() {
return _type;
}
}
public class ParaClass extends AbsClass {
}
public class Test {
public static void main(String[] args) throws NoSuchFieldException {
ParaClass paraClass = new ParaClass();
System.out.println(paraClass.getParameterizeType());
}
}
执行以后,输出:
class java.lang.Long
这里 ParaClass 继承的是 AbsClass< Long>,而非 AbsClass< T>。于是,对 ParaClass.class 调用 getGenericSuperclass(),就可以进一步获取到 T 所绑定的 Long 类型。
有木有发现,这两个示例的共同点是,都用到了 ParameterizedType.getActualTypeArguments()[0] 这一句,因为泛型的参数类型也就是存在了这里。
参考文献