泛型实现参数化类型的概念,使代码可以应用于多种类型,解除类或方法与所使用的类型之间的约束。在JDK 1.5开始引入了泛型,但Java实现泛型的方式与C++或C#差异很大。在平常写代码用到泛型时,仿佛一切都来得如此理所当然。但其实Java泛型还是有挺多tricky的东西的,编译器在背后为我们做了很多事。下面我们来看看有关Java泛型容易忽视的点。
什么是协变?举个例子。
class Fruit{}
class Apple extends Fruit{}
Fruit[] fruit = new Apple[10]; // OK
子类数组可以赋给父类数组的引用。但泛型是不支持这种协变的。
ArrayList flist = new ArrayList(); // 无法通过编译
但我们可以使用通配符来解决
ArrayList extends Fruit> flist = new ArrayList();// 使用通配符解决协变问题
List extends Fruit> flist = Arrays.asList(new Apple());
Apple a = (Apple)flist.get(0); // No warning
flist.contains(new Apple()); // Argument is ‘Object’
flist.indexOf(new Apple()); // Argument is ‘Object’
//flist.add(new Apple()); 无法编译
List extends Fruit>
表示某种特定类型 ( Fruit 或者其子类 ) 的 List,但是编译器并不关心(不知道)这个实际的具体类型到底是什么。值得注意的是,这并不意味着这个List可以持有Fruit的任意类型!
由于List的具体类型是并不确定的,而且Java泛型是不支持协变的,因此带有泛型类型参数的方法都无法正常调用。比如add(T item);
,即使是传Object也无法通过编译。
但对于返回类型是泛型的方法,比如T get(int index);
,返回值类型与上界类型一样。如上面示例代码调用的flist.get(0)
返回值就是Fruit类型的。
static void add(List super Apple> list) {
// list.add(new Fruit()); // 无法编译
Object object = list.get(0);// pass
}
代码中的
List super Apple> list
表明list持有的类型是Apple的父类类型,但与上界通配符类似,这并不意味list可以持有Apple任意的子类类型的对象,编译器并不知道list具体的类型是什么。因此,list.add(new Fruit());
就不能编译了。
List> list
表示 list
是持有某种特定类型的 List,但是不知道具体是哪种类型。而单独的 List list
,也就是没有传入泛型参数,表示这个 list 持有的元素的类型是 Object
。
所谓的擦除,仅仅是对方法的Code属性中的字节码(也就是方法内的逻辑代码)进行擦除,实际上元数据(类和接口的声明,类字段的声明)中还是保留了泛型信息。
引用R大的话就是:
位于声明一侧的,源码里写了什么到运行时就能看到什么;
位于使用一侧的,源码里写什么到运行时都没了。
public class GenericClass<T> { // 1
private List list; // 2
private Map map; // 3
public U genericMethod(Map m) { // 4
List list = new ArrayList<>(); // 5
return null;
}
}
上面的代码中,注释1到注释4的T和U是保留在Class文件当中的,源码是什么,那么通过反射获取得到的就是什么。也就是说,在运行时,是无法获取到具体的T和U是什么类型的。
但运行时,在方法内部的局部变量的泛型信息是被全部擦除的。如上的注释5中的list的具体类型是无法在运行时获取到的。
当时今日头条的面试官问过我这个问题,我当时对泛型的认识比较浅薄,以为编译器会将所有的泛型信息擦除,那么运行时也就无能获取到具体的泛型类型了。但其实并不是这样,如上面介绍到,JDK1.5之后,Class的格式有变化,编译器会将声明的类,接口,方法的泛型信息保留到字节码当中。那么通过反射,这些信息还是可以获取到的。但要获取到具体的泛型类型,一般也只能获取到继承父类所使用的泛型类型。
比如:
public class SubClass extends Base<String> { }
那么Base所绑定的泛型类型可以被获取到的。对SubClass.class调用getGenericSuperclass
可以获取到T所绑定的类型。
Type type = SubClass.class.getGenericSuperclass();
Type targ = ((ParameterizedType) type).getActualTypeArguments()[0];
System.out.println(type); // SubClass
System.out.println(targ); // class java.lang.String
具体的用法可以参考Gson和Guice的源码:
https://github.com/google/guice/blob/abc78c361d9018da211690b673accb580a52abf2/core/src/com/google/inject/TypeLiteral.java#L94
https://github.com/google/gson/blob/master/gson/src/main/java/com/google/gson/internal/%24Gson%24Types.java
为了使Java的泛型方法生成的字节码与1.5以前的字节码相兼容,由编译期自己生成的方法。顾名思义,桥方法是一座桥,沟通着泛型与多态。
可以通过Method.isBridge()
方法来判断一个方法是否是桥接方法,在字节码中桥接方法会被标记为ACC_BRIDGE
和ACC_SYNTHETIC
。
public class Fruit<T> {
T value;
public T getValue() {
return value;
}
}
public class Apple extends Fruit<String> {
@Override
public String getValue() {
return "foo was call";
}
}
反编译生成的字节码:
public class Apple extends Fruit<java.lang.String> {
public Apple();
Code:
0: aload_0
1: invokespecial #1 // Method Fruit."":()V
4: return
public java.lang.String getValue();
Code:
0: ldc #2 // String calling
2: areturn
public java.lang.Object getValue();
Code:
0: aload_0
1: invokevirtual #3 // Method getValue:()Ljava/lang/String;
4: areturn
}
编译器为我们自动生成了有一个桥方法,这个桥方法返回类型为Object,内部调用了我们自定义的另一个getValue方法。
在Java代码中,方法的特征签名只包括方法名称,参数顺序和参数类型,而字节码中的特征签名还包括方法返回值和受查异常表。因此,桥方法public Object getValue()
与public String getValue()
是可以被JVM区分而在同一个Class文件中共存的。
由于编译期泛型擦除机制,在父类中带泛型参数的方法会被替换成Object类型。要让子类重写父类带泛型参数的方法,需要通过桥方法直接复写父类的方法,然后桥方法再调用子类自定义的方法,就以上面作为例子,子类Apple中的桥方法public Object getValue()
直接override父类Fruit的public Object getValue()
,然后桥方法内部再调用子类Apple的public String getValue()
。因此,Java利用桥方法在保证多态机制不被破坏情况下实现了泛型。