目录:
1、泛型基础
1.1、c++模板和java泛型的异同
1.2、java泛型的好处
2、类型擦除
3、泛型的实现原理
3.1、保证类型安全
3.2、实现自动类型转换
4、泛型中的继承关系
5、泛型使用中的注意点
5.1、运行时类型查询
5.2、异常中使用泛型的问题
5.3、不允许创建泛型类数组
5.3、泛型类中的静态方法和静态变量
5.3、类型擦除后的冲突
参考文章
和C++以模板来实现静多态不同,Java基于运行时支持选择了泛型,两者的实现原理大相庭径。C++可以支持基本类型作为模板参数,Java却只能接受类作为泛型参数;Java可以在泛型类的方法中取得自己泛型参数的Class类型,C++只能由编译器推断在不为人知的地方生成新的类,对于特定的模板参数你只能使用特化。在本文中我主要想聊聊泛型的实现原理和一些高级特性。
C++ template是reified generic,Java generic用的是type erasure。
C++是在call site做instantiate type,Java是在call site插入cast。
C++ template在call site可以做inline,Java generic因为并没有在call site生成代码所以不行。
C++在runtime没有额外的开销,Java在runtime有cast的开销。
C++的每个reified generic type都有一份独立的代码,Java只有一份type erased之后的代码
C++的type check是在编译时做的,Java的type check在编译期和运行期都要做一些工作。
总的来说C++的template会生成更大的二进制代码,但会执行的比较快,但大个的二进制代码可能会导致更多的I/O,所以也不一定完全是优势。
Java生成的代码只有一份,运行时会有一些type cast开销,但可以在运行时支持新类型,比如用ClassLoader动态加载进来的类。
泛型是对Java语言类型系统的一种扩展,有点类似于C++的模板,其实可以把类型参数看作是使用参数化类型时指定的类型的一个占位符。引入泛型,是对Java语言一个较大的功能增强,带来了很多的好处:
类型安全。类型错误现在在编译期间就被捕获到了,而不是在运行时当作java.lang.ClassCastException展示出来,将类型检查从运行时挪到编译时有助于开发者更容易找到错误,并提高程序的可靠性
消除了代码中许多的强制类型转换,增强了代码的可读性
为较大的优化带来了可能
泛型是什么并不会对一个对象实例是什么类型的造成影响,所以,通过改变泛型的方式试图定义不同的重载方法是不可以的。剩下的内容我不会对泛型的使用做过多的讲述,泛型的通配符等知识请自行查阅。
在进入下面的论述之前我想先问几个问题:
正确理解泛型概念的首要前提是理解类型擦除(type erasure)。 Java中的泛型基本上都是在编译器这个层次来实现的。在生成的Java字节代码中是不包含泛型中的类型信息的。使用泛型的时候加上的类型参数,会被编译器在编译的时候去掉。这个过程就称为类型擦除。如在代码中定义的List
很多泛型的奇怪特性都与这个类型擦除的存在有关,包括:
类型擦除的基本过程也比较简单,首先是找到用来替换类型参数的具体类。这个具体类一般是Object。如果指定了类型参数的上界的话,则使用这个上界。把代码中的类型参数都替换成具体的类。同时去掉出现的类型声明,即去掉<>的内容。比如T get()方法声明就变成了Object get();List
因为种种原因,Java不能实现真正的泛型,只能使用类型擦除来实现伪泛型,这样虽然不会有类型膨胀(C++模板令人困扰的难题)的问题,但是也引起了许多新的问题。所以,Sun对这些问题作出了许多限制,避免我们犯各种错误
首先第一个是泛型所宣称的类型安全,既然类型擦除了,如何保证我们只能使用泛型变量限定的类型呢?java编译器是通过先检查代码中泛型的类型,然后再进行类型擦除,在进行编译的。那类型检查是针对谁的呢,让我们先看一个例子。
ArrayList arrayList1=new ArrayList(); // 正确,只能放入String
ArrayList arrayList2=new ArrayList(); // 可以放入任意Object
这样是没有错误的,不过会有个编译时警告。不过在第一种情况,可以实现与 完全使用泛型参数一样的效果,第二种则完全没效果。因为,本来类型检查就是编译时完成的。new ArrayList()只是在内存中开辟一个存储空间,可以存储任何的类型对象。而真正涉及类型检查的是它的引用,因为我们是使用它引用arrayList1 来调用它的方法,比如说调用add()方法。所以arrayList1引用能完成泛型类型的检查。 而引用arrayList2没有使用泛型,所以不行。
类型检查就是针对引用的,谁是一个引用,用这个引用调用泛型方法,就会对这个引用调用的方法进行类型检测,而无关它真正引用的对象。
因为类型擦除的问题,所以所有的泛型类型变量最后都会被替换为原始类型。这样就引起了一个问题,既然都被替换为原始类型,那么为什么我们在获取的时候,不需要进行强制类型转换呢?
public class Test {
public static void main(String[] args) {
ArrayList list=new ArrayList();
list.add(new Date());
Date myDate=list.get(0);
}
}
编译器生成的class文件中会在你调用泛型方法完成之后返回调用点之前加上类型转换的操作,比如上文的get函数,就是在get方法完成后,jump回原本的赋值操作的指令位置之前加入了强制转换,转换的类型由编译器推导。
先看一个例子:
class DateInter extends A {
@Override
public void setValue(Date value) {
super.setValue(value);
}
@Override
public Date getValue() {
return super.getValue();
}
}
先来分析setValue方法,父类的类型是Object,而子类的类型是Date,参数类型不一样,这如果实在普通的继承关系中,根本就不会是重写,而是重载。
public void setValue(java.util.Date); //我们重写的setValue方法
Code:
0: aload_0
1: aload_1
2: invokespecial #16 // invoke A setValue
:(Ljava/lang/Object;)V
5: return
public java.util.Date getValue(); //我们重写的getValue方法
Code:
0: aload_0
1: invokespecial #23 // A.getValue
:()Ljava/lang/Object;
4: checkcast #26
7: areturn
public java.lang.Object getValue(); //编译时由编译器生成的方法
Code:
0: aload_0
1: invokevirtual #28 // Method getValue:() 去调用我们重写的getValue方法
;
4: areturn
public void setValue(java.lang.Object); //编译时由编译器生成的方法
Code:
0: aload_0
1: aload_1
2: checkcast #26
5: invokevirtual #30 // Method setValue; 去调用我们重写的setValue方法
)V
8: return
并且,还有一点也许会有疑问,子类中的方法 Object getValue()和Date getValue()是同 时存在的,可是如果是常规的两个方法,他们的方法签名是一样的,也就是说虚拟机根本不能分别这两个方法。如果是我们自己编写Java代码,这样的代码是无法通过编译器的检查的,但是虚拟机却是允许这样做的,因为虚拟机通过参数类型和返回类型来确定一个方法,所以编译器为了实现泛型的多态允许自己做这个看起来“不合法”的事情,然后交给虚拟器去区别。
我们再看一个经常出现的例子。
class A {
Object get(){
return new Object();
}
}
class B extends A {
@Override
Integer get() {
return new Integer(1);
}
}
public static void main(String[] args){
A a = new B();
B b = (B) a;
A c = new A();
a.get();
b.get();
c.get();
}
反编译之后的结果:
17: invokespecial #5 // Method com/suemi/network/test/A."":()V
20: astore_3
21: aload_1
22: invokevirtual #6 // Method com/suemi/network/test/A.get:()Ljava/lang/Object;
25: pop
26: aload_2
27: invokevirtual #7 // Method com/suemi/network/test/B.get:()Ljava/lang/Integer;
30: pop
31: aload_3
32: invokevirtual #6 // Method com/suemi/network/test/A.get:()Ljava/lang/Object;
实际上当我们使用父类引用调用子类的get时,先调用的是JVM生成的那个覆盖方法,在桥接方法再调用自己写的方法实现。
泛型参数的继承关系
在Java中,大家比较熟悉的是通过继承机制而产生的类型体系结构。比如String继承自Object。根据Liskov替换原则,子类是可以替换父类的。当需要Object类的引用的时候,如果传入一个String对象是没有任何问题的。但是反过来的话,即用父类的引用替换子类引用的时候,就需要进行强制类型转换。编译器并不能保证运行时刻这种转换一定是合法的。这种自动的子类替换父类的类型转换机制,对于数组也是适用的。 String[]可以替换Object[]。但是泛型的引入,对于这个类型系统产生了一定的影响。正如前面提到的List
引入泛型之后的类型系统增加了两个维度:一个是类型参数自身的继承体系结构,另外一个是泛型类或接口自身的继承体系结构。第一个指的是对于 List
相同类型参数的泛型类的关系取决于泛型类自身的继承体系结构。即List
如果泛型类中包含多个类型参数,则对于每个类型参数分别应用上面的规则。理解了上面的规则之后,就可以很容易的修正实例分析中给出的代码了。只需要把List
个人认为这里对上面这种情形使用子类型这种说法来形容这种关系是不当的,因为List
// 错误,为类型擦除之后,ArrayList只剩下原始类型,泛型信息String不存在了,无法进行判断
if( arrayList instanceof ArrayList)
if( arrayList instanceof ArrayList>) // 正确
public static void doWork(Class t){
try{
...
}catch(T e){ //编译错误 T->Throwable,下面的永远不会被捕获,所以不被允许
...
}catch(IndexOutOfBounds e){
}
}
Pair[] table = new Pair[10];// 编译错误
Pair[] table = new Pair[10];// 无编译错误
由于数组必须携带自己元素的类型信息,在类型擦除之后,Pair
泛型类中的静态方法和静态变量不可以使用泛型类所声明的泛型类型参数。
public class Test2 {
public static T one; //编译错误
public static T show(T one){ //编译错误
return null;
}
}
因为泛型类中的泛型参数的实例化是在定义对象的时候指定的,而静态变量和静态方法不需要使用对象来调用。对象都没有创建,如何确定这个泛型参数是何种类型,所以当然是错误的。
class Pair {
public boolean equals(T value) {
return null;
}
}
方法重定义了,同时存在两个equals(Object o)。