【Java技术专题】「入门到精通系列教程」深入探索Java特性中泛型技术体系的原理和实战开发指南

深入探索Java特性中泛型技术体系的原理和实战开发指南

  • 前提介绍
  • 泛型的介绍
    • 泛型带来的好处
    • 泛型引发的问题
      • 错觉:泛型也可以实现多态
  • 泛型的特点
    • 类型擦除
      • 概念定义
      • 案例分析
      • 隐患问题
      • 开发要点
      • 类型擦除的过程
        • 案例代码
    • 实例分析
      • 类型转换问题
    • 通配符与上下界
      • 通配符
        • List的处理
        • 类型不确定问题
        • 抽象Object类型
        • 泛型上界
        • 类型系统
          • 多态的类型转换
          • 泛型无法实现多态
          • 两种类型的继承体系
            • 泛型类型转换继承规则
        • 开发自己的泛型类
        • 总结
        • 前提介绍

          开发人员在使用泛型时,常常会根据自己的直觉犯一些错误,本文旨在对 Java 泛型进行概括性说明,并提供一些帮助开发人员避免这些常见错误的建议。

          泛型的介绍

          Java泛型(generics)是JDK 5中引入的一项新特性,允许在定义类和接口时使用类型参数(type parameter)。声明的类型参数在使用时用具体的类型来替换。泛型最主要的应用是在JDK 5中的新集合类框架中。对于泛型概念的引入,开发社区的观点褒贬不一。

          泛型带来的好处

          从好的方面来说,泛型的引入可以解决之前集合类框架在使用过程中通常会出现的运行时类型错误问题,因为编译器可以在编译时发现很多明显的错误。然而,为了保证与旧有版本的兼容性,Java泛型的实现存在一些不够优雅的地方。这也是任何有历史的编程语言所需要承担的历史包袱。

          未来的版本更新将会解决早期设计缺陷所带来的问题。

          泛型引发的问题

          错觉:泛型也可以实现多态

          例如,如果一个方法接收 List 作为形式参数,尝试将一个 List 的对象作为实际参数传递进去,就会发现无法通过编译。

          尽管从直觉上来看,Object 是 String 的父类,这种类型转换应该是合理的,但实际上这会产生隐含的类型转换问题,因此编译器直接禁止这样的行为。

          泛型的特点

          在Java中,泛型基本上都是在编译器层次实现的。

          类型擦除

          概念定义

          正确理解泛型概念的首要前提是理解类型擦除(type erasure),在生成的Java字节代码中,不包含泛型中的类型信息。在使用泛型时加上的类型参数会在编译时被编译器去掉,这个过程称为类型擦除。

          案例分析

          例如,代码中定义的 List 和 List 等类型,在编译后都会变成 List。JVM看到的只是 List,而泛型附加的类型信息对JVM来说是不可见的。

          隐患问题

          Java编译器会在编译时尽可能地发现可能出错的地方,但仍无法避免在运行时出现类型转换异常的情况。类型擦除也是Java的泛型实现方式与C++模板机制实现方式之间的重要区别。

          开发要点

          很多泛型的特性要点都与这个类型擦除的存在有关,包括:

          • 泛型类并没有独立的 Class 类对象。例如,List.class 或 List.class 并不存在,只有 List.class 存在。

          • 静态变量是被泛型类的所有实例所共享的。对于声明为 MyClass 的类,访问其中的静态变量的方法仍然是 MyClass.myStaticVar。无论是通过 new MyClass 还是 new MyClass 创建的对象,它们都共享一个静态变量。

          • 泛型的类型参数不能用于 Java 异常处理的 catch 语句中。因为异常处理是由 JVM 在运行时刻进行的,而类型信息被擦除,JVM 无法区分两个异常类型 MyException 和 MyException。对于 JVM 来说,它们都是 MyException 类型的,因此无法执行与异常对应的 catch 语句。

          类型擦除的过程

          • 首先会找到用于替换类型参数的具体类,通常是 Object 类。如果指定了类型参数的上界,则使用该上界。
          • 然后将代码中的类型参数替换为具体类,并删除所有类型声明(即删除<>中的内容)。

          例如,T get() 方法声明将变为 Object get(),而 List 将变为 List。

          在此过程中,可能需要生成一些桥接方法(bridge method),因为擦除类型后的类可能缺少某些必要的方法。

          案例代码

          例如,考虑以下代码:

           class MyString implements Comparable<String> {
             public int compareTo(String str) { 
               return 0; 
             } 
           }
          

          当类型信息被擦除之后,上述类的声明变成了 class MyString implements Comparable。但是这样的话,类 MyString 就会有编译错误,因为没有实现接口Comparable 声明的 int compareTo(Object)方法。这个时候就由编译器来动态生成这个方法。

          实例分析

          了解了类型擦除机制后,就会明白编译器承担了全部的类型检查工作。编译器禁止某些泛型使用方式,正是为了确保类型的安全性。下面以 List 和 List 为例具体分析:

          public void inspect(List<Object> list) { 
           for (Object obj : list) { 
             System.out.println(obj); 
           } 
           list.add(1); //这个操作在当前方法的上下文是合法的
          }
          public void test() { 
           List<String> strs = new ArrayList<String>(); 
           inspect(strs); //编译错误
          }
          

          这段代码中,inspect方法接收List作为参数。如果在test方法中试图传入List,则会出现编译错误。

          类型转换问题

          假设这样的做法是允许的,那么在inspect方法中就可以通过list.add(1)来向集合中添加一个数字。这样在test方法看来,其声明为List的集合中却被添加了一个Integer类型的对象。这显然是违反类型安全原则的,某个时候肯定会抛出ClassCastException异常。

          因此,编译器禁止这样的行为。编译器会尽可能地检查可能存在的类型安全问题。对于确定是违反相关原则的地方,会给出编译错误。当编译器无法判断类型的使用是否正确时,会给出警告信息。

          通配符与上下界

          在使用泛型类的时候,既可以指定一个具体的类型,如 List就声明了具体的类型是String,也可以用通配符?来表示未知类型,如 List就声明了 List 中包含的元素类型是未知的。

          通配符

          通配符所代表的其实是一组类型,但具体的类型是未知的。List所声明的就是所有类型都是可以的。但是List并不等同于 List。

          List的处理

          List实际上确定了 List 中包含的是 Object 及其子类,在使用的时候都可以通过 Object 来进行引用。

          类型不确定问题

          • 类型唯一性:List则其中所包含的元素类型是不确定。其中可能包含的是 String,也可能是 Integer。如果它包含了 String的话,往里面添加 Integer 类型的元素就是错误的。

          • 实例声明未知:不能通过 new ArrayList()的方法来创建一个新的 ArrayList 对象。因为编译器无法知道具体的类型是什么。

          抽象Object类型

          但是对于 List中的元素确总是可以用 Object 来引用的,因为虽然类型未知,但肯定是Object 及其子类。考虑下面的代码:

          public void wildcard(List<?> list) {
           list.add(1);//编译错误
          }
          

          如上所示,试图对一个带通配符的泛型类进行操作的时候,总是会出现编译错误。其原因在于通配符所表示的类型是未知的。

          泛型上界

          因为对于 List中的元素只能用Object 来引用,在有些情况下不是很方便。在这些情况下,可以使用上下界来限制未知类型的范围。如 List 说明List中可能包含的元素类型是Number及其子类,而List则说明List中包含的是 Number 及其父类。

          当引入了上界之后,在使用类型的时候就可以使用上界类中定义的方法,比如访问 List的时候,就可以使用 Number类的 intValue 等方法。

          类型系统

          在Java中,大家比较熟悉的是通过继承机制而产生的类型体系结构,那就是多态特性。

          多态的类型转换

          比如,String继承自Object,根据 Liskov替换原则 ,子类是可以替换父类的。当需要Object类的引用的时候,如果传入一个String对象是没有任何问题的。但是反过来的话,即用父类的引用替换子类引用的时候,就需要进行强制类型转换。

          泛型无法实现多态

          编译器并不能保证运行时刻这种转换一定是合法的。这种自动的子类替换父类的类型转换机制,对于数组也是适用的。String[]可以替换Object[]。但是泛型的引入,对于这个类型系统产生了一定的影响。正如前面提到的List是 不能替换掉List的。

          两种类型的继承体系

          引入泛型之后的类型系统增加了两个维度:一个是类型参数自身的继承体系结构,另外一个是泛型类或接口自身的继承体系结构。

          1. List和List这样的情况,类型参数String是继承自 Object 的。
          2. List接口继承自Collection 接口。

          泛型类型转换继承规则

          • 相同类型参数的泛型类的关系取决于泛型类自身的继承体系结构,即List 是 Collection 的子类型, List 可以替换Collection。这种情况也适用于带有上下界的类型声明。

          • 当泛型类的类型声明中使用了通配符的时候,其子类型可以在两个维度上分别展开。

            • 对 Collection来说,其子类型可以在Collection这个维度上展开,即List和 Set等;
            • 在Number 这个层次上展开,即 Collection和 Collection等。如此循环下去,ArrayList和 HashSet等也都算是 Collection的子类型。
          • 如果泛型类中包含多个类型参数,则对于每个类型参数分别应用上面的规则。

          理解了上面的规则之后,就可以很容易的修正实例分析中给出的代码了。只需要把List改成 List即可。List是 List的子类型,因此传递参数时不会发生错误。

          开发自己的泛型类

          泛型类与一般的 Java 类基本相同,只是在类和接口定义上多出来了用<>声明的类型参数。一个类可以有多个类型参数,如 MyClass。 每个类型参数在声明的时候可以指定上界。所声明的类型参数在 Java 类中可以像一般的类型一样作为方法的参数和返回值,或是作为域和局部变量的类型。但是由于类型擦除机制,类型参
          数并不能用来创建对象或是作为静态变量的类型。考虑下面的泛型类中的正确和错误的用法。

          class ClassTest<X extends Number, Y, Z> { 
           private X x; 
           private static Y y; //编译错误,不能用在静态变量中 
           public X getFirst() {
           //正确用法 
           return x; 
           } 
           public void wrong() { 
             Z z = new Z(); //编译错误,不能创建对象 
           }
          }
          

          总结

          Java泛型为我们提供了一种更加类型安全和灵活的编程方式,但也需要我们在使用时注意其一些局限性和设计缺陷。

          • 建议在代码中避免泛型类和原始类型的混用,例如List和List不应该共同使用,因为这样会产生一些编译器警告和潜在的运行时异常。如果需要利用JDK 5之前开发的遗留代码,也应尽可能隔离相关的代码。

          • 在使用带通配符的泛型类时,需要明确通配符所代表的一组类型的概念。由于具体的类型是未知的,很多操作是不允许的。

          • 最好不要将泛型类与数组一起使用。虽然可以创建new List[10]这样的数组,但无法创建new List[10]这样的数组。这限制了数组的使用能力,而且会带来很多费解的问题。因此,在需要类似数组的功能时,建议使用集合类。

          • 请不要忽视编译器给出的警告信息,这些警告信息可能会指出代码中存在的潜在问题,及时修复可以避免后续出现更严重的问题。

          你可能感兴趣的:(#,【Java技术专题】,java,jvm,开发语言)