泛型(Generics)是强类型编程语言中经常使用的一种技术。很多框架的代码中都会大量使用到泛型,比如在Java中我们经常看到的:
List<String> strList = new ArrayList<String>();
List<Double> doubleList = new LinkedList<Double>();
在这段代码中,ArrayList
就是一个泛型类,List
就是一个泛型接口类,他们提供给开发者一个放置不同类型的集合容器,我们可以向这个集合容器中添加String
、Double
以及其他各类数据类型。无论内部存储的是什么类型,集合容器提供给开发者的功能都是相同的,比如添加add
,get
等。有了泛型,我们就没必要创建StringArrayList
、DoubleArrayList
等集合了,否则代码量太大,维护起来成本极高。
在Java中,泛型一般有三种使用方式:泛型类,泛型方法和泛型接口类。一般使用尖括号<>
来接收泛型参数。
假如我们自己定义一个支持泛型的MyArrayList
,这个列表类可以简单支持初始化和数据写入。只要在类名后面加上
就可以让这个类支持泛型,类内部的一些属性和方法都可以使用泛型类型T
。当然我们给这个类也可以添加多个泛型参数,比如
,
等。在类中设置泛型会作用到整个类上。
public class MyArrayList<T> {
private int size;
T[] elements;
public MyArrayList(int capacity) {
this.size = capacity;
this.elements = (T[]) new Object[capacity];
}
public void set(T element, int position) {
elements[position] = element;
}
@Override
public String toString() {
String result = "";
for (int i = 0; i < size; i++) {
result += elements[i].toString();
}
return result;
}
public static void main(String[] args){
MyArrayList<String> strList = new MyArrayList<String>(2);
strList.set("first", 0);
strList.set("second", 1);
System.out.println(strList.toString());
}
}
我们也可以从父类中继承并扩展泛型,比如Flink源码中有这样一个类定义,子类继承了父类的T
,同时自己增加了泛型KEY
:
public class KeyedStream<T, KEY> extends DataStream<T> {
...
}
Java泛型接口类的定义和Java泛型类基本相同。下面的代码展示了List
接口中定义subList
方法,该方法截取原来列表的一部分。
public interface List<E> {
...
public List<E> subList(int fromIndex, int toIndex);
}
继承并实现这个接口类的代码如下:
public class ArrayList<E> implements List<E> {
...
public List<E> subList(int fromIndex, int toIndex) {
subListRangeCheck(fromIndex, toIndex, size);
return new SubList(this, 0, fromIndex, toIndex);
}
}
泛型方法可以存在于泛型类(包括接口类)中,也可以存在于普通的类中。
public class MyArrayList<T> {
...
// public关键字和返回值E之间的表明这是一个泛型方法
// 泛型方法中的类型E和泛型类中的类型T可以不一样
public <E> E processElement(E element) {
...
return E;
}
}
从上面的代码示例可以看出,public
或private
关键字和方法返回值之间的尖括号
表示这是一个泛型方法。泛型方法的类型E和泛型类中的T可以不一样,或者说,如果泛型方法是泛型类的一个成员,泛型方法既可以继续使用类中的T,也可以自己定义新的类型E。
除了用
表示泛型外,还有 >
这种形式。>
被称为通配符,用来适应各种不同的泛型。
对Java的泛型总结下来发现,虽然它的语法有时候让人有些眼花缭乱,其本质是为了接受不同的数据类型,增强代码的复用性。
我们可以在一个类里使用多个泛型,每个泛型一般使用大写字母表示。Java为此提供了一些大写字母使用规范:
Java的泛型给开发者提供了不少便利,尤其是保证了底层代码简洁性,因为这些底层代码通常被封装为一个框架,会有各种各样的上层应用调用这些底层代码进行特定的业务处理,每次调用都可能涉及泛型问题。比如,大数据框架Spark和Flink中都需要开发者基于泛型进行数据处理。
以上只对泛型做了一个简单的介绍,实际上在具体使用时还有一些细节需要注意。
Java的泛型有一个遗留问题,那就是类型擦除(Type Erasure)。我们先看一下下面的代码:
Class<?> strListClass = new ArrayList<String>().getClass();
Class<?> intListClass = new ArrayList<Integer>().getClass();
// 输出:class java.util.ArrayList
System.out.println(strListClass);
// 输出:class java.util.ArrayList
System.out.println(intListClass);
// 输出:true
System.out.println(strListClass.equals(intListClass));
虽然声明时我们分别使用了String
和Integer
,但运行时关于泛型的信息被擦除了,我们无法区别strListClass
和intListClass
这两个类型。这是因为,泛型信息只存在于代码编译阶段,当程序运行到JVM上时,与泛型相关的信息会被擦除掉。类型擦除对于绝大多数应用系统开发者来说关系不太大,但是对于一些框架开发者来说,必须要注意。比如,Spark和Flink的开发者都使用了一些办法来解决类型擦除问题,对于API调用者来说,受到的影响不大。
对Java的泛型有了基本了解后,我们接着来了解一下Scala中的泛型。相比而言,Scala的类型系统更复杂,本文只介绍一些简单语法,帮助读者能够读懂一些源码。
Scala中,泛型放在了中括号[]
中。或者我们可以简单地理解为,原来Java的泛型类
,现在改为[T]
即可。
我们创建一个Stack[T]
的泛型类,并实现了两个简单的方法,类中各成员和方法都可以使用泛型T。我们也定义了泛型方法,形如isStackPeekEquals[T]
,方法中可以使用泛型T。
object MyStackDemo {
// Stack泛型类
class Stack[T] {
private var elements: List[T] = Nil
def push(x: T) { elements = x :: elements }
def peek: T = elements.head
}
// 泛型方法,检查两个Stack顶部是否相同
def isStackPeekEquals[T](p: Stack[T], q: Stack[T]): Boolean = {
p.peek == q.peek
}
def main(args: Array[String]): Unit = {
val stack = new Stack[Int]
stack.push(1)
stack.push(2)
println(stack.peek)
val stack2 = new Stack[Int]
stack2.push(2)
val stack3 = new Stack[Int]
stack3.push(3)
println(isStackPeekEquals(stack, stack2))
println(isStackPeekEquals(stack, stack3))
}
}
本文简单介绍了Java/Scala的泛型,它允许数据类型是可变,提升了代码的复用性,是很多框架都会采用的技术,开发者非常有必要了解泛型的基本用法。