Java泛型

为什么需要泛型?

在Java1.5版本之前是没有泛型的。这时如果我们要实现一个Array类,它里面可以存储任何的对象,我们该怎样做呢?显然,我们可以通过多态来实现:

1
2
3
4
5
class Array {
void add(Object e);
// ....
Object get(int i);
}

因为Java中的对象都继承自Object,所以就可以往这个Array中添加任何的对象,并且取出任何的对象了。但是这样做会有很大的风险:

  • 我们取出的对象都是Object类型的,所以如果要使用这个对象就必须做一次强制转换,因为我们使用Collection框架的频率是很高的,所以这种转换就显得比较麻烦
  • 不安全,因为是Object,所以我们可以往里面放任何的对象,比如Animal对象,Plant对象,Plane对象,这样如果我们在调用Array中对象的方法时就可能Crash

第二点对于Java这种追求安全性的语言来说,显然是不可以接受的,所以就出现了泛型。

泛型的基本用法

泛型类

我们可以定义一个泛型的类,具体的方法如下:

1
2
3
4
5
class Pair<T> {
T first;
T second;
// ....
}

这样在我们创建对象的时候就可以使用Pair<Integer> pair = new Pair<Integer>(),这样我们就可以明确的指出这里的Pair中存放的就是Integer类型的对象,其它对象如果要放到Pair中编译器就会报错,这样就在很大程度上增加了安全性。并且在取出的时候也不必再进行一次强制转换了。
如果某个类中有多个泛型,那么这些泛型用,好分割开就好了。public class Pair<T, U> { . . . }一般我们会用大写字母来表示泛型的元素,在Java框架中E用来表示一个元素,KV用来表示一个table的key value值。

同样,我们可以定义一个泛型的方法,比如:

1
2
3
4
5
class ArrayAlg {
public static <T> T getMiddle(T... a) {
return a[a.length / 2];

}

注意这个泛型的方法并不是在泛型类中的,而是在普通的Java类中的,当然,它也可以被定义在泛型类中。

调用的时候不需要进行强制转换:

1
2
String middle = ArrayAlg.getMiddle("John", "Q.", "Public");
double middle = ArrayAlg.getMiddle(3.14, 1729, 0);

在第二个例子中我们传入的参数是原始数据类型,这时编译器会给我们自动打包,在从类中取出的时候编译器会给我们自动的拆包。

泛型的界

有时候我们需要对输入的参数做一些限制,比如说要好处两个数值中较小的一个,那么我们就要求进入方法的参数是实现了Comparable接口的,或者是某个类的子类,这样我们就可以做如下的限制,来让泛型有界:

1
public static <T extends Comparable> T min(T[] a) . . .

如果某个类型没有实现Comparable接口的话,让它作为参数会产生一个编译期的警告,在运行时就会Crash。如果一个泛型需要限制很多个接口的话,那么很多个接口之间用,隔开(但是这其中只能有一个是对类的限制,并且如果有对类的限制,那么这个限制一定要写在第一个的位置)。

泛型和JVM

在Java虚拟机中是没有任何泛型类的,所有的对象都是普通的Java类。其实泛型只是一种给程序员的一个假象,用来方便程序员写出安全语言的一种手段,在编译完之后编译器会对泛型实行一次擦除的过程。也就是说,当你定义一个泛型的时候,系统会自动给你创建一个原始类型给你。原始类型变量的名字和泛型时候取的名字是一样的,但是泛型类型的参数类型被移除了。这些类型被移除之后,取而代之的是它们的边界类型(如果没有边界,那么它的边界就是Object,这也是为了和Java之前的版本做兼容。这也就是上文提到的,为什么对于原始数据类型有一个装包和拆包的过程)。比如,如果你创建上文中的Pair<T>,在编译之后Pair类就成了下面的样子:

1
2
3
4
5
6
7
8
9
public class Pair {
private Object first; private Object second;
public Pair(Object first, Object second) {
this.first = first;
this.second = second; }
public Object getFirst() { return first; }
public Object getSecond() { return second; }
public void setFirst(Object newValue) { first = newValue; }
public void setSecond(Object newValue) { second = newValue; } }

这其实和没有泛型时候创建的类是一样的了。

这里有一个特殊情况,如果有两个限制,那么会以第一个限制为准:

1
2
3
4
5
6
7
8
public class Interval<T extends Comparable & Serializable> implements Serializable {
private T lower;
private T upper;
...
public Interval(T first, T second) {
if (first.compareTo(second) <= 0) { lower = first; upper = second; }
else { lower = second; upper = first; } }
}

这时Interval的基本类型就是:

1
2
3
4
5
6
public class Interval implements Serializable {
private Comparable lower;
private Comparable upper;
...
public Interval(Comparable first, Comparable second) { . . . }
}

这种情况下,如果第一种类型要转化为第二种类型的时候编译器会自动的加上强制转换。

例如:

1
2
Pair<Employee> buddies = . . .;
Employee buddy = buddies.getFirst();

因为在编译期进行了类型擦除,所以在调用buddies.getFirst()的时候返回的是一个Object,所以编译器就自动添加了一层强制转换。

泛型方法的翻译

上文提到过泛型会被编译器在编译的阶段进行擦除,并且将边界替换为泛型的类型。这种泛型的擦除同时也带来了复杂性,比如下面的例子:

1
2
3
4
5
6
class DateInterval extends Pair<LocalDate> {
public void setSecond(LocalDate second) {
if (second.compareTo(getFirst()) >= 0) super.setSecond(second);
}
//...
}

因为我们要保证Pair中的第二个元素要始终不小于第一个元素,所以我们就继承了Pair,并且重写了其setSecond方法,这样经过泛型的擦除,最后将会变为:

1
2
3
4
5
class DateInterval extends Pair // after erasure 
{
public void setSecond(LocalDate second) { . . . }
//...
}

而原来的Pair类中的setSecond方法是这样子的:

1
public void setSecond(Object second)

很显然,这是两个不同的方法,然而我们不想让它们是不同的方法,我们想让它走我们新写的方法,因为我们在这里面新增加了我们自己的业务逻辑,比如下面的方法:

1
2
DateInterval interval = new DateInterval(. . .); Pair<LocalDate> pair = interval; // OK--assignment to superclass
pair.setSecond(aDate);

在这里很显然,我们想走我们新的方法,这时编译器其实会在我们的参数为Object的方法里面重新调用我们新写的方法:

1
2
3
public void setSecond(Object second) {
setSecond((Date) second);
}

也就是这种转换让系统调用到了我们新写的方法。这样就可以始终调用到我们自己的方法里面了。

Java泛型中需要注意的问题

不能使用基本数据类型作为泛型类的初始化参数

因为Java泛型在编译完之后就被擦除了,泛型类的属性都会变成Object类型,所以就不能传入基本数据类型作为参数,必须使用与基本数据类型所对应的Java类。还好Java中只有八中类型的基本数据类型。

Runtime类型检查不起作用

1
2
3
4
5
6
7
8
if (stringPair instanceof Pair<String>){

//....
}
if (stringPair instanceof Pair<T>){
//...

}

上面的两种运行时的类型检查会报错,因为在编译完之后Pair<String>就不存在了,Pair就变成了属性为String类型的类,所以这种判断错误的,也不能通过编译。但是如果使用泛型类创建了一个对象,然后再判断对象的类型,那么就是可行的。比如:

1
2
3
4
5
6
Pair<String> stringPair = new Pair<>();
Pair<Double> doublePair = new Pair<>();
if (stringPair.getClass() == doublePair.getClass()){

System.out.println("StringPair and DoublePair is equal");
}

这时是可以判断成功的,他们都是一个Pair类,只不过这个类属性的类型不一样。

不能使用参数类型来创建Array

泛型引入就是为了增加语言的安全性,如果没有泛型,那么对于Collection框架,在进行类型转化的时候很容易出现java.lang.ClassCastException这种类型的异常。泛型在设计的时候有一条原则:

如果一段代码在编译时没有提出“[unchecked] 未经检查的转换”警告,则程序在运行时不会引发ClasscastException异常

所以,如果

1
2
Pair<String>[] p=new Pair<String>[10]; //1 这段代码实际是不能通过编译的
Object[] objs=p; //2

这里,如果第一行的代码被允许,那么根据数组的特性,第二行的代码也是被允许的,并且不会有警告。这样一来我们就可以给objs数组里面添加任意的对象了,并且不会有任何警告,这显然是与泛型的设计原则相违背的。如果这时非要使用数组来存储泛型,那么可以使用ArrayList:

1
ArrayList<Pair<String>> myArrayList = new ArrayList<>();

为什么ArrayList可以呢?因为将Pair<String>类型的ArrayList转换为Object类型的ArrayList在编译期就会报错,这就保证了安全性。

可变参数警告

如果一个方法是可变参数的,并且其类型是泛型,那么Java虚拟机就不得不创建一个泛型数组,这与上一条约定是矛盾的,但这时JVM会放松对泛型的限制,只不过会抛出一个警告uncheck的警告:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
private static void testFour(){

Collection<Pair<String>> table = null;
Pair<String> pair1 = new Pair<>();
Pair<String> pair2 = new Pair<>();
addAll(table,pair1,pair2);
}

private static <T> void addAll(Collection<T> collection, T... ts){

for(T t:ts) {
collection.add(t);
}
}

这时会抛出一个Unchecked generics array creation for varargs parameters 这个警告,这时有两种解决方案。首先可以再addAll方法的上面加上@SafeVarargs的注解或者在调用方testFour的上面加上@SuppressWarnings('unchecked')注解。

不能初始化泛型变量

也就是说在泛型类中,如果一个变量是泛型的,那么不能直接对其进行初始化,比如在构造方法中:

1
2
3
4
5
public Pair() {

first = new T();
second = new T();
}

这样的写法是通不过编译的,因为泛型在编译完成之后泛型就被擦除了,就变成了Object,如果真的可以初始化,那么这个Pair类在初始化之后它的first和second的初始值就是Object了。这显然不是我们期望的,所以不能对泛型属性进行实例化。如果真的想在初始化时候就实例化,那么可以提供一个静态初始化方法,然后将属性的类传进来:

1
2
3
4
5
6
7
8
public static <T> Pair<T> makePair(Class<T> cl) {

try {
return new Pair<>(cl.newInstance(),cl.newInstance());
}catch (Exception x) {
return null;
}
}

泛型类中的静态环境中不允许使用类型变量

比如下面的泛型类:

1
2
3
4
5
6
7
8
9
10
public class Singleton<T> {

private static T singleInstance;
public static T getSingleInstance() {
if(singleInstance == null) {
// 初始化singleInstance
}
return singleInstance;
}
}

上面的公用泛型类是不能通过编译的,因为在泛型被擦除之后就变成了Object,那么这个即使这个Singleton可以使static变量,那么也只能创建一个对象,而不能作为单例的公用方法。为什么不能将泛型声明为stati呢?因为泛型是要在对象创建的时候才知道是什么类型的,而对象创建的代码执行先后顺序是:static的部分,然后才是构造函数等等。所以在对象初始化之前static的部分已经执行了,如果你在静态部分引用的泛型,那么毫无疑问虚拟机根本不知道是什么东西,因为这个时候类还没有初始化。

不能抛出或者捕获泛型类对象

泛型类不能extend Throwable,同时不能Catch住泛型,比如:

1
2
3
public class Problem<T> extends Exception {
//...
}

以及:

1
2
3
4
5
6
7
public static <T extends Throwable> void doWork(Class<T> t){
try{
doWork();
}catch (T e){
Logger.global.info(...);
}
}

这些都是不能通过编译的。之所以要这样设计,我猜测是不利于异常的处理,因为我们在泛型类里已经捕获到了异常,当我们调用泛型类的时候,即使报错了,我们也不知道,因为底层的泛型类已经将错误吞掉了,这样不利于对具体的业务做相应的处理。所以,如果我们把错误抛出来,那么就会好很多,比如下面这种做法就是可行的:

1
2
3
4
5
6
7
8
9
10
public static <T extends Throwable> void doWork(T t) throw T {

try {

doWork();
}catch(Throwable realCause){
t.initCause(realCause);
throw t;
}
}

这样使用泛型类的Client端就可以根据业务的需要做相应的处理了。

泛型擦除之后可能引起冲突

泛型在擦除之后是Object,所以在定义某些泛型方法的时候要注意,在泛型变为Object的时候是不是会引起和原来的方法引起冲突。比如:

1
2
3
4
5
6
7
public class Pair<T> {
public boolean equals(T value) {

return first.equals(value) && second.equals(value);
//...
}
}

这样在泛型被擦除之后boolean equals(T)就变为了boolean equals(Object),这个方法其实和Object的equals(Object)方法是一样的,所以就引起了冲突。

其它

在遗留代码中往往有非泛型的类,这时,如果用一个泛型类去接,那么往往会产生一个警告,比如:

1
Dictionary<Integer, Components> labelTable = slider.getLabelTable(); // Warning

这时如果你检查了labelTable中数据的类型,并且确定了其中的key value为IntegerComponents,那么就可以使用@SuppressWarnings("unchecked")来忽略这个警告。

1
2
@SuppressWarnings("unchecked")
Dictionary<Integer, Components> labelTable = slider.getLabelTable(); // No warning

当然也可以在外层的方法上添加。

参考内容

  1. https://www.zhihu.com/question/20400700
  2. http://blog.csdn.net/claram/article/details/51943742
  3. http://blog.csdn.net/yj_fq/article/details/44590285
  4. Java核心卷1