泛型是JDK 1.5的一项新特性,它的本质是参数化类型(Parameterized Type)的应用,也就是说所操作的数据类型被指定为一个参数。这种参数类型可以用在类、接口和方法的创建中,分别称为泛型类、泛型接口和泛型方法。
泛型思想早在C++语言的模板(Templates)中就开始生根发芽,在Java语言处于还没有出现泛型的版本时,只能通过Object是所有类型的 父类和类型强制转换两个特点的配合来实现类型泛化。例如在哈希表的存取中,JDK 1.5之前使用HashMap的get()方法,返回值就是一个Object对象,由于Java语言里面所有的类型都继承于 java.lang.Object,那Object转型成任何对象都是有可能的。但是也因为有无限的可能性,就只有程序员和运行期的虚拟机才知道这个 Object到底是个什么类型的对象。在编译期间,编译器无法检查这个Object的强制转型是否成功,如果仅仅依赖程序员去保障这项操作的正确性,许多 ClassCastException的风险就会被转嫁到程序运行期之中。
泛型技术在C#和Java之中的使用方式看似相同,但实现上却有 着根本性的分歧,C#里面泛型无论在程序源码中、编译后的IL中(Intermediate Language,中间语言,这时候泛型是一个占位符)或是运行期的CLR中都是切实存在的,List<int>与 List<String>就是两个不同的类型,它们在系统运行期生成,有自己的虚方法表和类型数据,这种实现称为类型膨胀,基于这种方法实现 的泛型被称为真实泛型。
Java语言中的泛型则不一样,它只在程序源码中存在,在编译后的字节码文件中,就已经被替换为原来的原生类型 (Raw Type,也称为裸类型,也即没有了后面的参数)了,并且在相应的地方插入了强制转型代码,因此对于运行期的Java语言来说,ArrayList<int>与 ArrayList<String>就是同一个类。所以说泛型技术实际上是Java语言的一颗语法糖,Java语言中的泛型实现方法称为类型 擦除,基于这种方法实现的泛型被称为伪泛型。
也就是说Java中的泛型是个假泛型,仅仅只是在编译器那边做了语法检查而已,和C#里的泛型不一样的。
基本上,不管你在List<>里面写什么类型,编译通过了以后运行时全部都是Object。
代码清单10-2是一段简单的Java泛型例子,我们可以看一下它编译后的结果是怎样的?
代码清单 10-2 泛型擦除前的例子
Java代码
- public static void main(String[] args) {
- Map<String, String> map = new HashMap<String, String>();
- map.put("hello", "你好");
- map.put("how are you?", "吃了没?");
- System.out.println(map.get("hello"));
- System.out.println(map.get("how are you?"));
- }
代码清单 10-3 泛型擦除后的例子
Java代码
- public static void main(String[] args) {
- Map map = new HashMap();
- map.put("hello", "你好");
- map.put("how are you?", "吃了没?");
- System.out.println((String) map.get("hello"));
- System.out.println((String) map.get("how are you?"));
- }
(注1:原文:http://www.anyang-window.com.cn/quotthis-is-not-a-genericquot-bruce-eckel-eyes-of-the-generic-java/)
当时众多的批评之中,有一些是比较表面的,还有一些从性能上说泛型会由于强制转型操作和运行期缺少针对类型的优化等从而导致比C#的泛型慢一些,则是完 全偏离了方向,姑且不论Java泛型是不是真的会比C#泛型慢,选择从性能的角度上评价用于提升语义准确性的泛型思想,就犹如在讨论刘翔打斯诺克的水平与 丁俊晖有多大的差距一般。但笔者也并非在为Java的泛型辩护,它在某些场景下确实存在不足,笔者认为通过擦除法来实现泛型丧失了一些泛型思想应有的优 雅,例如下面代码清单10-4的例子:
代码清单 10-4 当泛型遇见重载 1
Java代码
- public class GenericTypes {
- public static void method(List<String> list) {
- System.out.println("invoke method(List<String> list)");
- }
- public static void method(List<Integer> list) {
- System.out.println("invoke method(List<Integer> list)");
- }
- }
代码清单 10-5 当泛型遇见重载 2
Java代码
- public class GenericTypes {
- public static String method(List<String> list) {
- System.out.println("invoke method(List<String> list)");
- return "";
- }
- public static int method(List<Integer> list) {
- System.out.println("invoke method(List<Integer> list)");
- return 1;
- }
- public static void main(String[] args) {
- method(new ArrayList<String>());
- method(new ArrayList<Integer>());
- }
- }
Java代码
- invoke method(List<String> list)
- invoke method(List<Integer> list)
(注 2:测试的时候请使用Sun JDK的Javac编译器进行编译,其他编译器,如Eclipse JDT的ECJ编译器,仍然可能会拒绝编译这段代码,ECJ编译时会提示“Method method(List<String>) has the same erasure method(List<E>) as another method in type GenericTypes”。)
代码清单10-5中的重载当然不是根据返回值来确定的,之所以这次能编译和执行成功,是因为两个 mehtod()方法加入了不同的返回值后才能共存在一个Class文件之中。第6章介绍Class文件方法表(method_info)的数据结构时曾 经提到过,方法重载要求方法具备不同的特征签名,返回值并不包含在方法的特征签名之中,所以返回值不参与重载选择,但是在Class文件格式之中,只要描 述符不是完全一致的两个方法就可以共存。也就是说两个方法如果有相同的名称和特征签名,但返回值不同,那它们也是可以合法地共存于一个Class文件中 的。
由于Java泛型的引入,各种场景(虚拟机解析、反射等)下的方法调用都可能对原有的基础产生影响和新的需求,如在泛型类中如何获取传 入的参数化类型等。所以JCP组织对虚拟机规范做出了相应的修改,引入了诸如Signature、LocalVariableTypeTable等新的属 性用于解决伴随泛型而来的参数类型的识别问题,Signature是其中最重要的一项属性,它的作用就是存储一个方法在字节码层面的特征签名 ,这个属性中保存的参数类型并不是原生类型,而是包括了参数化类型的信息。修改后的虚拟机规范 要求所有能识别49.0以上版本的Class文件的虚拟机都要能正确地识别Signature参数。
(注3:在《Java虚拟机规范第二版》 (JDK 1.5修改后的版本)的“§4.4.4 Signatures”章节及《Java语言规范第三版》的“§8.4.2 Method Signature”章节中分别都定义了字节码层面的方法特征签名,以及Java代码层面的方法特征签名,特征签名最重要的任务就是作为方法独一无二不可 重复的ID,在Java代码中的方法特征签名只包括了方法名称、参数顺序及参数类型,而在字节码中的特征签名还包括方法返回值及受查异常表,本书中如果指 的是字节码层面的方法签名,笔者会加入限定语进行说明,也请读者根据上下文语境注意区分。)
从上面的例子可以看到擦除法对实际编码带来的影 响,由于List<String>和List<Integer>擦除后是同一个类型,我们只能添加两个并不需要实际使用到的返回 值才能完成重载,这是一种毫无优雅和美感可言的解决方案。同时,从Signature属性的出现我们还可以得出结论,擦除法所谓的擦除,仅仅是对方法的 Code属性中的字节码进行擦除,实际上元数据中还是保留了泛型信息,这也是我们能通过反射手段取得参数化类型的根本依据。
###同时值得注意的是:泛型与继承的关系
例如:
public void inspect(List<Object> list)这段代码中,inspect方法接受List<Object>作为参数,当在test方法中试图传入List<String>的 时候,会出现编译错误。假设这样的做法是允许的,那么在inspect方法就可以通过list.add(1)来向集合中添加一个数字。这样在test方法 看来,其声明为List<String>的集合中却被添加了一个Integer类型的对象。这显然是违反类型安全的原则的,在某个时候肯定会 抛出ClassCastException。因此,编译器禁止这样的行为。编译器会尽可能的检查可能存在的类型安全问题。对于确定是违反相关原则的地方,会给出编译错误。当编译器无法判断类型的使用是否正确的时候,会给出警告信息。
{
for (Object obj : list)
{ System.out.println(obj); }
list.add(1); //这个操作在当前方法的上下文是合法的。
}
public void test()
{ List<String> strs = new ArrayList<String>();
inspect(strs); //编译错误
}