虚拟机把描述类的数据从Class文件加载到内存,并对数据进行检验、转换解析和初始化,最终形成了可以被虚拟机直接使用的Java类型,这就是虚拟机的类加载机制。在Java语言里,类型的加载、连接和初始化过程都是在程序运行时期完成的。
类的生命周期:
类从被加载到虚拟机内存中开始,到卸载出内存,它的整个生命周期包括:加载(Loading)、验证(Verification)、准备(Preparation)、解析(Resolution)、初始化(Initiallization)、使用(Using)和卸载(Unloading)这7个阶段。其中验证、准备、解析3个部分统称为连接(Linking),这七个阶段的发生顺序如下图:
有且只有以下四种情况必须立即对类进行”初始化”(称为对一个类进行主动引用):
- 遇到new、getstatic、putstatic、invokestatic这四条字节码指令时(使用new实例化对象的时候、读取或设置一个类的静态字段、调用一个类的静态方法)。
- 使用java.lang.reflet包的方法对类进行反射调用的时候。
- 当初始化一个类的时候,如果发现其负类没有进行过初始化,则需要先触发其父类的初始化。
- 当虚拟机启动时,虚拟机会初始化主类(包含main方法的那个类)。
类加载的过程
加载
加载是类加载的第一个阶段。有两种时机会触发类加载:
1、预加载。虚拟机启动时加载,加载的是JAVA_HOME/lib/下的rt.jar下的.class文件,这个jar包里面的内容是程序运行时非常常常用到的,像java.lang.*、java.util.*、java.io.*等等,因此随着虚拟机一起加载。要证明这一点很简单,写一个空的main函数,设置虚拟机参数为"-XX:+TraceClassLoading"来获取类加载信息,运行一下:
1 [Opened E:MyEclipse10Commoninarycom.sun.java.jdk.win32.x86_64_1.6.0.013jrelib t.jar] 2 [Loaded java.lang.Object from E:MyEclipse10Commoninarycom.sun.java.jdk.win32.x86_64_1.6.0.013jrelib t.jar] 3 [Loaded java.io.Serializable from E:MyEclipse10Commoninarycom.sun.java.jdk.win32.x86_64_1.6.0.013jrelib t.jar] 4 [Loaded java.lang.Comparable from E:MyEclipse10Commoninarycom.sun.java.jdk.win32.x86_64_1.6.0.013jrelib t.jar] 5 [Loaded java.lang.CharSequence from E:MyEclipse10Commoninarycom.sun.java.jdk.win32.x86_64_1.6.0.013jrelib t.jar] 6 [Loaded java.lang.String from E:MyEclipse10Commoninarycom.sun.java.jdk.win32.x86_64_1.6.0.013jrelib t.jar] 7 [Loaded java.lang.reflect.GenericDeclaration from E:MyEclipse10Commoninarycom.sun.java.jdk.win32.x86_64_1.6.0.013jrelib t.jar] 8 [Loaded java.lang.reflect.Type from E:MyEclipse10Commoninarycom.sun.java.jdk.win32.x86_64_1.6.0.013jrelib t.jar] 9 [Loaded java.lang.reflect.AnnotatedElement from E:MyEclipse10Commoninarycom.sun.java.jdk.win32.x86_64_1.6.0.013jrelib t.jar] 10 [Loaded java.lang.Class from E:MyEclipse10Commoninarycom.sun.java.jdk.win32.x86_64_1.6.0.013jrelib t.jar] 11 [Loaded java.lang.Cloneable from E:MyEclipse10Commoninarycom.sun.java.jdk.win32.x86_64_1.6.0.013jrelib t.jar] 12 ...
2、运行时加载。虚拟机在用到一个.class文件的时候,会先去内存中查看一下这个.class文件有没有被加载,如果没有就会按照类的全限定名来加载这个类。
加载时类加载过程的一个阶段,在加载阶段,虚拟机需要完成以下3件事情:
(1)通过一个类的全限定名来获取定义此类的二进制字节流
(2)将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
(3)在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入口。
虚拟机规范对这三点的要求并不具体,因此虚拟机实现与具体应用的灵活度都是相当大的。例如第一条,根本没有指明二进制字节流要从哪里来、怎么来,因此单单就这一条,就能变出许多花样来:
· 从zip包中获取,这就是以后jar、ear、war格式的基础
· 从网络中获取,典型应用就是Applet
· 运行时计算生成,典型应用就是动态代理技术
· 由其他文件生成,典型应用就是JSP,即由JSP生成对应的.class文件
· 从数据库中读取,这种场景比较少见
总而言之,在类加载整个过程中,这部分是对于开发者来说可控性最强的一个阶段。
加载阶段完成后,虚拟机外部的二进制字节流就按照虚拟机所需的格式存储在方法区之中。然后再内存中实例化
验证
验证是连接阶段的第一步,这一阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。虚拟机如果不检查输入的字节流,对齐完全信任的话,很可能会因为载入了有害的字节流而导致系统崩溃,所以验证是虚拟机对自身保护的一项重要工作。
验证阶段的验证工作:
(1)文件格式验证:验证字节流是否符合Class文件格式的规范,并且能被当前版本的虚拟机处理。验证的点:1、是否以魔数CAFEBABE开头。2、主次版本是否在当前虚拟机处理范围之内。3、常量池的常量是否有不被支持的类型等。。。
(2)元数据验证:主要是对字节码描述的信息进行语义分析,以保证其描述的信息符合Java语言规范的要求:是否有父类,是否允许父类被继承,是否实现了所有的方法,类中的字段方法是否与父类产生矛盾。
(3)字节码验证:这个阶段是验证过程中最复杂的一部分,主要目的是通过数据流和控制流分析,确定成语语义是合法、符合逻辑的。
(4)符号引用验证:这个阶段发生在虚拟机将符号引用转化为直接引用时,这个转化动作将在连接的第三阶段--解析阶段发生。对常量池中的各种符号引用的信息进行匹配性的校验。
准备
准备阶段是正式为类变量分配内存并设置类变量初始值(各数据类型的零值)的阶段,这些内存将在方法区中进行分配。但是如果类字段的字段属性表中存在ConstantValue属性,那在准备阶段变量值就会初始化为ConstantValue属性指定的值。
解析
解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程,下面区分一下解析过程中的符号引用和直接引用的区别:
符号引用:符号引用以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能无歧义地定位到目标即可
直接引用:直接引用可以是直接指向目标的指针、相对偏移量或者一个能间接定位到目标的句柄。如果有了直接引用,那引用的目标必定已经在内存中存在。
A. 类或接口(对应于常量池的CONSTANT_Class_info类型)的解析:
假设当前代码所处的类为D,需要将一个从未解析过的符号引用N解析为一个类或接口C的直接引用:
- 如果C不是一个数组类型,虚拟机将会把代表C的全限定名传递给D的类加载器去加载这个类。
- 如果C是一个数组类型,并且数组的元素类型为对象(N的描述符类似[Ljava.lang.Integer),将会加载数组元素类型(java.lang.Integer),接着由虚拟机生成一个代表此数组维度和元素的数组对象。
- 如果以上过程没有发生异常,则C在虚拟机中已经成为了一个有效的类和接口了,之后还要进行的是符号引用验证,确认D是否具有对C的访问权限,如果没有,将抛出java.lang.IllegalAccessError异常。
B. 字段(对应于常量池的CONSTANT_Fieldref_info类型)解析:
- 对字段表中的class_index项中索引的CONSTANT_Class_info符号引用进行解析。用C表示这个字段所属的类或接口。
- 如果C本身就包含了简单名称和字段描述符都与目标相匹配的字段,则返回这个字段的直接引用。
- 否则,如果C实现了接口,则会按照继承关系从下往上递归搜索各个接口和他的父接口,如果接口中包含了简单名称和字段描述符都与目标相匹配的字段,则返回这个字段的直接引用。
- 否则,如果C不是java.lang.Object类型的话,将会按照继承关系从下往上递归的搜索其父类,如果在父类中包含了简单名称和字段描述符都与目标相匹配的字段,则返回这个字段的直接引用。
- 否则,查找失败,抛出java.lang.NoSuchFieldError异常。
虚拟机的编译器实现可能会更严格:如果一个同名字段同时出现在C实现的接口和父类中,或者同时在自己或父类的多个接口中出现,编译器将可能拒绝编译。
C. 类方法(对应于常量池的CONSTANT_Methodref_info类型)解析:
- 对方法表中的class_index项中索引的CONSTANT_Class_info符号引用进行解析。用C表示这个方法所属的类或接口。
- 类方法和接口方法符号引用的常量类型定义是分开的,如果在类方法表中发现class_index中索引的C是个接口,则抛出java.lang.IncompatibleClassChangeError。
- 在类C中查找是否有简单名称和描述符都与目标相匹配的方法,如果有则返回这个方法的直接引用。
- 否则,在C的父类中递归查找是否有简单名称和描述符都与目标相匹配的方法,如果有则返回这个方法的直接引用。
- 否则,在C实现的接口列表及它们的父接口中递归的查找是否有简单名称和描述符都与目标相匹配的方法,如果有说明C是个抽象类,查找结束,抛出java.lang.AbstractMethodError异常。
- 否则,查找失败,抛出java.lang.NoSuchMethodError异常。
- 如果查找返回了直接引用,将会对这个方法进行权限验证,如果发现不具备对这个方法的访问权限,则抛出java.lang.IllegalAccessError异常。
D. 接口方法(对应于常量池的CONSTANT_InterfaceMethodref_info类型):
- 对方法表中的class_index项中索引的CONSTANT_Class_info符号引用进行解析。用C表示这个方法所属的类或接口。
- 如果在接口方法表中发现class_index中索引的C是个类,则抛出java.lang.IncompatibleClassChangeError。
- 否则,在接口C中查找是否有简单名称和描述符都与目标相匹配的方法,如果有则返回这个方法的直接引用。
- 否则,在接口C的父接口中递归查找,知道java.lang.Object类(包括在内),看是否有简单名称和描述符都与目标相匹配的方法,如果有则返回这个方法的直接引用。
- 否则,查找失败,抛出java.lang.NoSuchMethodError。
初始化
初始化阶段是执行类构造器<clinit>()方法的过程。
- <clinit>()方法是由编译器自动收集类中的所有类变量的赋值动作和静态语句块(static{}块)中的语句合并产生的,编译器收集的顺序是由语句在源文件中出现的顺序决定的。静态语句块只能访问到定义在静态语句块之前的变量,定义在它之后的变量,在前面的静态语句块中可以赋值,但是不能访问。
2. 方法与实例构造器<init>()不同,不需要显示的调用父类构造器,虚拟机会保证在子类的<clinit>()方法执行之前,父类的<clinit>()已经执行完毕。
3. <clinit>()方法对于类或接口来说不是必须的,如果一个类中没有静态语句块也没有对变量的赋值操作,那么编译器可以不为这个类生成<clinit>()方法。
4. 执行接口的<clinit>()不需要先执行父接口的<clinit>()方法,只有当父接口中定义的变量被使用时,父接口才会被初始化。接口的实现类在初始化时也不会执行接口的<clinit>()方法。
5. 虚拟机会保证一个类的<clinit>()方法在多线程环境中被正确的加锁和同步,如果多个线程同时去初始化一个类,则只会有一个线程去执行这个类的<clinit>()方法,其他线程需要阻塞等待。
提到Java虚拟机加载器,肯定会联想到它的双亲委派机制,具体如下图所示(因为懒得画所以就网上借了个图):
双亲委派机制图
先来大概的解释一下各个加载器的情况:
■启动类加载器(Bootstrap ClassLoader):这个类加载器负责将<JAVA_HOME>lib目录中的,或被-Xbootclasspath参数所指定的路径中的,并且是虚拟机识别的(如rt.jar)类库加载到虚拟机内存中。
Bootstrap ClassLoader是JVM系统级别的类加载器,应用是无法使用的,例如Object类是由这个类加载器加载的,我们尝试去打印Object类的类加载器,得到结果如下:
这就是JVM为了保护Bootstrap ClassLoader所做的限制。
■扩展类加载器(Extension ClassLoader):这个加载器由sun.misc.Launcher$ExtClassLoader实现的,它负责加载<JAVA_HOME>libext目录中的,或者被java.ext.dirs系统变量所指定的路径中的所有类库,开发者可以直接使用扩展类加载器,如下示例:
图(1)是我的ClassLoaderTest类在classpath下打印的结果:
图(1)
图(2)是我的ClassLoaderTest类打包放在<JAVA_HOME>/lib/ext目录下的打印结果:
图(2)
从以上实验可以看出,Extension ClassLoader确实可以被用户利用。
■应用程序类加载器(Application ClassLoader):从上面的测试可以看到,这个类加载器由sun.misc.Launcher$AppClassLoader实现,由于这个类加载器是ClassLoader中的getSystemClassLoader()方法的返回值,所以一般也称为系统类加载器。它负责加载用户类路径(ClassPath)上所指定的类库,开发者可以直接使用这个类加载器,如果应用程序中没有自定义自己的类加载器,一般情况下这个就是程序中默认的类加载器。
■自定义类加载器(User ClassLoader):所有自定义的类加载器必须继承ClassLoader抽象类(严格说所有类加载器都继承于它,除了Bootstrap ClassLoader,因它是由C/C++实现的),那先来看看ClassLoader有哪些重点方法:
方法 |
说明 |
getParent() |
返回该类加载器的父类加载器。 |
loadClass(String name) |
加载名称为 name的类,返回的结果是 java.lang.Class类的实例。 |
findClass(String name) |
查找名称为 name的类,返回的结果是 java.lang.Class类的实例。 |
findLoadedClass(String name) |
查找名称为 name的已经被加载过的类,返回的结果是 java.lang.Class类的实例。 |
defineClass(String name, byte[] b, int off, int len) |
把字节数组 b中的内容转换成 Java 类,返回的结果是 java.lang.Class类的实例。这个方法被声明为 final的。 |
resolveClass(Class<?> c) |
链接指定的 Java 类,调用的是本地方法。 |
除了以上ClassLoader抽象类的一些主要方法介绍,在自己写自定义类加载器前还是非常有必要讲解一下类加载器的“双亲委派机制”。就如以上的“双亲委派机制图”所示,它的工作过程是这样的:如果一个类加载器收到了类加载的请求,它首先不会自己去尝试加载这个类,而是把这个请求委派给父类加载器去完成,每一个层次的类加载器都是如此,因此所有的加载器请求最终都是应该传送到顶层的启动类加载器中,只有当父加载器反馈自己无法完成这个加载请求(它的搜索范围中没有找到所需要的类)时,子加载器才会尝试自己去加载。如ClassLoader类的loadClass方法所示:
以上ClassLoader的loadClass方法的实现就是“双亲委派机制”的原型。除了“双亲委派机制”外,我们还需要知道一点的是:对于任意一个类,都需要由它的类加载器和这个类本身一同确立其在Java虚拟机中的唯一性。也就是说,同一个class文件,由不同的加载器去加载,都不相等。所以“双亲委派机制”有一个显而易见的好处就是Java类随着它的类加载器一起具备了一种带有优先级的层次关系,例如java.lang.Object,它存放于rt.jar之中,无论哪一个类加载器要加载这个类,最终都是委派给处于模型最顶端的启动类去加载,因此Object类在程序的各种类加载器环境中都是同一个类。除此之外,这种设计模式的其它优缺点需要各自脑补了。当然,这种设计默认并不是必须的(后面会提到)。学习以上的知识,那么就可以自定义动手写一个属于自己的类加载器了,如下所示:
1 public class MyClassLoader extends ClassLoader{ 2 3 public MyClassLoader(){} 4 5 public MyClassLoader(ClassLoader parent){ 6 super(parent); 7 } 8 9 @Override 10 protected Class<?> findClass(String name) throws ClassNotFoundException{ 11 12 byte[] bytes = null; 13 14 /*获取类字节,自定义类我默认在G盘*/ 15 FileInputStream fis = null; 16 try { 17 fis = new FileInputStream("G:\"+name+".class"); 18 ByteArrayOutputStream baos = new ByteArrayOutputStream(); 19 byte[] buff = new byte[100]; 20 int rc = 0; 21 while ((rc = fis.read(buff, 0, 100)) > 0) { 22 baos.write(buff, 0, rc); 23 } 24 bytes = baos.toByteArray(); 25 26 } catch (Exception e) { 27 e.printStackTrace(); 28 29 }finally{ 30 if(fis != null){ 31 try { 32 fis.close(); 33 } catch (IOException e) { 34 e.printStackTrace(); 35 } 36 } 37 } 38 39 /*生产Class对象*/ 40 try{ 41 Class<?> c = this.defineClass(name, bytes, 0, bytes.length); 42 return c; 43 }catch (Exception e){ 44 e.printStackTrace(); 45 } 46 47 return super.findClass(name); 48 } 49 50 public static void main(String[] args) throws Exception{ 51 MyClassLoader mlc = new MyClassLoader(MyClassLoader.getSystemClassLoader()); 52 Class c = mlc.loadClass("MyClassLoaderTest"); 53 System.out.println(c.newInstance().toString()); 54 } 55 56 }
自定义一个类加载器的原因有很多,例如应用需要加载不在ClassPath路径下的类(重写findClass方法),又或者不同插件容器需要不同加载器加载同一个类文件(重写loadClass方法)等等。就像以上例子,我自定义了一个MyClassLoader重写了findClass方法专门去加载我本地G盘的类。其实,只要得到类文件的二进制流(甚至可以通过ASM字节码操作框架动态生成class二进制),就可以初始化类对象,所以无论本地还是远程,都可以通过实现类加载。
总结
类加载确实是Java虚拟机的一大亮点,在本章也学习了类加载器委托、可见性以及单一性原理特性,许多人可能还是会把类加载器跟“双亲委派机制”紧关联甚至画上等号,“双亲委派机制”是一种设计模式(代理模式),这种模式带来的好处显而易见,但是不同场景可能会有不同的场景需求而去破坏这种设计模式,例如许多WEB容器都有自己的类加载器,如Tomcat,它的自定义加载器首先会尝试自己加载应用的类文件再交给父类加载器尝试加载,这一点已经打破了双亲委派模型,但有些WEB容器又有自己的自定义规则,例如Websphere,所有本章重点在于理解类加载器原理,才能更好的掌控“格局”。