• 09-字节码执行引擎


    1. 概述

    执行引擎是 Java 虚拟机核心的组成部分之一。“虚拟机”是一个相对于“物理机”的概念,这两种机器都有代码执行能力,其区别是物理机的执行引擎是直接建立在处理器、缓存、指令集和操作系统层面上的,而虚拟机的执行引擎则是由软件自行实现的,因此可以不受物理条件制约地定制指令集与执行引擎的结构体系,能够执行那些不被硬件直接支持的指令集格式。

    在《Java 虚拟机规范》中制定了 Java 虚拟机字节码执行引擎的概念模型,这个概念模型成为各大发行商的 Java 虚拟机执行引擎的统一外观(Facade)。

    在不同的虚拟机实现中,执行引擎在执行字节码的时候,通常会有解释执行(通过解释器执行)和编译执行(通过即时编译器产生本地代码执行)两种选择,也可能两者兼备,还可能会有同时包含几个不同级别的即时编译器一起工作的执行引擎。但从外观上来看,所有的 Java 虚拟机的执行引擎输入、输出都是一致的:输入的是字节码二进制流,处理过程是字节码解析执行的等效过程,输出的是执行结果,本章将主要从概念模型的角度来讲解虚拟机的方法调用和字节码执行。

    2. 运行时栈帧结构

    Java 虚拟机以方法作为最基本的执行单元,“栈帧”(Stack Frame)则是用于支持虚拟机进行方法调用和方法执行背后的数据结构,它也是虚拟机运行时数据区中的虚拟机栈(Virtual Machine Stack)的栈元素。

    栈帧存储了方法的局部变量表、操作数栈、动态连接和方法返回地址等信息,如果看过《类文件结构》,应该能从 Class 文件格式的方法表中找到以上大多数概念的静态对照物。每一个方法从调用开始至执行结束的过程,都对应着一个栈帧在虚拟机栈里面从入栈到出栈的过程。

    每一个栈帧都包括了局部变量表、操作数栈、动态连接、方法返回地址和一些额外的附加信息。在编译 Java 程序源码的时候,栈帧中需要多大的局部变量表,需要多深的操作数栈就已经被分析计算出来,并且写入到方法表的属性之中。换言之,一个栈帧需要分配多少内存,并不会受到程序运行期变量数据的影响,而仅仅取决于程序源码和具体的虚拟机实现的栈内存布局形式。

    一个线程中的方法调用链可能会很长,以 Java 程序的角度来看,同一时刻、同一条线程里面,在调用堆栈的所有方法都同时处于执行状态。而对于执行引擎来讲,在活动线程中,只有位于栈顶的方法才是在运行的,只有位于栈顶的栈帧才是生效的,其被称为“当前栈帧”(Current Stack Frame),与这个栈帧所关联的方法被称为“当前方法”(Current Method)。

    执行引擎所运行的所有字节码指令都只针对当前栈帧进行操作,在概念模型上,典型的栈帧结构如下图所示,这就是虚拟机栈和栈帧的总体结构。

    2.1 局部变量表

    2.1.1 变量槽规范

    局部变量表(Local Variables Table)是一组变量值的存储空间,用于存放方法参数和方法内部定义的局部变量。在 Java 程序被编译为 Class 文件时,就在方法的 Code 属性的 max_locals 数据项中确定了该方法所需分配的局部变量表的最大容量。

    局部变量表的容量以变量槽(Variable Slot)为最小单位,《Java 虚拟机规范》中并没有明确指出一个变量槽应占用的内存空间大小,只是很有导向性地说到每个变量槽都应该能存放一个 boolean、byte、char、short、int、float、reference 或 returnAddress 类型的数据,这 8 种数据类型,都可以使用 32 位或更小的物理内存来存储,但这种描述与明确指出“每个变量槽应占用 32 位长度的内存空间”是有本质差别的,它允许变量槽的长度可以随着处理器、操作系统或虚拟机实现的不同而发生变化,保证了即使在 64 位虚拟机中使用了 64 位的物理内存空间去实现一个变量槽,虚拟机仍要使用对齐和补白的手段让变量槽在外观上看起来与 32 位虚拟机中的一致。

    既然前面提到了 Java 虚拟机的数据类型,在此对它们再简单介绍一下。一个变量槽可以存放一个 32 位以内的数据类型,Java 中占用不超过 32 位存储空间的数据类型有 boolean、byte、char、short、int、float、reference 和 returnAddress 这 8 种类型。前面 6 种不需要多加解释,读者可以按照 Java 语言中对应数据类型的概念去理解它们(仅是这样理解而已,Java 语言和 Java 虚拟机中的基本数据类型是存在本质差别的),而第 7 种 reference 类型表示对一个对象实例的引用,《Java 虚拟机规范》既没有说明它的长度,也没有明确指出这种引用应有怎样的结构。但是一般来说,虚拟机实现至少都应当能通过这个引用做到两件事情,一是从根据引用直接或间接地查找到对象在 Java 堆中的数据存放的起始地址或索引,二是根据引用直接或间接地查找到对象所属数据类型在方法区中的存储的类型信息,否则将无法实现《Java 语言规范》中定义的语法约定。第 8 种 returnAddress 类型目前已经很少见了,它是为字节码指令 jsr、jsr_w 和 ret 服务的,指向了一条字节码指令的地址,某些很古老的 Java 虚拟机曾经使用这几条指令来实现异常处理时的跳转,但现在也已经全部改为采用异常表来代替了。

    对于 64 位的数据类型,Java 虚拟机会以高位对齐的方式为其分配两个连续的变量槽空间。Java 语言中明确的 64 位的数据类型只有 long 和 double 两种。这里把 long 和 double 数据类型分割存储的做法与“long 和 double 的非原子性协定”中允许把一次 long 和 double 数据类型读写分割为两次 32 位读写的做法有些类似,读者阅读到本书关于 Java 内存模型的内容时可以进行对比。不过,由于局部变量表是建立在线程堆栈中的,属于线程私有的数据,无论读写两个连续的变量槽是否为原子操作,都不会引起数据竞争和线程安全问题

    Java 虚拟机通过索引定位的方式使用局部变量表,索引值的范围是从 0 开始至局部变量表最大的变量槽数量。如果访问的是 32 位数据类型的变量,索引 N 就代表了使用第 N 个变量槽,如果访问的是 64 位数据类型的变量,则说明会同时使用第 N 和 N+1 两个变量槽。对于两个相邻的共同存放一个 64 位数据的两个变量槽,虚拟机不允许采用任何方式单独访问其中的某一个,《Java 虚拟机规范》中明确要求了如果遇到进行这种操作的字节码序列,虚拟机就应该在类加载的校验阶段中抛出异常。当一个方法被调用时,Java 虚拟机会使用局部变量表来完成参数值到参数变量列表的传递过程,即实参到形参的传递。如果执行的是实例方法(没有被 static 修饰的方法),那局部变量表中第 0 位索引的变量槽默认是用于传递方法所属对象实例的引用,在方法中可以通过关键字“this”来访问到这个隐含的参数。其余参数则按照参数表顺序排列,占用从 1 开始的局部变量槽,参数表分配完毕后,再根据方法体内部定义的变量顺序和作用域分配其余的变量槽。

    2.1.2 变量槽复用

    为了尽可能节省栈帧耗用的内存空间,局部变量表中的变量槽是可以重用的,方法体中定义的变量,其作用域并不一定会覆盖整个方法体,如果当前字节码 PC 计数器的值已经超出了某个变量的作用域,那这个变量对应的变量槽就可以交给其他变量来重用。不过,这样的设计除了节省栈帧空间以外,还会伴随有少量额外的副作用,例如在某些情况下变量槽的复用会直接影响到系统的垃圾收集行为,请看如下 3 个演示。

    (1)局部变量表 Slot 复用对垃圾收集的影响之一

    public static void main(String[] args)() {
        byte[] placeholder = new byte[64 * 1024 * 1024];
        System.gc();
    }
    

    向内存填充了 64MB 的数据,然后通知虚拟机进行垃圾收集。我们在虚拟机运行参数中加上“-verbose:gc”来看看垃圾收集的过程,发现在 System.gc() 运行后并没有回收掉这 64MB 的内存,下面是运行的结果:

    [GC 66846K->65824K(125632K), 0.0032678 secs]
    [Full GC 65824K->65746K(125632K), 0.0064131 secs]
    

    上面的代码没有回收掉 placeholder 所占的内存是能说得过去,因为在执行 System.gc() 时,变量 placeholder 还处于作用域之内,虚拟机自然不敢回收掉 placeholder 的内存。那我们把代码修改一下,变成下面的样子。

    (2)局部变量表 Slot 复用对垃圾收集的影响之二

    public static void main(String[] args)() {
        {
            byte[] placeholder = new byte[64 * 1024 * 1024];
        }
        System.gc();
    }
    

    加入了花括号之后,placeholder 的作用域被限制在花括号以内,从代码逻辑上讲,在执行 System.gc() 的时候,placeholder 已经不可能再被访问了,但执行这段程序,会发现运行结果如下,还是有 64MB 的内存没有被回收掉,这又是为什么呢?

    [GC 66846K->65888K(125632K), 0.0009397 secs]
    [Full GC 65888K->65746K(125632K), 0.0051574 secs]
    

    在解释为什么之前,我们先对这段代码进行第二次修改,在调用 System.gc() 之前加入一行 int a=0;,代码就变成下面这个样子。

    (3)局部变量表 Slot 复用对垃圾收集的影响之三

    public static void main(String[] args)() {
        {
            byte[] placeholder = new byte[64 * 1024 * 1024];
        }
        int a = 0;
        System.gc();
    }
    

    这个修改看起来很莫名其妙,但运行一下程序,却发现这次内存真的被正确回收了:

    [GC 66401K->65778K(125632K), 0.0035471 secs]
    [Full GC 65778K->218K(125632K), 0.0140596 secs]
    

    代码 1~3 中,placeholder 能否被回收的根本原因就是:局部变量表中的变量槽是否还存有关于 placeholder 数组对象的引用。第一次修改中,代码虽然已经离开了 placeholder 的作用域,但在此之后,再没有发生过任何对局部变量表的读写操作,placeholder 原本所占用的变量槽还没有被其他变量所复用,所以作为 GC Roots 一部分的局部变量表仍然保持着对它的关联。这种关联没有被及时打断,绝大部分情况下影响都很轻微。但如果遇到一个方法,其后面的代码有一些耗时很长的操作,而前面又定义了占用了大量内存但实际上已经不会再使用的变量,手动将其设置为 null 值(用来代替那句 int a=0,把变量对应的局部变量槽清空)便不见得是一个绝对无意义的操作,这种操作可以作为一种在极特殊情形(对象占用内存大、此方法的栈帧长时间不能被回收、方法调用次数达不到即时编译器的编译条件)下的“奇技”来使用。

    【BTW】Java 语言的一本非常著名的书籍《Practical Java》中将把“不使用的对象应手动赋值为 null”作为一条推荐的编码规则(笔者并不认同这条规则),但是并没有解释具体原因,很长时间里都有读者对这条规则感到疑惑。

    2.1.3 补充

    虽然代码 1~3 的示例说明了赋 null 操作在某些极端情况下确实是有用的,但笔者的观点是不应当对赋 null 值操作有什么特别的依赖,更没有必要把它当作一个普遍的编码规则来推广。原因有两点,从编码角度讲,以恰当的变量作用域来控制变量回收时间才是最优雅的解决方法,如代码 3 那样的场景除了做实验外几乎毫无用处。更关键的是,从执行角度来讲,使用赋 null 操作来优化内存回收是建立在对字节码执行引擎概念模型的理解之上的。这里要注意!概念模型与实际执行过程是外部看起来等效,内部看上去则可以完全不同

    当虚拟机使用解释器执行时,通常与概念模型还会比较接近,但经过即时编译器施加了各种编译优化措施以后,两者的差异就会非常大,只保证程序执行的结果与概念一致。在实际情况中,即时编译才是虚拟机执行代码的主要方式,赋 null 值的操作在经过即时编译优化后几乎是一定会被当作无效操作消除掉的,这时候将变量设置为 null 就是毫无意义的行为。字节码被即时编译为本地代码后,对 GC Roots 的枚举也与解释执行时期有显著差别,以前面的例子来看,经过第一次修改的代码 2 在经过即时编译后,System.gc() 执行时就可以正确地回收内存,根本无须写成代码 3 的样子。

    关于局部变量表,还有一点可能会对实际开发产生影响,就是局部变量不像前面介绍的类变量那样存在“准备阶段”。通过前面的学习,我们已经知道类的字段变量有两次赋初始值的过程,一次在准备阶段,赋予系统初始值;另外一次在初始化阶段,赋予程序员定义的初始值。

    因此即使在初始化阶段程序员没有为类变量赋值也没有关系,类变量仍然具有一个确定的初始值,不会产生歧义。但局部变量就不一样了,如果一个局部变量定义了但没有赋初始值,那它是完全不能使用的。所以不要认为 Java 中任何情况下都存在诸如整型变量默认为 0、布尔型变量默认为 false 等这样的默认值规则。如下述代码所示,这段代码在 Java 中其实并不能运行(但是在其他语言,譬如 C 和 C++ 中类似的代码是可以运行的),所幸编译器能在编译期间就检查到并提示出这一点,即便编译能通过或者手动生成字节码的方式制造出下面代码的效果,字节码校验的时候也会被虚拟机发现而导致类加载失败。

    public static void main(String[] args) {
        int a; // 未赋值的局部变量
        System.out.println(a);
    }
    

    2.2 操作数栈

    操作数栈(Operand Stack)也常被称为操作栈,它是一个后入先出(Last In First Out,LIFO)栈。同局部变量表一样,操作数栈的最大深度也在编译的时候被写入到 Code 属性的 max_stacks 数据项之中。操作数栈的每一个元素都可以是包括 long 和 double 在内的任意 Java 数据类型。32 位数据类型所占的栈容量为 1,64 位数据类型所占的栈容量为 2。Javac 编译器的数据流分析工作保证了在方法执行的任何时候,操作数栈的深度都不会超过在 max_stacks 数据项中设定的最大值。

    当一个方法刚刚开始执行的时候,这个方法的操作数栈是空的,在方法的执行过程中,会有各种字节码指令往操作数栈中写入和提取内容,也就是出栈和入栈操作。譬如在做算术运算的时候是通过将运算涉及的操作数栈压入栈顶后调用运算指令来进行的,又譬如在调用其他方法的时候是通过操作数栈来进行方法参数的传递。举个例子,例如整数加法的字节码指令 iadd,这条指令在运行的时候要求操作数栈中最接近栈顶的两个元素已经存入了两个 int 型的数值,当执行这个指令时,会把这两个 int 值出栈并相加,然后将相加的结果重新入栈。

    操作数栈中元素的数据类型必须与字节码指令的序列严格匹配,在编译程序代码的时候,编译器必须要严格保证这一点,在类校验阶段的数据流分析中还要再次验证这一点。再以上面的 iadd 指令为例,这个指令只能用于整型数的加法,它在执行时,最接近栈顶的两个元素的数据类型必须为 int 型,不能出现一个 long 和一个 float 使用 iadd 命令相加的情况。

    另外在概念模型中,两个不同栈帧作为不同方法的虚拟机栈的元素,是完全相互独立的。但是在大多虚拟机的实现里都会进行一些优化处理,令两个栈帧出现一部分重叠。让下面栈帧的部分操作数栈与上面栈帧的部分局部变量表重叠在一起,这样做不仅节约了一些空间,更重要的是在进行方法调用时就可以直接共用一部分数据,无须进行额外的参数复制传递了,重叠的过程如下图所示。

    Java 虚拟机的解释执行引擎被称为“基于栈的执行引擎”,里面的“栈”就是操作数栈。后文会对基于栈的代码执行过程进行更详细的讲解,介绍它与更常见的基于寄存器的执行引擎有哪些差别。

    2.3 动态连接

    每个栈帧都包含一个指向运行时常量池中该栈帧所属方法的引用,持有这个引用是为了支持方法调用过程中的动态连接(Dynamic Linking)。通过前面的讲解,我们知道 Class 文件的常量池中存有大量的符号引用,字节码中的方法调用指令就以常量池里指向方法的符号引用作为参数。这些符号引用一部分会在类加载阶段或者第一次使用的时候就被转化为直接引用,这种转化被称为「静态解析」。

    另外一部分将在每一次运行期间都转化为直接引用,这部分就称为「动态连接」。关于这两个转化过程的具体过程,将在 #3 再详细讲解。

    2.4 方法返回地址

    当一个方法开始执行后,只有两种方式退出这个方法。

    • 执行引擎遇到任意一个方法返回的字节码指令,这时候可能会有返回值传递给上层的方法调用者(调用当前方法的方法称为调用者或者主调方法),方法是否有返回值以及返回值的类型将根据遇到何种方法返回指令来决定,这种退出方法的方式称为“正常调用完成”(Normal Method Invocation Completion)。
    • 在方法执行的过程中遇到了异常,并且这个异常没有在方法体内得到妥善处理。无论是 Java 虚拟机内部产生的异常,还是代码中使用 athrow 字节码指令产生的异常,只要在本方法的异常表中没有搜索到匹配的异常处理器,就会导致方法退出,这种退出方法的方式称为“异常调用完成(Abrupt Method Invocation Completion)”。一个方法使用异常完成出口的方式退出,是不会给它的上层调用者提供任何返回值的。

    无论采用何种退出方式,在方法退出之后,都必须返回到最初方法被调用时的位置,程序才能继续执行,方法返回时可能需要在栈帧中保存一些信息,用来帮助恢复它的上层主调方法的执行状态。

    一般来说,方法正常退出时,〈主调方法的 PC 计数器的值〉就可以作为返回地址,栈帧中很可能会保存这个计数器值。而方法异常退出时,返回地址是要通过「异常处理器表」来确定的,栈帧中就一般不会保存这部分信息。方法退出的过程实际上等同于把当前栈帧出栈,因此退出时可能执行的操作有:恢复上层方法的局部变量表和操作数栈,把返回值(如果有的话)压入调用者栈帧的操作数栈中,调整 PC 计数器的值以指向方法调用指令后面的一条指令等。笔者这里写的“可能”是由于这是基于概念模型的讨论,只有具体到某一款 Java 虚拟机实现,会执行哪些操作才能确定下来。

    2.5 附加信息

    《Java 虚拟机规范》允许虚拟机实现增加一些规范里没有描述的信息到栈帧之中,例如与调试、性能收集相关的信息,这部分信息完全取决于具体的虚拟机实现,这里不再详述。在讨论概念时,一般会把动态连接、方法返回地址与其他附加信息全部归为一类,称为栈帧信息。

    3. 方法调用

    方法调用并不等同于方法中的代码被执行,方法调用阶段唯一的任务就是确定被调用方法的版本(即调用哪一个方法),暂时还未涉及方法内部的具体运行过程。

    在程序运行时,进行方法调用是最普遍、最频繁的操作之一,但前面也已经讲过,Class 文件的编译过程中不包含传统程序语言编译的“连接”步骤,一切“方法调用”在 Class 文件里面存储的都只是符号引用,而不是方法在实际运行时内存布局中的入口地址(也就是之前说的直接引用)。

    “方法调用”说到底其实就是要回答一个问题:JVM 在执行一个方法的时候,它是如何找到这个方法的?

    3.1 解析

    所有方法调用的目标方法在 Class 文件里面都是一个常量池中的「符号引用」,在类加载的解析阶段,会将其中的一部分「符号引用」转化为「直接引用」,这种解析能够成立的前提是:方法在程序真正运行之前就有一个可确定的调用版本,并且这个方法的调用版本在运行期是不可改变的。

    换句话说,调用目标在程序代码写好、编译器进行编译那一刻就已经确定下来。这类方法的调用被称为「解析(Resolution)」。

    在 Java 语言中符合“编译期可知,运行期不可变”这个要求的方法,主要有静态方法和私有方法两大类,前者与类型直接关联,后者在外部不可被访问,这两种方法各自的特点决定了它们都不可能通过继承或别的方式重写出其他版本,因此它们都适合在类加载阶段进行解析。

    调用不同类型的方法,字节码指令集里设计了不同的指令。在 Java 虚拟机支持以下 5 条方法调用字节码指令,分别是:

    指令 调用的方法
    invokestatic 用于调用〈静态方法〉
    invokespecial 用于调用〈实例构造器 <init>() 方法〉、〈私有方法〉和〈父类中的方法〉
    invokevirtual 用于调用所有的〈虚方法 〉
    invokeinterface 用于调用〈接口方法〉,会在运行时再确定一个实现该接口的对象
    invokedynamic 先在运行时动态解析出调用点限定符所引用的方法,然后再执行该方法(前面 4 条调用指令,分派逻辑都固化在 Java 虚拟机内部,而 invokedynamic 指令的分派逻辑是由用户设定的引导方法来决定的)。

    只要能被 invokestatic 和 invokespecial 指令调用的方法,都可以在解析阶段中确定唯一的调用版本,Java 语言里符合这个条件的方法共有静态方法、私有方法、实例构造器、父类方法 4 种,再加上被 final 修饰的实例方法(尽管它使用 invokevirtual 指令调用),这 5 种方法调用会在类加载的时候就可以把「符号引用」解析为该方法的「直接引用」。这些方法统称为“非虚方法”(Non-Virtual Method),与之相反,其他方法就被称为“虚方法”(Virtual Method)。

    虽然由于历史设计的原因,final 方法是使用 invokevirtual 指令来调用的,但是因为它也无法被覆盖,没有其他版本的可能,所以也无须对方法接收者进行多态选择,又或者说多态选择的结果肯定是唯一的。在《Java 语言规范》中明确定义了被 final 修饰的方法是一种“非虚方法”。

    「解析调用」一定是个静态的过程,在编译期间就完全确定,在类加载的解析阶段就会把涉及的「符号引用」全部转变为明确的「直接引用」,不必延迟到运行期再去完成。而另一种主要的方法调用形式:分派(Dispatch)调用则要复杂许多,它可能是静态的也可能是动态的,按照分派依据的宗量数可分为单分派和多分派。这两类分派方式两两组合就构成了静态单分派、静态多分派、动态单分派、动态多分派 4 种分派组合情况 ... => 剧透:Java 语言是一门静态多分派、动态单分派的语言。

    3.2 分派

    众所周知,Java 是一门面向对象的程序语言,因为 Java 具备面向对象的 3 个基本特征:继承、封装和多态。本节讲解的分派调用过程将会揭示多态性特征的一些最基本的体现,如“重载”和“重写”在 Java 虚拟机之中是如何实现的,这里的实现当然不是语法上该如何写,我们关心的依然是虚拟机如何确定正确的目标方法。

    3.2.1 静态分派

    在开始讲解静态分派前,笔者先声明一点,“分派”(Dispatch)这个词本身就具有动态性,一般不应用在静态语境之中,即应该归入上节的“解析”里去讲解,但部分其他外文资料和国内翻译的许多中文资料都将这种行为称为“静态分派”,所以笔者在此特别说明一下。

    为了解释静态分派和重载(Overload),笔者准备了一段经常出现在面试题中的程序代码,读者不妨先看一遍,想一下程序的输出结果是什么。后面的话题将围绕这个类的方法来编写重载代码,以分析虚拟机和编译器确定方法版本的过程。程序如下所示。

    public class StaticDispatch {
        static abstract class Human {
        }
        static class Man extends Human {
        }
        static class Woman extends Human {
        }
        public void sayHello(Human guy) {
            System.out.println("hello,guy!");
        }
        public void sayHello(Man guy) {
            System.out.println("hello,gentleman!");
        }
        public void sayHello(Woman guy) {
            System.out.println("hello,lady!");
        }
        public static void main(String[] args) {
            Human man = new Man();
            Human woman = new Woman();
            StaticDispatch sr = new StaticDispatch();
            sr.sayHello(man);
            sr.sayHello(woman);
        }
    }
    

    运行结果:

    hello,guy!
    hello,guy!
    

    我们把 Human man = new Man(); 中的“Human”称为变量的“静态类型”(Static Type)或者叫“外观类型”(Apparent Type),后面的“Man”则被称为变量的“实际类型”(Actual Type)或者叫“运行时类型”(Runtime Type)。静态类型和实际类型在程序中都可能会发生变化,区别是静态类型的变化仅仅在使用时发生,变量本身的静态类型不会被改变,并且最终的静态类型是在编译期可知的;而实际类型变化的结果在运行期才可确定,编译器在编译程序的时候并不知道一个对象的实际类型是什么。

    上面这段话可能不好理解,这里不妨通过一段实际例子来解释,譬如有下面的代码:

    // 实际类型变化
    Human human = (new Random()).nextBoolean() ? new Man() : new Woman();
    // 静态类型变化
    sr.sayHello((Man) human)
    sr.sayHello((Woman) human)
    

    对象 human 的实际类型是可变的,编译期间它完全是个“薛定谔的人”,到底是 Man 还是 Woman,必须等到程序运行到这行的时候才能确定。而 human 的静态类型是 Human,也可以在使用时(如 sayHello() 中的强制转型)临时改变这个类型,但这个改变仍是在编译期是可知的,两次 sayHello() 的调用,在编译期完全可以明确转型的是 Man 还是 Woman。

    解释清楚了“静态类型”与“实际类型”的概念,我们就把话题再转回到样例代码中。

    main() 里面的两次 sayHello() 调用,在方法接收者已经确定是对象“sr”的前提下,使用哪个重载版本,就完全取决于传入参数的数量和数据类型。代码中故意定义了两个静态类型相同,而实际类型不同的变量,但虚拟机(或者准确地说是编译器)在重载时是通过参数的静态类型而不是实际类型作为判定依据的。由于静态类型在编译期可知,所以在编译阶段,Javac 编译器就根据参数的静态类型决定了会使用哪个重载版本,因此选择了 sayHello(Human) 作为调用目标,并把这个方法的符号引用写到 main() 里的两条 invokevirtual 指令的参数中。

    所有依赖“静态类型”来决定方法执行版本的分派动作,都称为「静态分派」。静态分派的最典型应用表现就是“方法重载”。「静态分派」发生在〈编译阶段〉,因此确定「静态分派」的动作实际上不是由虚拟机来执行的,这点也是为何一些资料选择把它归入“解析”而不是“分派”的原因。

    需要注意 Javac 编译器虽然能确定出方法的重载版本,但在很多情况下这个重载版本并不是“唯一”的,往往只能确定一个“相对更合适的”版本。这种模糊的结论在由 0 和 1 构成的计算机世界中算是个比较稀罕的事件,产生这种模糊结论的主要原因是字面量天生的模糊性,它不需要定义,所以字面量就没有显式的静态类型,它的静态类型只能通过语言、语法的规则去理解和推断。如下代码演示了何谓“更加合适的”版本。

    public class Overload {
        public static void sayHello(Object arg) {
            System.out.println("hello Object");
        }
        public static void sayHello(int arg) {
            System.out.println("hello int");
        }
        public static void sayHello(long arg) {
            System.out.println("hello long");
        }
        public static void sayHello(Character arg) {
            System.out.println("hello Character");
        }
        public static void sayHello(char arg) {
            System.out.println("hello char");
        }
        public static void sayHello(char... arg) {
            System.out.println("hello char ...");
        }
        public static void sayHello(Serializable arg) {
            System.out.println("hello Serializable");
        }
        public static void main(String[] args) {
            sayHello('a');
        }
    }
    

    上面的代码运行后会输出:“hello char”。

    这很好理解,'a'是一个 char 类型的数据,自然会寻找参数类型为 char 的重载方法,如果注释掉 sayHello(char arg) 方法,那输出会变为:“hello int”。

    这时发生了一次自动类型转换,'a' 除了可以代表一个字符串,还可以代表数字 97(字符 'a' 的 Unicode 数值为十进制数字 97),因此参数类型为 int 的重载也是合适的。我们继续注释掉 sayHello(int arg),那输出会变为:“hello long”。

    这时发生了两次自动类型转换,'a' 转型为整数 97 之后,进一步转型为长整数 97L,匹配了参数类型为 long 的重载。笔者在代码中没有写其他的类型如 float、double 等的重载,不过实际上自动转型还能继续发生多次,按照 char>int>long>float>double 的顺序转型进行匹配,但不会匹配到 byte 和 short 类型的重载,因为 char 到 byte 或 short 的转型是不安全的。我们继续注释掉 sayHello(long arg) 方法,那输出会变为:“hello Character”。

    这时发生了一次自动装箱,'a' 被包装为它的封装类型 java.lang.Character,所以匹配到了参数类型为 Character 的重载,继续注释掉 sayHello(Character arg),那输出会变为:“hello Serializable”。

    这个输出可能会让人摸不着头脑,一个字符或数字与序列化有什么关系?出现“hello Serializable”,是因为 java.lang.Serializable 是 java.lang.Character 类实现的一个接口,当自动装箱之后发现还是找不到装箱类,但是找到了装箱类所实现的接口类型,所以紧接着又发生一次自动转型。char 可以转型成 int,但是 Character 是绝对不会转型为 Integer 的,它只能安全地转型为它实现的接口或父类。Character 还实现了另外一个接口 java.lang.Comparable<Character>,如果同时出现两个参数分别为 Serializable 和 Comparable<Character> 的重载方法,那它们在此时的优先级是一样的。编译器无法确定要自动转型为哪种类型,会提示“类型模糊”(Type Ambiguous),并拒绝编译。程序必须在调用时显式地指定字面量的静态类型,如:sayHello((Comparable<Character>)'a'),才能编译通过。但是如果读者愿意花费一点时间,绕过 Javac 编译器,自己去构造出表达相同语义的字节码,将会发现这是能够通过 Java 虚拟机的类加载校验,而且能够被 Java 虚拟机正常执行的,但是会选择 Serializable 还是 Comparable<Character> 的重载方法则并不能事先确定,这是《Java 虚拟机规范》所允许的,在介绍接口方法解析过程时曾经提到过。

    下面继续注释掉 sayHello(Serializable arg) 方法,输出会变为:“hello Object”。

    这时是 char 装箱后转型为父类了,如果有多个父类,那将在继承关系中从下往上开始搜索,越接上层的优先级越低。即使方法调用传入的参数值为 null 时,这个规则仍然适用。我们把 sayHello(Object arg) 也注释掉,输出将会变为:“hello char ...”。

    7 个重载方法已经被注释得只剩 1 个了,可见变长参数的重载优先级是最低的,这时候字符 'a' 被当作了一个 char[] 数组的元素。笔者使用的是 char 类型的变长参数,读者在验证时还可以选择 int 类型、Character 类型、Object 类型等的变长参数重载来把上面的过程重新折腾一遍。但是要注意的是,有一些在单个参数中能成立的自动转型,如 char 转型为 int,在变长参数中是不成立的。

    上面代码演示了编译期间选择静态分派目标的过程,这个过程也是 Java 语言实现方法重载的本质。

    另外还有一点读者可能比较容易混淆:笔者讲述的解析与分派这两者之间的关系并不是二选一的排他关系,它们是在不同层次上去筛选、确定目标方法的过程。例如前面说过静态方法会在编译期确定、在类加载期就进行「解析」,而静态方法显然也是可以拥有重载版本的,选择重载版本的过程也是通过「静态分派」完成的。

    3.2.2 动态分派

    了解了静态分派,我们接下来看一下 Java 语言里动态分派的实现过程,它与 Java 语言多态性的另外一个重要体现 —— 重写(Override)有着很密切的关联。

    方法动态分派演示:

    public class DynamicDispatch {
        static abstract class Human {
            protected abstract void sayHello();
        }
        static class Man extends Human {
            @Override
            protected void sayHello() {
                System.out.println("man say hello");
            }
        }
        static class Woman extends Human {
            @Override
            protected void sayHello() {
                System.out.println("woman say hello");
            }
        }
        public static void main(String[] args) {
            Human man = new Man();
            Human woman = new Woman();
            man.sayHello();
            woman.sayHello();
            man = new Woman();
            man.sayHello();
        }
    }
    

    运行结果:

    man say hello
    woman say hello
    woman say hello
    

    这个运行结果相信不会出乎任何人的意料,对于习惯了面向对象思维的 Java 程序员们会觉得这是完全理所当然的结论。我们现在的问题还是和前面的一样,Java 虚拟机是如何判断应该调用哪个方法的?

    显然这里选择调用的方法版本是不可能再根据静态类型来决定的,因为静态类型同样都是 Human 的两个变量 man 和 woman 在调用 sayHello() 时产生了不同的行为,甚至变量 man 在两次调用中还执行了两个不同的方法。导致这个现象的原因很明显,是因为这两个变量的实际类型不同,Java 虚拟机是如何根据实际类型来分派方法执行版本的呢?我们使用 javap 命令输出这段代码的字节码,尝试从中寻找答案,输出结果如下代码所示。

    public static void main(java.lang.String[]);
     Code:
      Stack=2, Locals=3, Args_size=1
       0:   new     #16;         // class  cn/edu/nuist/DynamicDispatch$Man
       3:   dup
       4:   invokespecial   #18; // Method cn/edu/nuist/Dynamic Dispatch$Man."<init>":()V
       7:   astore_1
       8:   new     #19;         // class  cn/edu/nuist/DynamicDispatch$Woman
      11:  dup
      12:  invokespecial   #21;  // Method cn/edu/nuist/DynamicDispatch$Woman."<init>":()V
      15:  astore_2
      16:  aload_1
      17:  invokevirtual   #22;  // Method cn/edu/nuist/Dynamic Dispatch$Human.sayHello:()V
      20:  aload_2
      21:  invokevirtual   #22;  // Method cn/edu/nuist/Dynamic Dispatch$Human.sayHello:()V
      24:  new     #19;          // class  cn/edu/nuist/DynamicDispatch$Woman
      27:  dup
      28:  invokespecial   #21;  // Method cn/edu/nuist/DynamicDispatch$Woman."<init>":()V
      31:  astore_1
      32:  aload_1
      33:  invokevirtual   #22;  // Method cn/edu/nuist/Dynamic Dispatch$Human.sayHello:()V
      36:  return
    

    0~15 行的字节码是准备动作,作用是建立 man 和 woman 的内存空间、调用 Man 和 Woman 类型的实例构造器,将这两个实例的引用存放在第 1、2 个局部变量表的变量槽中,这些动作实际对应了 Java 源码中的这两行:

    Human man = new Man();
    Human woman = new Woman();
    

    接下来的 16~21 行是关键部分,16 和 20 行的 aload 指令分别把刚刚创建的两个对象的引用压到栈顶,这两个对象是将要执行的 sayHello() 方法的所有者,称为接收者(Receiver);17 和 21 行是方法调用指令,这两条调用指令单从字节码角度来看,无论是指令(都是 invokevirtual)还是参数(都是常量池中第 22 项的常量,注释显示了这个常量是 Human.sayHello() 的符号引用)都完全一样,但是这两句指令最终执行的目标方法并不相同。

    那看来解决问题的关键还必须从 invokevirtual 指令本身入手,要弄清楚它是如何确定调用方法版本、如何实现多态查找来着手分析才行。根据《Java 虚拟机规范》,invokevirtual 指令的运行时解析过程大致分为以下几步:

    1. 找到操作数栈顶的第一个元素所指向的对象的实际类型,记作 C。
    2. 如果在类型 C 中找到与常量中的描述符和简单名称都相符的方法,则进行访问权限校验,如果通过则返回这个方法的直接引用,查找过程结束;不通过则返回 java.lang.IllegalAccessError 异常。
    3. 否则,按照继承关系从下往上依次对 C 的各个父类进行第二步的搜索和验证过程。
    4. 如果始终没有找到合适的方法,则抛出 java.lang.AbstractMethodError 异常。

    正是因为 invokevirtual 指令执行的第一步就是在运行期确定接收者的实际类型,所以两次调用中的 invokevirtual 指令并不是把常量池中方法的符号引用解析到直接引用上就结束了,还会根据方法接收者的实际类型来选择方法版本,这个过程就是 Java 语言中“方法重写”的本质。我们把这种在运行期根据实际类型确定方法执行版本的分派过程称为「动态分派」。

    既然这种多态性的根源在于虚方法调用指令 invokevirtual 的执行逻辑,那自然我们得出的结论就只会对方法有效,对字段是无效的,因为字段不使用这条指令。事实上,在 Java 里面只有虚方法存在,字段永远不可能是虚的,换句话说,字段永远不参与多态,哪个类的方法访问某个名字的字段时,该名字指的就是这个类能看到的那个字段。当子类声明了与父类同名的字段时,虽然在子类的内存中两个字段都会存在,但是子类的字段会遮蔽父类的同名字段。为了加深理解,笔者又编撰了一份“劣质面试题式”的代码片段,请阅读如下代码,思考运行后会输出什么结果。

    public class FieldHasNoPolymorphic {
        static class Father {
            public int money = 1;
            public Father() {
                money = 2;
                showMeTheMoney();
                System.out.println("this: " + this.getClass());
            }
            public void showMeTheMoney() {
                System.out.println("I am Father, i have $" + money);
            }
        }
        static class Son extends Father {
            public int money = 3;
            public Son() {
                money = 4;
                showMeTheMoney();
            }
            public void showMeTheMoney() {
                System.out.println("I am Son,  i have $" + money);
            }
        }
        public static void main(String[] args) {
            Father gay = new Son();
            System.out.println("This gay has $" + gay.money);
        }
    }
    

    运行后输出结果为:

    I am Son, i have $0
    this: class FieldHasNoPolymorphic$Son
    I am Son, i have $4
    This gay has $2
    

    输出两句都是“I am Son”,这是因为 Son 类在创建的时候,首先隐式调用了 Father 的构造函数,而 Father 构造函数中对 showMeTheMoney() 的调用是一次虚方法调用,实际执行的版本是 Son::showMeTheMoney() 方法,所以输出的是“I am Son”,这点经过前面的分析相信读者是没有疑问的了。而这时候虽然父类的 money 字段已经被初始化成 2 了,但 Son::showMeTheMoney() 方法中访问的却是子类的 money 字段,这时候结果自然还是 0,因为它要到子类的构造函数执行时才会被初始化。main() 的最后一句通过静态类型访问到了父类中的 money,输出了 2。

    3.2.3 单分派与多分派

    〈方法的接收者〉与〈方法的参数〉统称为「方法的宗量」,这个定义最早应该来源于著名的《Java 与模式》一书。根据分派基于多少种宗量,可以将分派划分为“单分派”和“多分派”两种。单分派是根据一个宗量对目标方法进行选择,多分派则是根据多于一个宗量对目标方法进行选择。

    单分派和多分派的定义读起来拗口,从字面上看也比较抽象,不过对照着实例看并不难理解其含义,如下代码中举了一个 Father 和 Son 一起来做出“一个艰难的决定”的例子。

    public class Dispatch {
        static class QQ {}
        static class _360 {}
        public static class Father {
            public void hardChoice(QQ arg) {
                System.out.println("father choose qq");
            }
            public void hardChoice(_360 arg) {
                System.out.println("father choose 360");
            }
        }
    
        public static class Son extends Father {
            public void hardChoice(QQ arg) {
                System.out.println("son choose qq");
            }
            public void hardChoice(_360 arg) {
                System.out.println("son choose 360");
            }
        }
        public static void main(String[] args) {
            Father father = new Father();
            Father son = new Son();
            father.hardChoice(new _360());
            son.hardChoice(new QQ());
        }
    }
    

    运行结果:

    father choose 360
    son choose qq
    

    main() 里调用了两次 hardChoice() 方法,这两次 hardChoice() 方法的选择结果在程序输出中已经显示得很清楚了。

    • 首先关注的是编译阶段中编译器的选择过程,也就是「静态分派」的过程。这时候选择目标方法的依据有两点:一是〈静态类型〉是 Father 还是 Son,二是〈方法参数〉是 QQ 还是 360。这次选择结果的最终产物是产生了两条 invokevirtual 指令,两条指令的参数分别为常量池中指向 Father::hardChoice(360)Father::hardChoice(QQ) 方法的符号引用。因为是根据两个宗量进行选择,所以 Java 语言的静态分派属于“多分派类型”。
    • 再看看运行阶段中虚拟机的选择,也就是「动态分派」的过程。在执行 son.hardChoice(new QQ()) 这行代码时,更准确地说,是在执行这行代码所对应的 invokevirtual 指令时,由于编译期已经决定目标方法的签名必须为 hardChoice(QQ),虚拟机此时不会关心传递过来的参数“QQ”到底是“腾讯QQ”还是“奇瑞QQ”,因为这时候参数的静态类型、实际类型都对方法的选择不会构成任何影响,唯一可以影响虚拟机选择的因素只有该〈方法的接收者〉的实际类型是 Father 还是 Son。因为只有一个宗量作为选择依据,所以 Java 语言的动态分派属于“单分派类型”。

    根据上述论证的结果,我们可以总结一句:如今的 Java 语言是一门静态多分派、动态单分派的语言。

    3.2.4 VM 动态分派的实现

    前面介绍的分派过程,作为对 Java 虚拟机概念模型的解释基本上已经足够了,它已经解决了虚拟机在分派中“会做什么”这个问题。但如果问 Java 虚拟机“具体如何做到”的,答案则可能因各种虚拟机的实现不同会有些差别。

    动态分派是执行非常频繁的动作,而且动态分派的方法版本选择过程需要运行时在接收者类型的方法元数据中搜索合适的目标方法,因此, Java 虚拟机实现基于执行性能的考虑,真正运行时一般不会如此频繁地去反复搜索类型元数据。

    面对这种情况,一种基础而且常见的优化手段是为类型在方法区中建立一个虚方法表(Virtual Method Table,也称为 vtable,与此对应的,在 invokeinterface 执行时也会用到接口方法表 —— Interface Method Table,简称 itable),使用虚方法表索引来代替元数据查找以提高性能。

    虚方法表中存放着各个方法的实际入口地址。如果某个方法在子类中没有被重写,那子类的虚方法表中的地址入口和父类相同方法的地址入口是一致的,都指向父类的实现入口。如果子类中重写了这个方法,子类虚方法表中的地址也会被替换为指向子类实现版本的入口地址。

    在上图中,Son 重写了来自 Father 的全部方法,因此 Son 的方法表没有指向 Father 类型数据的箭头。但是 Son 和 Father 都没有重写来自 Object 的方法,所以它们的方法表中所有从 Object 继承来的方法都指向了 Object 的数据类型。

    为了程序实现方便,具有相同签名的方法,在父类、子类的虚方法表中都应当具有一样的索引序号,这样当类型变换时,仅需要变更查找的虚方法表,就可以从不同的虚方法表中按索引转换出所需的入口地址。虚方法表一般在类加载的连接阶段进行初始化,准备了类的变量初始值后,虚拟机会把该类的虚方法表也一同初始化完毕。

    上文中笔者提到了查虚方法表是分派调用的一种优化手段,由于 Java 对象里面的方法默认(即不使用 final 修饰)就是虚方法,虚拟机除了使用虚方法表之外,为了进一步提高性能,还会使用类型继承关系分析(Class Hierarchy Analysis,CHA)、守护内联(Guarded Inlining)、内联缓存(Inline Cache)等多种非稳定的激进优化来争取更大的性能空间。

    4. 基于栈的字节码解释执行引擎

    分析在“概念模型”下的 Java 虚拟机解释执行字节码时,其执行引擎是如何工作的。

    强调“概念模型”是因为实际的虚拟机实现,譬如 HotSpot 的模板解释器工作的时候,并不是按照下文中的动作一板一眼地进行机械式计算,而是动态产生每条字节码对应的汇编代码来运行,这与概念模型中执行过程的差异很大,但是结果却能保证是一致的。

    4.1 解释执行

    Java 语言经常被人们定位为“解释执行”的语言,在 Java 初生的 JDK 1.0 时代,这种定义还算是比较准确的,但当主流的虚拟机中都包含了即时编译器后,Class 文件中的代码到底会被解释执行还是编译执行,就成了只有虚拟机自己才能准确判断的事。

    再后来,Java 也发展出可以直接生成本地代码的编译器(如 Jaotc、GCJ,Excelsior JET),而 C/C++ 语言也出现了通过解释器执行的版本(如 CINT),这时候再笼统地说“解释执行”,对于整个 Java 语言来说就成了几乎是没有意义的概念。

    只有确定了谈论对象是某种具体的 Java 实现版本和执行引擎运行模式时,谈解释执行还是编译执行才会比较合理确切。

    大部分的程序代码转换成物理机的目标代码或虚拟机能执行的指令集之前,都需要经过下图中的各个步骤。如果读者对大学编译原理的相关课程还有印象的话,很容易就会发现下图中下面的那条分支,就是传统编译原理中程序代码到目标机器代码的生成过程;而中间的那条分支,自然就是解释执行的过程。

    如今,基于物理机、Java 虚拟机,或者是 !Java 的其他高级语言虚拟机(HLLVM)的代码执行过程,大体上都会遵循这种符合现代经典编译原理的思路,在执行前先对程序源码进行〈词法分析〉和〈语法分析〉处理,把源码转化为「抽象语法树(Abstract Syntax Tree,AST)」。对于一门具体语言的实现来说:

    • 词法、语法分析以至后面的优化器和目标代码生成器都可以选择独立于执行引擎,形成一个完整意义的编译器去实现,这类代表是 C/C++ 语言;
    • 也可以选择把其中一部分步骤(如生成抽象语法树之前的步骤)实现为一个半独立的编译器,这类代表是 Java 语言;
    • 又或者把这些步骤和执行引擎全部集中封装在一个封闭的黑匣子之中,如大多数的 JavaScript 执行引擎。

    在 Java 语言中,「Javac 编译器」完成了程序代码经过〈词法分析〉、〈语法分析〉到「抽象语法树」,再遍历「语法树」生成线性的字节码指令流的过程。因为这一部分动作是在 Java 虚拟机之外进行的,而「解释器」在虚拟机的内部,所以 Java 程序的编译就是半独立的实现。

    4.2 基于栈/寄存器的指令集

    Javac 编译器输出的字节码指令流,基本上(使用“基本上”,是因为部分字节码指令会带有参数,而纯粹基于栈的指令集架构中应当全部都是零地址指令,也就是都不存在显式的参数。Java 这样实现主要是考虑了代码的可校验性)是一种基于栈的指令集架构(Instruction Set Architecture,ISA),字节码指令流里面的指令大部分都是零地址指令,它们依赖操作数栈进行工作。

    与之相对的另外一套常用的指令集架构是基于寄存器的指令集,最典型的就是 x86 的二地址指令集,如果说得更通俗一些就是现在我们主流PC机中物理硬件直接支持的指令集架构,这些指令依赖寄存器进行工作。

    那么,基于栈的指令集与基于寄存器的指令集这两者之间有什么不同呢?


    举个最简单的例子,分别使用这两种指令集去计算“1+1”的结果,基于栈的指令集会是这样子的:

    iconst_1
    iconst_1
    iadd
    istore_0
    

    两条 iconst_1 指令连续把两个常量 1 压入栈后,iadd 指令把栈顶的两个值出栈、相加,然后把结果放回栈顶,最后 istore_0 把栈顶的值放到局部变量表的第 0 个变量槽中。这种指令流中的指令通常都是不带参数的,使用操作数栈中的数据作为指令的运算输入,指令的运算结果也存储在操作数栈之中。

    而如果用基于寄存器的指令集,那程序可能会是这个样子:

    mov  eax, 1
    add  eax, 1
    

    mov 指令把 EAX 寄存器的值设为 1,然后 add 指令再把这个值加 1,结果就保存在 EAX 寄存器里面。这种二地址指令是 x86 指令集中的主流,每个指令都包含两个单独的输入参数,依赖于寄存器来访问和存储数据。


    了解了基于栈的指令集与基于寄存器的指令集的区别后,读者可能会有个进一步的疑问,这两套指令集谁更好一些呢?

    应该说,既然两套指令集会同时并存和发展,那肯定是各有优势的,如果有一套指令集全面优于另外一套的话,就是直接替代而不存在选择的问题了。

    基于栈的指令集主要优点是可移植,因为寄存器由硬件直接提供(物理机器上的寄存器),程序直接依赖这些硬件寄存器则不可避免地要受到硬件的约束。如果使用栈架构的指令集,用户程序不会直接用到这些寄存器,那就可以由虚拟实现来自行决定把一些访问最频繁的数据(程序计数器、栈顶缓存等)放到寄存器中以获取尽量好的性能,这样实现起来也更简单一些。栈架构的指令集还有一些其他的优点,如代码相对更加紧凑(字节码中每个字节就对应一条指令,而多地址指令集中还需要存放参数)、编译器实现更加简单(不需要考虑空间分配的问题,所需空间都在栈上操作)等。

    栈架构指令集的主要缺点是理论上执行速度相对来说会稍慢一些,所有主流物理机的指令集都是寄存器架构也从侧面印证了这点。不过这里的执行速度是要局限在解释执行的状态下,如果经过即时编译器输出成物理机上的汇编指令流,那就与虚拟机采用哪种指令集架构没有什么关系了。

    在解释执行时,栈架构指令集的代码虽然紧凑,但是完成相同功能所需的指令数量一般会比寄存器架构来得更多,因为出栈、入栈操作本身就产生了相当大量的指令。更重要的是栈实现在内存中,频繁的栈访问也就意味着频繁的内存访问,相对于处理器来说,内存始终是执行速度的瓶颈。尽管虚拟机可以采取栈顶缓存的优化方法,把最常用的操作映射到寄存器中避免直接内存访问,但这也只是优化措施而不是解决本质问题的方法。因此由于指令数量和内存访问的原因,导致了栈架构指令集的执行速度会相对慢上一点。

    4.3 基于栈的解释器执行过程

    关于栈架构执行引擎的必要前置知识已经全部讲解完毕了,本节笔者准备了一段 Java 代码,以便向读者实际展示在虚拟机里字节码是如何执行的。

    public int calc() {
        int a = 100;
        int b = 200;
        int c = 300;
        return (a + b) * c;
    }
    

    这段代码从 Java 语言的角度没有任何谈论的必要,直接使用 javap 命令看看它的字节码指令,如下所示:

    public int calc();
        Code:
            Stack=2, Locals=4, Args_size=1
             0:   bipush  100
             2:   istore_1
             3:   sipush  200
             6:   istore_2
             7:   sipush  300
            10:  istore_3
            11:  iload_1
            12:  iload_2
            13:  iadd
            14:  iload_3
            15:  imul
            16:  ireturn
    }
    

    javap 提示这段代码需要深度为 2 的操作数栈和 4 个变量槽的局部变量空间,笔者就根据这些信息画了 7 张图片,来描述上述代码执行过程中的代码、操作数栈和局部变量表的变化情况。

    1. 首先,执行偏移地址为 0 的指令,bipush 指令的作用是将单字节的整型常量值(-128~127)推入操作数栈顶,跟随有一个参数,指明推送的常量值,这里是 100。
    2. 执行偏移地址为 2 的指令,istore_1 指令的作用是将操作数栈顶的整型值出栈并存放到第 1 个局部变量槽中。后续 4 条指令(直到偏移为 11 的指令为止)都是做一样的事情,也就是在对应代码中把变量 a、b、c 赋值为 100、200、300。这 4 条指令的图示略过。
    3. 执行偏移地址为 11 的指令,iload_1 指令的作用是将局部变量表第 1 个变量槽中的整型值复制到操作数栈顶。
    4. 执行偏移地址为 12 的指令,iload_2 指令的执行过程与 iload_1 类似,把第 2 个变量槽的整型值入栈。画出这个指令的图示主要是为了显示下一条 iadd 指令执行前的堆栈状况。
    5. 执行偏移地址为 13 的指令,iadd 指令的作用是将操作数栈中头两个栈顶元素出栈,做整型加法,然后把结果重新入栈。在 iadd 指令执行完毕后,栈中原有的 100 和 200 被出栈,它们的和 300 被重新入栈。
    6. 执行偏移地址为 14 的指令,iload_3 指令把存放在第 3 个局部变量槽中的 300 入栈到操作数栈中。这时操作数栈为两个整数 300。下一条指令 imul 是将操作数栈中头两个栈顶元素出栈,做整型乘法,然后把结果重新入栈,与 iadd 完全类似,所以笔者省略图示。
    7. 执行偏移地址为 16 的指令,ireturn 指令是方法返回指令之一,它将结束方法执行并将操作数栈顶的整型值返回给该方法的调用者。到此为止,这段方法执行结束。

    再次强调上面的执行过程仅仅是一种“概念模型”,虚拟机最终会对执行过程做出一系列优化来提高性能,实际的运作过程并不会完全符合概念模型的描述。更确切地说,实际情况会和上面描述的概念模型差距非常大,差距产生的根本原因是虚拟机中解析器和即时编译器都会对输入的字节码进行优化,即使解释器中也不是按照字节码指令去逐条执行的。

  • 相关阅读:
    记录ViewPager配合Fragment使用中遇到的一个问题
    StringBuffer类的构造方法
    认识StringBuffer类
    Java中增强for循环的用法
    xml解析案例
    XML的序列化(Serializer)
    文件权限之(介绍,更改,扩展)
    保存数据到sdcard中去
    反编译
    后端——框架——容器框架——spring_core——格式化器
  • 原文地址:https://www.cnblogs.com/liujiaqi1101/p/14787251.html
Copyright © 2020-2023  润新知