现在让你谈谈对Java平台的理解,你是否会感觉内容过于庞大?这个问题是比较宽泛的,Java发展到现在已经不仅仅是语言这么简单了,Java平台涉及的,包括但不仅限于下面提到的这些内容:
- Java语言本身,包括基础的语言特性,面向对象、放射、范型、lambda等等。
- Java类库,包括核心类库如IO/NIO、网络、utils、安全、jdk等,以及在生产环境中常用的第三方类库。
- Java虚拟机,包括java的内存管理机制、垃圾收集器、运行时、动态编译等
- Java/JVM生态,包括了Java EE、Spring、Hadoop、Spark等等
- Java工具,包括用来诊断性能如jmap、jstack等、编译器javac、sjavac、以及辅助工具如jlink、jar等。
这些内容无法在一个篇幅中都提到。本文从Java等基本特性开始,先来回答一个问题“Java是编译执行语言,这句话对吗?”,我们又该如何理解Java的“书写一次 ,到处执行”呢?
Java语言本身最显著的两大特性是“书写一次,到处运行(Write Once,run anywhere)“,以及垃圾收集。这两点都和C++有明显的区别。
”书写一次,到处运行“的能力是基于Java 虚拟机(JVM)的。Java源代码编译后生成的.class文件并不是最终的机器码,而是一种可以被JVM解析的格式,称为字节码。JVM将字节码翻译成机器码后执行机器码来运行程序。只要在不同的操作系统上安装好JVM后,.class文件便可以在这些JVM上运行。
从这个过程来看,字节码是在JVM中被解释执行的,那么“Java是解释执行的语言”这句话正确吗?这句话不太准确,常见的JVM,比如我们最经常使用的Oracle JDK提供的JVM,都提供了JIT(Just-In-Time)编译器,也就是通常所说的即时编译(https://en.wikipedia.org/wiki/Just-in-time_compilation)。为了提高热点代码的执行效率,在运行时,JVM会把这些代码编译成与本地平台相关的机器码,并进行各种层次的优化,这种情况下,热点代码就属于“编译执行”而不是解释执行。JVM提供了不同的参数来对这两种模式进行指定,例如-Xint
告诉JVM只进行解释执行,不对代码进行编译,这种模式就抛弃了JIT带来的性能上的优化。同时另一个参数-Xcomp
则是告诉JVM不要进行解释执行,这种模式也叫做“最大优化级别”,但实际上也并不一定会高效。
总的来说,Java的“编译”和C/C++的编译含义是不同的。Java源代码编译后生成的.class文件中是字节码,而不是可以直接运行的机器码。JVM通过类加载器(class-loader)来加载字节码,进行解释执行或编译执行。除了上面说到的这两种编译模式外,还有一种编译模式称为AOT(Ahead-of-Time Compilation)(https://en.wikipedia.org/wiki/Ahead-of-time_compilation),AOT可以将字节码直接编译成机器码,在JDK 9中便引入了这些特性。更多的细节可以参考文档http://openjdk.java.net/jeps/295。
JVM本身是一个强大的平台,它除了使得Java源代码编译生成的字节码具备”书写一次,到处运行“的能力外,只要符合格式的字节码,都可以运行在JVM上,所以大量的JVM语言的字节码都可以在JVM上运行,例如Scala。
关于Java平台的更多内容,请看后续文章。