• 【JVM虚拟机】(5)---深入理解JVM-Class中常量池


    深入理解Class---常量池

    一、概念

    1、jvm生命周期

    启动:当启动一个java程序时,一个jvm实例就诞生了,任何一个拥有main方法的class都可以作为jvm实例运行的起点。

    运行:main()函数作为程序初始线程起点,其它线程由该线程启动,包括守护线程(daemon)和non-daemon(普通线程)。守护线程是JVM自己使用的线程比如GC线程就是个守护线程,只要这个jvm实例还有普通线程执行,就不会停止,但是可以用exit()强制终止程序。

    消亡:所有非守护线程退出时,JVM实例结束生命,若安全管理器允许,程序也可以使用java.lang.Runtime类或者System.exit(0)来退出。实际上exit也是用到Runtime类来退出,Runtime是个神奇的类,它还可以用于启动和关闭非java进程。

    2、JVM与Class文件

    我们一直说java虚拟机实现的与语言是无关的,java虚拟机不和包含java在内的任何语言绑定,它只和与class文件这种特殊的二进制文件格式所关联,class文件中包含了java虚拟机指令集符号表以及若干其他辅助信息。基于安全方面的考虑, Java 虑拟机规范要求在 Class 文件中使用许多强制性的语法和结构化约束,但任一门功能性语言都可以表示为一个能被 Java 虚拟机所接受的有效的 Class 文件。作为一个通用的、机器无关的执行平台,任何其他语言的实现者都可以将 Java 虚拟机作为语言的产品交付媒介。例如,使用 Java 编译器可以把 Java 代码编译为存储字节码的 Class 文件,使用 JRuby 等其他语言的编译器同样可以把程序代码编译成 Class 文件,虚拟机并不关心Class 的来源是何种语言,如图。

    3、什么是Class文件

    Java字节码类文件(.class)是Java编译器编译Java源文件(.java)产生的“目标文件”。它是一种8位字节的二进制流文件, 各个数据项按顺序紧密的从前向后排列, 相邻的项之间没有间隙, 这样可以使得class文件非常紧凑, 体积轻巧, 可以被JVM快速的加载至内存, 并且占据较少的内存空间(方便于网络的传输)。

    class文件是一组以8位字节为基础单位的二进制流。
    

    class文件中的信息是一项一项排列的, 每项数据都有它的固定长度, 有的占一个字节, 有的占两个字节, 还有的占四个字节或8个字节, 数据项的不同长度分别用u1, u2, u4, u8表示, 分别表示一种数据项在class文件中占据一个字节, 两个字节, 4个字节和8个字节。

    4、什么是魔数

    当我们把class文件转成16进制,我们可以看到文件的头四个字节是cafe babe,这个就称为魔数。,它唯一作用就告诉虚拟机当前的文件就是class文件。
    使用魔数而不是用扩展名来进行识别主要是基于安全考虑,因为扩展名我们可以随意通过重命名等方式改动。而通过魔数就算你把结尾改成.clss。但它同样还能在JVM运行,因为它的头部还是cafe babe没变。
    很多文件存储标准中都用魔数进行身份标识,如图片gif,jpeg都在文件头部中存储着魔数。

    5、jvm常量池

    我先讲下概念,接下来我会将class文件转为16进制流后,在举例说明。

    常量池中每一项常量都是一个表,jdk1.8有14种结构不同的表结构,这14个表有个共同特点,就是表开始的第一位都是一个u1类型的标志位,JVM根据这个标志位[tag]来确定某个常量池项表示什么类型的字面量,比如tag为1就是指CONSTANT_utf8_info

    再看常量池类型表

    这14种常量项结构还有一个特点是,其中13表占用得字节固定,只有CONSTANT_Utf8_info占用字节不固定,其大小由length决定。为什么呢?因为从常量池存放的内容可知,其存放的是字面量和符号引用,最终这些内容都会是一个字符串,
    这些字符串的大小是在编写程序时才确定,比如你定义一个类,类名可以取长取短,所以在没编译前,无法确定大小不固定,编译后,通过utf-8编码,就可以知道其长度。

    在看每一项常量表对应的说明:


    二、16进制class文件解析

    先看java代码

    package com.jincou.demo.domain;
    public class XiaoXiao {
        private String father;
        public String fatherName() {
            return "小小她爹";
        }
    }
    
    

    通过命令自动生成class文件(会在同一目录生成)

    javac XiaoXiao.java
    

    在将class文件拖入文本编辑器里,显示自然就是16进制流了,如下:

    上面的表其实可以划分为以下七个部分,.class 字节码文件包括:

    • 魔数与class文件版本
    • 常量池
    • 访问标志
    • 类索引、父类索引、接口索引
    • 字段表集合
    • 方法表集合
    • 属性表集合

    这篇博客只讲到常量池,其它的下篇讲,接下来我们一行一行解释,首先是:

    cafe babe:上面说过了这个是魔数,告诉JVM虚拟机我就是class文件。

    0000 0034:次版本号组成u2+主版本号u2。共占4个字节。0034转10进制为52,代表当前JDK版本为1.8。

    0013 :说明有19-1即18个常量。

    上面这些位置是固定的。接下来就是说明每一个常量:

    0a:这就是tag代表一个标志,0a代表10,去找常量池列表。

    得知它是一个接口中方法的符号引用,然后去找CONSTANT_Methodref_info对应常量列表描述:

    从常量列表我们可以知道该类型一共占了5u,即0a00 0400 0f,那么下一个tag就是08代表字符串类型常量,以此类推就可以知道一共18个常量的信息。

    三、class反编译

    通过上面看16进制的却太麻烦了,现在我们可以通过JDK自带反编译工具查看会更加清晰。

    javap -verbose 文件名
    

    通过反编译看去就很直观,比如第一个字符常量很明显告诉你是CONSTANT_Methodref_info,而且对于的就是4和15和上面完美对应。

    最后思考,到底哪些会放到常量池?

    1.常量池可以理解为class文件中的资源仓库,有很多种类型,主要存放两大常量
    ①.字面量 
    字面量就是通俗理解的java常量,如文本字符串,8大基本数据类型,final修饰的常量值等
    ②.符号引用
    符号引用属于编译原理的概念,主要包含以下三种
    1)类和接口的全限定名
    2)字段的名称和描述符
    3)方法的名称和描述符
    

    参考

    1、深入了解java虚拟机第2版第六章

    2、深入理解JVM-Class文件结构和类加载

    3、深入理解JVM之Java字节码(.class)文件详解



    只要自己变优秀了,其他的事情才会跟着好起来(少将3)
    
  • 相关阅读:
    python中的GIL
    centos7 安装docker
    ORACLE INSERT INTO SELECT
    Java substring几个用例
    Java Date类型转换、操作等(util.Date sql.Date,)
    ORACLE 按字段去除重复数据
    OFFICE技巧汇编
    ORACLE自动类型转换的坑
    ubuntu下,pycharm svn 版本控制,svn服务器在win下
    【草稿】pip重要命令;python 变量命名规则
  • 原文地址:https://www.cnblogs.com/qdhxhz/p/10646088.html
Copyright © 2020-2023  润新知