• JVM源码分析之jstat工具原理完全解读


    概述

    jstat是hotspot自带的工具,和java一样也位于JAVA_HOME/bin下面,我们通过该工具可以实时了解当前进程的gc,compiler,class,memory等相关的情况,具体我们可以通过jstat -options来看我们到底支持哪些类型的数据,譬如JDK8下的结果是:

    -class-compiler
    -gc
    -gccapacity
    -gccause
    -gcmetacapacity
    -gcnew
    -gcnewcapacity
    -gcold
    -gcoldcapacity
    -gcutil
    -printcompilation

    jstat的输出

    jstat大家用得其实挺多的,最常见的用法是jstat -gcutil,输出如下:

    ~ ᐅ jstat -gcutil 692 1000
      S0     S1     E      O      M     CCS    YGC     YGCT    FGC    FGCT     GCT  0.00  41.49  59.79  83.66  89.92  78.74    295    5.436    10    3.855    9.291
      0.00  41.49  59.80  83.66  89.92  78.74    295    5.436    10    3.855    9.291
      0.00  41.49  59.80  83.66  89.92  78.74    295    5.436    10    3.855    9.291
      0.00  41.49  59.80  83.66  89.92  78.74    295    5.436    10    3.855    9.291
      0.00  41.49  59.80  83.66  89.92  78.74    295    5.436    10    3.855    9.291

    那每一列是怎么定义,怎么计算的呢,其实在tools.jar里存在一个文件叫做jstat_options,这个文件里定义了上面的每种类型的输出结果,比如说gcutil

    option gcutil {
      column {
        header "^S0^"    /* Survivor 0 Space - Percent Used */
        data (1-((sun.gc.generation.0.space.1.capacity - sun.gc.generation.0.space.1.used)/sun.gc.generation.0.space.1.capacity)) * 100
        scale raw
        align right
        width 6
        format "0.00"
      }
      column {
        header "^S1^"    /* Survivor 1 Space - Percent Used */
        data (1-((sun.gc.generation.0.space.2.capacity - sun.gc.generation.0.space.2.used)/sun.gc.generation.0.space.2.capacity)) * 100
        scale raw
        align right
        width 6
        format "0.00"
      }
      column {
        header "^E^"    /* Eden Space - Percent Used */
        data (1-((sun.gc.generation.0.space.0.capacity - sun.gc.generation.0.space.0.used)/sun.gc.generation.0.space.0.capacity)) * 100
        align right
        scale raw
        width 6
        format "0.00"
      }
      column {
        header "^O^"    /* Old Space - Percent Used */
        data (1-((sun.gc.generation.1.space.0.capacity - sun.gc.generation.1.space.0.used)/sun.gc.generation.1.space.0.capacity)) * 100
        align right
        scale raw
        width 6
        format "0.00"
      }
      column {
        header "^M^"    /* Metaspace Space - Percent Used */
        data (1-((sun.gc.metaspace.capacity - sun.gc.metaspace.used)/sun.gc.metaspace.capacity)) * 100
        align right
        width 6
        scale raw
        format "0.00"
      }
      column {
        header "^CCS^"    /* Compressed Class Space Space - Percent Used */
        data (1-((sun.gc.compressedclassspace.capacity - sun.gc.compressedclassspace.used)/sun.gc.compressedclassspace.capacity)) * 100
        align right
        width 6
        scale raw
        format "0.00"
      }
      column {
        header "^YGC^"    /* Young Generation Collections */
        data sun.gc.collector.0.invocations
        align right
        width 6
        format "0"
      }
      column {
        header "^YGCT^"    /* Young Generation Collection Time */
        data sun.gc.collector.0.time/sun.os.hrt.frequency
        align right
        scale sec
        width 8
        format "0.000"
      }
      column {
        header "^FGC^"    /* Full Collections */
        data sun.gc.collector.1.invocations
        align right
        width 5
        scale raw
        format "0"
      }
      column {
        header "^FGCT^"    /* Full Collection Time */
        data sun.gc.collector.1.time/sun.os.hrt.frequency
        align right
        scale sec
        width 8
        format "0.000"
      }
      column {
        header "^GCT^"    /* Total Garbage Collection Time */
        data (sun.gc.collector.0.time + sun.gc.collector.1.time)/sun.os.hrt.frequency
        align right
        width 8
        scale sec
        format "0.000"
      }
    }

    从上面的定义我们知道gcutil的每一列是什么意思,怎么计算出来的,其中类似sun.gc.generation.0.space.0.capacity这样的一些变量是jvm里创建并实时更新的值

    jstat如何获取到这些变量的值

    变量值显然是从目标进程里获取来的,但是是怎样来的?local socket还是memory share?其实是从一个共享文件里来的,这个文件叫PerfData,主要指的是/tmp/hsperfdata_<user>/<pid>这个文件

    PerfData文件

    文件创建

    这个文件是否存在取决于两个参数,一个UsePerfData,另一个是PerfDisableSharedMem,如果设置了-XX:+PerfDisableSharedMem或者-XX:-UsePerfData,那这个文件是不会存在的,默认情况下PerfDisableSharedMem是关闭的,UsePerfData是打开的,所以默认情况下PerfData文件是存在的。对于UsePerfData和PerfDisableSharedMem这两个参数,这里着重讲一下:

    • UsePerfData:如果关闭了UsePerfData这个参数,那么jvm启动过程中perf memory都不会被创建,jvm运行过程中自然不会再将这些性能数据保存起来,默认情况是是打开的

    • PerfDisableSharedMem:该参数决定了存储PerfData的内存是不是可以被共享,也就是说不管这个参数设置没设置,jvm在启动的时候都会分配一块内存来存PerfData,只是说这个PerfData是不是其他进程可见的问题,如果设置了这个参数,说明不能被共享,此时其他进程将访问不了该内存,这样一来,譬如我们jps,jstat等都无法工作。默认这个参数是关闭的,也就是默认支持共享的方式

    具体代码在PerfMemory::create_memory_region里

     if (PerfDisableSharedMem) {    // do not share the memory for the performance data.
        _start = create_standard_memory(size);
      }  else {
        _start = create_shared_memory(size);    if (_start == NULL) {      // creation of the shared memory region failed, attempt
          // to create a contiguous, non-shared memory region instead.
          //
          if (PrintMiscellaneous && Verbose) {
            warning("Reverting to non-shared PerfMemory region.
    ");
          }
          PerfDisableSharedMem = true;
          _start = create_standard_memory(size);
        }
      }

    文件删除

    那这个文件什么时候删除?正常情况下当进程退出的时候会自动删除,但是某些极端情况下,比如kill -9,这种信号jvm是不能捕获的,所以导致进程直接退出了,而没有做一些收尾性的工作,这个时候你会发现进程虽然没了,但是这个文件其实还是存在的。那这个文件是不是就一直留着,只能等待人为的删除呢,jvm里考虑到了这种情况,会在当前用户接下来的任何一个java进程(比如说我们执行jps)起来的时候会去做一个判断,遍历/tmp/hsperfdata_<user>下的进程文件,挨个看进程是不是还存在,如果不存在了就直接删除该文件,判断是否存在的具体操作其实就是发一个kill -0的信号看是否有异常。

    文件更新

    由于这个文件是通过mmap的方式映射到了内存里,而jstat是直接通过DirectByteBuffer的方式从PerfData里读取的,所以只要内存里的值变了,那我们从jstat看到的值就会发生变化,内存里的值什么时候变,取决于-XX:PerfDataSamplingInterval这个参数,默认是50ms,也就是说50ms更新一次值,基本上可以认为是实时的了。

    PerfData其他相关VM参数

    • -XX:PerfDataMemorySize:指定/tmp/hsperfdata_<user>
      下perfData文件的大小,默认是32KB,如果用户设置了该值,jvm里会自动和os的page size对齐,比如linux下pagesize默认是4KB,那如果你设置了31KB,那自动会分配32KB

    • -XX:+PerfDataSaveToFile:是否在进程退出的时候将PerfData里的数据保存到一个特定的文件里,文件路径由下面的参数指定,否则就在当前目录下

    • -XX:PerfDataSaveFile:指定保存PerfData文件的路径

    jstat里的坑

    本人暂时想到的两大坑:

    • 一次正常的Background CMS GC之后,发现FGC的值加了2次,后面发现主要原因是CMS有init mark和remark两个会暂停应用的阶段,同时因为是对old做gc,因此算了两次

    • JDK8下metaspace的使用情况不准确,比如说CCSC的值表示的是 Compressed Class Space Capacity,但是发现这个值的计算却不是reserve的值,所以我们可能会发现metaspace其实用了非常少,但是通过jstat看起使用率已经非常大了,因此这种情况最好是通过jmx的方式去取那些值做一个计算

    size_t CompressedClassSpaceCounters::capacity() {  return MetaspaceAux::committed_bytes(Metaspace::ClassType);
    }
    

      

    推荐阅读:

    大数据中台之Kafka,到底好在哪里?

    一个 JVM 参数引发的频繁 CMS GC

  • 相关阅读:
    苹果系统的时间兼容问题
    WOWJS+animate滚动特效
    js的帧动画
    网页图片透明加载
    文字不可被选中设置属性!
    [转]阻塞IO与非阻塞IO
    死锁
    TCP 三次握手四次挥手
    键入网址后,期间发生了什么
    堆排序
  • 原文地址:https://www.cnblogs.com/perfma/p/12456056.html
Copyright © 2020-2023  润新知