• BEA WebLogic JRockit的使用和性能调优


    一.JRockit调优简介 
    JRockit是一个自适应的JVM,它能够自动调整自己去适应底层硬件,因此对它的调优主要集中在一些需要人工干预的参数上,比如说:需要划分多少RAM给JRockit使用等。JRockit有一组非标准的-X启动选项,我们可以用它来调节JVM。JRockit有两组主要的子系统可以被优化--内存管理系统(包括垃圾回收)和线程系统。在内存管理子系统方面,有很多调优的工作可以做。


    二.Tuning WebLogic JRockit JVM 
    1.设置初始堆尺寸 
    可以通过-Xms:<size>m来设置初始堆大小,如果-Xmx的值小于128MB,则-Xms缺省取值为16MB;如果-Xmx设置大于128MB,则-Xms缺省值为物理内存的25%,最大不超过64M。例子:
    $java -Xgc:gencon -xms:64m -Xmx:64m myClass
    2.设置最大堆尺寸
    可以通过-Xmx:<size>m来设置最大堆尺寸。在IA32构架下,由于操作系统给每个进程的最大内存寻址空间为1.8G,因此最大堆尺寸不能超过1.8G。在IA64构架下,就没有1.8G的限制。
    如果你的JAVA应用程序在运行时出现了Out of memory的错误,你就需要调大最大堆尺寸。如果没有设置最大堆尺寸,则缺省值为:
    1. 如果设置了-Xgc:gencopy,由最大堆尺寸是min{400, 物理内存*75%};
    2. 如果没有设置-Xgc:gencopy,由最大堆尺寸是min{1536, 物理内存*75%};
    最好手工把最大堆尺寸设置为物理内存(1024M)的75%:
    $java -Xgc:gencon -xms:64m -Xmx:768m myClass
    3.设置Nursery的尺寸
    可以使用-Xns:<size>来设置Nursery的尺寸,我们要在保证垃圾回收停顿时间(garbage collection-pause)尽可能短的同时,尽量加大Nursery的尺寸,这在创建了大量的临时对象时尤其重要。缺省值为:
    1. 对于-Xgc:gencopy,缺省的Nursery大小为320KB/CPU,对于10个CPU的系统来说,Nursery大小为3200KB(3.2M)
    2. 对于-Xgc:gencon,缺省的Nursery大小为10M/CPU,对于10个CPU的系统来说,Nursery大小为100M
    4.定义内存空间的清理时机
    可以使用-Xcleartype:<gc|local|alloc>来定义已经被垃圾回收的内存空间在什么时候可以被清理,支持以下三种方式:
    1. gc,在垃圾回收的同时清理内存;
    2. local,在分配了一块thread-local区域时清理内存,仅在把参数-Xallocationtype设置成local时才有用;
    3. alloc,在这块内存被分配给其它对象时清理。在IA64上目前还不支持。
    缺省值为:
    1. IA32上缺省值为alloc
    2. IA64上缺省值为gc
    5.定义线程分配的类型
    可以使用-Xallocationtype:<global|local>来定义线程分配的类型。
    1. global,在最大堆尺寸比较小时(小于128M)或者应用程序大量使用了线程时使用。
    2. local,在最大堆尺寸比较大时(大于128M)或者应用程序少量使用了线程时使用。
    缺省值:
    1. 如果设置了-Xgc:gencopy,缺省值为global
    2. 如果设置了-Xgc:siglecon,-Xgc:gencon和-Xgc:parallel,缺省值为local
    6.定义线程栈尺寸
    可以使用-Xss<size>[k|K][m|M]来定义线程栈大小。最小线程尺寸定义如下:
    1. thin threads:最小线程栈尺寸为8K,缺省为64K;
    2. native threads:最小线程栈尺寸为16K
    如果-Xss设置小于最小值,则自动使用最小值。
    缺省值:
    1. IA32系统,WIN32:64K,LINUX32:128K
    2. IA64系统,WIN64:320K,LINUX64:1M

    二.Basic Tuning Tips and Techniques 
    尽管JRockit提供了一组缺省的OOTB配置选项,但最好根据实际应用情况来对JRockit作一些调整。
    1.决定你要在哪方面调优
    要考虑的因素有:
    1. 要为JRockit分配多少内存空间;
    2. 你要调优的目的是什么,是要得到更好的响应性还是更好的性能;
    2.设置堆尺寸
    对于堆尺寸来说,当然是越大越好了。如果设得不够大,就会造成Out-of-memory和内存分页错。如果同时运行了多个应用程序,建议把最小和最大堆尺寸设置成一样大。
    3.在高响应性方面的调优 
    要得到更好的响应性能,应该设置
    1. 使用并发垃圾回收器。-Xgc:gencon
    2. 设置初始和最大堆大小。-Xms512m,-Xmx768m,由于使用了并发垃圾回收器,所以堆大小不会造成长时间的等待。
    3. 设置nursery尺寸。如果用到了大量的临时对象,则需要适当的调大nursery尺寸。调大nursery尺寸会导致垃圾回收的停顿时间加长,因此要注意,确保垃圾回收的停顿时间在可忍受的范围内,这个停顿时间可以通过设置-Xgcpause来查看。
    4.在高性能方面的调优
    如果要得到更好的性能,你应该:
    1. 选用并行垃圾回收器,由于并行垃圾回收器不使用nursery,因此你不必再设置-Xns,方法是加上-Xgc:parallel
    2. 把初始和最大堆尺寸设置调到尽可能的大。方法是-Xms512m, -Xmx768m。
    5.分析垃圾回收和停顿时间
    1. 使用-Xgcreport生成报表,显示垃圾回收的统计信息,从中可以看出你是不是最有效地使用了垃圾回收器。
    2. 使用-Xverbose:memory来显示在运行期间每一次垃圾回收的停顿时间。本选项仅用于调试,会产生大量的控制台输出。
    6.调整线程选项
    当大量地使用了线程时(超过100个),需要调整线程选项:
    1. 使用thin线程选项。-Xthinthreads。瘦线程模式在LINUX下非常有效。注意:瘦线程在JRockit中只是一个试验选项,不推荐广泛使用;
    2. 关闭本地分配线程的选项。-Xallocationtype:global。每个本地线程区都要消耗大约2K的内存,如果大量地使用了线程,本地线程不但会造成内存空间浪费,而且还会造成堆碎片。使用全局线程机制会减少堆碎片,但在内存分配方面速度要慢一些。
    7.分析并改善应用程序设计
    找出瓶颈方法:
    1. 使用Intel VTune工具;
    2. 使用-Xjvmpi:allocs=off,monitors=off,entryexit=off选项。

    三.Command Line Options by Name 
    启动JRockit时,可以带一些-X选项,这些选项是非JVM标准的,专门用于配置JRockit的性能。

    选项
    描述

    -X

    显示扩展Java选项

    -Xallotype

    -Xallocationtype

    可取值global和local,定义使用本地线程还是全局线程。

    -Xbootclasspath

    指定类搜索路径,可以是ZIP和JAR文件,以;或:分隔

    -Xcleartype

    定义内存清理时机,可取值gc, local, alloc。gc表示在垃圾回收时清理内存;local表示时分配一块local线程区时清理;alloc表示内存区要被分配给其它对象时清理

    -Xgc

    选择要使用的垃圾回收器的类型,可取值:

    gencopy:generational copying

    singlecon:single spaced concurrent,单空间并发

    gencon:generational concurrent

    parallel:parallel

    如果-Xmx小于128M,缺省使用gencopy,否则使用gencon

    -Xgcpause

    打印由垃圾回收器造成的停顿时间

    -Xgcreport

    打印垃圾回收报表

    -Xjvmpi

    是否允许JVMPI事件,这些事件有:

    entryexit(缺省ON)

    allocs(缺省ON)

    monitors(缺省ON)

    arenasdelete(缺省OFF)

    -Xmanagement

    激活JVM中的管理服务器,在JVM的管理控制台能连接到它之前,必须先激活。

    -Xms

    设置初始堆大小,单位有K、M、G

    -Xmx

    设置最大堆大小,单位有K、M、G

    -Xnativethreads

    使用本地线程系统,这是缺省选项

    -Xnoclassgc

    禁止对类作垃圾回收

    -Xnohup

    告诉JRockit,忽略CTRL_LOGOFF_EVENT和SIGHUP事件

    -Xns

    设置nursery尺寸,单位有K、M、G

    -Xss

    设置线程栈尺寸,单位有K、M、G

    -Xthinthreads

    使用JRockit的高性能线程系统,在IA64上不可用。

    -Xverbose

    让JRockit打印更多的信息,可选的参数有:

    codegen、cpuinfo、gc、load、memory、Opt

    -Xverify

    作完整的bytecode一级的校验

    四.用JRockit8.1中的Method Profiler调优WebLogic 
    1.关于Method Profiler工具 
    BEA WebLogic JRockit 8.1提供了一个Profiling工具:Method Profiler来调优WebLogic应用。
    2.利用Method Profiler调优WebLogic应用
    JRockit 8.1所带的Method Profiler工具能够将所有在JRockit Java虚拟机上执行的成员方法的调用次数、执行的总时间和每次调用的执行时间都统计出来,如图1所示。这样的功能一来可以让我们对跑在WebLogic上的应用进行tuning(代码级的),二来也大大方便了我们确定系统瓶颈在何处。这也可以说是JRockit JVM相对于其他JVM在功能上的一大优势。

    在一次对WebLogic Server 8.1的压力测试中,对一组包含了CMP特性的样本进行压力测试时,就利用JRockit的Method Profiler诊断出了系统的瓶颈所在,现介绍如下。CMP这组样本中原先对CMP Entity Bean的操作除了用ejbCreate插入一条记录之外,紧跟着用setName方法设置其name属性,即UPDATE其对应数据库记录中name域的值,代码如下:
    public void ejbCreate() //Stateful4CMPBean中的方法
    throws CreateException
    {
    try
    {
    Context ctx = new InitialContext();
    SheepHome home = (SheepHome)ctx.lookup("Sheep");
    Sheep sheep = null;
    int x = getNextId(); // getNextId()也包含对数据库的操作
    sheep = home.create(x);
    if(sheep != null)
    {
    sheep.setName("sheep1".concat(String.valueOf(String.valueOf(x))));
    m_strMsg = "create sheep".concat(String.valueOf(String.valueOf(x)));
    } else
    {
    m_strMsg = "The sheep name is not created.";
    }
    }
    catch(Exception e)
    {
    m_strMsg = 
    "*** some exception occured! (CMP) ".concat(String.valueOf(String.valueOf(e.getMessage())));
    }
    }
    此时测出来的数据,TPS平均值非常低,且测试时Response Time总是随着时间的增长几乎呈线性攀升。于是用Method Profiler进行诊断:
    (1) 在JRockit的启动参数中加入-Xmanagement,以便启动JRockit的时候同时启动其Management Server。
    (2) 启动JRockit Management Console,并且将其连接到启动了的Management Server上。(在做压力测试时用JRockit Management Console进行观察对性能的损耗可以忽略不计)
    (3) 在JRockit Management Console中,将ToolsàPreferences菜单中的Mode of operation属性设为developer。
    (4) 在Method Profiler属性页中添加你所需要观察的类的成员方法。
    (5) 按Start按钮让Method Profiler开始进行统计。
    Time/Inv(ns)指标的显示结果表明Stateful4CMPBean.ejbCreate()代码所含逻辑成为了系统的瓶颈。结果又显示getNextId()和home.create()操作消耗的时间只占Stateful4CMPBean.ejbCreate()的一小部分,而sheep.setName()操作消耗的时间却占了Stateful4CMPBean.ejbCreate()的剩下的(指除去getNextId()和home.create()操作消耗的时间)绝大部分。
    于是又用Method Profiler作了一系列实验,结果如下:用1个用户做压力测试,sheep.setName()操作消耗的时间为X,getNextId()操作消耗的时间为Y,home.create()操作消耗的时间为Z;用2个用户做压力测试,sheep.setName()操作消耗的时间约为2X,getNextId()操作消耗的时间约为Y,home.create()操作消耗的时间约为Z;用3个用户做压力测试,sheep.setName()操作消耗的时间约为3X,getNextId()操作消耗的时间约为Y,home.create()操作消耗的时间约为Z。可以比较肯定地判断,sheep.setName()执行的是一个串行化的逻辑。检查Oralce中UPDATE的ISOLATION-LEVEL,果然为SERIALIZABLE。
    将sheep.setName("sheep1".concat(String.valueOf(String.valueOf(x)))); 这句代码删掉。
    重新测试,TPS平均值有很大幅度的提高,Response Time在压力测试开始一段时间后也趋于平稳,几乎呈水平线走势。

     作者简介
      经乾是(dev2dev ID: jq75) BEA系统(中国)有限公司 渠道部技术顾问
  • 相关阅读:
    C编程规范
    c# 闭包 小例
    计算前后2行的时间差
    判断是不是奇数
    条件表达式工具类
    代码重构-5 取消类的私有变量(实例变量)
    代码重构-4 通用方法 用 static
    代码重构-3 用Tuple代替 out与ref
    代码重构-2 简单不变的 if else 用字典代替
    代码重构-1 对参数中有 bool值的拆分
  • 原文地址:https://www.cnblogs.com/meetrice/p/1877769.html
Copyright © 2020-2023  润新知