• 20220605 JVM下篇:性能监控与调优篇 1. 概述篇


    1. 大厂面试题

    支付宝:
    支付宝三面:JVM性能调优都做了什么?
     
    小米:
    有做过JVM内存优化吗?
    从SQL、JVM、架构、数据库四个方面讲讲优化思路
     
    蚂蚁金服:
    JVM的编译优化
    jvm性能调优都做了什么
    JVM诊断调优工具用过哪些?
    二面:jvm怎样调优,堆内存、栈空间设置多少合适
    三面:JVM相关的分析工具使用过的有哪些?具体的性能调优步骤如何
     
    阿里:
    如何进行JVM调优?有哪些方法?
    如何理解内存泄漏问题?有哪些情况会导致内存泄漏?如何解决?
     
    字节跳动:
    三面:JVM如何调优、参数怎么调?
     
    拼多多:
    从SQL、JVM、架构、数据库四个方面讲讲优化思路
     
    京东:
    JVM诊断调优工具用过哪些?
    每秒几十万并发的秒杀系统为什么会频繁发生GC?
    日均百万级交易系统如何优化JVM?
    线上生产系统OOM如何监控及定位与解决?
    高并发系统如何基于G1垃圾回收器优化性能?
    

    2. 背景说明

    生产环境中的问题

    • 生产环境发生了内存溢出该如何处理?

    • 生产环境应该给服务器分配多少内存合适?

    • 如何对垃圾回收器的性能进行调优?

    • 生产环境 CPU 负载飙高该如何处理?

    • 生产环境应该给应用分配多少线程合适?

    • 不加 log ,如何确定请求是否执行了某一行代码?

    • 不加 log ,如何实时查看某个方法的入参与返回值?

    为什么要调优?

    • 防止出现 OOM

    • 解决 OOM

    • 减少 Full GC 出现的频率

    不同阶段的考虑

    • 上线前

    • 项目运行阶段

    • 线上出现 OOM

    3. 调优概述

    监控的依据

    • 运行日志
    • 异常堆栈
    • GC 日志
    • 线程快照
    • 堆转储快照

    调优的大方向

    • 合理地编写代码
    • 充分并合理的使用硬件资源
    • 合理地进行 JVM 调优

    4. 性能优化的步骤

    第 1 步(发现问题):性能监控

    一种以非强行或者入侵方式 收集或查看 应用运营性能数据的活动。

    监控通常是指一种在生产、质量评估或者开发环境下实施的带有 预防或主动性 的活动

    当应用相关干系人提出性能问题却 没有提供足够多的线索 时,首先我们需要进行性能监控,随后是性能分析。

    可能出现的问题:

    • GC 频繁
    • CPU load 过高
    • OOM
    • 内存泄露
    • 死锁
    • 程序响应时间较长

    第 2 步(排查问题):性能分析

    一种以 侵入方式 收集运行性能数据的活动,它会影响应用的吞吐量或响应性。

    性能分析是针对性能问题的答复结果,关注的范围通常比性能监控更加集中。

    性能分析很少在生产环境下进行,通常是在质量评估、系统测试或者开发环境下进行,是性能监控之后的步骤。

    性能分析的方法:

    • 打印 GC 日志,通过 GCviewer 或者 GCeasy 来分析异常信息
    • 灵活运用命令行工具:jstack、jmap、jinfo 等
    • dump 出堆文件,使用内存分析工具分析文件
    • 使用阿里 Arthas、jconsole、JVisualVM 来实时查看 JVM 状态
    • jstack 查看堆栈信息

    第 3 步(解决问题):性能调优

    一种为改善应用响应性或吞吐量而更改参数、源代码、属性配置的活动,性能调优是在性能监控、性能分析之后的活动。

    性能调优的方法:

    • 适当增加内存,根据业务背景选择垃圾回收器
    • 优化代码,控制内存使用
    • 增加机器,分散节点压力
    • 合理设置线程池线程数量
    • 使用中间件提高程序效率,比如缓存、消息队列等
    • 其他……

    5. 性能评价/测试指标

    1. 停顿时间(或响应时间)

    提交请求和返回该请求的响应之间使用的时间,一般比较关注平均响应时间。常用操作的响应时间列表:

    操作 响应时间
    打开一个站点 几秒
    数据库查询一条记录(有索引) 十几毫秒
    机械磁盘一次寻址定位 4 毫秒
    从机械磁盘顺序读取 1M 数据 2 毫秒
    从 SSD 磁盘顺序读取 1M 数据 0.3 毫秒
    从远程分布式换成 Redis 读取一个数据 0.5 毫秒
    从内存读取 1M 数据 十几微秒
    Java 程序本地方法调用 几微秒
    网络传输 2Kb 数据 1 微秒

    在垃圾回收环节中:

    • 暂停时间:执行垃圾收集时,程序的工作线程被暂停的时间
    • -XX:MaxGCPauseMillis 设置最大暂停时间

    2. 吞吐量

    • 对单位时间内完成的工作量(请求)的量度
    • 在 GC 中:运行用户代码的时间占总运行时间的比例(总运行时间:程序的运行时间+内存回收的时间)
    • 吞吐量为 1-1/(1+n) ,其中 -XX::GCTimeRatio=n

    3. 并发数

    • 同一时刻,对服务器有实际交互的请求数

    4. 内存占用

    • Java 堆区所占的内存大小

    5. 相互间的关系

    以高速公路通行状况为例

    • 吞吐量:每天通过高速公路收费站的车辆的数据
    • 并发数:高速公路上正在行驶的车辆的数目
    • 响应时间:车速
  • 相关阅读:
    go 算法之插入排序算法 running
    Go多协程并发环境下的错误处理 running
    go 协程控制之sync.Once{} running
    php 生成指定范围内不重复的随机数 running
    php 正则函数preg_replace_callback running
    go 算法之冒泡算法 running
    googleStyle
    ubuntu搭建APT源简单方法
    request.getParameterMap()快速转化为bean
    多线程编程CountDownLatch和CyclicBarrier
  • 原文地址:https://www.cnblogs.com/huangwenjie/p/16343375.html
Copyright © 2020-2023  润新知