• top命令详析及排查问题使用演示


     1. top基本使用

    top命令运行图

    第一行:基本信息

    第二行:任务信息

    第三行:CPU使用情况

    第四行:物理内存使用情况

    buff/cache:

    buffers 和 cache 都是内存中存放的数据,不同的是,buffers 存放的是准备写入磁盘的数据,而 cache 存放的是从磁盘中读取的数据 

    在Linux系统中,有一个守护进程(daemon)会定期把buffers中的数据写入的磁盘,也可以使用 sync 命令手动把buffers中的数据写入磁盘。使用buffers可以把分散的 I/O 操作集中起来,减少了磁盘寻道的时间和磁盘碎片。 
    cache是Linux把读取频率高的数据,放到内存中,减少I/O。Linux中cache没有固定大小,根据使用情况自动增加或删除。

    第五行:交换区使用情况

    Swap(内存交换区):

    是硬盘上的一块空间。在内存不足的情况下,操作系统把内存中不用的数据存到硬盘的交换区,腾出内存来让别的程序运行。因此,开启swap会一定程度的引起 I/O 性能下降(阿里服务器默认不开)。

    第六行:进程详细信息

     2. 问题排查模拟

    介绍一下使用到的top参数

    线上的出现需要使用top排查的情况一般是死循环或者死锁,下面通过代码来模拟两种情况

    package com.zang.top.controller;
    
    import org.springframework.web.bind.annotation.RequestMapping;
    import org.springframework.web.bind.annotation.RestController;
    
    import java.util.concurrent.TimeUnit;
    
    /**
     * @author zangjf
     * @version zangjf: TopController.java,v1.0 2019/2/27 22:51 zangjf Exp $$
     * @since 1.0
     */
    @RestController
    @RequestMapping("top")
    public class TopController {
    
        private Object lock1 = new Object();
        private Object lock2 = new Object();
    
        @RequestMapping("test")
        public String test() {
            return "success";
        }
    
        // 死循环
        @RequestMapping("loop")
        public String loop() {
            System.out.println("start");
            while (true) {}
        }
    
        // 死锁
        @RequestMapping("deadlock")
        public String deadlock() {
            new Thread(() -> {
                synchronized (lock1) {
                    try{
                        TimeUnit.SECONDS.sleep(1);
                    } catch (Exception e) {}
                    synchronized (lock2) {
                        System.out.println("thread1 over");
                    }
                }
            }).start();
            new Thread(() -> {
                synchronized (lock2) {
                    try{
                        TimeUnit.SECONDS.sleep(1);
                    } catch (Exception e) {}
                    synchronized (lock1) {
                        System.out.println("thread2 over");
                    }
                }
            }).start();
            return "success";
        }
    }

    放到服务器上启动

    2.1 死循环

    手动制造CPU飙高的场景,重复执行该命令三次,模拟三个导致高cpu占用的线程

    curl localhost:8080/top/loop

    执行top命令,可以看到pid为22095的进程CPU占用较高

     查看pid为22095的进程中线程的具体情况

    top -p 22095 -H

    可以看到PID为22114,22115和22116的线程占用CPU较高。这里可能有人有疑惑,为什么线程也有PID啊?其实线程进程都会有自己的ID,这个ID就叫做PID,PID是不特指进程ID,线程ID也可以叫做PID。

    jstack命令工具可以得到线程堆栈信息,根据这些线程堆栈信息,我们可以去检查Java程序出现的问题。

    打印PID为22095的进程的详细堆栈信息。

    jstack 22095 > loop.txt

    以PID为22114的线程为例,到loop.txt中查找该线程的信息,因为jstack中PID用的是16进制,所以需要将10进制的PID转换为16进制的数值到文件中查找。

    printf "%x" 22114
    # 输出5662

     

    可以定位到程序中出现问题的代码位置

     

    2.2 死锁

    模拟死锁

    curl localhost:8080/top/deadlock

    输出堆栈信息

    jstack 22223 > deadlock.txt

    查看文件最后的信息,看到发现一个死锁及产生位置

    参考:https://mp.weixin.qq.com/s/G7F25H3h7WuqiUdU_ocbhA

  • 相关阅读:
    Idea快捷键
    基于LinkedHashMap实现一个基于LRU算法的缓存设计
    SpringBoot整合Mybatis
    MyBatis Generator自动生成代码
    java.sql.SQLException: The server time zone value 'Öйú±ê׼ʱ¼ä' is unrecognized or represents more
    Dubbo的异步调用
    Jackson的ObjectMapper的简单用法及语法
    mysql实例代码
    6. Z 字形变换
    13. 罗马数字转整数
  • 原文地址:https://www.cnblogs.com/zjfjava/p/10448002.html
Copyright © 2020-2023  润新知