1. top基本使用
top命令运行图
第一行:基本信息
第二行:任务信息
第三行:CPU使用情况
第四行:物理内存使用情况
buff/cache:
buffers 和 cache 都是内存中存放的数据,不同的是,buffers 存放的是准备写入磁盘的数据,而 cache 存放的是从磁盘中读取的数据
在Linux系统中,有一个守护进程(daemon)会定期把buffers中的数据写入的磁盘,也可以使用 sync 命令手动把buffers中的数据写入磁盘。使用buffers可以把分散的 I/O 操作集中起来,减少了磁盘寻道的时间和磁盘碎片。
cache是Linux把读取频率高的数据,放到内存中,减少I/O。Linux中cache没有固定大小,根据使用情况自动增加或删除。
第五行:交换区使用情况
Swap(内存交换区):
是硬盘上的一块空间。在内存不足的情况下,操作系统把内存中不用的数据存到硬盘的交换区,腾出内存来让别的程序运行。因此,开启swap会一定程度的引起 I/O 性能下降(阿里服务器默认不开)。
第六行:进程详细信息
2. 问题排查模拟
介绍一下使用到的top参数
线上的出现需要使用top排查的情况一般是死循环或者死锁,下面通过代码来模拟两种情况
package com.zang.top.controller; import org.springframework.web.bind.annotation.RequestMapping; import org.springframework.web.bind.annotation.RestController; import java.util.concurrent.TimeUnit; /** * @author zangjf * @version zangjf: TopController.java,v1.0 2019/2/27 22:51 zangjf Exp $$ * @since 1.0 */ @RestController @RequestMapping("top") public class TopController { private Object lock1 = new Object(); private Object lock2 = new Object(); @RequestMapping("test") public String test() { return "success"; } // 死循环 @RequestMapping("loop") public String loop() { System.out.println("start"); while (true) {} } // 死锁 @RequestMapping("deadlock") public String deadlock() { new Thread(() -> { synchronized (lock1) { try{ TimeUnit.SECONDS.sleep(1); } catch (Exception e) {} synchronized (lock2) { System.out.println("thread1 over"); } } }).start(); new Thread(() -> { synchronized (lock2) { try{ TimeUnit.SECONDS.sleep(1); } catch (Exception e) {} synchronized (lock1) { System.out.println("thread2 over"); } } }).start(); return "success"; } }
放到服务器上启动
2.1 死循环
手动制造CPU飙高的场景,重复执行该命令三次,模拟三个导致高cpu占用的线程
curl localhost:8080/top/loop
执行top命令,可以看到pid为22095的进程CPU占用较高
查看pid为22095的进程中线程的具体情况
top -p 22095 -H
可以看到PID为22114,22115和22116的线程占用CPU较高。这里可能有人有疑惑,为什么线程也有PID啊?其实线程进程都会有自己的ID,这个ID就叫做PID,PID是不特指进程ID,线程ID也可以叫做PID。
jstack命令工具可以得到线程堆栈信息,根据这些线程堆栈信息,我们可以去检查Java程序出现的问题。
打印PID为22095的进程的详细堆栈信息。
jstack 22095 > loop.txt
以PID为22114的线程为例,到loop.txt中查找该线程的信息,因为jstack中PID用的是16进制,所以需要将10进制的PID转换为16进制的数值到文件中查找。
printf "%x" 22114 # 输出5662
可以定位到程序中出现问题的代码位置
2.2 死锁
模拟死锁
curl localhost:8080/top/deadlock
输出堆栈信息
jstack 22223 > deadlock.txt
查看文件最后的信息,看到发现一个死锁及产生位置
参考:https://mp.weixin.qq.com/s/G7F25H3h7WuqiUdU_ocbhA