Linux 监控
一 相关名词解释
cpu context switch (上下文切换)
1 定义 CPU给每个任务一定的服务时间,当时间片轮转的时候,需要把当前状态保存下来,同时加载下一个任务,这个过程叫做上下文切换。
2 目的 时间片轮转的方式,使得多个任务利用一个CPU执行成为可能,
3 性能消耗 频繁的保存现场和加载现场,也带来了性能消耗。
4 出现上下文切换的几种可能
1、当前任务的时间片用完之后,系统CPU正常调度下一个任务;
2、当前任务碰到IO阻塞,调度线程将挂起此任务,继续下一个任务;
3、多个任务抢占锁资源,当前任务没有抢到,被调度器挂起,继续下一个任务;
4、用户代码挂起当前任务,让出CPU时间;
5、硬件中断
cpu interrupt(中断)
1 定义 中断其实就是由硬件或软件所发送的一种称为IRQ(中断请求)的信号。中断允许让设备表面他们需要cpu资源.一旦CPU接收了中断请求,CPU就会暂时停止执行正在运行的程序
2 分类 我们在此讨论的是软中断
3 查看方式 /proc/interrupts
二 图形查看
1 cpu jumps
1 context switch(上下文切换)
2 interrups(软中断)
2 cpu load
processor load(整体的服务器负载)
3 cpu utilization
cpu 相关参数(包含用户使用率,可用性等)
4 DISK
1 DISK 流量监控(包括读写)
2 DISK IOPS监控(包括读写)
3 DISK 空间
三 触发器报警
1 磁盘IO
1 监控util值 报警阈值 近5min繁忙程度超过固定值
2 主机名
1 监控hostname,一旦变化会发生警报
3 负载
1 主要关注uptime值,报警阈值 近5min繁忙程序超过固定值
4 进程
1 正在运行的,阈值>=固定值
2 总的进程,阈值>=固定值
5 内存
1 主要内存,阈值<=固定值
6 文件系统
1 inodes点
2 文件打开数
四 总结
1 关注 IOPS cpu load 内存等图形