• linux系统CPU,内存,磁盘,网络流量监控脚本


    前序

    1#cat /proc/stat/ 信息包含了所有CPU活动的信息,该文件中的所有值都是从系统启动开始累积到当前时刻

    2#vmstat –s 或者#vmstat 虚拟内存统计

    3, #cat /proc/loadavg 从系统启动开始到当前累积时刻

    4, #uptime 系统运行多长时间

    5, #mpstat CPU的一些统计信息

    6, #



    一,linux系统CPU,内存,磁盘,网络流量监控脚本

    [作者:佚名来源:不详时间:2010-7-6 【我来说两句大中小】  cme.sh网络流量监控使用


      [root@china213 ~]# cd /bin


      [root@china213 bin]# ./cme.sh


      cpu 99


      disk 39


      mem 38


      nic 19855 33 0


      [root@china213 bin]#


      CPU剩余率,磁盘剩余率,内存剩余率,以及网卡接收的bps,ppsdps(丢包)


      把下面内容用vi命令写入到cme.sh[root@china213 bin]# vi cme.sh,同时用[root@china213 bin]# chmod +x cme.sh增加可执行权限


      注意:shell文件开头必须以#!/bin/sh开始,在window中保存成cme.sh上传的时候会执行不了,可能是文件头的问题。


      ==============================不要把这行分各符放到cme.sh文件中=========================================


    #!/bin/sh


    eth="eth0 eth1 "


    function get_eth_info()


    {


    name=$1


    cat /proc/net/dev | awk -F ':' '{if(NR>2)print $1" "$2" "$9" "$10}' | awk '{print$1" "$2" "$3" "$5}' | while


    read line


    do


    # echo $line


    data=`echo $name" "$line | awk '{if($1==$2)print $3" "$4" "$5}'`


    if ! [ -z "$data" ]


    then


    echo $data


    fi


    done


    }


    function sum_eth()


    {


    rm -fr 12321.txt


    for name in $eth


    do


    ret=`get_eth_info $name`


    #echo $ret | awk '{bps+=$0;pps+$1;dps+=$2;print bps" "pps" "dps}'


    echo $ret >> 12321.txt


    done


    cat 12321.txt | awk 'BEGIN{bps=0;pps=0;dps=0} {bps+=$1;pps+=$2;dps+=$3}END{print bps" "pps" "dps}'


    }


    flow=`sum_eth`


    disk=`df | awk 'BEGIN{total=0;avl=0;used=0;}NR > 1 {total+=$2;used+=$3;avl+=$4;}END{printf"%d", avl/total*100}'`


    #top -b -n 1 | grep -w Mem | awk '{print"tot_mem: "$2" used_mem: " $4 " free_mem: "$6" left:"$6/$2"%"}'


    mem=`top -b -n 1 | grep -w Mem | awk '{printf"%d",$6/$2*100}'`


    #top -b -n 1 | grep -w Cpu | awk '{print"cpu: "$5}' | awk -F '%' {print$1}


    cpu=`top -b -n 1 | grep -w Cpu | awk '{print$5}' | awk -F '%' '{printf"%d",$1}'`


    tm=`date +%s`


    if ! [ -f "flow.txt" ]


    then


    echo $tm" "$flow >flow.txt


    sleep 1


    tm=`date +%s`


    flow=`sum_eth`


    fi


    old_flow=`cat flow.txt`


    new_flow=`echo $tm $flow`


    echo $new_flow >flow.txt


    #echo $old_flow


    #echo $new_flow


    final_flow=`echo $old_flow $new_flow | awk '{dif_tm=$5- $1;dif_byte=$6-$2;dif_pkt=$7-$3;dif_dpkt=$8-$4;printf"%d %d % d",dif_byte*8/dif_tm, dif_pkt/dif_tm, dif_dpkt/dif_tm}'`


    #final_flow=`echo $old_flow $new_flow | awk '{print$0}'`


    echo "cpu "$cpu


    echo "disk "$disk


    echo "mem "$mem


    echo "nic "$final_flow


    二,监控CPU进程的CPU使用率

    例如:mysqld

    脚本:

    1,获取某个进程的使用率

    [root@test testCPU]# cat topmysql.sh

    #!/bin/bash

    top -n 1 > /root/testCPU/topmysql.log

    if grep -q mysqld /root/testCPU/topmysql.log

    then cpu=`grep "mysqld" /root/testCPU/topmysql.log | gawk '{print $9}'`

    echo $cpu

    else

    echo "0"

    fi

    exit

    [root@test testCPU]#

    2,获取cpu使用率

    [root@test home]# cat getCPU.sh

    #!/bin/sh

    awk '$0 ~/cpu[0-9]/' /proc/stat | while read line

    do

    echo "$line" | awk '{total=$2+$3+$4+$5+$6+$7+$8;free=$5;

    print$1" Free "free/total*100"%",

    "Used " (total-free)/total*100"%"}'

    done


    [root@test home]# ./getCPU.sh

    cpu0 Free 90.0662% Used 9.93379%

    [root@test home]#

    3,监控进程占用cpu最高的前几个进程

    [root@test testCPU]# cat pscpu.sh

    #!/bin/bash

    time=`date +%m%d%T`

    ps aux|head -1;ps aux|grep -v PID|sort -rn -k +3|head -3 > /root/testCPU/pscpu$time.log

    [root@test testCPU]#



    # linux 下 取进程占用 cpu 最高的前10个进程
    #ps aux|head -1;ps aux|grep -v PID|sort -rn -k +3|head

    取进程占用CPU最高的前五个进程

    或者# ps aux|head -1;ps aux|grep -v PID|sort -rn -k +3|head -5


    # linux
    下 取进程占用内存(MEM)最高的前10个进程
    #ps aux|head -1;ps aux|grep -v PID|sort -rn -k +4|head


    ####################################

    Linux 进程管理命令详解(pstop

    1, ps命令

    作用:ps命令主要查看系统中进程的状态。

    格式:ps 【选项】

    主要选项如下。

    -A:显示系统中所有进程的信息。
    -e
    :显示所有进程的信息。
    -f
    :显示进程的所有信息。
    -l
    :以长格式显示进程信息。
    -r
    :只显示正在运行的进程。
    -u
    :显示面向用户的格式(包括用户名、CPU及内存使用情况等信息)。
    -x
    :显示所有非控制终端上的进程信息。
    -p
    :显示由进程ID指定的进程的信息。
    -t
    :显示指定终端上的进程的信息。



    说明:要对进程进行监测和控制,首先要了解当前进程的情况,也就是需要查看当前进程。ps命令就是最基本、也是非常强大的进程查看命令。根据显示的信息可以确定哪个进程正在运行、哪个进程被挂起、进程已运行了多久、进程正在使用的资源、进程的相对优先级,以及进程的标志号(PID)。所有这些信息对用户都很有用,对于系统管理员来说更为重要。使用"ps aux"命令可以获得终端上所有用户的有关进程的所有信息,下面结合图讲解进程的基本信息。

    root@Linux ~]# ps -aux
    USER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
    root         1 0.0 0.0   2064   624 ?        Ss   Sep27   0:03 init [3]                                  
    root         2 0.0 0.0      0     0 ?        S<   Sep27   0:03 [migration/0]
    root         3 0.0 0.0      0     0 ?        SN   Sep27   0:00 [ksoftirqd/0]
    root         4 0.0 0.0      0     0 ?        S<   Sep27   0:00 [watchdog/0]
    root         5 0.0 0.0      0     0 ?        S<   Sep27   0:04 [migration/1]
    root         6 0.0 0.0      0     0 ?        SN   Sep27   0:00 [ksoftirqd/1]
    root         7 0.0 0.0      0     0 ?        S<   Sep27   0:00 [watchdog/1]
    root         8 0.0 0.0      0     0 ?        S<   Sep27   0:05 [migration/2]
    root         9 0.0 0.0      0     0 ?        SN   Sep27   0:00 [ksoftirqd/2]
    root        10 0.0 0.0      0     0 ?        S<   Sep27   0:00 [watchdog/2]

    图中第二行代码中,USER表示启动进程用户。PID表示进程标志号。%CPU表示运行该进程占用CPU的时间与该进程总的运行时间的比例。%MEM表示该进程占用内存和总内存的比例。VSZ表示占用的虚拟内存大小,以KB为单位。RSS为进程占用的物理内存值,以KB为单位。TTY表示该进程建立时所对应的终端,"?"表示该进程不占用终端。STAT表示进程的运行状态,包括以下几种代码:D,不可中断的睡眠;R,就绪(在可运行队列中);S,睡眠;T,被跟踪或停止;Z,终止(僵死)的进程,Z不存在,但暂时无法消除;W,没有足够的内存分页可分配;<高优先序的进程;N,低优先序的进程;L,有内存分页分配并锁在内存体内(实时系统或I/O)。START为进程开始时间。TIME为执行的时间。COMMAND是对应的命令名。
    应用实例如下。
    在进行系统维护时,如果CPU负载突然增加,而又不知道是哪一个进程造成的情况。使用命令:

    #ps aux | sort +3n

    因为%CPU选项在第三列,所以sort3作为参数,+表示升序输出结果 .

    2.top命令
    top命令用来显示系统当前的进程状况。
    格式:top [选项]
    主要选项如下。

    d:指定更新的间隔,以秒计算。
    q
    :没有任何延迟的更新。如果使用者有超级用户,则top命令将会以最高的优先序执行。
    c
    :显示进程完整的路径与名称。
    S
    :累积模式,会将已完成或消失的子进程的CPU时间累积起来。
    s
    :安全模式。
    i
    :不显示任何闲置(Idle)或无用(Zombie)的进程。
    n
    :显示更新的次数,完成后将会退出top

    说明:top命令和ps命令的基本作用是相同的,都显示系统当前的进程状况。但是top是一个动态显示过程,即可以通过用户按键来不断刷新当前状态。这里结合图来说明它给出的信息。

    top - 15:01:27 up 48 days, 20:31, 3 users, load average: 0.08, 0.12, 0.42
    Tasks: 174 total,   1 running, 171 sleeping,   0 stopped,   2 zombie
    Cpu(s): 0.0%us, 0.1%sy, 0.0%ni, 99.6%id, 0.3%wa, 0.0%hi, 0.0%si, 0.0%st
    Mem:   2075312k total, 1996848k used,    78464k free,   179360k buffers
    Swap: 4128760k total,       68k used, 4128692k free, 1298736k cached

    PID USER      PR NI VIRT RES SHR S %CPU %MEM    TIME+ COMMAND                                                            
    9013 root      15   0 2328 1056 796 R 0.3 0.1   0:00.02 top                                                                
        1 root      15   0 2064 624 536 S 0.0 0.0   0:03.80 init                                                               
        2 root      RT -5     0    0    0 S 0.0 0.0   0:03.88 migration/0                                                        
        3 root      36 19     0    0    0 S 0.0 0.0   0:00.04 ksoftirqd/0                                                        
        4 root      RT -5     0    0    0 S 0.0 0.0   0:00.00 watchdog/0                                                         
        5 root      RT -5     0    0    0 S 0.0 0.0   0:04.06 migration/1                                                        
        6 root      34 19     0    0    0 S 0.0 0.0   0:00.05 ksoftirqd/1                                                        
        7 root      RT -5     0    0    0 S 0.0 0.0   0:00.00 watchdog/1                                                         
        8 root      RT -5     0    0    0 S 0.0 0.0   0:05.96 migration/2                                                        
        9 root      34 19     0    0    0 S 0.0 0.0   0:00.04 ksoftirqd/2                                                        
       10 root      RT -5     0    0    0 S 0.0 0.0   0:00.00 watchdog/2                                                         
       11 root      RT -5     0    0    0 S 0.0 0.0   0:02.98 migration/3                                                        
       12 root      34 19     0    0    0 S 0.0 0.0   0:00.09 ksoftirqd/3    

    在图中,第一行表示的项目依次为当前时间、系统启动时间、当前系统登录用户数目、平均负载。第二行显示的是所有启动的、目前运行的、挂起(Sleeping)的和无用(Zombie)的进程。第三行显示的是目前CPU的使用情况,包括系统占用的比例、用户使用比例、闲置(Idle)比例。第四行显示物理内存的使用情况,包括总的可以使用的内存、已用内存、空闲内存、缓冲区占用的内存。第五行显示交换分区的使用情况,包括总的交换分区、使用的、空闲的和用于高速缓存的交换分区。第六行显示的项目最多,下面列出了详细解释。
    PID
    Process ID):进程标志号,是非零正整数。USER:进程所有者的用户名。PR:进程的优先级别。NI:进程的优先级别数值。VIRT:进程占用的虚拟内存值。RES:进程占用的物理内存值。SHR:进程使用的共享内存值。STAT:进程的状态,其中S表示休眠,R表示正在运行,Z表示僵死状态,N表示该进程优先值是负数。%CPU:该进程占用的CPU使用率。%MEM:该进程占用的物理内存和总内存的百分比。TIME:该进程启动后占用的总的CPU时间。COMMAND:进程启动的启动命令名称,如果这一行显示不下,进程会有一个完整的命令行。top命令使用过程中,还可以使用一些交互的命令来完成其他参数的功能。这些命令是通过快捷键启动的。

    <空格>:立刻刷新。
    P
    :根据CPU使用大小进行排序。
    T
    :根据时间、累计时间排序。
    q
    :退出top命令。
    m
    :切换显示内存信息。
    t
    :切换显示进程和CPU状态信息。
    c
    :切换显示命令名称和完整命令行。
    M
    :根据使用内存大小进行排序。
    W
    :将当前设置写入~/.toprc文件中。这是写top配置文件的推荐方法。

    可以看到,top命令是一个功能十分强大的监控系统的工具,对于系统管理员而言尤其重要。但是,它的缺点是会消耗很多系统资源。


  • 相关阅读:
    delphi RTTI 反射技术
    delphi 自我删除和线程池(1000行代码,需要仔细研究)
    寻找两个已序数组中的第k大元素
    OpenCV中的神器Image Watch
    PYTHON 之 【RE模块的正则表达式学习】
    Call U
    微软IE11浏览器的7大变化
    集群应用及运维经验小结
    逆序对:从插入排序到归并排序
    Jquery 图片轮播实现原理总结
  • 原文地址:https://www.cnblogs.com/timssd/p/4677022.html
Copyright © 2020-2023  润新知