• nagios加入被监控的机器


    此工作大约用时: 30min

    准备工作, 在被监控机上

    yum install -y gcc glibc glibc-common gd gd-devel xinetd openssl-devel

    0 client上添加用户

    /usr/sbin/useradd -m -s /sbin/nologin nagios

    1。安装Nagios 插件

     wget http://nagios-plugins.org/download/nagios-plugins-2.0.3.tar.gz
     tar zxvf nagios-plugins-2.0.3.tar.gz 
     cd nagios-plugins-2.0.3
     ./configure --prefix=/usr/local/nagios
     make 
     make install

    这一步完毕后会在/usr/local/nagios/下生成三个文件夹include、libexec和share。
    改动文件夹权限

    chown nagios.nagios /usr/local/nagios
    chown -R nagios.nagios /usr/local/nagios/libexec

    2。 安装NRPE

     wget http://prdownloads.sourceforge.net/sourceforge/nagios/nrpe-2.12.tar.gz
     tar zxvf nrpe-2.12.tar.gz
    cd  nrpe-2.12
    ./configure
    make all

    3。接下来安装NPRE插件,daemon和演示样例配置文件。

    3.1 安装check_nrpe 这个插件

    make install-plugin

    监控机须要安装check_nrpe 这个插件,被监控机并不须要,我们在这里安装它仅仅是为了測试目的。

    3.2 安装deamon

    make install-daemon

    3.3 安装配置文件

    make install-daemon-config

    如今再查看/usr/local/nagios/文件夹就会发现有5个文件夹了

    依照安装文档的说明,是将NRPE deamon作为xinetd下的一个服务执行的。在这种情况下xinetd就必须要先安装好。只是一般系统已经默认安装了。
    3.4 安装xinted 脚本

    make install-xinetd

    能够看到创建了这个文件/etc/xinetd.d/nrpe , 编辑该文件

    在only_from 后添加监控主机的IP地址,如

     only_from       = 127.0.0.1  10.254.166.60

    编辑/etc/services 文件,添加NRPE服务 。在文件最后 添加一行

     nrpe    5666/tcp   #nrpe

    重新启动xinted 服务

    service xinetd restart

    查看NRPE 是否已经启动
    netstat -an | grep 5666

    假设发现5666 port号被监控,则是起来了。

    本地測试
    /usr/local/nagios/libexec/check_nrpe -H localhost
    成功启动 ,会返回版本

    添加 监控机的訪问IP
    默认仅仅同意本地的訪问,须要配置文件。以便监控机也能够訪问。


    vi /usr/local/nagios/etc/nrpe.cfg

     allowed_hosts=127.0.0.1,10.254.166.60

    假设NRPE是手动方式启动的,这里须要重新启动NRPE 。假设是以xinet服务启动的,则不用重新启动。

    手工重新启动一下 NRPE方法,以xinet服务启动时 ,不用做这一步。
    pkill nrpe
    /usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d

    如今 去 监控机測试一下 ,10.136.57.84 为被监控机IP
    /usr/local/nagios/libexec/check_nrpe -H 10.136.57.84
    成功启动 。会返回版本

    被监控机就配好了。

    去监控机 加入 主机
    1。 加入HOST
    vi /usr/local/nagios/etc/objects/hosts.cfg 添加一个主机信息

      define host{   
            use                     linux-server          ;引用主机linux-server的属性信息。linux-server主机在templates.cfg文件里进行了定义。

    host_name blfb-login ;主机名 alias blfb-登录 ;主机别名 address 10.254.132.148 ;被监控的主机地址,这个地址能够是ip,也能够是域名。

    }

    2。 添加服务
    vi /usr/local/nagios/etc/objects/services.cfg
    能够新建服务,或者 假设服务同样的话, 直接将 新加入的 host那么 用逗号隔开,跟在host_name 的后面就能够。 如

      #---blfb-login start------------------------------------------------------------------
    define service{  
            use                     local-service          ;引用local-service服务的属性值,local-service在templates.cfg文件里进行了定义。
            host_name               blfb-login,blfb-gamesr01  ;这个服务写了 两个 主机名。说明这连个主机 都会检測 这个check-host-alive 服务
            service_description     check-host-alive       ;对监控服务内容的描写叙述,以供维护人员參考。
            check_command           check-host-alive       ;指定检查的命令。
            }   
    define service{
            use                     local-service
            host_name               blfb-login
            service_description     Current Load
            check_command           check_nrpe!check_load
            }   
    
    define service{
            use                     local-service
            host_name               blfb-login
            service_description     Check Disk vdc1
            check_command           check_nrpe!check_vdc1
            contact_groups          admins,blfb_cp_group 
            }   
    
    define service{
            use                     local-service
            host_name               blfb-login
            service_description     Check Zombie Procs
            check_command           check_nrpe!check_zombie_procs
            }   
    
    #---blfb-login- end----------------------------------------------------------------
    

    3,重新启动前 检查 配置文件
    ./bin/nagios -v ./etc/nagios.cfg

    4, 假设没有错误 。也没有警告, 就能够重新启动。
    service nagios restart

    5, 在浏览器查看加入情况
    完。

    注意:可能check_vdc1 这个命令会提示不存在, 或者 硬盘名不正确。 那就须要去 被监控机改一个配置 ,该成自己想要监控的 设备名 如我的是 /dev/vdv1
    vi /usr/local/nagios/etc/nrpe.cfg

      command[check_vdc1]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /dev/vdc1

    參考博客
    http://os.51cto.com/art/201104/253718.htm

    手动启动NRPE的方法
    /usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d

  • 相关阅读:
    解决android运行速度慢的问题
    nginx配合tomcat、resin等java应用服务器提供java支持(转)
    部分面向对象习题,留给学生做不错!!!
    该内存不能为“read”或“written”
    ORACLE数据库管理系统体系结构详解
    Linux下设置ORACLE自启动
    Oracle静默安装模板
    python安装步骤
    Oracle删除重复索引
    windows操作系统下python IDLE安装
  • 原文地址:https://www.cnblogs.com/yjbjingcha/p/8409234.html
Copyright © 2020-2023  润新知