需要监控的对象
* 网络服务监控
*
* 主机存活检查
* web服务监控
* ftp服务监控
* 数据库服务监控
* 自定义服务监控
* 。。。
* 主机资源监控
*
* 系统负载
* 当前ip链接数
* 磁盘空间使用情况
* 当前进程数
* 自定义资源监控
nagios本身并没有监控的功能,所有的监控是由插件完成的,插件将监控的结果返回给nagios,nagios分析这些结果以web的方式展现给我们,同时提供相应的报警功能(这个报警的功能也是由插件完成的)。
NRPE是nagios的一个扩展,它被用于被监控的服务器上,向nagios监控平台提供该服务器的一些本地的情况。例如,cpu负载、内存使用、硬盘使用等等。NRPE可以称为nagios的for linux 客户端。
nagios的目录结构
[root@tyzz local]# tree nagios/
nagios/
├── bin
│?? ├── nagios #启动脚本
│?? └── nagiostats
├── etc
│?? ├── cgi.cfg
│?? ├── htpasswd.users
│?? ├── nagios.cfg 总配置文件
│?? ├── nagiosgraph.cfg
│?? ├── objects
│?? │?? ├── commands.cfg #分配置文件
│?? │?? ├── contacts.cfg
│?? │?? ├── hosts.cfg
│?? │?? ├── localhost.cfg
│?? │?? ├── printer.cfg
│?? │?? ├── services.cfg
│?? │?? ├── switch.cfg
│?? │?? ├── templates.cfg
│?? │?? ├── timeperiods.cfg
│?? │?? └── windows.cfg
│?? └── resource.cfg
├── include
├── libexec 监控插件
│?? ├── check_apt
│?? ├── check_breeze
│?? ├── check_by_ssh
│?? ├── check_clamd -> check_tcp
│?? ├── check_cluster
│?? ├── check_dhcp
│?? ├── check_dig
│?? ├── check_disk
│?? ├── check_disk_smb
│?? ├── check_dns
│?? ├── check_dummy
│?? ├── check_file_age
│?? ├── check_flexlm
│?? ├── check_ftp -> check_tcp
│?? ├── check_http
│?? ├── check_icmp
│?? ├── check_ide_smart
│?? ├── check_ifoperstatus
│?? ├── check_ifstatus
│?? ├── check_imap -> check_tcp
│?? ├── check_ircd
│?? ├── check_jabber -> check_tcp
│?? ├── check_load
│?? ├── check_log
│?? ├── check_mailq
│?? ├── check_mrtg
│?? ├── check_mrtgtraf
│?? ├── check_mysql
│?? ├── check_mysql_query
│?? ├── check_nagios
│?? ├── check_nntp -> check_tcp
│?? ├── check_nntps -> check_tcp
│?? ├── check_nrpe
│?? ├── check_nt
│?? ├── check_ntp
│?? ├── check_ntp_peer
│?? ├── check_ntp_time
│?? ├── check_nwstat
│?? ├── check_oracle
│?? ├── check_overcr
│?? ├── check_ping
│?? ├── check_pop -> check_tcp
│?? ├── check_procs
│?? ├── check_real
│?? ├── check_rpc
│?? ├── check_sensors
│?? ├── check_simap -> check_tcp
│?? ├── check_smtp
│?? ├── check_spop -> check_tcp
│?? ├── check_ssh
│?? ├── check_ssmtp -> check_tcp
│?? ├── check_swap
│?? ├── check_sys_temperature.sh
│?? ├── check_tcp
│?? ├── check_time
│?? ├── check_traffic.sh
│?? ├── check_udp -> check_tcp
│?? ├── check_ups
│?? ├── check_uptime
│?? ├── check_users
│?? ├── check_wave
│?? ├── negate
│?? ├── urlize
│?? ├── utils.pm
│?? ├── utils.sh
Nagios 为了方便我们的管理工作,提供了至少 3 种表现手段:
1
、web 方式,即通过浏览器观看被监控的对象;如正常状态下,其状态(status)是以蓝色
填充并显示一个 OK。
2、邮件通知,发生故障时,到达设定重试次数和探测间隔时间后发送邮件给管理员或相关
人员,报告问题的大致情况。
3、手机短信,这是非常有用和及时的功能了;晚上熟睡中,再也没可能看 web 页面或查阅
邮件,可以一旦发生故障,手机短信却能把你随时唤醒。
一般情况下,这 3 者是同时进行的:上班时间开个浏览器看页面显示、打开邮件程序定时收
取邮件、手机