Zabbix
什么是Zabbix?
Zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。
Zabbix作用
Zabbix能够监视各种服务器的健康性、网络的稳定性以及各种应用系统的可靠性。当监控出现异常时,Zabbix通过灵活的告警策略,可以为任何事件配置基于邮件、短信、微信等告警机制。
Zabbix特性:
可以通过基于Zabbix提供的web界面进行配置和操作,基于web的前端页面还提供了出色的报告和数据可视化功能。
Zabbix构成
Zabbix由两部分构成:Zabbix server与可选组件Zabbix agent。
Zabbix server可以通过SNMP、Zabbix agent、Ping、端口监视等方法提供对远程服务器/网络状态的监视、数据收集等功能,它可以运行在Linux、Solaris、HP-UX、AIX、Free BSD、Open BSD、OSX等平台上。
Zabbix优点及缺点
优点:Zabbix解决了cacti没有告警的不足,也解决了nagios不能通过web配置的缺点,同时还支持分布式部署。
缺点:消耗资源比较多,监控主机过多时,可能会出现监控超时、告警超时等现象。(解决方法:提高硬件性能,改变Zabbix监控模式等)
Zabbix运行架构
图中展示的几个主要构成组件:
一、Zabbix应用组件
① Zabbix Server
Zabbix的核心组件,是所有配置信息,统计信息和操作数据的核心存储器。主要负责接收客户端发送的报告和信息,同时,所有配置、统计数据及配置操作数据均由其组织进行。
② Zabbix Database Storage
主要用于存储数据,所有配置信息和Zabbix收集到的数据都被存储在数据库中。常用的存储设备有MySQL、Oracle、SQLite等。
③ Zabbix Web界面
这是Zabbix提供的GUI接口,通常(但不一定)与Zabbix Server运行在同一台物理机器上。
④ Zabbix Proxy代理服务器
这是一个可选组件,常用于分布监控环境中,代理Server可以替Zabbix Server收集性能和可用性数据,汇总后统一发往Zabbix Server端。
⑤ Zabbix Agent监控代理
Zabbix Agent部署在被监控主机上,能够主动监控本地资源和应用程序,并负责收集数据发往Zabbix Server端或Zabbix Proxy端。
二、Zabbix服务进程
根据功能和用途,默认情况下Zabbix包含5个进程,分别是Zabbix_agentd、Zabbix_get、Zabbix_proxy、Zabbix_sender、Zabbix_server,另外还有一个Zabbix_java_gateway是可选的功能,需要另外安装。
① Zabbix_agentd
Zabbix_agentd是Zabbix Agent监控代理端守护进程,此进程手机客户端数据,例如:CPU负载、内存、硬盘、网络使用情况等。
② Zabbix_get
Zabbix提供的一个工具,通常在Zabbix server或者Zabbix proxy端执行用来获取远程客户端信息,这其实是Zabbix Server去Zabbix Agent端拉取数据的过程,此工具主要用来进行用户排错。例如在Zabbix server端获取不到客户端的监控数据时,可以使用Zabbix__get命令测试获取客户端数据来做故障排查。
③ Zabbix_sender
Zabbix提供的一个工具,用于发送数据给Zabbix server或者Zabbix proxy,这其实是Zabbix Agent端主动推送监控数据到Zabbix Server端的过程,通常用于耗时较长的检查或者有大量主机(千台以上)需要监控的场景。此时通过主动推送数据到Zabbix server,可以在很大程度上减轻Zabbix server的压力和负载。
④ Zabbix_proxy
Zabbix Proxy的代理守护进程。功能类似Zabbix server,唯一不同的是它只是一个中转站,它需要把收集到的数据提交或者被提交到Zabbix Server上。
⑤ Zabbix_java_gateway
Zabbix2.0之后引入的一个功能。顾名思义:Java网关,主要用来监控JAVA应用环境,类似于Zabbix_agentd进程。需要特别注意的是,它只能主动去推送数据,而不能等待Zabbix server或者Zabbix Proxy来拉取数据,它的数据最终会给到Zabbix Server或者Zabbix Proxy上。
⑥ Zabbix_Server
Zabbix server是整个Zabbix系统的核心进程。其它进程Zabbix_agentd、Zabbix_get、Zabbix_sender、Zabbix_proxy、Zabbix_java_gateway的数据最终都是提交到Zabbix server来统一进行处理。
Zabbix监控术语
① 主机(host)
表示要监控的一台服务器或者网络设备,可以通过IP或主机名指定。
② 主机组(host group)
主机的逻辑卷;它包含主机和模板,但同一个主机组内的主机和模板没有任何直接的关联;主机组通常在给用户或用户组指派监控权限时使用。
③ 监控项(item)
表示一个监控的具体对象,例如监控服务器的CPU负载、磁盘空间等,item是zabbix进行数据收集核心,相对某个监控对象,每个item都由“key”来标识。
④ 触发器(trigger)
其实就是一个监控阀值表达式,用于评估某监控对象收到的数据是否在合理范围内;如果接受的数据大于阀值时,触发器状态将从“OK”转变为“Problem”,当接收到的数据低于阀值时,又转变为“OK”状态。
⑤ 应用集(Applications)
一组监控项组成的逻辑集合。
⑥ 动作(action)
指对于监控中出现的问题事先定义的处理方法,例如发送通知,何时执行操作、执行频率等等;
⑦ 报警媒介类型(media)
表示发送通知的手段,告警通知的途径,如(Email、Jabber或者是SMS等)。
⑧ 模板(template)
一组可以被应用到一个或多个主机上的实体集合,一个模板通常包含了应用集、监控项、触发器、图形、聚合图形、自动发现规则、Web场景等几个项目;模板可以直接链接到某个主机。
模板是学习Zabbix的一个难点和终点,为了实现批量、自动化监控,通常会将具有相同特征的监控项汇总到模板中,然后在主机中直接应用即可,实现快速监控部署。