• 5、zabbix使用进阶(01)


    详细描述user parameters、定义主机发现规则实现自动发现、如何定义和实现自动注册方式

    zabbix常用术语

    1、主机(host):要监控的网络设备,可有IP或DNS名称指定;

    2、主机组(host group):主机的逻辑容器,可以包含主机和模板,但同一个组内的主机和模板不能互相连接;主机组通常在给用户或用户组指派监控权限时使用;

    3、监控项(item):一个特定监控指标的相关数据,这些数据来自于被监控对象;item是zabbix进行数据收集的核心,没有item,将没有数据;相对某监控对象来说,                       每个item都有"key"进行标识

    4、触发器(trigger):一个表达式,用于评估某监控对象的某特定item内所接收到的数据是否在合理范围内,即阈值;接收到的数据量大于阈值时,

                      触发器状态将从"OK"转变为"problem",当数据量再次回归到合理范围时,其状态将从"problem"转换回"OK";

    5、事件(event):即发生的一个值得关注的事情,例如触发器的状态转变,新的agent或重新上线的agent的自动注册等;

    6、动作(action):指对于特定事件事先定义的处理方法,通过包含操作(如发送通知)和条件(何时执行操作);

    7、报警升级(escalation):发送报警或执行远程命令的自定义方案,如每隔5分钟发送一次警报,共发送5次等;

    8、媒介(media):发送通知的手段或通道,如Email、jabber或SMS等;

    9、通知(notification):通过选定的媒介向用户发送的有关事件的信息;

    10、远程命令(remote command):预定义的命令,可在被监控主机处于某特定条件下时自动执行;

    11、模板(template):用于快速定义被监控主机的预设条目集合,通常包含了item、trigger、graph、screen、application

                      以及low-level discovery rule(低级别发现规则,相当消耗资源,一般不用);模板可以直接连接至单个主机;

    12、应用(application):一组item的集合;

    13、web场景(web scennario):用于检测web站点可用性一个或多个HTTP请求;

    14、前端(frontend):zabbix的web接口

    zabbix启动的进程

      

    Item key:

    命名要求:只能使用字母、数字、下划线、点号、连接符

    接受参数:system.cpu.load[<cpu>,<mode>], net.if.inbound[if,<mode>]

    注意:每一个key背后都应该有一个命令或脚本来负责实现数据收集;此命令(system.cppu.load)或脚本可调用传递给key的参数(if,<mode>),调用方式为$1,$2,...

    在zabbix中定义item时调用某key,还需要额外定义数据采集频率、历史数据的保存时长等信息;

    Trigger:

    触发器表达式:{<Server>:<key>.<function>(<parameter>)}<operator><constrant>    //被监控服务器上的key所对应的数据,被函数表达式所调用的参数处理之后的结果,与某个所期望的数值作比较。 

              被监控服务器         调用函数      参数         操作符   指定数据范围值

    {192.168.128.132:net.if.in[ens33,bytes].last(#1)}>1200   

    //192.168.128.132是被监控的服务器; net.if.in[ens33,bytes]是key; last(#1)是函数,表示取最后一次的数据; >是操作符; 1200是所指定的数值,也可以定义为宏

    <function>:评估采集到的数据是否在合理范围内时所使用的函数;其评估过程可以根据采集到的数据、当前时间

    count、change、date、dayofweek、dayofmonth、delta、diff、iregexp、regexp、last、max、min、nodata、now、sum、strlen

    avg:可以采样做平均值;

    regexp:检查最后一次采样的数据是否能够被指定的模式所匹配,1表示匹配,0表示不匹配; 

    now:返回自Unix元年至此刻经历的秒数;

    prev:倒数第二个采样值; 

    str:从最后一次的采样中查找此处指定的字串;

    <operator>:操作符

    >、<、=、#(不等于)

    /、*、-、+

    &(与)、|(或)

    触发器间有依赖关系:

    Action

    • message
    • condition 由event触发,包括:trigger、discovery、auto_registration、lid
    • discovery包括:service up、service down、host up、host down、service discovered、service lost、service discovered、host lost
    • operation:
    • send message:
    • Media type:Email、SMS、Jabber、Script、EZ Texting

    Script:Alert Script 必须放到特定目录中:AlertScriptsPath=/usr/lib/zabbix/alertscript

    zabbix_server.conf配置文件中的参数

     

    脚本中可使用$1,$2,$3来调用 action 中的, $1表示邮件的收件人,$2表示Default Subject,$3表示Default Message;

    注意:新放入/usr/lib/zabbix/alertscript目录的脚本,只有重启zabbix-server方能被使用

    • User
    • remote command:

    (1)zabbix server主机远程被监控主机(zabbix agent),那么命令在被监控主机上运行,这个命令就是由zabbix agent进程生成的,运行zabbix agent进程的用户是zabbix用户,所以这里指定的远程命令zabbix                                          用户不一定有权限执行,所以要给zabbix定义sudo规则,在每一个agent主机上都应该添加zabbix用户在任意主机上以任意用户的身份运行任意命令。 zabbix ALL=(ALL) ALL

    (2)不支持active模式的agent;

    (3)不支持带来模式

    (4)命令长度不得超过255个字符

    (5)可以使用宏;

    (6)zabbix-server仅执行命令,而不关心命令是否执行成功

    使用脚本报警:http://www.ywnds.com/?p=6574    http://www.51niux.com/?id=153

    前提:zabbix-agent要配置为支持执行远程命令;  https://www.zabbix.com/documentation/3.4/zh/manual/config/notifications/action/operation/remote_command

    注意:

    (1):如果用到以其他用户身份执行命令的话,那么命令本身要以sudo方式运行;

    sudo /usr/sbin/apachectl restart

    (2)在各agent上的sudoers文件,要注释如下行:

    Defaults requiretty

    示例:监控node2主机上即zabbix agent端的httpd服务器是否启动,如果没有启动server端则执行远程命令重启agent端的httpd服务

    # vim /etc/zabbix/zabbix_agentd.conf 

    EnableRemoteCommands=1

    LogRemoteCommands=1    //是否记录远程命令执行的日志,1表示记录

    # systemctl restart zabbix-agent

    每一个item key的官方文档:https://www.zabbix.com/documentation/4.0/manual/config/items/itemtypes/zabbix_agent

    想要让server端远程重启agent端的httpd服务,那么server端首先要监控httpd服务。可以基于最后一次采样的值判断httpd服务的状态是否不正常,不正常则执行远程命令。

    首先定义一个applications,定义http service

    定义items,这里监听的是httpd服务的80端口,即80端口存在证明httpd服务是正常,不存在就证明http服务出现了问题

    定义一个graph,查看效果

    此时启动与停止httpd服务,查看效果图

    定义triger

    定义actions

    在agent端执行# systemctl stop httpd,停掉httpd服务

  • 相关阅读:
    第二次作业
    大学——新生活方式
    第四次作业
    第三次作业
    第二次作业——起航
    梦开始的地方
    第四次作业
    第三次作业
    第二次作业
    博客作业 随笔
  • 原文地址:https://www.cnblogs.com/hanshanxiaoheshang/p/10318320.html
Copyright © 2020-2023  润新知