• Zabbix故障总结(持续更新)


    Zabbix housekeeper processes more than 75% busy

    问题原因

    为了防止数据库持续增大,zabbix有个自动删除历史数据的机制,就是housekeeper,而mysql数据库删数据的时候,性能会降低,就会报这个错

    解决方案

    调整HousekeepingFrequency参数,我这里设置为12小时执行一次

    HousekeepingFrequency=12   #时间间隔

    MaxHousekeeperDelete=1000000     #最大删除量

     

    Zabbix discoverer processes more than 75% busy

    问题原因

    配置了自动发现的任务。每个自动发现的任务都会在一定时间内占用一个自动发现的进程。而默认配置项为1,所以报警

    解决方案

    修改配置文件的StartDiscoverers选项

    [root@zabbix-master ~]# grep 'StartDiscoverers' /etc/zabbix/zabbix_server.conf
    ### Option: StartDiscoverers
    StartDiscoverers=10

     Zabbix poller processes more than 75% busy

     问题原因

    翻译过来是轮询的负载量高,网上大多数说法是增加启动的StartPollers进程数,但就我遇到的情况,无法解决。查了很多文档,发现可能是我大批量更改模板导致。

    这边有一个交换机模板,应用了百台交换机,后来对这个模板的自动发现进行了调整。交换机发现了新的监控项,而老的监控项默认保留40天,造成监控项爆炸了。个人理解,不一定对。

     解决方案  : 调整StartPollers数量

     [root@zabbix-master ~]# grep 'StartPollers' /etc/zabbix/zabbix_server.conf
    ### Option: StartPollers
    StartPollers=100
    ### Option: StartPollersUnreachable
    StartPollersUnreachable=80

     修改模板自动发现规则的保留失去的资源期间
    zabbix3版本故障总结

    Zabbix alerter processes more than 75% busy

    问题原因

    zabbix服务器邮件进程繁忙导致的,一般是因为在设置动作的时候,间隔太短,在一些特殊情况下,产生大量告警,例如几万封邮件,服务器发邮件,邮件进程发挂了。

    解决方案

    网上有牛逼的人删数据库解决,风险较大,建议通过导流解决。改发邮件的脚本,将邮件的动作改为打印时间,如下,待邮件都释放完了,再改回来。

    [root@zabbix-master ~]# cat /usr/lib/zabbix/alertscripts/sms
    #!/bin/bash
    echo `date` >> /tmp/sms.txt

    Too many processes on zabbix server

    
    

    zabbix服务器进程太多报警,默认超过300个进程就报警。感觉默认值太小了,zabbix配置调优后,进程就500多个了,所以我把触发值改为600.

    
    

    zabbix3版本故障总结

    Zabbix preprocessing manager processes more than 75% 

    随着3.4版本的发布,出现了一大波新功能,后续会陆续推出3.4版本新功能介绍及实践.本次说一下3.4新增的Preprocessing这个功能.(3.4中文翻译好像有点问题把Preprocessing翻译为进程,翻译有点错误)Preprocessing为预处理,预加工(google翻译^_^)使用这个功能可以对item收到的数据行处理,处理之后再存入数据库或展示出来.

     preprocessing功能非常实用,如某些品牌的网络设备,使用snmp方式监控并收集回来的数据,由于厂商预先进行了处理,导致网络流量的值为4.5MB或者56KB等形式,人性化的表现形式,而对于3.4以前的zabbix来说,整数或浮点数后面多一两个字符,这整串数据就不能以整数值或者浮点数配置监控项的数据库收集类型,必须使用文本字符串类型,而文本和字符串类型监控项触发器不能使用数值监控类型的判断并触发流量报警。要变成数字类型,唯一的方式是使用外部检查预先编写字符串处理脚本,但增加的配置监控项的繁琐程度,且外部检查降低了zabbix的性能,3.4的preprocessing功能使得问题解决,并更加灵活的处理监控数据。

     

     

     

     

     

  • 相关阅读:
    http状态码
    Django基础篇(二)
    Django基础篇
    mysql进阶
    mysql数据库的基本操作
    JavaScript
    分布式原理之RPC框架
    Java实现本地缓存
    模版方法模式:封装算法 && 迭代器与组合模式:管理良好的集合
    分布式高并发系统设计与分析
  • 原文地址:https://www.cnblogs.com/yujianadu/p/10510611.html
Copyright © 2020-2023  润新知