• zabbix-server卡死不动


    关于zabbix-server 卡死问题有几种,但是在网上搜索都不是我的问题,写个总结给各位如有遇到并解决在好不过。

    问题描述 

    systemctl start zabbix-server.serivce  启动无果,另开窗口查看日志。

    tail -999f /var/log/zabbix/zabbix_server.log

    12377:20190117:182738.777 [Z3001] connection to database 'zabbix' failed: [1040] Too many connections
    12386:20190117:182738.777 [Z3001] connection to database 'zabbix' failed: [1040] Too many connections
    12377:20190117:182738.777 Cannot connect to the database. Exiting...
    12386:20190117:182738.777 Cannot connect to the database. Exiting...
    12378:20190117:182738.778 [Z3001] connection to database 'zabbix' failed: [1040] Too many connections
    12378:20190117:182738.778 Cannot connect to the database. Exiting...
    12327:20190117:182738.779 One child process died (PID:12386,exitcode/signal:1). Exiting ...
    zabbix_server [12327]: Error waiting for process with PID 12384: [4] Interrupted system call
    zabbix_server [12327]: Error waiting for process with PID 12386: [10] No child processes
    12327:20190117:182855.614 syncing history data...
    12327:20190117:182855.614 syncing history data done
    12327:20190117:182855.615 syncing trend data...
    12327:20190117:182855.615 syncing trend data done
    12327:20190117:182855.615 Zabbix Server stopped. Zabbix 4.0.0rc3 (revision 85283).  

    发现日志卡死在这就不在动了,检查下服务是否还在。

    ps -ef | grep zabbix-server
    root   22304 13466 0 19:48 pts/6 00:00:00 grep --color=auto zabbix-server

    发现并没有,用status命令检查下看看状态

    systemctl status zabbix-server.service
    ● zabbix-server.service - Zabbix Server
    Loaded: loaded (/usr/lib/systemd/system/zabbix-server.service; enabled; vendor preset: disabled)
    Active: deactivating (final-sigterm) since 四 2019-01-17 18:28:55 CST; 1h 23min ago
    Process: 14797 ExecStop=/bin/kill -SIGTERM $MAINPID (code=exited, status=0/SUCCESS)
    Process: 12316 ExecStart=/usr/sbin/zabbix_server -c $CONFFILE (code=exited, status=0/SUCCESS)
    Main PID: 12327 (code=exited, status=0/SUCCESS)
    Tasks: 1
    CGroup: /system.slice/zabbix-server.service
    └─12384 /usr/sbin/zabbix_server -c /etc/zabbix/zabbix_server.conf

    1月 17 18:27:38 server1 systemd[1]: Starting Zabbix Server...
    1月 17 18:27:38 server1 systemd[1]: Started Zabbix Server.
    1月 17 18:28:55 server1 systemd[1]: Stopping Zabbix Server...

    确实是不在,但是为什么会启动不了,百思不得其解, 最后我发现 CGroup 下进程号对应对是启动命令,于是我百度了下CGgroup百度文章是这样说的。

    作用

    编辑
    Cgroups最初的目标是为资源管理提供的一个统一的框架,既整合现有的cpuset等子系统,也为未来开发新的子系统提供接口。现在的cgroups适用于多种应用场景,从单个进程的资源控制,到实现操作系统层次的虚拟化(OS Level Virtualization)。Cgroups提供了以下功能:
    1.限制进程组可以使用的资源数量(Resource limiting )。比如:memory子系统可以为进程组设定一个memory使用上限,一旦进程组使用的内存达到限额再申请内存,就会触发OOM(out of memory)。
    2.进程组的优先级控制(Prioritization )。比如:可以使用cpu子系统为某个进程组分配特定cpu share。
    3.记录进程组使用的资源数量(Accounting )。比如:可以使用cpuacct子系统记录某个进程组使用的cpu时间
    4.进程组隔离(Isolation)。比如:使用ns子系统可以使不同的进程组使用不同的namespace,以达到隔离的目的,不同的进程组有各自的进程、网络、文件系统挂载空间。
    5.进程组控制(Control)。比如:使用freezer子系统可以将进程组挂起和恢复。
    --------------------------------------------------------------------------------------------------------------------------
    第5条解释给了我启发,于是乎我果断的kill -9  12327,果不其然,立马被锁死的进程被释放。

    systemctl status zabbix-server.service
    zabbix-server.service - Zabbix Server
    Loaded: loaded (/usr/lib/systemd/system/zabbix-server.service; enabled; vendor preset: disabled)
    Active: active (running) since 四 2019-01-17 19:53:10 CST; 4s ago
    Process: 14797 ExecStop=/bin/kill -SIGTERM $MAINPID (code=exited, status=0/SUCCESS)
    Process: 33547 ExecStart=/usr/sbin/zabbix_server -c $CONFFILE (code=exited, status=0/SUCCESS)
    Main PID: 33555 (zabbix_server)
    Tasks: 69
    CGroup: /system.slice/zabbix-server.service
    ├─33555 /usr/sbin/zabbix_server -c /etc/zabbix/zabbix_server.conf
    ├─33556 /usr/sbin/zabbix_server: configuration syncer [waiting 60 sec for processes]
    ├─33557 /usr/sbin/zabbix_server: alerter #1 started
    ├─33558 /usr/sbin/zabbix_server: alerter #2 started
    ├─33559 /usr/sbin/zabbix_server: alerter #3 started
    ├─33561 /usr/sbin/zabbix_server: housekeeper [startup idle for 30 minutes]

     
     
     
  • 相关阅读:
    我和杨兄的不同的Code First简单权限设计
    JavaScript&JQ 004_JS闭包
    省市区三级联动[JSON+Jquery]
    JavaScript 005_JS数组的CRUD
    linq头脑风暴001_聚合函数
    类成员函数指针的特殊之处
    模拟手算,计算组合数C(m,n)
    命令行版扫雷(vc08)
    UNICODE,GBK,UTF8:编码格式的区别
    画高频PCB的心得
  • 原文地址:https://www.cnblogs.com/sunju/p/10286839.html
Copyright © 2020-2023  润新知