• 自动化运维监控工具有哪些?常用的开源运维监控工具大全


    对于一个企业来说,服务器的安全性是一个非常重要的事情,因此,做好监控防御工作是十分必要的,很多企业都需要搭建和管理一套坚实的监控系统,就需要自动化运维工程师们了解并掌握一些常用的运维监控工具,以下是对常用的开源运维监控工具的讲解。

      Zabbix

      Zabbix是一个基于WEB界面的提供分布式系统监控以及网络监控功能的企业级开源运维平台,也是目前国内互联网用户中使用广的监控软件,云智慧遇到的85%以上用户在使用Zabbix做监控解决方案。

      Zabbix是一款入门简单、上手简单、功能强大的开源监控工具,其易于管理和配置,能生成比较漂亮的数据图,其自动发现功能大大减轻日常管理的工作量,丰富的数据采集方式和API接口可以让用户灵活进行数据采集,而分布式系统架构可以支持监控更多的设备。理论上,通过Zabbix提供的插件式架构,可以满足企业的任何需求。对于一般中小型企业可以选择Zabbix作为监控工具。

      优点:

      1. 支持多平台的企业级分布式开源监控软件

      2. 安装部署简单,多种数据采集插件灵活集成

      3. 功能强大,可实现复杂多条件告警,

      4. 自带画图功能,得到的数据可以绘成图形

      5. 提供多种API接口,支持调用脚本

      6. 出现问题时可自动远程执行命令(需对agent设置执行权限)

      缺点:

      1. 项目批量修改不方便

      2. 入门容易,能实现基础的监控,但是深层次需求需要非常熟悉Zabbix并进行大量的二次定制开发,难度较大;

      3. 系统级别报警设置相对比较多,如果不筛选的话报警邮件会很多;并且自定义的项目报警需要自己设置,过程比较繁琐(但是网上的模板比较,也可以使用模板导入的方法);

      4. 缺少数据汇总功能,如无法查看一组服务器平均值,需进行二次开发;

      5. 数据报表需要特殊二次开发定义;

      Nagios

      Nagios是一款开源的企业级监控系统,能够实现对系统CPU、磁盘、网络等方面参数的基本系统监控,以及SMTP,POP3,HTTP,NNTP等各种基本的服务类型。另外通过安装插件和编写监控脚本,用户可以实现应用监控,并针对大量的监控主机和多个对象部署层次化监控架构。

      Nagios的特点是其强大的管理中心,尽管其功能是监控服务和主机的,但Nagios自身并不包括这部分功能代码,所有的监控、告警功能都是由相关插件完成的,适合复杂IT环境的企业。

      优点:

      1. 出错的服务器、应用和设备会自动重启,自动日志滚动

      2. 配置灵活,可以自定义shell脚本,通过分布式监控模式

      3. 支持以冗余方式进行主机监控,报警设置多样

      4. 命令重新加载配置文件无需打扰Nagios的运行

      缺点:

      1. 事件控制台功能很弱,插件易用性差

      2. 对性能、流量等指标的处理不给力

      3. 看不到历史数据,只能看到报警事件,很难追查故障原因

      4. 配置复杂,初学者投入的时间、精力和成本比较大

      Ganglia

      Ganglia是一个跨平台可扩展的,高性能计算系统下的分布式监控系统,它已被广泛移植到各种操作系统和处理器架构上,适用于大型服务器集群用户。

      优点:

      1. 适合监控系统性能,通过曲线很容易见到每个节点的工作状态

      2. 可以自定义监控项,监控展示有表格和图像两种,支持手机版

      3. 部署方便,通过不同的分层管理上万台机器,无需逐个添加配置

      缺点:

      1. 没有内置的消息通知系统

      2. 没有报警机制,出现问题不能够及时报警

      Zenoss

      Zenoss Core是Zenoss的开源版本,其商用版本为ZenossEnterprise。作为企业级智能监控软件,Zenoss Core允许IT管理员依靠单一的WEB控制台来监控网络架构的状态和健康度。Zenoss Core的强大能力来自于深入的列表与配置管理数据库,以发现和管理公司IT环境的各类资产。Zenoss同时提供与CMDB关联的事件和错误管理系统,以协助提高各类事件和提醒的管理效率。

      优点:

      1. Zenoss比较出色的地方在于它的Dashboard,可以配置很多portlet

      2. 每个用户的界面都是分开管理的,自定义dashboard不会影响其他用户

      3. 强大监控功能支持服务器、路由交换、防火墙、存储、数据库、中间件监控

      4. 采用基于HBASE的opentsdb存储任意时间段的数据

      5. 将状态监控,性能监控,资源管理,良好的报告机制进行有机的整合

      缺点:

      1. 对资源要求较高,即使只管理少数几台设备,也需要消耗大量硬件及内存等附加资源。

      2. 针对windows系统,开源版只提供SNMP,通过WMI检测CPU,Disk,软硬件和性能只在收费版提供。

      以上自动化运维监控工具各有优缺点,可以根据实际需求选择使用!

  • 相关阅读:
    JStack分析cpu消耗过高问题
    Machine Learning in Action – PCA和SVD
    Machine Learning in Action -- FP-growth
    Machine Learning in Action -- 树回归
    Machine Learning in Action -- 回归
    Kafka 0.8 配置参数解析
    统计学习方法笔记 -- 隐马尔可夫模型
    Machine Learning in Action -- AdaBoost
    统计学习方法笔记 -- Boosting方法
    Andrew Ng机器学习公开课笔记–Reinforcement Learning and Control
  • 原文地址:https://www.cnblogs.com/qianxiaoruofeng/p/13812408.html
Copyright © 2020-2023  润新知