告警的选型
(1)备选方案
-
Prometheus
-
Open-falcon
-
Zabbix
(2)方案对比
我们从市面上调研了一些监控系统,其中比较流行的是Prometheus、Open-falcon、Zabbix。根据自身需求对这三个监控系统进行对比,首先我们进行对接方面的对比。这三个系统它们都可以支持多通道的告警源,同时可以支持多通道的告警目标,所以在这个需求上面,这三个方案都是满足的。
关于告警的收敛。Zabbix 在告警的收敛上面没有任何的支持。Open-falcon只进行了一些简单的收敛,比如一段时间内重复的告警,它不会重复的发送。而Prometheus提供了灵活的规则,能够满足在不同场景下的需求。但是通知次数上面,Open-falcon和Zabbix都限制了最大通知次数,Prometheus则没有最大通知次数的限制,在这一点上上面两个方案比Prometheus好一点。
第三个需求方面的支持。首先是Zabbix,监控系统和告警系统绑定在一起,所以它的故障域很大。Open-falcon和Prometheus,其监控系统和告警系统都可以单独的部署,所以它的故障域相对来说要小,但是Open-falcon所有的组件都支持高可用,除了它的告警系统以外,这一点是比较遗憾的。
然后我们还考量了一些其他的方面:
第一点是配置,Open-falcon和Zabbix都是基于模板的配置,而Prometheus提供的是一种树形的配置,我们通过对比发现树形配置比较灵活,而且学习成本也相对较低。
第二点是语言,我们公司的大多数产品都是使用GO语言,所以我们希望选择的方案能够贴合我们的技术栈。通过以上方面的比较,我们最终选择了Prometheus作为我们的方案选型。Prometheus它是一整套的解决方案,它包括了监控系统Prometheus,以及告警的展示Grafana,以及它的告警系统Alertmanager。
参考原文地址:https://blog.csdn.net/weixin_34361881/article/details/93116829