-
毛刺收敛:
在织云监控中,我们的告警策略为了防止毛刺的影响,会将告警策略定义为10分钟发生3次类似的模式。
-
同类收敛:
一个模块有300个监控实力,产生了300条的告警,只要有一条告给运维,对于运维同类收敛掉了。
-
时间收敛:
生产环境中有很多定时的任务,如定时跑批会引起I/O的陡增等异常,这种可以针对性的收敛掉。
-
昼夜收敛:
有一些告警,在分布式服务的高可用架构下,晚上不需要告警出来,可以等白天才告警,更人性化的管理。
-
变更收敛:
如果告警的时间点有运维的活动,就要收敛掉它。怎么做到的?取决于要把运维的活动都收口在标准化运维的平台,运维平台对生产环节都要讲变更日志写入在变更记录中心那里,然后统一告警系统能够关联变更记录来决策是收敛还是发出告警。