• prometheus定时定点发送告警


    需求:

      有时候,我们总有一些奇奇怪怪的需求,要定时定点的去判断或者去操作;

      比如我现在就有一个奇奇怪怪的需求,因为prometheus 没有做高可用,我要看它是否挂了,如果太频繁我又嫌烦,如果太久又不能起到效果;

      所以我现在需要,每天早上6点发个告警,以便我确保 prometheus 是存活的;

    解决:

      比如现在是 2021-08-02 16:01:01 ,那么我获取的

    获取小时数 16:floor(node_time_seconds{instance='10.20.50.5:9100'}%(3600*24)/3600+8)      ,这里+8 是因为是 UTC 时间,+8 到我们中国本地时间

    获取分钟数 5:floor(node_time_seconds{instance='10.20.50.5:9100'}%(3600*24)/60%60)         ,这里不+8 是因为,反正分钟都一样

      

     最后,在rules 里面配置

      

    - alert: Prometheus存活测试
    expr: floor(node_time_seconds{instance='10.20.50.5:9100'}%(3600*24)/3600+8)==6 and floor(node_time_seconds{instance='10.20.50.5:9100'}%(3600*24)/60%60)<10
    for: 5m
    labels:
    severity: critical
    annotations:
    summary: "Prometheus 存活测试"
    description: "Prometheus alive test"

  • 相关阅读:
    java优雅的使用elasticsearch api
    springboot mybatis优雅的添加多数据源
    java通过shield链接Elasticsearch
    java spark-streaming接收TCP/Kafka数据
    hiveQL求差集
    hiveQL去重
    Ubuntu16.04+Opencv3.3的安装教程
    TensorFlow池化层-函数
    TensorFlow激活函数+归一化-函数
    TensorFlow图像预处理-函数
  • 原文地址:https://www.cnblogs.com/gered/p/15090307.html
Copyright © 2020-2023  润新知