• prometheus中的alertmanage配置文件详解


    alertmanage学习链接:
    路由中标签详解:
    https://yunlzheng.gitbook.io/prometheus-book/parti-prometheus-ji-chu/alert/alert-manager-route
    alertmanage的配置文件示例
    https://blog.csdn.net/qq_22227087/article/details/96483009
    alertmanage主配置文件中关键字(方法)详解
    https://zhuanlan.zhihu.com/p/74932366
    
    ###########################################################
    prometheus配置文件和alert,amage配置文件详解
    
    prometheus的主配置文件中包含rule.yml, rule.yml中的rules只负责定义报警的触发条件(下面有rule.yml配置文件的样例)。触发以后会将消息转发到alertmanage,alertmanage的主配置文件中根据路由选择转发给哪个接收者(下面有alertmanage.yml配置文件的样例)
    
    
    
    ############################################################
    rule.yml配置样例
    groups:
    - name: test-rule
      rules:
      - alert: "tcp连接报警"
        expr: netdata_ipv4_tcpsock_active_connections_average{dimension="connections",family="tcp"} > 1
        for: 1s
        labels:
          severity: warning
        annotations:
          summary: "服务名:{{$labels.alertname}}"
          description: "业务500报警: {{ $value }}"
          value: "{{ $value }}"
    
    - name: test-rule2
      rules:
      - alert: "内存报警"
        expr: 100 - ((node_memory_MemAvailable * 100) / node_memory_MemTotal) > 1
        for: 1s
        labels:
          severity: test
        annotations:
          summary: "服务名:{{$labels.alertname}}"
          description: "业务500报警: {{ $value }}"
          value: "{{ $value }}"
    ##########################################################
    global:
      resolve_timeout: 5m
      # smtp_smarthost: 使用email打开服务配置
      smtp_smarthost: 'smtp.gmail.com:465'
      # smtp_from:指定通知报警的邮箱
      smtp_from: 'solomon02040@gmail.com'
      # smtp_auth_username:邮箱用户名
      smtp_auth_username: 'solomon02040@gmail.com'
      # smtp_auth_password:授权密码
      smtp_auth_password: '8899//zz'
      # smtp_require_tls:是否启用tls
      smtp_require_tls: false
    
    templates:
      - '/data/alertmanager/template/*.tmpl'
    
    route:
      receiver: solomontest     #接收人的名字可以自己定义
      group_by: ['alertname']
      group_wait: 10s     #组报警等待时间
      group_interval: 10s  #组报警间隔时间
      repeat_interval: 60s   #重复报警间隔时间
      routes:
      - receiver: solomontest
        group_wait: 10s
        match_re:          #使用match_re方法(使用正则的方式匹配,这里用match更好)
          env: test        #env是报警数据中的标签,test是标签的值
    
    
    receivers:
    - name: solomontest
      email_configs:
      - to: 'solomon02040@gmail.com'
        html: '{{ template "xx.html" . }}'   #指定模板
        headers: { Subject: "[WARN] 报警邮件" }
    
    
    - name: 'test'
      email_configs:
      - to: 'xxx@xx.xx'
        html: '{{ template "xx.html" . }}'
        headers: { Subject: " {{ 第二路由匹配测试}}" }
    ########################################################
  • 相关阅读:
    平台升级至spring 4.3.0 运行稳定
    java过滤特殊字符的正则表达式
    xheditor-文件上传-java-支持html5-application/octet-stream
    java用正则方法验证文件名是否合法
    Java实现在线预览Word,Excel,Ppt文档
    为什么用freemarker视图?
    Java中判断String不为空的问题性能比较
    解决org.apache.velocity.exception.ResourceNotFoundException: Unable to find resource
    Java Swing 使用非本地字体
    第三方包jintellitype实现Java设置全局热键
  • 原文地址:https://www.cnblogs.com/zhuhaofeng/p/13418454.html
Copyright © 2020-2023  润新知