• Prometheus 部署 +grafana + 报警 + 邮箱


    环境:

    服务器A:prometheus

    服务器B:被监控端

    软件:

    标红的传到prometheus端,其余的传到被监控端

    安装前时间同步:否则会出错

     解决就是时间同步:

    [root@localhost ~]# yum -y install ntpdate
    [root@localhost ~]# ntpdate cn.pool.ntp.org  

     安装prometheus :

    [root@192 ~]# cd /usr/local/src/
    [root@192 src]# ll
    总用量 142600
    -rw-r--r--. 1 root root 25710888 8月   5 19:47 alertmanager-0.21.0.linux-amd64.tar.gz
    -rw-r--r--. 1 root root 54991977 8月   5 19:47 grafana-5.4.2-1.x86_64.rpm
    -rw-r--r--. 1 root root 65312139 8月   5 19:47 prometheus-2.20.0.linux-amd64.tar.gz
    [root@192 src]# tar zxf prometheus-2.20.0.linux-amd64.tar.gz 
    [root@192 src]# mkdir /usr/local/prometeus
    [root@192 src]# mv prometheus-2.20.0.linux-amd64/* /usr/local/prometeus/
    [root@192 src]# cd /usr/local/prometeus/
    [root@192 prometeus]# ls 
    console_libraries  consoles  LICENSE  NOTICE  prometheus  prometheus.yml  promtool  tsdb
    [root@192 prometeus]# ./prometheus  #前台启动
    
    [root@192 prometeus]# nohup ./prometheus &   #后台启动 生成nohup.out文件
    
    [root@192 prometeus]# ll
    总用量 153588
    drwxr-xr-x. 2 3434 3434       38 7月  23 05:00 console_libraries
    drwxr-xr-x. 2 3434 3434      173 7月  23 05:00 consoles
    drwxr-xr-x. 4 root root       70 8月   5 20:12 data
    -rw-r--r--. 1 3434 3434    11357 7月  23 05:00 LICENSE
    -rw-------. 1 root root     2374 8月   5 20:13 nohup.out
    -rw-r--r--. 1 3434 3434     3420 7月  23 05:00 NOTICE
    -rwxr-xr-x. 1 3434 3434 90933367 7月  23 02:53 prometheus
    -rw-r--r--. 1 3434 3434      926 7月  23 05:00 prometheus.yml
    -rwxr-xr-x. 1 3434 3434 51151585 7月  23 02:55 promtool
    -rwxr-xr-x. 1 3434 3434 15159115 7月  23 02:56 tsdb
    [root@192 prometeus]# tailf nohup.out  #实时打印日志
    
    [root@192 prometeus]# vim prometheus.yml
    alerting:
      alertmanagers:
      - static_configs:
        - targets:
          # - alertmanager:9093   #打开报警
    
    rule_files:
      # - "first_rules.yml"
      # - "second_rules.yml"        #报警规则
    
    - job_name: 'prometheus'
    
        # metrics_path defaults to '/metrics'
        # scheme defaults to 'http'.
    
        static_configs:
        - targets: ['localhost:9090']  #监控本机
    
    - job_name: 'node_exporter'
    
        # metrics_path defaults to '/metrics'
        # scheme defaults to 'http'.
    
        static_configs:
        - targets: ['192.168.177.142:9100']  #监控被监控端  

      

     被监控端:

    [root@192 ~]# cd /usr/local/src/
    [root@192 src]# ll
    总用量 16388
    -rw-r--r--. 1 root root 7121565 8月   5 19:47 mysqld_exporter-0.12.1.linux-amd64.tar.gz
    -rw-r--r--. 1 root root  134391 8月   5 19:47 mysql_rev1.json
    -rw-r--r--. 1 root root 9520728 8月   5 19:47 node_exporter-1.0.1.linux-amd64.tar.gz
    [root@192 src]# tar zxf node_exporter-1.0.1.linux-amd64.tar.gz 
    [root@192 src]# mkdir /usr/local/node_exporter
    [root@192 src]# mv node_exporter-1.0.1.linux-amd64 /usr/local/node_exporter/
    [root@192 src]# cd /usr/local/node_exporter/
    [root@192 node_exporter]# ll
    总用量 0
    drwxr-xr-x. 2 3434 3434 56 6月  16 21:19 node_exporter-1.0.1.linux-amd64
    [root@192 node_exporter]# cd node_exporter-1.0.1.linux-amd64/
    [root@192 node_exporter-1.0.1.linux-amd64]# ll
    总用量 19216
    -rw-r--r--. 1 3434 3434    11357 6月  16 21:19 LICENSE
    -rwxr-xr-x. 1 3434 3434 19657731 6月  16 20:44 node_exporter
    -rw-r--r--. 1 3434 3434      463 6月  16 21:19 NOTICE
    [root@192 node_exporter-1.0.1.linux-amd64]# ./node_exporter #启动服务前台
    

      

    web检测:192.168.177.252:9090

    查看数据指标

     下面要结合grafana来进行监控:

    安装grafana

    [root@192 src]# rpm -ivh --nodeps grafana-5.4.2-1.x86_64.rpm  #会有依赖 加上--nodeps
    [root@192 src]# systemctl daemon-reload
    [root@192 src]# systemctl restart grafana-server
    [root@192 src]# systemctl status grafana-server 
    ● grafana-server.service - Grafana instance
       Loaded: loaded (/usr/lib/systemd/system/grafana-server.service; disabled; vendor preset: disabled)
       Active: active (running) since 三 2020-08-05 21:00:49 CST; 16s ago 

     web访问:ip+3000

    之后改密码:自己随便改:

     

     

     

     监控的本机

     

     

     

     保存

     监控被监控端

     插入与上面重复一样:

     

     报警机制的选择:

    [root@192 prometeus]# vim prometheus.yml 
    [root@192 prometeus]# vim first_rules.yml
    groups:
    - name: node_exporter_1 alert rule
      rules:
      - alert: node_exporter_1Down
        expr: sum(up{job="node_exporter_1"}) == 0
        for: 10s
        labels:
          severity: critical
    [root@192 prometeus]# vim prometheus.yml
    rule_files: 
    - "first_rules.yml" 拖进来
    # - "first_rules.yml"
    # - "second_rules.yml" ~

     停掉监控端查看:

     

     报警机制:

    [root@192 src]# ll
    总用量 142600
    -rw-r--r--. 1 root root 25710888 8月   5 19:47 alertmanager-0.21.0.linux-amd64.tar.gz
    -rw-r--r--. 1 root root 54991977 8月   5 20:58 grafana-5.4.2-1.x86_64.rpm
    drwxr-xr-x. 2 3434 3434        6 8月   5 20:12 prometheus-2.20.0.linux-amd64
    -rw-r--r--. 1 root root 65312139 8月   5 19:47 prometheus-2.20.0.linux-amd64.tar.gz
    [root@192 src]# tar zxf alertmanager-0.21.0.linux-amd64.tar.gz 
    [root@192 src]# mkdir /usr/local/alertmanager
    [root@192 src]# mv alertmanager-0.21.0.linux-amd64/* /usr/local/alertmanager/
    [root@192 src]# cd /usr/local/alertmanager/
    [root@192 alertmanager]# ll
    总用量 51644
    -rwxr-xr-x. 1 3434 3434 28871879 6月  17 16:54 alertmanager
    -rw-r--r--. 1 3434 3434      380 6月  17 17:34 alertmanager.yml
    -rwxr-xr-x. 1 3434 3434 23987848 6月  17 16:55 amtool
    -rw-r--r--. 1 3434 3434    11357 6月  17 17:34 LICENSE
    -rw-r--r--. 1 3434 3434      457 6月  17 17:34 NOTICE
    [root@192 alertmanager]# vim alertmanager.yml 
    [root@192 alertmanager]# vim alertmanager.yml 
    [root@192 alertmanager]# ./alertmanager 
    [root@192 alertmanager]# cat alertmanager.yml 
    global:
      resolve_timeout: 5m
      smtp_smarthost: 'smtp.qq.com:465'
      smtp_from: 'QQ号@qq.com'
      smtp_auth_username: 'QQ号@qq.com'
      smtp_auth_password: '验证码'
    
    route:
      group_by: ['alertname']
      group_wait: 10s
      group_interval: 10s
      repeat_interval: 10s
      receiver: 'mail-receiver'
    receivers:
    - name: 'mail-receiver'
      email_configs:
      - to: 'QQ号@qq.com'
    inhibit_rules:
      - source_match:
          severity: 'critical'
        target_match:
          severity: 'warning'
        equal: ['alertname', 'dev', 'instance']
    

      

     

     可以调整报警规则,来进行检测,收到邮箱就为成功!!!

      

  • 相关阅读:
    C# 关于反射事件
    SqlBulkCopy 帮助类
    【转载】FormsAuthenticationTicket 对象
    c# 安全队列
    用户离职后网盘数据交接的实现
    网盘文件被下载过的记录查询脚本(亲测有效)
    学校搭建教学资源库平台的成熟方案
    【不务正业】太空工程师自动导航v1.0 beta
    golang的sort研究
    关于golang的defer的练习
  • 原文地址:https://www.cnblogs.com/wendyluo/p/13443423.html
Copyright © 2020-2023  润新知