• 第十二 讲:Grafana 超实⽤用企业级监控绘图⼯工具的结合


      本讲内容

    •   Grafana 这款软件的介绍
    •   Grafana 下载/安装/配置/运⾏
    •   Grafana 设置数据源 连接prometheus_server
    •   Grafana 建⽴ Dashboard
    •   Grafana 创建 graph 成图
    •   Grafana graph进阶内容
    •   Grafana Dashboard 全局部署优化
    •   Grafana json备份 和 还原
    •   Grafana 实现报警功能 连接(4.0新功能 重要!)

      Grafana介绍

       Grafana是⼀款近⼏年新兴的 开源数据绘图⼯具平台,默认⽀持如下这么多钟 数据源作为输⼊  

      Grafana 下载/安装/配置/运⾏

      官网地址:https://grafana.com/

      下载安装运行

    #下载
    wget https://s3-us-west-2.amazonaws.com/grafana-releases/release/grafana-4.6.3-1.x86_64.rpm
    #安装
    rpm -ivh grafana-4.6.3-1.x86_64.rpm 
    #运行
    rpm -ivh grafana-4.6.3-1.x86_64.rpm 
    systemctl daemon-reload
    systemctl enable grafana-server.service
    systemctl start grafana-server.service
    

       访问默认使用3000端口

      默认用户名和密码为admin

      添加数据源

       添加后查看

       创建图形

       创建Graph图形

       点击编辑edit

     

    count_netstat_wait_connections
    

     

       可以设置 整个graph的分辨率  如果希望图形更清晰 可以设置 Height的部分 到200-400px

       接下来我们看 Metrics选项卡的部分
      默认图像下⽅的输出信息 是输出全部的标签 看着很乱 我们可以定制⾃⼰的 标签别名

       接下来 我们来到 Legend选项卡

      在这⾥ 我们可以进⼀步 对输出值 进⾏规划 可以讲显⽰数值 额外设置 最⼩ 最⼤ 平均 当前 数值进⾏显⽰ 最终可以做成这种样⼦的显⽰

     

     

       最终效果

        Grafana json备份 和 还原

      SAVE as  当我们的dashboard设置的graph越来越多时 我们除了即时保存  还要掌握 导出的⽅法 以便永久保存

      在最上⾯ 设置的部分 选择 View Json

     

       将全部的json copy出来 保存到第⼀个地⽅ 以备不时之需  Grafana⽀持将 json导⼊ 还原成 dashboard

     

     

     

     

       删除监控图

       Grafana 实现报警功能 连接(4.0新功能 重要!)

      Grafana 4.0之后 ⽀持报警功能

      所有的graph图形都可以 设置连接上多个报警平台 并设置阈 值并报警

      这个是⼀个⾮常重要的新功能 有了这个 新功能后 prometheus_server(alertmanager插件)-Pagerduty 仅仅作为数据 源即可(没有必要再使⽤prometheus做报警设置了)

      整个的流程如下

       接下来我们来看下 如何设置grafana的报警功能

      1) 新建⼀个报警平台 连接渠道(Alerting channel) 我们先去Pagerduty   获取⼀个 Integration Key 这个Integration Key   实际上是⼀串数字,作为让其他软件连接到⾃⼰的 认证码 xxxxxxxxxxxxxxxx

     

     

       2) 回到我们的 Dashboard => Graph 我们来设置 报警阈值

     

       可以是 avg() 也可以是 max() min() 等等 对⼀段数据的数值 进⾏估算 ,可以⾛ 平均 也可以取最⼤值 最⼩值 然后 OF 之后 选择我们的 之前的查询公式 Query(A,1m,now) 其中的 A 就是我们在创建 Graph Metrics选项卡的 设置的第⼀ 个查询公式 1m 代表的是 取1分钟内的数据 IS ABOVE 后 就是报警的触发阈值了 当⼤于110的时候 就会发出报警到 Pagerduty 保存之后 我们的Graph图 如下

       3) 继续设置 我们的 notification

     

       设置一个CPU使用率的监控图

      查询语句是

    (1-sum(increase(node_cpu{mode="idle"}[1m])) by(instance) / sum(increase(node_cpu[1m])) by(instance))*100
    

     

     

     

       有达到阈值返回true

      报错报警规则

     

     

  • 相关阅读:
    [转载]oracle中的exists 和not exists 用法详解
    oracle中sql语句的优化(转帖)
    BizTalk Server 2010 使用 WCF Service [ 上篇 ]
    冒泡排序
    一起复习几何(4)
    手把手教你升级到 Mysql 5.5
    BizTalk Server 2010 映射器(Mapper) [ 上篇 ]
    基于OpenGL的渲染引擎
    BizTalk Server 2010 映射器(Mapper) [ 下篇 ]
    BizTalk Server 2010 映射器(Mapper) [ 中篇 ]
  • 原文地址:https://www.cnblogs.com/minseo/p/13384657.html
Copyright © 2020-2023  润新知