先过一下grafana的配置文件
grafana的配置文件。
右键服务的地址、发信人 账号 和面等
配置要连到prometheus上。
登陆的密码是多少,第二行是不允许用户注册。
dashboard.json里面内容太多 不能完全的看懂。
界面
admin password
新建一个dashboard
导入一个事先已经写好的了。
去找我们刚才看的那个 dashboard.jsn的文件
这个就是我们刚才在配置文件内配置的数据源。就是那个本地9090的那个prometheus
duratin:服务的平均响应时间,
上面是一些过滤条件
设置报警
出问题的时候,可以通知我。
在方法里面抛出一个异常。
再次启动OrderAPI
写一个测试的工具来测试,我们不停的去调用它,然后它就会一直报错。然后在grafana那边配置,错误打到什么样的频率就触发报警。
把这个测试类也跑起来。
这样他一直在报错500、
配置grafana
可以看到5xx的错误 一直在增长。
争对这个情况配置一个报警。notification channels 通知的渠道。
报警的方式,支持很多种方式
证明我们测试的邮件发出去了。然后点击Save保存即可
一分钟之前收到的邮件。
查看最近15分钟,10秒的刷新频率。
改完再保存一下
这和就是之前介绍的promethous的查询语言,就是定义了一个怎么计算我当前错误的数据。
找的是状态是5开头的
我们要写的报警
这里改成application-app
这样这边 就不报错了。看过去一分钟总的错误数量,大于1就报警
选择通知的渠道。刚才我们在notification channels 配置的渠道。
等了一会。裂开的红心。
触发的报警的历史记录
收到邮件的内容。
面板的定义
面板就是这个几千行的json定义出来的
也可以通过可视化的界面去加panel
结束