Prometheus 介绍

我们知道zabbix在监控界占有不可撼动的地位，功能强大。但是对容器监控显得力不从心。为解决监控容器的问题，引入了prometheus技术。prometheus号称是下一代监控。接下来的文章打算围绕prometheus做一个系列的介绍，顺便帮自己理清知识点。

一、简介

　　prometheus是由谷歌研发的一款开源的监控软件，目前已经被云计算本地基金会托管，是继k8s托管的第二个项目。

二、优势

　　易于管理

　　轻易获取服务内部状态

　　高效灵活的查询语句

　　支持本地和远程存储

　　采用http协议，默认pull模式拉取数据，也可以通过中间网关push数据

　　支持自动发现

　　可扩展

　　易集成

三、prometheus运行流程

prometheus根据配置定时去拉取各个节点的数据，默认使用的拉取方式是pull，也可以使用pushgateway提供的push方式获取各个监控节点的数据。将获取到的数据存入TSDB，一款时序型数据库。此时prometheus已经获取到了监控数据，可以使用内置的PromQL进行查询。它的报警功能使用Alertmanager提供，Alertmanager是prometheus的告警管理和发送报警的一个组件。prometheus原生的图标功能过于简单，可将prometheus数据接入grafana，由grafana进行统一管理。

四、监控的目的

　　google指出，监控分为白盒监控和黑盒监控之分。

　　白盒监控：通过监控内部的运行状态及指标判断可能会发生的问题，从而做出预判或对其进行优化。

　　黑盒监控：监控系统或服务，在发生异常时做出相应措施。

　　监控的目的如下：

　　　　1、根据历史监控数据，对为了做出预测

　　　　2、发生异常时，即使报警，或做出相应措施

　　　　3、根据监控报警及时定位问题根源

　　　　4、通过可视化图表展示，便于直观获取信息

五、常用概念

　　prometheus采集到的监控数据均以metric（指标）形式保存在时序数据库中（TSDB）

　　每一条时间序列由 metric 和 labels 组成，每条时间序列按照时间的先后顺序存储它的样本值。

　　默认情况下各监控client向外暴露一个HTTP服务，prometheus会通过pull方式获取client的数据，数据格式如下：

#  HELP node_cpu Seconds the cpus spent in each mode.
#  TYPE node_cpu counter
node_cpu{cpu="cpu0",mode="idle"}    362812.7890625
#  HELP node_load1 1m   load    average.
#  TYPE node_load1 gauge
node_load1 3.0703125

　　以#开头的表示注释信息，解释了每一个指标的监控目的和类型

　　node_cpu表示监控指标的名称

　　{}内的内容是标签，以键值对的方式记录

　　数字是这个指标监控的数据

　　下图横坐标代表的是时间（时间戳的方式记录在TSDB中），纵坐标代表了各种不同的指标名称，坐标系中的黑点代表了各个指标在不同时间下的值。

　　每一个横线就是时间序列

　　每个黑点就是样本（prometheus将样本以时间序列的方式保存在内存中，然后定时保存到硬盘上）

　　指标（metric）的格式如下：

<metric  name>{<label  name>=<label  value>,  ...}

　　指标名称反映的是监控了什么。

　　标签反映的是样本的维度，可以理解成指标的细化。比如：

api_http_requests_total{method="POST",  handler="/messages"}

　　指标是“api_http_requests_total”，含义是通过api请求的http总数。

　　标签“method="POST"” "handler="/messages""代表了这些http请求中 POST 请求并且 handler是/messages的数量

　　上述指标等同于：

{__name__="api_http_requests_total"，method="POST",  handler="/messages"}

　　指标有四种类型

　　1、Counter　　只增不减计数器

　　2、Gauge　　可增可减仪表盘

　　3、Histogram　　直方图

　　4、Summary　　摘要型

相关阅读:
Flask从负到零的一周
DOM(一)：节点层次－Node类型
错误处理(三)：区分致命错误和非致命错误
错误处理(二)：常见错误类型
错误处理(一)
跨域(二)
跨域(一)
AJAX(四)：XHR2支持的方法
AJAX(三)：GET与POST
AJAX(二)：HTTP头部信息

原文地址：https://www.cnblogs.com/gakuki/p/12268968.html