一 标准书写方式
ALERT grafana中的key
IF key(这里可加函数) <3
FOR time(持续时间)
LABELS {
severity = "major"(报警级别,由alert.yml中进行定义)
}
ANNOTATIONS {
summary = "{{$label.instance}} " label输出的标签
description = current size ( {{$value}})" 具体报警信息
}
二 redis报警项
1 redis_up 0 不可到达
2 redis_connected_clients 1600 客户端连接数过高
3 redis_used_cpu_sys 0.7 syscpu使用率过高
4 redis_used_cpu_user 0.7 usercpu使用率过高
5 redis_connected_slaves 1 当前master单实例没有slave
6 redis_net_output_bytes_total N 出口流量过高
7 redis_cluster_state OK 检测集群状态
8 redis_cluster_slots_fail 检测失败状态的slots
9 redis_cluster_nodes 检测集群成员
10 redis_cluster_size 检测split数量
11 memoryusage 检测内存占用比
三 mysql报警项
1 mysql_up 0 不可到达
2 mysql_slave_status_slave_io_running/mysql_slave_status_slave_sql_running 复制进程
3 mysql_global_status_threads_connected 总创建的连接数
4 mysql_global_status_threads_running 正在运行的线程
5 mysql_global_status_slow_queries 慢查询量
6 mysql_slave_status_seconds_behind_master 主从延时