摘要:GaussDB(DWS)使用DMS来承载数据库的智能运维体系,提供了数据库运维过程中的监控,分析,处理三大核心处理过程。
本文分享自华为云社区《GaussDB(DWS) 数据库智能监控运维服务-性能监控指标》,作者:power_gouge 。
GaussDB(DWS)使用DMS来承载数据库的智能运维体系,提供了数据库运维过程中的监控,分析,处理三大核心处理过程。
节点监控指标
在GaussDB(DWS) 产品中完成集群创建后,即可在集群管理页面看到创建的集群信息,选择集群操作选项中的监控面板功能,即可进入 DMS服务中。
![](https://pic3.zhimg.com/80/v2-bd953b6d9ed8b3717be6b848cf6a711a_720w.jpg)
DMS提供了多项关于数据库相关的监控与工具功能,本文中我们主要关注监控功能中对于节点监控指标。
![](https://pic1.zhimg.com/80/v2-9ba92bc9efacc761fd2c005d241c44b0_720w.jpg)
对于数据库集群中节点监控主要在于CPU 内存 磁盘 网络四个方面,从当前这个概览界面可以看主机当前的一些状态指标
![](https://pic2.zhimg.com/80/v2-c33e0ce476f8cf86e6fb5005e89319d1_720w.jpg)
将鼠标移动至某个指标,还可以查看更详细的一些监控值例如CPU,可以查看用户态 系统态 IDLE IO等待消耗的CPU占比。
![](https://pic1.zhimg.com/80/v2-997d9caa3e1a49d8eacf5a291e3ef8a4_720w.jpg)
节点监控页面上还可以针对磁盘和网络活动更加详细的信息,例如磁盘功能将对每个节点各个磁盘的IO状态指标进行采集与展示。
![](https://pic4.zhimg.com/80/v2-0f2144eee31a7cfd009472d1a59ccd5b_720w.jpg)
DMS服务从CPU 内存 磁盘 网络四个方面对数据库节点展开监控,那么这些监控指标如何体现了数据库当前的状态,从这些指标又怎么发现数据库当前可能存在的问题
CPU指标:CPU使用率反映了集群当前运行业务情况,业务数量越多计算量越多,节点的CPU使用率越高,当在集群业务高峰期观察时将可以看到CPU使用率是处在高位。对于CPU指标举例两类场景问题:
![](https://pic4.zhimg.com/80/v2-2eddc89a6b03a8da10350f1a29be8c83_720w.jpg)
内存指标:内存使用率反映当前集群运行时消耗内存情况,业务涉及的数据量越多,节点的内存消耗越多。举例内存指标相关问题:
![](https://pic2.zhimg.com/80/v2-03a4774bd848192db21515011199265d_720w.jpg)
磁盘指标:磁盘指标反映了当前集群运行时集群数据对于磁盘占用情况, 举例磁盘指标相关问题:
![](https://pic4.zhimg.com/80/v2-7010c25586d032e54482b8308fe4b4f7_720w.jpg)
网络指标:网络指标反映了当前集群运行时各个节点网络流量状态,举例网络问题:
![](https://pic1.zhimg.com/80/v2-e0664544639ca4b2b07c73013907e668_720w.jpg)
性能监控指标
在GaussDB(DWS) 产品中完成集群创建后,即可在集群管理页面看到创建的集群信息,选择集群操作选项中的监控面板功能,即可进入 DMS服务中。MS提供了多项关于数据库相关的监控与工具功能,接下来我们主要关注监控功能中对于集群整体的性能监控。
![](https://pic3.zhimg.com/80/v2-12c3287c0b42e46942b13130246a70d6_720w.jpg)
在性能监控页面上,我们首先关注功能区域:
![](https://pic2.zhimg.com/80/v2-12e252901503d2b1d8df332a0fb2ae91_720w.jpg)
![](https://pic1.zhimg.com/80/v2-bef88d80119546e841267b9d55159630_720w.jpg)
当前的版本中支持哪些监控指标呢? 可以参考下表
![](https://pic2.zhimg.com/80/v2-10c71ccfd8235b0979fe6c5fd2bde175_720w.jpg)