背景
国庆处理的vCenter监控. 老的vCenter6.0的平台很正常.
但是新的vCenter 6.7 就经常出现断连的情况.
花费了快一个多小时才搞定, 这里记录一下.
问题现象
vCenter的监控. 6.7 版本的vCenter经常提示未 NO DATA
这边发现telegraf 还是正常启动.
root 541004 284806 5 09:06 pts/0 00:06:03 telegraf -config=telegraf.conf
root 1623862 284806 13 10:35 pts/0 00:01:48 telegraf -config=telegraf8087.conf
注意 我这边是第二个 telegraf8087 是 vCenter6.7 的监控配置文件.
但是日志里面有大量的错误现象:
2022-10-08T02:43:20Z E! [inputs.vsphere] Error in plugin: while collecting datastore: ServerFaultCode: This operation is restricted by the administrator - 'vpxd.stats.maxQueryMetrics'. Contact your system administrator.
问题解决
百度进行处理, 发现一直没有好办法. 唯一的方案是修改vCenter的配置:
登录vCenter 6.7
在vCenter最上面级点击.
然后进入配置-设置-高级设置
增加配置信息为
config.vpxd.stats.maxQueryMetrics 256
(建议修改成 -1 默认值就是 256 百度深坑.)
问题解决
搜到一个github 上面的说明
https://github.com/influxdata/telegraf/issues/5037
处理方式为:
修改两个地方
cluster_metric_include = [] ## if omitted or empty, all metrics are collected
cluster_metric_exclude = [ "*" ] ## Nothing excluded by default
max_query_metrics = -1
保存配置文件. 重启telegraf
cd /etc/telegraf
nohup telegraf -config=telegraf8087.conf >252.log &
观察
观察一天时间未出现异常.