最近遇到一个Case,Oracle Support要求添加私网(心跳网络)监控。
OSW默认是没有私网监控的,如需增加只需配置private.net文件,对应采集信息会存放到archive/oswprvtnet目录下。
需要在RAC所有节点上配置,方法完全一样,这里以其中一个节点为例说明:
1.查看配置文件示例Exampleprivate.net
[grid@db02 oswbb]$ pwd
/opt/app/grid/oracle.ahf/data/repository/suptools/db02/oswbb/grid/oswbb
[grid@db02 oswbb]$ cat Exampleprivate.net
######################################################################
# This file contains examples of how to monitor private networks. To
# monitor your private networks create an executable file in this same
# directory named private.net. Use the example for your host os below.
# Make sure not to remove the last line in this file. Your file
# private.net MUST contain the rm lock.file line.
######################################################################
#Solaris Example
######################################################################
echo "zzz ***"`date`
traceroute -r -F <node1-priv>
traceroute -I -r -F <node1-priv>
traceroute -r -F <node2-priv>
traceroute -I -r -F <node2-priv>
######################################################################
#HP Example
######################################################################
echo "zzz ***"`date`
traceroute -r -F <node1-priv>
traceroute -r -F <node2-priv>
######################################################################
#Linux Example
######################################################################
echo "zzz ***"`date`
traceroute -r -F <node1-priv>
traceroute -r -F <node2-priv>
######################################################################
#Tru64 Example
######################################################################
echo "zzz ***"`date`
traceroute -r -f <node1-priv>
traceroute -r -f <node2-priv>
######################################################################
#AIX Example
######################################################################
echo "zzz ***"`date`
traceroute -r <node1-priv>
traceroute -r <node2-priv>
######################################################################
# DO NOT DELETE THE FOLLOWING LINE!!!!!!!!!!!!!!!!!!!!!
######################################################################
rm locks/lock.file
[grid@db02 oswbb]$
2.拷贝示例文件到private.net
[grid@db02 oswbb]$ cp Exampleprivate.net private.net
3.修改private.net配置文件
保留Linux和最后提示不允许删除的部分,根据实际情况修改私网名称或者私网IP地址,我这里用到两组心跳网络:[grid@db02 oswbb]$ cat private.net
######################################################################
#Linux Example
######################################################################
echo "zzz ***"`date`
traceroute -r -F db01-priv
traceroute -r -F db02-priv
traceroute -r -F db01-priv-2
traceroute -r -F db02-priv-2
######################################################################
# DO NOT DELETE THE FOLLOWING LINE!!!!!!!!!!!!!!!!!!!!!
######################################################################
rm locks/lock.file
检查oswprvtnet下面是否生成数据,如果没有可以尝试重启下osw:
[grid@db02 oswbb]$ tfactl stop oswbb
Stopped OSWatcher
[grid@db02 oswbb]$ tfactl start oswbb
Starting OSWatcher
4.确认OSW正常监控私网
观察到oswprvtnet目录下生成文件并定时更新写入信息:[grid@db02 oswprvtnet]$ cat db02_prvtnet_20.06.30.0900.dat
zzz ***Tue Jun 30 09:41:35 CST 2020
./private.net: line 5: traceroute: command not found
./private.net: line 6: traceroute: command not found
./private.net: line 7: traceroute: command not found
./private.net: line 8: traceroute: command not found
zzz ***Tue Jun 30 09:41:50 CST 2020
traceroute to db01-priv (10.10.1.107), 30 hops max, 60 byte packets
1 db01-priv (10.10.1.107) 0.890 ms 0.869 ms 0.859 ms
traceroute to db02-priv (10.10.1.108), 30 hops max, 60 byte packets
1 db02-priv (10.10.1.108) 0.036 ms 0.006 ms 0.005 ms
traceroute to db01-priv-2 (10.10.2.107), 30 hops max, 60 byte packets
1 db01-priv-2 (10.10.2.107) 0.747 ms 0.799 ms 0.653 ms
traceroute to db02-priv-2 (10.10.2.108), 30 hops max, 60 byte packets
1 db02-priv-2 (10.10.2.108) 0.037 ms 0.006 ms 0.005 ms
zzz ***Tue Jun 30 09:42:05 CST 2020
traceroute to db01-priv (10.10.1.107), 30 hops max, 60 byte packets
1 db01-priv (10.10.1.107) 0.306 ms 0.163 ms 0.237 ms
traceroute to db02-priv (10.10.1.108), 30 hops max, 60 byte packets
1 db02-priv (10.10.1.108) 0.027 ms 0.006 ms 0.005 ms
traceroute to db01-priv-2 (10.10.2.107), 30 hops max, 60 byte packets
1 db01-priv-2 (10.10.2.107) 0.208 ms 0.164 ms 0.101 ms
traceroute to db02-priv-2 (10.10.2.108), 30 hops max, 60 byte packets
1 db02-priv-2 (10.10.2.108) 0.017 ms 0.006 ms 0.008 ms
之前报错是因为系统缺失traceroute这个命令,一般OS都会有这个命令,如果没有可用yum安装即可:
[root@db02 ~]# yum install traceroute