1 日常维护
1.1 环境及单板硬件状态观测
表1 环境及单板硬件状态观测
项目 |
操作指导 |
参考标准 |
备注 |
环境状况 |
display environment查看设备温度 |
设备温度应该在门限以内 |
见display environment 命令参考 |
前面板指示灯状况 |
观察前面板的电源指示灯、端口指示灯、模块指示灯及数码管运行状况 |
黄色闪烁指示故障状态,数码管指示故障类型。 |
具体含义请参考产品资料。 |
单板运行状况 |
display device查看单板运行状况 |
所有单板设备应该都是Normal。 |
见display device命令参考 |
系统电源状态 |
display power 查看电源状态 |
凡是在位的电源模块应该为Normal,如果存在FUALT态需要检查模块是否有异常。 |
|
系统风扇状态 |
display fan查看风扇状态 |
显示Fan 1 State: Normal 则表示所有风扇正常, |
|
display enviroment命令参考
显示当前环境的温度信息
[H3C]dis environment
System Temperature information (degree centigrade):
----------------------------------------------------
SlotNo Temperature Lower limit Upper limit
1 30 0 55
9 30 0 55
表2 display environment命令显示信息描述表
域名 |
描述 |
Temperature |
当前单板温度 |
Lower limit |
单板温度低限 |
Upper limit |
单板温度高限 |
display device命令参考
[H3C]dis device
Slot 1
SubSNo PortNum PCBVer FPGAVer CPLDVer BootRomVer AddrLM Type State
0 28 REV.C NULL 002 506 IVL MAIN Normal
2 0 REV.A NULL NULL NULL IVL 2*10GE Normal
Slot 9
SubSNo PortNum PCBVer FPGAVer CPLDVer BootRomVer AddrLM Type State
0 28 REV.C NULL 002 508 IVL MAIN Normal
1 0 REV.A NULL NULL NULL IVL 2*10GE Normal
display power命令参考
查看系统电源模块使用状态:
[H3C]dis power
Slot 1
Power 1
State : Normal
Type : AC
Slot 9
Power 1
State : Normal
Type : AC
表3 display power命令显示信息描述表
State |
描述 |
Normal |
电源正常 |
Fault |
未供电 |
Absent |
电源不存在 |
display fan命令参考
查看风扇状态:
[H3C]dis fan
Slot 1
FAN 1
State : Normal
Slot 9
FAN 1
State : Normal
注:系统中有多个风扇,只要有一个风扇故障则报Fault.
1.2 CPU及内存状态观测
表4 CPU及内存状态观测
项目 |
操作指导 |
参考标准 |
备注 |
CPU占用率状况 |
display cpu |
正常情况下CPU占用率应当不超过60%,如果太高为不正常。 |
参见display cpu命令参考 |
系统内存占用率状况 |
display memory |
正常情况下系统内存占用率应在80%以下,否则为不正常 |
参见display memory命令参考 |
display cpu命令参考
显示系统的CPU占用率:
[H3C]dis cpu
Slot 1 CPU usage:
4% in last 5 seconds
4% in last 1 minute
3% in last 5 minutes
Slot 9 CPU usage:
6% in last 5 seconds
5% in last 1 minute
5% in last 5 minutes
注:该命令将打印出所有当前在位的单板CPU使用率。分过去5秒内、过去1分钟内和过去5分钟内三个时间段进行统计。
display memory命令参考
显示系统内存占用率;
<H3C>display memory
System Total Memory(bytes): 190696704
Total Used Memory(bytes): 45232232
Used Rate: 23%
<H3C>
1.3 告警日志信息查看
表5 查看告警日志信息的命令
项目 |
操作指导 |
参考标准 |
备注 |
系统告警缓冲区查看 |
display trapbuffer |
正常情况下无严重告警记录,否则为不正常。 |
参见display trapbuffer命令参考 |
系统日志缓冲区查看 |
display logbuffer |
正常情况下无严重出错日志记录,否则为不正常。 |
参见display logbuffer命令参考 |
display trapbuffer命令参考
显示系统告警缓冲区信息
<H3C>display trapbuffer
display logbuffer命令参考
显示系统日志缓冲区信息
<H3C>display logbuffer
1.4 查看系统状态和信息
display clock
命令:display clock
描述:用户可以执行display clock命令获取系统的日期和时间信息。如果发现系统时间有误,可及时调整。
display current-configuration
命令:display current-configuration
描述:display current-configuration命令用来显示以太网交换机当前生效的配置参数。对于某些正在生效的配置参数,如果与缺省工作参数相同,则不显示。当用户完成一组配置之后,如果需要验证配置是否正确,则可以执行display current-configuration命令查看当前生效的参数。对于某些参数,虽然用户已经配置,但如果这些参数对应的功能没有生效,系统不予显示(如单板不在位);如果save配置后,将保存当前能显示到的配置。
display saved-configuration
命令:display saved-configuration
描述:display saved-configuration命令用来显示以太网交换机的Flash中配置文件。
如果以太网交换机上电之后不能正常工作,可以执行display saved-configuration命令查看以太网交换机的启动配置。
display users
命令:display users [ all ]
描述:display users命令用来显示当前与以太网交换机连接的线路状态。
display version
命令:display version
描述:display version命令用来显示系统的版本信息。
用户可以通过该命令查看软件的版本信息、发布时间、交换机的基本硬件配置等信息。
more
命令:more {string}
描述:分屏查看指定的文件。可以使用该命令查看配置文件,或flash上的其它文本文件。
1.5 S5800系列交换机自检表
本表供设备开局、日常维护、巡检使用。
表6 S5800系列交换机自检表
序号 |
自检项 |
自检方法 |
解决方法 |
结论 |
百兆端口自检 |
||||
1 |
端口是否协商出了半双工? |
使用如下命令,检测是否有半双工的端口:<H3C> dis brief interface |
端口默认为自协商,如果此时协商出的结果为半双工,很可能两端配置不一致,是否存在一端强制一端协商的情况,将两端配置成一致。 |
|
2 |
端口是否有大量的错误报文,包括收和发,是否迅速增加? |
使用如下命令,检测端口是否有错包:<H3C> dis interface |
检查线路,中间连接的光电转换器; 检查两端配置是否一致? |
|
3 |
是否有比较频繁的UPDOWN? |
display logbuffer查看 |
1、检查线路和中间连接的光电转换器; |
|
千兆端口自检 |
||||
1 |
千兆光口两端是否配置了千兆强制? |
用display intface命令查看端口配置 |
建议将两端光口速度和双工均设置为强制模式,相应命令:speed 1000 duplex full |
|
2 |
千兆光口是否有CRC错误?是否在增长? |
用display interface命令查看端口计数 |
检查光功率是否处于临界值? |
|
设置TRUNK 端口和 MULTI端口的自检 |
||||
1 |
端口的PVID是否和对端设备的PVID一致? |
用display interface命令查看Trunk端口的配置 |
互联Trunk端口的两端设备允许通过的VLAN配置为一致,并且两端PVID配置为一致。 |
|
2 |
TRUNK端口允许通过的VLAN是否和对端设备允许通过的VLAN 一致? |
用display intface命令查看Trunk端口 ALLOW VLAN |
互联Trunk端口的两端设备允许通过的VLAN配置为一致,并且两端PVID配置为一致。 |
|
3 |
是否一端配置成TRUNK,一端配置成ACCESS? |
|
互联Trunk端口的两端设备允许通过的VLAN配置为一致,并且两端PVID配置为一致。 |
|
STP的自检 |
||||
1 |
边缘端口的设置? |
使用display stp命令查看生成树的状态。 |
确认和PC连接的端口设置为Edge Port 或者将STP关掉。和非lanswitch连接的链路关掉stp |
|
2 |
是否和思科的PVST+互通? |
|
和PVST+的配合,只能应用STP的方式,不能应用mstp的方式 |
|
3 |
是否在STP环中配置了许多公共VLAN或者TRUNK ALL |
检查各个STP链路,看是否存在公共VLAN |
避免将一个STP环故障影响其它链路 |
|
4 |
是否存在STP频繁切换的情况 |
查看display stp history信息 |
如有待定位 |
|
系统自检 |
||||
1 |
CPU占用率是否超过70%? |
执行 display cpu |
定位cpu占用率高的原因,是否有攻击存在,可以通过命令行display cpu-usage task查看是否有任务占用率高的任务, |
|
2 |
内存占用率是否正常,是否存在内存泄漏? |
执行display memory |
定位内存异常情况 |
|
3 |
检查温度、电源、风扇、日期是否正常 |
displayenvironment;display fan;display power;display clock |
如确认异常,可能需要更换相应电源、风扇、单板;时间和时区需要设置正确 |
|
4 |
是否有任务挂起的情况 |
[H3C-diagnose]_display task-info查看是否有任务挂起的情况 |
如有待定位,注意RootTask挂起是正常现象 |
|
|
log日志是否有异常信息记录 |
display logbuffer |
如有需确认 |
|
6 |
确认单板芯片丢包是否严重并且不断增加 |
bcm <slot> <chip> show/c/erdisc |
如有大量丢包计数,待定位 |
|
VRRP自检 |
||||
1 |
握手时间是否设置成3秒?两端的vrrp握手时间是否一致?两端master或slave状态是否正确?是否出现都是两边master的状态? |
disply vrrp |
|
|
OSPF自检 |
||||
1 |
是否有两台设备router id设置成一致? |
执行 display ospf peer |
修改配置 |
|
2 |
是否存在OSPF邻居中断 |
display ospf peer查看邻居up的时间是否正常 |
定位 |
|
3 |
display ospf error是否有大量错误计数? |
display ospf error |
定位 |
|
安全 |
||||
1 |
是否可以抵御重定向报文攻击 |
查看是否重定向报文送cpu处理 |
关闭重定向报文送cpu undo ip redirects |
|
2 |
是否可以抵御TTL超时报文攻击 |
查看是否TTL超时报文送cpu处理 |
关闭TTL超时报文送cpu undo ip ttl-expires |
|
3 |
是否可以抵御路由不可达报文攻击 |
查看是否路由不可达报文送cpu处理 |
关闭路由不可达报文送cpu undo ip unreachables |
|
4 |
是否可以抵御子网广播报文攻击 |
查看子网广播报文是否送cpu处理 |
关闭子网广播报文送cpu处理 |
|
5 |
是否可以抵御冲击波病毒攻击 |
是否配置防病毒acl |
|
|
MAC地址表、ARP表、路由表、组播表项 |
||||
1 |
确认MAC地址表的数量 |
display mac-address count |
|
|
2 |
确认arp表数量 |
display arp all |
|
|
3 |
确认路由表数量,路由表是否有频繁震荡的情况,缺省路由是否正常 |
display ip routing-table statistics; display ip routing-table |
|
|
4 |
确认组播表项数量 |
display multicast routing-table |
|
|