网络是一切系统赖以正常工作的基础设施,所以保证主机的网络连通性是一切工作得以开展的前提。由于网络协议和设备所具有的复杂性,很多故障解决起来是有难度的,不仅需要工作人员有相应的知识结构来帮助解决问题,有时候还需要他们具有丰富的网络经验。从大多数情况看,网络故障主要分为硬件故障和软件故障两种。
硬件故障又主要分为网卡物理损坏、链路故障等原因。其中网卡物理损坏是指网卡设
备由于使用中发生电子元件损坏而造成网卡设备无法继续使用的情况;链路故障很多
时候表现为网线或者水晶头在制作过程中出现线路问题,或由于线路老化等原因造成
物理链路断开,从而致使网络无法物理连通的情况。
软件主要表现为网卡驱动故障,也就是操作系统对网卡驱动的不兼容,这个问题往往
需要通过安装对应的网卡设备驱动来解决。
基于以上两点,将解决网络在故障时采用的步骤总结如下(不管其中哪一步中出现问题都需要解决当前的问题才能进行下一步测试,当所有测试都通过了则问题也就解决了):
第一步是要确认网卡本身是否能正常工作?利用ping工具可以确认这点。输入ping127.0.0.1,然后看是否能正常ping通?这里的127.0.0.1被称为主机的回环接口,是TCP/IP协议栈正常工作的前提。如果ping不通,一般可以证实为本机TCP/IP协议栈有问题,自然就无法连接网络了。不过,出现这种现象的概率比较低。
第二步是要确认网卡是否出现了物理或驱动故障,使用ping本机IP地址的方式,如果能ping通则说明本地设备和驱动都正常。
第三步要确认是否能ping通同网段的其他主机。这一步主要是确认二层网络设备(比如交换机或者HUB)工作是否正常。如果ping不通往往说明二层网络上出现了问题,可能涉及交换机的端口工作模式、vlan划分等因素。
第四步要确认是否能ping通网关IP。如果数据包能正常到达网关,则说明主机和本地网络都工作正常。
第五步确认是否能ping通公网上的IP,如果可以则说明本地的路由设置正确,否则就要确认路由设备是否做了正确的nat或路由设置。
第六步确认是否能ping通公网上的某个域名,如果能ping通则说明DNS部分设置正确。
即便实际工作中可能会受到诸如更复杂的网络环境、安全ACL、防火墙等众多因素的影响,而加大了网络排查的困难,但以上步骤是排除网络故障的主要环节,在排除不同的网络之间个性化的设置之后,排查的主要步骤都与此类似。