您好,欢迎访问三七文档
网络故障的排查方法主讲:崔兆龙本次内容网络故障的分类网络故障的分层排除法网络故障的检查网络故障的诊断网络故障的分类一般网络故障可以分为硬件故障,软件故障;或者分为内网故障,外网故障。其中硬件故障是指网络设备或通信媒体的故障软件故障是指设置上的问题内网故障是指内部局域网的故障外网故障是指与学校外部教委或Internet连接的故障网络故障分层排除法OSI的层次结构为管理员分析和排查故障提供了非常好的组织方式。由于各层相对独立,按层排查能够有效地发现和隔离故障,因而一般使用逐层分析和排查的方法。通常有两种逐层排查方式:是从低层开始排查,适用于物理网络不够成熟稳定的情况,如组建新的网络、重新调整网络线缆、增加新的网络设备;是从高层开始排查,适用于物理网络相对成熟稳定的情况,如硬件设备没有变动。在实际应用中往往采用折衷的方式,凡是涉及到网络通信的应用出了问题,直接从位于中间的网络层开始排查,首先测试网络连通性,如果网络不能连通,再从物理层(测试线路)开始排查;如果网络能够连通,再从应用层(测试应用程序本身)开始排查。网络故障分层排除法例如,这里要测试网络能否正常通信。通常从ping远程计算机开始(例中在主机A上ping主机B),成功说明系统和网络正常,失败说明主机离线或网络故障。失败后再ping同一子网的网关(例中为192.168.1.1)来确认主机A是否能够连接到路由器。失败后再ping环回地址127.0.0.1来确认TCP/IP协议软件是否有问题,如果有问题,需要重新安装TCP/IP协议软件。也可以采用另一种步骤,从ping环回地址127.0.0.1开始,失败说明TCP/IP协议软件安装有问题,如果成功再ping同一子网的网关,如果成功再ping其他网关(路由器)逐步排查网络各个环节,直到最后ping远程主机。只要成功地ping到远程主机,可以判断网络问题一般发生在更高层次。网络故障分层排除法物理层:采用替换法或专门的线缆测试仪,没有测试仪的可通过网络设备(网卡、交换机等)信号灯进行简单的目测。数据链路层:相对于其他的协议层,数据链路层出现问题的可能性不大,对于TCP/IP网络,可以使用简单的arp命令来检查MAC地址(物理地址)和IP地址之间的映射问题。网络层和传输层是最容易出现问题的两层,路由配置容易出现错误,可通过route命令来测试路由路径是否正确,也可使用ping命令来测试连通性。对于复杂的问题,也可以通过专门的协议分析器,专业的协议分析软件等,这些协议分析器具有很强的检测和排查能力,能够分析链路层及其以上层次的数据通信。应用层的问题,则需要对程序进行检查,或检查有没有什么其他程序影响到应用层本身工作。网络故障排除步骤第一步:全面收集信息,并分析故障现象全面了解故障的情况,并详细询问相关细节,可以请故障发生时操作人员描述正常运行时的情况,如果有可能的话,亲自去验证一下所出现的问题。看是否有正常的功能不见了,还是有异常的反应?检查一下在故障发生之前是否对该节点或是网络进行了改动。网络故障排除步骤•第二步:定位故障范围•通过第一步全面的收集的信息分析,可以将故障范围缩小到一个网段或节点。基于所作的分析,判断故障是否与一个网段有关,还是局限于一个节点。缩小故障范围是解决的开始。•例如当某台计算机发生无法上网的故障时,管理员可以询问其他用户是否也同样出现了这一问题,如果所有的用户都出现这一现象,则说明故障不在用户网络这端,在出口网络设备或其他设备上。网络故障排除步骤第三步:故障隔离如果故障影响整个网段,那么就通过减少可能的故障源来隔离故障。除两个节点外断开其它所有的节点。如果这两个节点能正常通讯,再增加其它节点。如这两个节点不能通讯,就要对物理层的有关部分,如电缆的接头、电缆本身或与它们相连的Hub和网卡等进行检查。如果故障能被隔离至一个节点,可以更换网卡,使用好的网卡驱动程序(绝不能使用该节点现有的网络软件或配置文件),或是用一条新的电缆与网络相连。如果网络的连接没有问题,那么检查一下是否只是某一个应用有问题。使用相同的驱动器或是文件系统运行其它的应用程序。网络故障排除步骤第四步:排除故障一旦确定了故障源,那么识别故障类型是比较容易的。对于网络硬件设备来说,最方便的措施就是简单地更换,对损坏部分的维修可以以后再进行。记住:“尽可能迅速地恢复网络的所有功能是故障诊断目的。”有两种办法可以解决软件故障。第一种是,重新安装有问题的软件,删除可能有问题的文件并且确保你拥有全部所需的文件。这也是保证第二种方法得以顺利实施的好办法,即对软件进行重新的设置。如果问题是单一用户的问题,通常最简单的方法是整个删除该用户然后从头开始,或是重复必要的步骤,使该用户重新获得原来有问题的应用。比无目标地进行检查,逻辑有序地执行这些步骤可以更快速地找到问题。网络故障排除步骤第五步:检验故障是否被排除请操作人员测试一下故障是否依然存在,这可以确保是否整个故障都已被排除。只是简要地请用户按正常方法操作有关网络设备即可,同时请用户快速地执行其它几种正常操作。有时解决一个地方的问题会引出别处的问题;有时问题是解决了,但可能会掩盖其它故障。常用网络命令介绍1.计算机网络故障排除常用命令.利用Arp工具检验MAC地址解析•利用Hostname工具查看主机名•利用Ipconfig工具检测网络配置•利用Nbtstat工具查看NetBIOS使用情况•利用Netstat工具查看协议统计信息•利用Ping工具检测网络连通性•利用Tracert进行路由检测利用Arp工具检验MAC地址解析Arp(AddressResolutionProtocol):地址解析协议。Arp–a:显示本机arp缓存内容Arp–d:清空本机arp缓存内容Arp–s:在本机添加一条静态缓存利用Hostname工具查看主机名Hostname:显示本机的主机名称利用Ipconfig工具检测网络配置Ipconfig/all:显示本机TCP/IP配置的详细信息;Ipconfig/release:DHCP客户端手工释放IP地址;Ipconfig/renew:DHCP客户端手工向服务器刷新请求;Ipconfig/flushdns:清除本地DNS缓存内容;Ipconfig/displaydns:显示本地DNS内容;Ipconfig/showclassid:显示网络适配器的DHCP类别信息;Ipconfig/setclassid:设置网络适配器的DHCP类别。利用Nbtstat工具查看NetBIOS使用情况Nbtstat工具用于查看NetBIOS使用情况nbtstat–n:查看客户机注册的NetBIOS名称nbtstat–c:显示本机NetBIOS缓存信息nbtstat–r:显示本机NetBIOS统计信息nbtstat–a远程主机IP地址NetBIOS信息利用Netstat工具查看协议统计信息Netstat:用来查看本机和其他计算机进行通信时所使用的协议信息。利用Ping工具检测网络连通性Ping命令用于检测网络中计算机的连通性,可以按照下面的步骤进行检测:–Ping127.0.0.1–Ping本机IP地址–Ping缺省网关–Ping外网主机IP地址–Ping主机名利用Tracert工具进行路由检测Tracert:显示到达目标地址所经过的路由器的IP地址。常见网络故障点•症状:在设备管理器的网络适配器中没有网卡用PING命令PING127.0.0.1或者PING本地IP地址没有PING通任务栏中的本地连接显示为断开(或者网卡灯不亮)网卡设备常见网络故障点网卡驱动问题重新安装网卡驱动程序,确保设备管理器的网络适配器中有网卡。网卡连接问题有的网卡在环境不是很好的情况下,触点发生氧化,致使接触不良。现在最常用的8139网卡大部分是国内杂牌厂家生产的,质量不稳定,寿命较短,极易损坏。建议购买质量好一些的品牌网线类型不匹配问题网线连接问题网线质量较差,达不到五类线标准,做线不规范,线头松脱等。建议认真检查,及时更换。常见网络故障点IP地址冲突当你设置的IP地址提示有冲突是,说明在局域网中有其他PC的ip地址与你相似,此时在本地连接属性里面点击TCP/IP协议属性,修改成其他没有被占用的IP地址子网掩码不匹配如果IP地址下面的子网掩码不和网关在同一个网段中,通过相同步骤更改子网掩码,确保和网关在同一个网段内常见网络故障点物理层问题•交换机端口状态灯不亮检查交换机网线连接情况,登陆交换机查看端口是否administratordown解决方式:Switch#showinterfacefa0/1查看端口状态Switch#configt进入全局模式Switch(config)#interfacefa0/1进入端口配置模式Switch(config-if)#noshutdown激活端口常见网络故障点数据链路层问题•交换机端口LINE不匹配或单双工模式交换机物理连接正常,line协议不匹配或单双工模式解决方式:调整为相同的封装方式(常用的ppp,hdlc)Switch#showinterfacefa0/1查看端口状态Switch#configt进入全局模式Switch(config)#interfacefa0/1进入端口配置模式Switch(config)#duplexfull(half/auto)单双工模式Switch(config-if)#encapsulationppp(hdlc)封装常见网络故障点网络层问题被交换机ACL屏蔽解决方法:Switch#showAccess-list查看对应的访问控制列表Switch#configt进入全局模式Switch(config)#interfacefa0/1进入应用ACL的对应端口Switch(config-if)#noaccess-group取消ACL在此端口的应用网络故障检查排查例如:网络中一台计算机无法访问互联网!检测步骤一•执行命令cmd/commandipconfig/winipcfg,查看本机ip地址是否正确•IP地址配置不正确重新配置IP地址•IP地址配置正确执行第二步检测步骤二•ping本机IP地址查看返回信息是否正确•返回不正常本机网卡和其他网络设置•返回信息正常执行第三步检测步骤三•Ping网关地址•返回信息不正常检查网线和网卡状况•返回信息正常执行检测步骤四检测步骤四•Ping外网某个ip地址•返回信息不正常检查网关设置•返回信息正常执行检测步骤五检测步骤五•检查DNS是否设置正确,例如郑州轻工业学院因特网DNS202.196.0.1,218.198.127.3•设置不正确设置正确的DNS•设置正确执行检测步骤六检查步骤六•检查防火墙或交换机上是否有限制策略或故障•通知相关服务人员进行检查实例分析:•现象描述•一个局域网内主机间的访问突然变慢,对外网的访问同时也处于时断时续状态•具体分析•接入分析用笔记本,启动科来网络分析系统捕获网络中的数据通讯,约2分钟后停止捕获,在科来网络分析系统中发现192.168.2.100和192.168.0.208两台主机的流量非常大,如图所示。•同时,我们知道,某台主机占用流量很大,有以下三种情况:•第一种:较大数据包(1500字节以上)和较小数据包(100字节以下)的数量较多,且较大数据包的流量占总流量的大部分,表示该主机在进行数据拷贝或上传下载;•第二种:100字节左右的小数据包数量较多,且占用的流量较大,表示该主机可能感染病毒,病毒程序正在攻击其它主机,或者该主机正在被感染病毒的主机攻击;•第三种:各大小的数据包比例分布比较均匀,表示该主机在进行正常的通讯。•查看上图可知,192.168.0.208的发送流量较大,而192.168.2.100的接收流量较大,且都为9.476G,这表示这两台机器之间很可能在通过网上邻居拷贝数据。在节点浏览器中选中192.168.0.208,同时选中图表视图,查看数据包大小分布情况,发现=1518范围内的数据包
本文标题:网络故障排查教程
链接地址:https://www.777doc.com/doc-3096679 .html