【
故障现象】
笔者筹建过某公司的网络中心,该中心以负责全市各家分公司间信息的交换,实现各分公司间资源的共享。各分公司都通过DDN专线经路由器用TCP/IP协议与主机连接。
网络中心的以太网分为两(
电脑没声音)个网段:192.168.1.x和 192.168 2.x,以下简称网段 1和网段2。其中有用于处理备分公司信息的生产机及开发机各一台,另有二台与各分公司进行远程通信的路由器。另外还有一些用于开发和监控的计算机。网段2中有多台计算机,进行客一端的开发调试。开发机和一台计算机同时连在两(电脑没声音)个网段上。
某天,网络发现各分公司的数据传输不正常,而旦是采用TCP/IP协议与中心连接的分公司的数据不正常。隔一段时间就发现这些分公司的数据通信室都不能进行,经过几天努力还是无法解决,但是公司正常运转必须借助网络,于是向笔者求助。
诊断过程
笔者赶到现场,仔细观察故障现象,基本上可以判断是通信问题造成的因为无论是在网段1 还是在网段2 上 计算机与生产机的连接都出现了时断时续的现象。而与生产机直接相连(不通过以太网)的主控台与主机的连接则没问题。从主控台上看,无论是
内存占用还是CPU利用率等各方面都没有发现异常。而且生产机上的所有进程也都没有发现异常。看来问题出现在以太网上。
既然两(电脑没声音)个网段与主机的连接都有问题,是不是两(电脑没声音)个网段都有问题呢用TCP/IP协议中最基本的测试方法Ping命令测试,结果发现网段2中的各台计算机之间的连接都没有问题,而网段1 中,不只是各台计算机与生产机之间Ping时断时通,而且其他各台计算机之间互Ping也是时断时通。问题肯定出在网段1上。网段2 到生产机的通信有问题,是因为从网段2到生产机必须经过网段1。
究竟是什么地方出了问题呢网段1 中各台计算机既然都是通过一台HUB连在一起的,那么HUB出问题的概率很大,所以首先要查一下HUB。经检查,H U B的工作状态正常,但是插在某个端口中的双绞线的指示灯状态却不正常;是闪烁的红灯(与正常运行的计算机连接时,各端口的指示灯应为绿色)。拔下此端口中的双绞线,网段1 中各台计算机间的通信恢复正常。
这就比较好办了,笔者 “顺藤摸瓜”沿着这条线排查下去,出问题的这条线连接的计算机正是接在网段1 上的。经查证,使用该计算机的用户想起出现问题时他恰好打开计算机。
会不会是这台计算机的问题呢这台计算机设置好之后很久没有更改了,问题不应出在软件上。是网卡出了问题吗笔者用另一块好的网卡替换下计算机里(
电脑自动关机)原来的网卡,问题仍然存在,说明问题不是出在网卡上。笔者拿来另一台计算机接在这根网线上,还是不能正常连上网络,看来问题多半就在于网线。根据以往的经验,网线的问题多出现在水晶头上,水晶头如果压得不好,拔插的次数一多就容易出问题。笔者干脆把线两(电脑没声音)边原来的水晶头切下来重新做。出乎意料的是问题仍然存在。如此看来,问题只能是出在线中间了。笔者从一头顺着双绞线检查,终于找到了问题的根源,原来是线被一条机柜压住了。由于机柜很重,压的时间比较长,以至于把双绞线的外皮压破,造成双绞线混线。更换新的双绞线后 故障解决。
排除心得
由于以HUB连接的局域网采用CSMA/CD(即带有冲突检测的载波侦听多路存取)技术进行信息传输,所以当网线发生混线后,信号不能正常传输并产生错误信号,以至网段内充满错误信号,使得正常信号不能顺利传输,导致网络通信的时断时续。从本例中我们可以得到一些经验 :在以太网中,尤其是以HUB连接的共享以太网中,网络中任何一点产生的问题,都可能造成整个网络的不正常以至瘫痪。网线虽然是连在HUB和单个计算机之间,但若是出了问题却可能影响整个网络。
网线破损导致“网络风暴”