案例一
故障现象●同事打电话给我说机器上不了网了,系统为windows98.放下电话到同事的电脑前开始检查.首先当然是利用Ping命令咯,发现ping自己没有问题,ping网关也是通的,说明网络物理上是通的.而且ping一些网站也是通的,说明网络设置也没什么问题.看了看IE的设置以及版本也没有任何问题,本地的网页可以打开的! 但是就是上不了网.
故障分析●这个问题肯定和网络线路以及网卡交换机没有什么关系咯,肯定是系统出问题了,而且这个是典型的问题,就是98系统的文件受到破坏了,就是那个scoket文件出问题的了.也有可能还有一些文件同时被破坏了.
解决办法●这个就简单了,在运行里输入SFC,检查文件的完整性,不出所料就是某几个文件有问题了,按照提示恢复这几个文件,重新启动.打开IE,一切都正常了.
案例二
故障现象●另一个部门的同事打电话告知机器上不了网了,系统也是为windows98的.放下电话跑到他的办公室开始检查他的电脑,这回发现ping自己没有问题,可是ping网关就不通了,更不用说上网了.可能物理上就没有通,但是看网卡灯是亮的.检查系统和网络协议没有发现任何问题.
故障分析●看来是线路或者网卡有问题了.赶快拿来了测线器测试网卡到墙上模块之间的线路发现没有问题,接着又检测模块到交换机的线路也是正常的.难道是网卡有问题了.接着把线路接到别的机器上发现那台机器可以正常上网.看来是网卡有问题了,马上又拿了几块网卡开始试,发现还是都上不了,奇怪了,网卡测试过是正常的呀.没办法,只能把机器拿到自己的办公室开始测试了.接上网线,设置好IP,ping这边的网关,奇怪竟然通了,而且原来的那块网卡也是正常的.那看来是线路和网卡的性能问题了!
解决办法●发现原来的那块网卡不论做工和性能都不怎么样,还是个不知名的小品牌.再看看那台用原线路可以正常上网的机器的网卡是3COM的,没的说咯.不死心给它换网卡,又把网卡的工作模式设置为10M全双工和10M半双工分别试了试还是不行,可是手头又没有3COM的卡,而且换了几块别的卡都不行,看来线路也得换.没办法又重新做了一条新的线,比原来的短了些,而且质量比原来的也要好.怀着一丝不苟的态度又试了试原来的卡,还是不通.换了块别的卡就OK了,看来线路的性能也不是很好呀!最终是换了网卡和网线才解决了这个故障,真是累死了!
评论●应该会有人说可能是交换机端口的问题.在这个案例中,相应的交换机端口测试过是没有问题的,我想CISCO3550的机器总不至于那么容易坏吧!其实从这个案例上可以看出,网线和网卡的质量对网络的性能来说是十分重要的.更不用说交换机的质量了,下面的案例还会碰到网络设备质量引起的故障.
案例三
故障现象●客户来电话说一台机器上网奇慢而且还经常不通.放下电话准备了一下就去客户那里了.看了看机器是windows2000的系统,网卡,协议和系统都没有问题.ping了一下网关发现丢包很是严重.
故障分析●问了问客户的网络布线情况,发现是最近重新布的线,又接着检查了一下交换机,是一台中档的交换机,质量还不错,也没有发现任何问题.看来是这条线路的问题了.先检查了两端RJ45接口的线序,发现都不是568B/A标准的线序.看来问题出在这里了.
解决办法●二话不说,把两个水晶头按照568B的标准重新做了一下,用测线仪测了一下,发现灯亮的是红红绿绿乱七八糟,还有的线是不通的.难道是我的做线技术下降了,有可能吧.接着又重新做了一下还是这样,郁闷死了.难道是线的中间出问题了,没办法只能查线了,移隔断,翻吊顶.一看吓一跳,发现这条线竟然是两条线接起来的,八根线还是乱七八糟的接起来的,线序也不对.猛然想到原来的两个水晶头的线序要不不是标准的呢,真是累死那个布线的大哥了,竟然还能把两头调的一样了(估计费了N个水晶头)!虽然原来是通的,但是根本达不到10M/100M的要求,所以才老丢包,接下来没我的事了,那位大哥有的忙了!
建议●大家在建网络的时候,千万要找稍微正规一点的布线公司,至少懂一定的布线知识吧,要不肯定是得不偿失的!这个案例中的布线大哥连什么是10/100以太网都不知道,更不用谈什么标准了.不标准的布线直接的后果是网络性能下降很多,还会经常出问题.
案例四
故障现象●客户来电话告知这几天机器上网很慢,收邮件也收不下来.重启一下路由器可以正常一会儿.想了想,应该是病毒引起的.这个客户的网络结构比较简单,也是最常见的.ADSL-路由器-交换机-N台PC,整个网络有一台服务器作为域控制器和文件服务器.安装的杀毒软件是Norton企业版.台式机的Norton客户端是被管理的,笔记本的是没有被管理的.因为常见所以就列为一个案例来讲讲.可以做为平时维护网络的一个参考.
故障分析●最近的病毒很是猖獗,客户的故障很有可能是网络中的机器中毒后不停的向网络中的设备发送数据包从而造成路由器堵死的.
解决办法●到了客户那里之后,发现网络已经查不多瘫痪了.马上先登入到路由器看看有没有流量之类的信息,看了看这个小路由器还不错,可以统计各个IP 10S内的流量和总流量,发现有几台机器不停的在发大数据包,路由器已经被堵的不行了.依次记下这几个IP,然后核实到具体的机器,网络中的机器应该都安装了Norton杀毒软件,但是发现几台机器的C盘已经满了,导致Norton的病毒库好久没有升级了,中毒颇深!赶紧断网,然后清理注册表,垃圾文件,开始全面杀毒!其他的机器则是安全更新没有及时安装,虽然病毒库是最新的,但是杀毒软件根本清理不干净,当然是赶快去Update咯!接着顺便理了理线路,清理清理交换机.折腾了一下午,终于搞定了,都是些累人的活(没有什么技术含量^_^我最烦了)!
建议●在这样的一个小网络环境里,最重要的工作无非还是病毒防护和系统更新.一定要保持最新的病毒库和最新的安全更新.这样一般就不容易出问题了.平时还可以注意观察一下路由器的流量监控,或者安装sniffer来监控流量,还可以对路由器做一定的限制.做到有问题及时处理,就不会有网络瘫痪的情况了!
案例五
故障现象●好几个同事报告网络时通时不通,都快急死了.赶快试了试,ping自己的网关都开始丢包了,看来网络中又有机器不停的发包了,这个包可是够厉害的,网络已经差不多要瘫痪了.
故障分析●看来主路由模块已经不堪重负了,可是它还是工作的,所以备份路由模块不能接手,这样网络就差不多被堵死了.由于整个网络划分了好多个VLAN,所有VLAN的网关都在这个路由模块上,看来是某个VLAN里的机器在不停的给网关发包,导致别的VLAN的正常数据都得不到路由模块的正常响应.
解决办法●看来得先查查是哪个VLAN的机器出问题了.没有什么好办法,sniffer又不能夸VLAN(我还不能让他跨VLAN,哪位大哥知道sniffer如何跨VLAN检测的话,麻烦告诉我一下,谢谢先!),只能一个一个VLAN的去抓包看了,这可真是个累人的工作.在查了N个VLAN之后终于发现有两个VLAN的数据量特别的大,而且大部分是广播包,奇怪的是,测试的笔记本一接到其中一个VLAN中后,马上CPU利用率变成100%,接着机器就变的慢死了,像死机了一样,但是一拔掉网线就恢复正常.看来大部分的问题是出现在这个VLAN里了.接着在这两个VLAN里检查是哪个交换机的端口数据量最大,马上把这几个端口直接关掉,看看网络已经开始正常工作了.接着当然是确认这几个端口为何有那么大的数据量了.找到对应的房间号和机器,几个同事就分别开始对这些机器进行检查了.有几台机器是因为刚重新安装过系统,还没有更新安全补丁,所以是中毒了.当是有一个端口出来是接了一个小的switch,然后接了10台机器,这10台机器都是同一个现象就是cpu使用率都是100%.安全模式下检查了杀毒软件和安全更新都是正常的,可是到正常模式下就不行了,慢的根本动不了!百般无奈,在专门网发帖子求救,其中有兄弟说可能是网络中存在回路.马上去检查那个小交换机,还真是有一条线的两头都接在了上面,从而产生了著名的广播风暴 (我还是第一次真正体会到广播风暴的威力).拔掉那条线后,网络恢复正常.真是被那位乱插线的兄弟害死了!
建议●尽量不要让最终用户接触到网络设备.以免用户乱接线引起网络故障!
后记●此次故障1个月后又发生了一次相同的故障,还是有兄弟乱接线引发了广播风暴,真是郁闷死了,看来要严格执行计算机设备的管理制度了!
新闻热点
疑难解答