浅谈城域网故障点及诊断
响水教育城域网自2006年筹建,经历3年建成。由当初的adsl,经电信汇聚,从盐城市教育局出口,今天,中心小学以上学校光钎接入,经电信汇聚直接转到教育局电教中心核心机房,10M出口。速度提了,设备投入加大了,终端的点数增加了,接踵而来的网络故障也越来越多了,就对城域网的几年管理,简单分析城域网的故障点已经诊断的方法。我把城域网故障分为两大类:硬故障和软故障。
1、硬故障
硬故障指是设备或线路、接头等损坏。我们机房和学校没有做防雷设施,设备在遭雷击坏的概率很大。
1、线路故障
通常我们发现网络某条线路突然中断,线路故障最常见的情况就是线路不通,诊断这种情况首先检查该线路上流量是否还存在,然后用tcp ip协议简要分析论文ping检查线路远端的路由器端口能否响应,用traceroute检查路由器配置是否正确,出问题逐个解决。方法为:
首先用ping命令,检查线路在网管中心这边是否连通。ping一般一次只能检测到一端到另一端的连通性,而不能一次检测一端到多端的连通性。我们经常发现有人依次扫描本网的大量IP地址,不一定就是有黑客攻击,而fping命令可以做到。如果连续几次ping都出现"Requst time out"信息,表明网络不通。我们用测线仪去检查端口,网络接头是否松动,是否坏了。如果这一段没有问题,往上一节检查,ping网关,如果通了,就检查到路由。这样一步一步去检查,一个学校的出口没有问题,我们就ping核心交换机的ip100.1.0.2),能到达,到汇聚也是通的。最后ping路由的ip100.1.0.1),能达到,路由也没有问题,最后只能说明是电信的出口的线路啦。
2、路由故障
事实上,线路故障中很多情况都涉及到路由器,因此也可以把一些线路故障归结为路由器故障。检测这种故障,需要利用MIB变量浏览器,用它收集路由器的路由表、端口流量数据、计费数据、路由器CPU的温度、负载以及路由器的内存余量等数据,通常情况下网络管理系统有专门的管理进程不断地检测路由器的关键数据,并及时给出报警。这里值得注意的是:路由器CPU温度过高十分危险,因为这可能导致路由器的烧毁;而路由器CPU利用率过高和
路由器内存余量太小都将直接影响到网络服务的质量。解决这种故障,只有对路由器进行升级、扩大内存等,或者重新规划网络拓扑结构。
3. 主机故障
主机故障常见的现象就是主机的配置不当。像主机配置的IP地址与其它主机冲突,或IP地址根本就不在子网范围内,由此导致主机无法连通。主机的另一故障就是安全故障,比如,主机没有控制其上的fingerRPCrlogin等多余服务。而攻击者可以通过这些多余进程的正常服务或bug攻击该主机,甚至得到Administrator的权限等。还有值得注意的一点就是,不要轻易的共享本机硬盘,因为这将导致恶意攻击者非法利用该主机的资源。发现主机故障一般比较困难,特别是别人恶意的攻击。一般可以通过监视主机的流量、或扫描主机端口和服务来防止可能的漏洞。最后提醒大家不要忘了安装防火墙,因为这是最省事也是最安全的办法。
2、软故障
1、配置错误
软故障中最常见的情况就是配置错误,就是指因为网络设备的配置原因而导致的网络异常或故障。配置错误可能是路由器端口参数设定有误,或路由器路由配置错误以至于路由循环或不到远端地址,或者是路由掩码设置错误等。比如,同样是网络中的线路故障,该线路没有流量,但又可以ping通线路的两端端口,这时就很有可能是路由配置错误了。遇到这种情况,我们通常用“路由跟踪程序”就是traceroute,它和ping类似,最大的区别在于traceroute是把端到端的线路按线路所经过的路由器分成多段,然后以每段返回响应与延迟。如果发现在traceroute的结果中某一段之后,两个IP地址循环出现,这时,一般就是线路远端把端口路由又指向了线路的近端,导致IP包在该线路上来回反复传递。幸好traceroute可以检测到哪个路由器之前都能正常响应,到哪个路由器就不能正常响应了。这时只需更改远端路由器端口配置,就能恢复线路正常了。
2、设备端口关闭
软故障的另一类就是一些重要进程或端口关闭,以及系统的负载过高。比如也是线路中断,没有流量,用ping发现线路端口不通,检查发现该端口处于down的状态,这就说明该端口已经关闭,因此导致故障。这时只需重新启动该端口,就可以恢复线路的连通了。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。