一次7609双引擎冗余故障处理过程 |
近日某客户报障一台Cisco7609路由器双引擎冗余工作不正常,需要上门处理。 到达现场发现改7609配置了两块SUP720-3B的引擎,分别在5 、6槽位,当前活跃引擎为slot5上引擎。 首先查看7609-1双引擎当前冗余状态 7609-1#show mod Mod Ports Card Type Model Serial No. 1 24 CEF720 24 port 1000mb SFP WS-X6724-SFP SALxxxxxxxx 2 48 CEF720 48 port 10/100/1000mb Ethernet WS-X6748-GE-TX SALxxxxxxxx 5 2 Supervisor Engine 720 (Active<wbr>) WS-SUP720-3B SALxxxxxxxx 6 2 Supervisor Engine 720 (Cold<wbr>) WS-SUP720-3B SALxxxxxxxx Mod MAC addresses Hw Fw Sw Status 1 0019.56f3.91bc to 0019.56f3.91d3 2.5 12.2(14r)S5 12.2(18)SXF7 Ok 2 001a.6cd7.ed40 to 001a.6cd7.ed6f 2.5 12.2(14r)S5 12.2(18)SXF7 Ok 5 0016.c85e.2ae8 to 0016.c85e.2aeb 5.2 8.4(2) 12.2(18)SXF7 Ok 6 0013.c43a.dc74 to 0013.c43a.dc77 4.5 8.1(3) 12.2(17d)SXB Ok 由于设备配置的双引擎冗余方式为SSO模式: 7609-1#show run ……… no ip domain-lookup ……… redundancy mode sso main-cpu auto-sync running-config ……… 位于slot6的引擎IOS版本12.2(17d)SXB不支持SSO模式,因此双引擎现在工作在RPR模式,此时如果主控引擎发生故障冗余引擎会经历一次完整的启动后接管主控引擎的位置。手动强制切换: 7609-1# redundancy force-switchover 重启时间大约在2分钟左右,结果如下: 7609-1#show mod Mod Ports Card Type Model Serial No. 1 24 CEF720 24 port 1000mb SFP WS-X6724-SFP SALxxxxxxxx 2 48 CEF720 48 port 10/100/1000mb Ethernet WS-X6748-GE-TX SALxxxxxxxx 5 2 Supervisor Engine 720 (Cold<wbr>) WS-SUP720-3B SALxxxxxxxx 6 2 Supervisor Engine 720 (Active<wbr>) WS-SUP720-3B SALxxxxxxxx Mod MAC addresses Hw Fw Sw Status 1 0019.56f3.91bc to 0019.56f3.91d3 2.5 12.2(14r)S5 12.2(18)SXF7 Ok 2 001a.6cd7.ed40 to 001a.6cd7.ed6f 2.5 12.2(14r)S5 12.2(18)SXF7 Ok 5 0016.c85e.2ae8 to 0016.c85e.2aeb 5.2 8.4(2) 12.2(18)SXF7<wbr> Ok 6 0013.c43a.dc74 to 0013.c43a.dc77 4.5 8.1(3) 12.2(17d)SXB<wbr> Ok 由于SSO模式下不需要经历完整重启,冗余引擎可以在几秒钟内接管故障引擎,因此尽可能让双引擎工作在SSO模式。要达到该目的需要升级该引擎的IOS文件到12.2(18)SXF7。Slot5上的引擎IOS文件存放在内置super-bootdisk,该存储介质容量为512M, 7609-1#dir sup-bootdisk: Directory of sup-bootdisk:/ 1 -rw- 81764868 Jan 8 2007 14:32:36 -08:00 s72033-ipservicesk9_wan-mz.122-18.SXF7.bin 512024576 bytes total (429957120 bytes free) 在Slot6的引擎上对应的sup-bootdisk只有64M,而s72033-ipservicesk9_wan-mz.122-18.SXF7.bin大于80M,因此将该IOS文件拷贝到slot6上引擎外置的disk0中,disk0容量为512M。 7609-1#copy sup-bootdisk: slavedisk0: Source filename [s72033-ipservicesk9_wan-mz.122-18.SXF7.bin] Destination filename [s72033-ipservicesk9_wan-mz.122-18.SXF7.bin] Copy 81764868 bytes copied in 220.980 secs (370010 bytes/sec) 进行强制切换(当前主控引擎为slot6上引擎): 7609-1# redundancy force-switchover 切换发生后slot5上的引擎成为主控, slot6的引擎不能正常重启,进入rommon状态。此时从主控引擎(slot5)上查看状态如下: 7609-1#show mod Mod Ports Card Type Model Serial No. 1 24 CEF720 24 port 1000mb SFP WS-X6724-SFP SALxxxxxxxx 2 48 CEF720 48 port 10/100/1000mb Ethernet WS-X6748-GE-TX SALxxxxxxxx 5 2 Supervisor Engine 720 (Active) WS-SUP720-3B SALxxxxxxxx 6 0 Supervisor-Other Unknown Unknown<wbr> Mod MAC addresses Hw Fw Sw Status 1 0019.56f3.91bc to 0019.56f3.91d3 2.5 12.2(14r)S5 12.2(18)SXF7 Ok 2 001a.6cd7.ed40 to 001a.6cd7.ed6f 2.5 12.2(14r)S5 12.2(18)SXF7 Ok 5 0016.c85e.2ae8 to 0016.c85e.2aeb 5.2 8.4(2) 12.2(18)SXF7 Ok 6 0000.0000.0000 to 0000.0000.0000 0.0 Unknown Unknown Unknown 回到slot6在rommon模式下指定启动文件即可正常启动: rommon 1 >boot disk0:/ s72033-ipservicesk9_wan-mz.122-18.SXF7.bin 造成此种现象的原因是unknown怎么处理7609-1的配置文件中指定的启动位置为内置的super-bootdisk, …….. hostname 7609-1 boot system flash sup-bootdisk: logging buffered 40960 debugging …….. 而Slot6上引擎的super-bootdisk(64M)为空,IOS文件存放于外置的disk0中,因此slot6上引擎发生重启的时候无法正常引导IOS文件,进入rommon模式。 在手动指定启动文件的情况下slot6上的引擎能正常启动,并且在启动完成后与slot5上的引擎工作在正常SSO模式,状态如下: 7609-1#show mod Mod Ports Card Type Model Serial No. 1 24 CEF720 24 port 1000mb SFP WS-X6724-SFP SALxxxxxxxx 2 48 CEF720 48 port 10/100/1000mb Ethernet WS-X6748-GE-TX SALxxxxxxxx 5 2 Supervisor Engine 720 (Active<wbr>) WS-SUP720-3B SALxxxxxxxx 6 2 Supervisor Engine 720 (Hot<wbr>) WS-SUP720-3B SALxxxxxxxx 当双引擎处于此状态时,两块引擎都处于完全启动状态,主控引擎发生故障时冗余引擎能在数秒内接管。但由于IOS文件存放位置不同,造成了切换测试中slot5→slot6→slot5切换过程正常,但是slot6会进入ROMMON模式,此时必须通过手工干预才能正常启动: rommon 1 >boot disk0:/ s72033-ipservicesk9_wan-mz.122-18.SXF7.bin |
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论