Cisco CRS-MSC-X板卡维修案例 思科板卡IOS XR FAILURE启动失败 维修案例
主题:CRS无法启动
CRS-MSC-X启动报错
使用命令 show platform 查看
RP/0/RP1/CPu0:ios(admin)#
RP/0/RP1/CPu0:ios(admin)#sh platform
Node Type PLIM State Config state
------------------------------------------------------------------------------------------------
0/2/CPU0 MSC-X N/A MBI-BOOTING PWR ,NSHUT ,MON
0/RP1/CPU0 RP(Active) N/A IOS XR RUN PWR ,NSHUT ,MON
0/FC1/SP FAN-CT(SP) N/A IOS XR RUN PWR ,NSHUT ,MON
0/AM1/SP ALARM-B(SP) N/A IOS XR RUN PWR ,NSHUT ,MON
0/SM0/SP FC-400G/S(SP) N/A IOS XR RUN PWR ,NSHUT ,MON
RP/0/RP1/CPU0:ios(admin)#
RP/0/RP1/cpu0:ios(admin)#sh platform pRp/0/Rp1/cpu0:mar 10 23:58:17.583 : shelfmgrV2[388]: %PLATFORM-SHELFMGRV2-3-NODE_HBLOSS_RESET : Reset node 0/2/cpl0 due to heartbeat loss
RP/0/RP1/CPU0:ios(admin)#sh platferm
Node Type PLIM State Config state
------------------------------------------------------------------------------------------------
0/2/CPU0 MSC-x N/A IOS XR FAILURE PWR ,NSHUT ,MON
0/RP1/CPU0 RP(Active) N/A IOS XR RUN PWR ,NSHUT ,MON
0/FC1/SP FAN-CT(SP) N/A IOS XR RUN PWR ,NSHUT ,MON
0/AM1/SP ALARM-B(SP) N/A IOS XR RUN PWR ,NSHUT ,MON
0/SM0/SP FC-400G/S(SP) N/A IOS XR RUN PWR ,NSHUT ,MON
RP/0/RP1/CPU0:ios(admin)#
RP/0/RP1/CPU0:ios(admin)#RP/0/RP1/CPU0: Mar 10 23:59:11.736 : shelfmgrv2[388]: %PLATFORM-SHELFMGRV2-3-FAILURE : DCDC enable failure 0xafea0a0'subsystem(8148)'detected the 'fatal' condition 'Code(5)'
一,故障判定
CRS-MSC-X启动报错, MBI-BOOTING 与CRS IOS XR FAILURE显示状态最终报错代码, DCDC enable failure 0xafea0a0'subsystem(8148)'detected the 'fatal' condition 'Code(5)',根据报错信息提示判定为DC供电模块故障。
二,故障测量
MSC-X板卡DC供电模块输入端电压正常并且稳定,但输出端电压存在波动,导致MSC-X板卡IOS XR FAILURE启动失败,无法启动到XR-Run 状态。测量结果发现其中一组BGA芯片DC供电转换模块处于损坏状态。更换好供电转换模块插入CRS-16-LCC机箱出现新的报错。
RP/0/RP1/CPU0:ios(admin)#sh platform
Node Type PLIM State Config state
------------------------------------------------------------------------------------------------
0/2/* MSC-x N/A PRESENT PWR ,NSHUT ,MON
0/RP1/CPU0 RP(Active) N/A IOS XR RUN PWR ,NSHUT ,MON
0/FC1/SP FAN-CT(SP) N/A IOS XR RUN PWR ,NSHUT ,MON
0/AM1/SP ALARM-B(SP) N/A IOS XR RUN PWR ,NSHUT ,MON
0/SM0/SP FC-400G/S(SP) N/A IOS XR RUN PWR ,NSHUT ,MON
RP/0/RP1/CPU0:ios(admin)#
RP/0/RP1/CPu0:ios(admin)#RP/0/RP1/CPU0: Mar 10 23:46:55.003 : shelfmgrV2[388]:%PLATFORM-SHELFMGRV2-3-INVALID_SLOTID_IN_BOOTREQ: A boot requestsent to shelfmgr on rack 0 (rack type 0) is ignored as it contains invalid slotId 45 with card type 400G Engine modular switch card (0x50006c).Possible seating issue, please reseat the suspected card(s).
三,BGA更换:
CRS启动失败,通电测量CRS-MSC-X各项电压输出正常,根据报错信息提示为无法正确识别400G模块。测量发现主板BGA芯片接口数据信号总线阻值异常,因此判断总线芯片损坏,这里要用到专业的BGA焊接台进行更换。BGA芯片更换必须要先了解芯片尺寸和焊点布局,选择合适的锡球,调整适当的温度设定足够的时间,以避免BGA芯片更换时过热或者过焊导致损坏。
BGA芯片更换后仪器测量各部件显示全部正常,安装好设备底壳配件等,CRS-MSC-X成功启动到 IOS XR 运行正常。如下图:
0/2/CPu0 MSC-X 40-10GbE IOS XR RUN PWR.NSHUT.MON
维修完成后,网度通信工程师再次测试机器所有功能是否正常,如正常便清洁机器内外部灰尘污渍后进行烤机,烤机2天后再次进行全面检查无故障问题后再交付给客户。
NODE 0/2/CPU 0 Node state : IOS XR RUN
我们每次维修都会记录相关故障信息数据和维修记录到数据库,网度通信多年来积累了CISCO、Juniper、Brocade、H3C、F5、华为、IBM、HP、EMC等多品牌:路由器维修、交换机维修、各类板卡引擎维修、负载均衡维修、防火墙维修、服务器维修、存储维修等各类ICT设备故障维修数据,维修技术经验成熟,现综合维修成功率达90%以上。
服务价值优势:
1、以较低成本修复高价值设备,可提高硬件资源利用率,降低企业采购成本;
2、及时快速的设备维修服务,保障业务系统可用性,提高业务系统稳定性,
3、维修期间还可提供备机备件,结合网度快速备件供应服务使停机时间更短,减少企业运营风险,解除客户长时间系统宕机之忧。
选择网度通信可以更加快捷为您解决问题,为您的业务系统硬件设备稳定高效运行提供一份安全保障。