专业IT设备第三方维保_IT设备维保服务_IT备件服务_IT基础架构运维_IT设备维修-网度通信

思科 CRS-MSC-X维修 Cisco板卡IOS XR FAILURE启动失败修复案例

2024-08-24 17:24
分享到:
        Cisco CRS-MSC-X板卡维修案例   思科板卡IOS XR FAILURE启动失败 维修案例
 
        主题:CRS无法启动
        CRS-MSC-X启动报错
 
使用命令 show platform 查看
RP/0/RP1/CPu0:ios(admin)#
RP/0/RP1/CPu0:ios(admin)#sh platform
Node  Type  PLIM   State     Config state         
------------------------------------------------------------------------------------------------
0/2/CPU0    MSC-X    N/A      MBI-BOOTING        PWR ,NSHUT ,MON
0/RP1/CPU0  RP(Active)  N/A      IOS XR RUN         PWR ,NSHUT ,MON
0/FC1/SP     FAN-CT(SP)  N/A        IOS XR RUN          PWR ,NSHUT ,MON
0/AM1/SP    ALARM-B(SP)  N/A        IOS XR RUN         PWR ,NSHUT ,MON 
0/SM0/SP   FC-400G/S(SP)  N/A        IOS XR RUN          PWR ,NSHUT ,MON 
RP/0/RP1/CPU0:ios(admin)#
RP/0/RP1/cpu0:ios(admin)#sh platform    pRp/0/Rp1/cpu0:mar 10 23:58:17.583 : shelfmgrV2[388]: %PLATFORM-SHELFMGRV2-3-NODE_HBLOSS_RESET : Reset node 0/2/cpl0 due to heartbeat loss  
 
RP/0/RP1/CPU0:ios(admin)#sh platferm
Node  Type  PLIM   State     Config state         
------------------------------------------------------------------------------------------------
0/2/CPU0    MSC-x    N/A      IOS XR FAILURE        PWR ,NSHUT ,MON
0/RP1/CPU0  RP(Active)  N/A      IOS XR RUN           PWR ,NSHUT ,MON
0/FC1/SP     FAN-CT(SP)  N/A        IOS XR RUN            PWR ,NSHUT ,MON
0/AM1/SP    ALARM-B(SP)  N/A        IOS XR RUN           PWR ,NSHUT ,MON 
0/SM0/SP   FC-400G/S(SP)  N/A        IOS XR RUN           PWR ,NSHUT ,MON 
 
RP/0/RP1/CPU0:ios(admin)#
RP/0/RP1/CPU0:ios(admin)#RP/0/RP1/CPU0:               Mar 10 23:59:11.736 : shelfmgrv2[388]: %PLATFORM-SHELFMGRV2-3-FAILURE : DCDC enable failure 0xafea0a0'subsystem(8148)'detected the 'fatal' condition 'Code(5)'
 
        一,故障判定
        CRS-MSC-X启动报错, MBI-BOOTING 与CRS IOS XR FAILURE显示状态最终报错代码, DCDC enable failure 0xafea0a0'subsystem(8148)'detected the 'fatal' condition 'Code(5)',根据报错信息提示判定为DC供电模块故障。
        二,故障测量
        MSC-X板卡DC供电模块输入端电压正常并且稳定,但输出端电压存在波动,导致MSC-X板卡IOS XR FAILURE启动失败,无法启动到XR-Run 状态。测量结果发现其中一组BGA芯片DC供电转换模块处于损坏状态。更换好供电转换模块插入CRS-16-LCC机箱出现新的报错。
 
RP/0/RP1/CPU0:ios(admin)#sh platform
Node  Type  PLIM   State     Config state         
------------------------------------------------------------------------------------------------
0/2/*        MSC-x    N/A      PRESENT          PWR ,NSHUT ,MON
0/RP1/CPU0  RP(Active)  N/A      IOS XR RUN         PWR ,NSHUT ,MON
0/FC1/SP     FAN-CT(SP)  N/A        IOS XR RUN          PWR ,NSHUT ,MON
0/AM1/SP    ALARM-B(SP)  N/A        IOS XR RUN         PWR ,NSHUT ,MON 
0/SM0/SP   FC-400G/S(SP)  N/A        IOS XR RUN          PWR ,NSHUT ,MON 
RP/0/RP1/CPU0:ios(admin)#
RP/0/RP1/CPu0:ios(admin)#RP/0/RP1/CPU0:      Mar 10 23:46:55.003 : shelfmgrV2[388]:%PLATFORM-SHELFMGRV2-3-INVALID_SLOTID_IN_BOOTREQ: A boot requestsent to shelfmgr on rack 0 (rack type 0) is ignored as it contains invalid slotId 45 with card type 400G Engine modular switch card (0x50006c).Possible seating issue, please reseat the suspected card(s).
 
        三,BGA更换:
        CRS启动失败,通电测量CRS-MSC-X各项电压输出正常,根据报错信息提示为无法正确识别400G模块。测量发现主板BGA芯片接口数据信号总线阻值异常,因此判断总线芯片损坏,这里要用到专业的BGA焊接台进行更换。BGA芯片更换必须要先了解芯片尺寸和焊点布局,选择合适的锡球,调整适当的温度设定足够的时间,以避免BGA芯片更换时过热或者过焊导致损坏。
        BGA芯片更换后仪器测量各部件显示全部正常,安装好设备底壳配件等,CRS-MSC-X成功启动到 IOS XR 运行正常。如下图:
 
0/2/CPu0  MSC-X  40-10GbE  IOS XR RUN PWR.NSHUT.MON
 
        维修完成后,网度通信工程师再次测试机器所有功能是否正常,如正常便清洁机器内外部灰尘污渍后进行烤机,烤机2天后再次进行全面检查无故障问题后再交付给客户。
NODE 0/2/CPU 0 Node state : IOS XR RUN
        我们每次维修都会记录相关故障信息数据和维修记录到数据库,网度通信多年来积累了CISCO、Juniper、Brocade、H3C、F5、华为、IBM、HP、EMC等多品牌:路由器维修、交换机维修、各类板卡引擎维修、负载均衡维修、防火墙维修、服务器维修、存储维修等各类ICT设备故障维修数据,维修技术经验成熟,现综合维修成功率达90%以上。
 
        服务价值优势:
        1、以较低成本修复高价值设备,可提高硬件资源利用率,降低企业采购成本;
        2、及时快速的设备维修服务,保障业务系统可用性,提高业务系统稳定性,
        3、维修期间还可提供备机备件,结合网度快速备件供应服务使停机时间更短,减少企业运营风险,解除客户长时间系统宕机之忧。  
        选择网度通信可以更加快捷为您解决问题,为您的业务系统硬件设备稳定高效运行提供一份安全保障。

上一篇:携手并进,再创新高!网度通信2024新春年会圆满落幕!
下一篇:思科设备常见命令讲解