编号 | |
密级 | |
IBM X3850 X5服务器无法开机故障
处理步骤
V1.0
一、设备概况
客户名称 | |||
机房位置 | |||
设备型号 | IBM X3850 X5 | 设备序列号 | |
操作系统 | 微码版本 | ||
应用软件 | |||
硬件配置 | |||
二、问题描述
接到客户报修,一台IBM X3850X5服务器宕机后无法开机,诊断面板上BRD指示灯亮起,立即赶往现场处理。
经过现场确认,设备电源可以正常加电,但按下开机按钮后无法启动,液晶面板在01、FR间循环显示,断电重新加电现象相同。通过用客户管理电脑连接IMM管理端口查看日志,有如下报错信息:
1. I -- -- 7/6/2016:6:24:35 -- N -- 0x4000000e00000000 -- Remote Login Successful. Login ID: USERID from Web at IP address 192.168.70.1 2. E -- -- 7/2/2016:2:6:35 -- C -- 0x800706081410ffff -- Sensor "I/O Board VRD" has transitioned to non-recoverable 3. I -- -- 7/2/2016:2:6:29 -- N -- 0x806f00091381ffff -- "Host Power" has been turned off 4. E -- -- 7/2/2016:2:6:26 -- C -- 0x80070608140bffff -- Sensor "CPU 2 VRD" has transitioned to non-recoverable |
三、处理步骤
通过设备维护手册查询,报错内容“Sensor "CPU 2 VRD" has transitioned to non-recoverable”为CPU板故障,报错内容“Sensor "I/O Board VRD" has transitioned to non-recoverable”为PCI板故障。这两个故障都可能导致目前无法开机的现象,从时间点看CPU板首先故障,所以CPU板故障可能性最大并准备备件准备更换,同时准备PCI板现场备用。
CPU板更换步骤如下:
1. 现场准备好新的备件。
2. 关闭服务器和外围设备,并根据需要断开电源线和所有外部电缆连接,以更换设
备。
3. 卸下顶盖。
4. 卸下顶盖支架)。
5. 卸下电源。
6. 从微处理器板组合件卸下I/O 板滑盖。
7. 卸下内存卡。
8. 卸下ServeRAID 适配器。
9. 卸下中间风扇。
10. 卸下内存卡仓。
11.卸下微处理器。
12. 断开以下电缆连接:前部风扇、可扩展指示灯、操作员信息面板和CD/DVD 电源。
13. 拧松服务器后部的指旋螺钉。
14. 将组合件轻轻向服务器前部滑动;然后使用左侧的微处理器板手柄,从一定角度
取出组合件。
15. 更换成新的CPU板,按相反步骤进行安装后加电开机测试。
服务器更换新CPU板后主机可以正常开机,但在启动过程中会有如下报错并无法进入操作系统:
there are offline or missing virtual drives with preserved cache. please check the cables and ensure that all drives are present. Press any key to continue or 'C' load the configuration utility. |
按照提示进行RAID卡管理界面,有如下内容提示:
以上提示内容原因为RAID卡cache中有脏数据未能正常写入磁盘,选择Discard cache选项丢弃,然后退出管理界面,设备正常进入操作系统。
自此设备硬件故障已经修复,但查看诊断面板仍然有Log报错灯亮起,通过登陆IMM管理台查看,有如下报错信息:
报错为FPGA微码版本不匹配,通过看到VPD信息发现FPGA微码版本高于IMM和UEFI微码版本,于是与客户沟通将所有微码升级到最新版本。升级前先进入主机BIOS,将system log events清除,升级过程如下:
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论