解决IBM X3800服务器ServerRaid 8i卡损坏引起的拷贝死机问题

IBM服务器的质量和性能,就像大家熟悉的ibm前桌面产品–thinkpad一样,过硬并且运行稳定,但只要是电子产品都有不稳定的时候,公司的IBM X3800 服务器就很巧合的遇见了一起ServerRaid 8i卡损坏引起的启动死机、拷贝时死机问题。

昨天早上一到公司,同事就告诉我,公司各服务器运行都正常,但IBM X3800服务器在凌晨自动重启后到现在,一直是win2003的启动界面,那个进度条一直在滚动。考虑到可能是重启的问题,因此拉开ibm的’remind’警示小拖盘,按“reset”让服务器重启,但重启后故障依然如此。于是考虑是不是系统坏了?

IBM X3800服务器,三块146G硬盘,装机时做的Raid5,以前用ghost做的有备份(raid是可以用ghost做备份和还原备份的)把光驱放进光盘,从光驱引导,以前在F盘有一个备份,尝试恢复一下系统试试,但在恢复进度条进行到百分之一时,系统再次死机。

考虑到系统里面有重要的商业数据,另外也考虑白天业务要正常运营,因此不再考虑太多,用WinPe启动进入,拷贝D盘的数据库数据,但在选择拷贝时正常,到粘贴后,拷贝到几十M时,该拷贝操作再次死掉。看来似是读文件过大或者过快,进程就会死掉。最初的操作系统启动,也是读硬盘文件时,死机,估计也是这个原因。

在多次启动到WinPe环境下,终于把小一点的一个数据库和另外两份软件程序给拷贝到了U盘上,但那个大至4G的数据库文件,实在是没办法拷贝出来了,都是死机,压缩分割都不行,用网上流行的断点续拷贝的软件拷贝也不行,用限速拷贝软件拷贝,也不行,拷贝一会,操作就会死掉。

在上述操作中,发现“remind”托盘灯“log”灯和“PCI BRD”灯亮,看起来是PCI设备的问题了。

在WinPe环境下,系统是比较干净的,如果此时还出现这样的现象,那就很可能是硬件层面的问题了。打电话给IBM800服务中心,详细给工程师描述了该故障现象,工程师倒是很干脆,说稍后就有工程师和你联系。郑州的IBM服务工作站的几个人我已经非常熟悉了,过不大一会,就有工作站的负责人给打电话了(其实之前我就直接给他们打过电话,但IBM售后服务工作站是不见单子不干活的),说明天设备就会从北京发过来。

既然这样,就不再做努力了,等吧!在网上浏览相关IBM raid环境下的网页时,突然考虑到,主板坏,也极有可能是Raid卡损坏,从而引起数据传输问题。马上打电话联系IBM售后服务工作站的人员,他们说,北京发的配件里面已经有Raid卡,看来,800的工程师也已经考虑到这个方面的问题了。

今天上午将近11点的时候,IBM售后服务站的工程师带着配件来到公司,先换了主板启动,不行;再刷新了BIOS,启动不行;最后才更换了Raid卡(更换以后,Raid卡自动会读取三个硬盘里面分散的Raid5阵列信息),启动,恢复ghost镜像,进度条进行到百分之二时,大家就知道,问题解决了。

接下来的事情就好办多了,重做系统,安装驱动,有一个操作系统没有默认安装的“raid控制器”,这个就是“Server Raid 8i controller”设备,在ibm的随机光盘“support CD”里面有这个设备的驱动,找到针对win2003的版本安装就OK了,光盘找不到的话,IBM官方网站提供的有,根据向导搜索就可以找得到。一切安装OK后,重新用ghost做了备份。

在使用WinPe和ghost时,深度的2.5PE会发生载入选择菜单时死机的现象,不是很稳定,用了老毛桃的去年11月份版本,一直还错,直接进WinPe环境做的备份,当然也可以在WinPe环境里面,直接还原备份。

One thought on “解决IBM X3800服务器ServerRaid 8i卡损坏引起的拷贝死机问题

  1. 博主我想问下,我应该怎样用ghost安装系统或备份系统!
    请指点下

    linker 于 2009-11-3 17:37:45 回复

    如果结合本文中所说,虽然是阵列,但做好做ghost备份或者恢复,和平常系统一样。使用一个winpe的系统,或者可启动带ghost的光盘,根据向导就可以备份系统了。具体使用ghost的方法,可以搜索网上的图文说明。

Comments are closed.