您现在的位置是:首页 > IT基础架构 > 计算存储 >

谨防由PDU老化引发的服务器宕机

2008-11-13 17:51:00作者: 来源:

摘要故障的根源是由于电源插座老化,感应漏电引起接地电压偏高。在市电供应停止的情况下,由于接地电压异常使得UPS不能正常响应,出现保护性关闭,服务器由于失电而异常关机,并破坏了BIOS的数据。由于服务器不能正常启动,引起了我们对磁盘及磁盘阵列的重视,结果从中也发现服务...

故障现象:一台HP LH6000服务器,由一台科龙FR-UK60L UPS提供输入电源。一次停电后,对机房进行巡视,发现该UPS异常关闭,蜂鸣器、长鸣,服务器由于没有电力供应已经自行关闭。检查发现UPS电池容量仍有60%,初步估计可能是UPS出现故障导致服务器断电关机。检测 UPS及相关线路,并未发现异常。重新启动服务器,提示磁盘阵列设置有错不能启动,按F2键不能进入BIOS设置。

故障分析与处理:检查并经查阅相关资料,推测可能是服务器磁盘和磁盘阵列控制卡出现故障,使用检测软件对服务器进行全方位的检测 排查,发现服务器存在两个问题:

1.RAID磁盘阵列中有一磁盘出现故障,已不能使用;

2.磁盘阵列的热备盘配置错误,没有启用。

更换故障磁盘,改正磁盘阵列中热备盘的配置,重启服务器,CMOS硬件检测正常,但不能进入Win2000启动界面。分析可能是BIOS出错,遂写 BIOS,再次启动服务器,很快进入熟悉的Win2000启动界面,检查相关数据,没有发现数据丢失。

本以为一切恢复正常,没想到第二天中午又出现新的问题。服务器出现连续的短促报警声,1分钟内服务器自动关机,UPS正常工作。重新 启动服务器,每次都自动关机,检查服务器电源模块,电源灯不亮,检查日志,报告电源出现故障。

对UPS输出模块、服务器输入电流和电压进行全面检测,发现UPS输出正常,服务器的输入电压为220V,但接地的电压高达70V还多。断开 服务器输入电源,检测服务器接入电源插座,同样存在接地电压过高的现象,这是一个杂牌的插座,已严重老化了,遂更换新的插座,重 新检测,接地电压为0V,连上服务器,试着启动服务器,一次启动成功,至今连续运行了半个多月,也未再发生异常情况。

总结:故障的根源是由于电源插座老化,感应漏电引起接地电压偏高。在市电供应停止的情况下,由于接地电压异常使得UPS不能正常响应,出现保护性关闭,服务器由于失电而异常关机,并破坏了BIOS的数据。由于服务器不能正常启动,引起了我们对磁盘及磁盘阵列的重视,结果从中也发现服务器的两个致命的隐患:坏盘和没配置好的热备盘。看来电源质量是一个不可忽视的问题,即使在高质量的UPS提供保障的前提下也应重视。


(本文不涉密)
责任编辑:

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们