IT博客汇
  • 首页
  • 精华
  • 技术
  • 设计
  • 资讯
  • 扯淡
  • 权利声明
  • 登录 注册

    Dell raid10阵列故障恢复处理杂谈

    admin发表于 2013-01-14 07:11:32
    love 0

    关于阵列恢复的一些小经验,用于备忘:

    服务器宕机,联系IDC的技术帮忙接上显示器观察下。

    出现以下报错:

    故障表现1

    (这里介绍一下生产环境,机器是R410用的是perc 6i阵列卡做了4个硬盘的raid 10阵列卡提供的raid 10模式是12、34号硬盘各自组raid 1,然后2个raid 1组raid 0)

    看到硬盘报错已经有可能是阵列问题,之前忽略这台服务器的阵列监控。然后只能重启了。

    重启果然报错:There are offline or missing virtual drives…

    故障表现2

    进去阵列管理界面发现3、4号硬盘离线了。

    故障表现3

    3、4号物理硬盘离线,虚拟磁盘挂了,当然阵列也崩溃了。

    (务必要养成自动备份的习惯,有备份遇到这情况就算阵列不能恢复也可以减少数据丢失)

    接下来就要分析怎么处理。

    按目前情况阵列只有3个原因出问题:1、硬盘数据线故障 2、阵列卡故障 3、真的2块硬盘故障了

    原因很简单,如果只是数据线或者阵列卡故障就好搞了。

    如果是同时挂了2块硬盘就只好回档或者找专业的数据恢复公司了。

    然后是同时进行回档准备与阵列修复,回档准备这里就不提了。

    阵列修复:

    1、先替换数据线一枚,接口要按稳,错误依旧,数据线原因可以排除掉

    2、替换阵列卡,然后进去阵列管理(题外话:阵列信息是保存于硬盘,所以放心换阵列卡,当然替换之后需要从硬盘恢复阵列信息)

    故障恢复1

    看到这个界面感觉到希望了。PD Count :4,认出4块物理硬盘,接下来就简单了。恢复阵列信息即可。

    故障恢复2

    如上图:在 No Configeration Present!这里按F2 -> Foreiga Config -> Import

    但是下面出现一幕之前实验没出现过的选项。不可逆?为啥出现这呢。但目前也只能选yes操作。

    故障恢复3

    然后4号硬盘居然进行了Rebuild

    故障恢复4

    到这里整个故障都明了。

    估计早一段时间阵列卡就已经有问题,导致4号盘离线。如果之前有监控好就不会出现今天的事了

    4号盘的数据早就跟其他3个盘数据不同步,然后今天3号硬盘因为raid 卡问题也掉线。同时阵列也崩溃了。

    现在恢复阵列需要4号硬盘数据同步才行,因此会干掉4号硬盘的原本数据,所以才提示不可逆这样的提示。

    所以阵列必须进行监控好。Dell系列的阵列检查推荐工具:MegaRAID,详细用法这里不多说。



沪ICP备19023445号-2号
友情链接