关于阵列恢复的一些小经验,用于备忘:
服务器宕机,联系IDC的技术帮忙接上显示器观察下。
出现以下报错:
(这里介绍一下生产环境,机器是R410用的是perc 6i阵列卡做了4个硬盘的raid 10阵列卡提供的raid 10模式是12、34号硬盘各自组raid 1,然后2个raid 1组raid 0)
看到硬盘报错已经有可能是阵列问题,之前忽略这台服务器的阵列监控。然后只能重启了。
重启果然报错:There are offline or missing virtual drives…
进去阵列管理界面发现3、4号硬盘离线了。
3、4号物理硬盘离线,虚拟磁盘挂了,当然阵列也崩溃了。
(务必要养成自动备份的习惯,有备份遇到这情况就算阵列不能恢复也可以减少数据丢失)
接下来就要分析怎么处理。
按目前情况阵列只有3个原因出问题:1、硬盘数据线故障 2、阵列卡故障 3、真的2块硬盘故障了
原因很简单,如果只是数据线或者阵列卡故障就好搞了。
如果是同时挂了2块硬盘就只好回档或者找专业的数据恢复公司了。
然后是同时进行回档准备与阵列修复,回档准备这里就不提了。
阵列修复:
1、先替换数据线一枚,接口要按稳,错误依旧,数据线原因可以排除掉
2、替换阵列卡,然后进去阵列管理(题外话:阵列信息是保存于硬盘,所以放心换阵列卡,当然替换之后需要从硬盘恢复阵列信息)
看到这个界面感觉到希望了。PD Count :4,认出4块物理硬盘,接下来就简单了。恢复阵列信息即可。
如上图:在 No Configeration Present!这里按F2 -> Foreiga Config -> Import
但是下面出现一幕之前实验没出现过的选项。不可逆?为啥出现这呢。但目前也只能选yes操作。
然后4号硬盘居然进行了Rebuild
到这里整个故障都明了。
估计早一段时间阵列卡就已经有问题,导致4号盘离线。如果之前有监控好就不会出现今天的事了
4号盘的数据早就跟其他3个盘数据不同步,然后今天3号硬盘因为raid 卡问题也掉线。同时阵列也崩溃了。
现在恢复阵列需要4号硬盘数据同步才行,因此会干掉4号硬盘的原本数据,所以才提示不可逆这样的提示。
所以阵列必须进行监控好。Dell系列的阵列检查推荐工具:MegaRAID,详细用法这里不多说。