shaken 发表于 2015-05-15 11:27

非官方提供的一个方法是将disk 8 (故障盘)冷却后重新插入使用,尝试重新数据补偿回复数据。

shaken 发表于 2015-05-15 11:49

ylky_2000 发表于 2015-05-15 10:37 static/image/common/back.gif
这个处理方法对吗?
1.raid 5没有热备盘的情况,目前都没有碰到
2.raid 5坏了一块盘之后,如果有热备,一般热备会直接replace了
3.常规阵列柜都支持热插拔吧
4.关机或者做其他任何的硬件操作之前,如果数据还可以读取,必须要先备份。
这次我raid 5故障的教训就是没有先做备份,主要是备份的量大,而业务又不能停,催着我赶紧修复硬件。这个是很明显的bug!

ylky_2000 发表于 2015-05-15 11:59

shaken 发表于 2015-05-15 11:49 static/image/common/back.gif
1.raid 5没有热备盘的情况,目前都没有碰到
2.raid 5坏了一块盘之后,如果有热备,一般热备会直接replac ...
以后遇到先后坏两块硬盘怎么弄?

bbjmmj 发表于 2015-05-15 13:14

回复 7# ylky_2000

遇到这种情况应该先拔电源,然后再通知客户,修复服务器比通知客户更紧急。

    有个简单粗暴的办法或许可以奏效:拔电源,拔插坏盘数次,等机器冷却后开机,RAID卡会自动识别RAID。
阵列损毁不都是硬盘损坏,尤其是用SATA硬盘的时候,硬盘有故障不等于就坏了,阵列崩溃可能是硬盘或者控制器不够稳定。

shaken 发表于 2015-05-19 12:07

目前问题解决,解决方法就是关阵列柜,拔掉disk 8 ,隔一段时间后(中间试过几次,发现时间长短效果都一样,估计不是盘的问题导致)插入disk 8,开机,阵列自动进行rebulid,奇怪的是一开始重建的是hotspare disk 14,然后是新插入的disk 12进行数据补偿。除了故障当天之外的所有数据都备份出来了,在备份数据的时候,只要一读取故障当天的数据,阵列就报错,disk 8 亮红灯。一共花了6个小时备份数据,在备份数据的同时,查询raid的状态都正常的。目前插入disk 8 ,系统在做重建,不是数据补偿。
故障的问题还有疑问,怀疑可能不是盘坏导致的,是SP B有问题,接下来备份日志,继续查问题。

shaken 发表于 2015-05-25 08:08

插入disk 8后,进行rebuild,读写所有数据都正常了。
页: 1 [2]
查看完整版本: RAID 5阵列故障问题