免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: shaken
打印 上一主题 下一主题

[RAID与磁盘阵列] RAID 5阵列故障问题 [复制链接]

论坛徽章:
0
11 [报告]
发表于 2015-05-15 11:27 |只看该作者
非官方提供的一个方法是将disk 8 (故障盘)冷却后重新插入使用,尝试重新数据补偿回复数据。

论坛徽章:
0
12 [报告]
发表于 2015-05-15 11:49 |只看该作者
ylky_2000 发表于 2015-05-15 10:37
这个处理方法对吗?

1.raid 5没有热备盘的情况,目前都没有碰到
2.raid 5坏了一块盘之后,如果有热备,一般热备会直接replace了
3.常规阵列柜都支持热插拔吧
4.关机或者做其他任何的硬件操作之前,如果数据还可以读取,必须要先备份。
这次我raid 5故障的教训就是没有先做备份,主要是备份的量大,而业务又不能停,催着我赶紧修复硬件。这个是很明显的bug!

论坛徽章:
3
季节之章:冬
日期:2015-01-15 10:36:57IT运维版块每日发帖之星
日期:2015-09-24 06:20:00IT运维版块每日发帖之星
日期:2015-10-24 06:20:00
13 [报告]
发表于 2015-05-15 11:59 |只看该作者
shaken 发表于 2015-05-15 11:49
1.raid 5没有热备盘的情况,目前都没有碰到
2.raid 5坏了一块盘之后,如果有热备,一般热备会直接replac ...

以后遇到先后坏两块硬盘怎么弄?

论坛徽章:
9
技术图书徽章
日期:2014-10-14 15:48:13数据库技术版块每日发帖之星
日期:2015-06-04 22:20:00数据库技术版块每日发帖之星
日期:2015-06-10 22:20:00数据库技术版块每日发帖之星
日期:2015-06-11 22:20:00数据库技术版块每日发帖之星
日期:2015-06-13 22:20:00IT运维版块每日发帖之星
日期:2015-09-22 06:20:00IT运维版块每日发帖之星
日期:2015-12-08 06:20:00综合交流区版块每日发帖之星
日期:2016-02-02 06:20:00IT运维版块每日发帖之星
日期:2016-07-25 06:20:00
14 [报告]
发表于 2015-05-15 13:14 |只看该作者
回复 7# ylky_2000

遇到这种情况应该先拔电源,然后再通知客户,修复服务器比通知客户更紧急。

    有个简单粗暴的办法或许可以奏效:拔电源,拔插坏盘数次,等机器冷却后开机,RAID卡会自动识别RAID。
阵列损毁不都是硬盘损坏,尤其是用SATA硬盘的时候,硬盘有故障不等于就坏了,阵列崩溃可能是硬盘或者控制器不够稳定。

论坛徽章:
0
15 [报告]
发表于 2015-05-19 12:07 |只看该作者
目前问题解决,解决方法就是关阵列柜,拔掉disk 8 ,隔一段时间后(中间试过几次,发现时间长短效果都一样,估计不是盘的问题导致)插入disk 8,开机,阵列自动进行rebulid,奇怪的是一开始重建的是hotspare disk 14,然后是新插入的disk 12进行数据补偿。除了故障当天之外的所有数据都备份出来了,在备份数据的时候,只要一读取故障当天的数据,阵列就报错,disk 8 亮红灯。一共花了6个小时备份数据,在备份数据的同时,查询raid的状态都正常的。目前插入disk 8 ,系统在做重建,不是数据补偿。
故障的问题还有疑问,怀疑可能不是盘坏导致的,是SP B有问题,接下来备份日志,继续查问题。

论坛徽章:
0
16 [报告]
发表于 2015-05-25 08:08 |只看该作者
插入disk 8后,进行rebuild,读写所有数据都正常了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP