RAID1 硬盘坏了一块,换新的后不会自动镜像,系统也启动不了 - 已经解决
本帖最后由 lidexiang 于 2014-04-15 16:01 编辑一台CentOS6服务器突然听到硬盘“嘀嘀”不正常狂响,开机箱听下, 应该是一块硬盘坏了。 然后正常关闭服务器。重新启动看下Raid设置,发现的确是一个硬盘坏了。 都查询不到。 所以买了个新硬盘换上去, 但是没有自动恢复,记得以前用HP的主机,raid1一个硬盘坏了,换一个就可以了。 不知道这次是什么问题,大家有什么建议? 以下是详细信息和图片。
请教: 1. 这个是不是可以拿回数据? 2. 如何让riad1正常工作? 3. 是否可以在linux下修复? 4. 是否要安装个windows版的Intel® Rapid Recover Technology来解决问题?
1. Asus 主板自带的Intel raid;
2. 2个2TB的硬盘组成 RAID1;
3. 现在是第一块硬盘坏了;
4. 买新的2TB硬盘直接换下第一块硬盘。
5. 主板型号P8Z77-LV
6. Intel rom 型号 11.0.0.1339
7. Intel Raid1 查看新硬盘Volume0 状态是 Failed,Bootable = No
8.换上新硬盘后Intel Raid1 查看新硬盘可以看到
9. RecoveryVolumeOptions不可用
用Linux systemrescuecd Live 启动系统,用mdadm查看raid1资料:
root@sysresccd /root % cat /proc/mdstat
Personalities :
md126 : active (read-only) raid1 sdb(S)
1953511424 blocks super external:/md127/0
md127 : inactive sdb(S)
2257 blocks super external:imsm
unused devices: <none>
root@sysresccd /root % mdadm -D /dev/md/Volume0_0
/dev/md/Volume0_0:
Container : /dev/md/imsm_1, member 0
Raid Level : raid1
Array Size : 1953511424 (1863.01 GiB 2000.40 GB)
Used Dev Size : 1953511556 (1863.01 GiB 2000.40 GB)
Raid Devices : 2
Total Devices : 1
State : clean, FAILED
Active Devices : 0
Working Devices : 1
Failed Devices : 0
Spare Devices : 1
Number Major Minor RaidDevice State
0 0 0 0 removed
1 0 0 1 removed
0 8 16 - spare /dev/sdb
root@sysresccd /root % ls /dev/sd*
/dev/sda/dev/sdb/dev/sdc/dev/sdc4
sda 是新硬盘,sdb是好的第二块raid1硬盘,sdc是live cd。
root@sysresccd /etc % ls -al /dev/md/Volume0_0
lrwxrwxrwx 1 root root 8 Apr 12 08:12 /dev/md/Volume0_0 -> ../md126
root@sysresccd /etc % ls /dev/md12*
/dev/md126/dev/md127
root@sysresccd /etc % mdadm -E /dev/sda
/dev/sda:
MBR Magic : aa55
root@sysresccd /etc % mdadm -E /dev/sdb
/dev/sdb:
Magic : Intel Raid ISM Cfg Sig.
Version : 1.1.00
Orig Family : 63409191
Family : 63409191
Generation : 003fb046
Attributes : All supported
UUID : de83aad6:8d1c0812:72c02043:5459fa5f
Checksum : 3e86fb32 correct
MPB Sectors : 1
Disks : 2
RAID Devices : 1
Disk00 Serial : W2F0F0V8
State : active
Id : 00000001
Usable Size : 3907023112 (1863.01 GiB 2000.40 GB)
:
UUID : 82f41dd6:43842b55:555cc5e7:8042a1b1
RAID Level : 1
Members : 2
Slots :
Failed disk : 0
This Slot : 0 (out-of-sync)
Array Size : 3907022848 (1863.01 GiB 2000.40 GB)
Per Dev Size : 3907023112 (1863.01 GiB 2000.40 GB)
Sector Offset : 0
Num Stripes : 15261808
Chunk Size : 64 KiB
Reserved : 0
Migrate State : idle
Map State : failed
Dirty State : clean
Disk01 Serial : W2F0F1NM:0
State : active
Id : ffffffff
Usable Size : 3907023112 (1863.01 GiB 2000.40 GB)
参考: http://www.sapphiretech.com/presentation/events/0010/PDF/14.lanbaoshiINTELzhubanRAIDdeshujuhuifufangfa.pdf
添加了一块安装windows 的硬盘, 用The Intel Matrix Storage Manager查看也好像恢复不了。 问题解决。
方法:
1. 将还完好的第二块硬盘拆到其他机器,设置启动顺序为这块硬盘,系统就可以启动了。 然后备份重要数据。
2. 将第二块硬安装回服务器;
3. 用新硬盘替换旧硬盘;
4. 启动系统,Ctrl+I进入Intel raid控制界面, 然后将完好的第二块硬盘设置成Non-raid member(主截面的第三个选项)。会提示设置non-raid 会删除数据,这只是个提示,不会真的删除数据(intel工程师说的)。
5. 关闭系统。
6. 弄块windows硬盘,然后启动windows系统;
7. 安装最新版本的Intel® Rapid Storage Technology (Intel® RST)(我安装的是2013年的某个版本)
8. 重新建立raid。主要要选保留数据(也就是第二块硬盘数据),选的时候注意下,就会看到这个选项。
9. 重建开始。。。。
10. 从raid1启动。
11.完成。
以上是raid1的我上面遇到的问题的解决方法。
数据安全第一,一切操作有风险
谢谢围观
页:
[1]