lidexiang 发表于 2014-04-12 08:33

RAID1 硬盘坏了一块,换新的后不会自动镜像,系统也启动不了 - 已经解决

本帖最后由 lidexiang 于 2014-04-15 16:01 编辑

一台CentOS6服务器突然听到硬盘“嘀嘀”不正常狂响,开机箱听下, 应该是一块硬盘坏了。 然后正常关闭服务器。重新启动看下Raid设置,发现的确是一个硬盘坏了。 都查询不到。 所以买了个新硬盘换上去, 但是没有自动恢复,记得以前用HP的主机,raid1一个硬盘坏了,换一个就可以了。 不知道这次是什么问题,大家有什么建议? 以下是详细信息和图片。
请教: 1. 这个是不是可以拿回数据? 2. 如何让riad1正常工作? 3. 是否可以在linux下修复? 4. 是否要安装个windows版的Intel® Rapid Recover Technology来解决问题?

1. Asus 主板自带的Intel raid;
2. 2个2TB的硬盘组成 RAID1;
3. 现在是第一块硬盘坏了;
4. 买新的2TB硬盘直接换下第一块硬盘。

5. 主板型号P8Z77-LV
6. Intel rom 型号 11.0.0.1339
7. Intel Raid1 查看新硬盘Volume0 状态是 Failed,Bootable = No
8.换上新硬盘后Intel Raid1 查看新硬盘可以看到
9. RecoveryVolumeOptions不可用

用Linux systemrescuecd Live 启动系统,用mdadm查看raid1资料:

root@sysresccd /root % cat /proc/mdstat
Personalities :
md126 : active (read-only) raid1 sdb(S)
      1953511424 blocks super external:/md127/0

md127 : inactive sdb(S)
      2257 blocks super external:imsm

unused devices: <none>

root@sysresccd /root % mdadm -D /dev/md/Volume0_0
/dev/md/Volume0_0:
      Container : /dev/md/imsm_1, member 0
   Raid Level : raid1
   Array Size : 1953511424 (1863.01 GiB 2000.40 GB)
Used Dev Size : 1953511556 (1863.01 GiB 2000.40 GB)
   Raid Devices : 2
Total Devices : 1

          State : clean, FAILED
Active Devices : 0
Working Devices : 1
Failed Devices : 0
Spare Devices : 1

    Number   Major   Minor   RaidDevice State
       0       0      0      0      removed
       1       0      0      1      removed

       0       8       16      -      spare   /dev/sdb

root@sysresccd /root % ls /dev/sd*
/dev/sda/dev/sdb/dev/sdc/dev/sdc4
sda 是新硬盘,sdb是好的第二块raid1硬盘,sdc是live cd。

root@sysresccd /etc % ls -al /dev/md/Volume0_0
lrwxrwxrwx 1 root root 8 Apr 12 08:12 /dev/md/Volume0_0 -> ../md126

root@sysresccd /etc % ls /dev/md12*
/dev/md126/dev/md127

root@sysresccd /etc % mdadm -E /dev/sda
/dev/sda:
   MBR Magic : aa55
root@sysresccd /etc % mdadm -E /dev/sdb
/dev/sdb:
          Magic : Intel Raid ISM Cfg Sig.
      Version : 1.1.00
    Orig Family : 63409191
         Family : 63409191
   Generation : 003fb046
   Attributes : All supported
         UUID : de83aad6:8d1c0812:72c02043:5459fa5f
       Checksum : 3e86fb32 correct
    MPB Sectors : 1
          Disks : 2
   RAID Devices : 1

Disk00 Serial : W2F0F0V8
          State : active
             Id : 00000001
    Usable Size : 3907023112 (1863.01 GiB 2000.40 GB)

:
         UUID : 82f41dd6:43842b55:555cc5e7:8042a1b1
   RAID Level : 1
      Members : 2
          Slots :
    Failed disk : 0
      This Slot : 0 (out-of-sync)
   Array Size : 3907022848 (1863.01 GiB 2000.40 GB)
   Per Dev Size : 3907023112 (1863.01 GiB 2000.40 GB)
Sector Offset : 0
    Num Stripes : 15261808
   Chunk Size : 64 KiB
       Reserved : 0
Migrate State : idle
      Map State : failed
    Dirty State : clean

Disk01 Serial : W2F0F1NM:0
          State : active
             Id : ffffffff
    Usable Size : 3907023112 (1863.01 GiB 2000.40 GB)

参考: http://www.sapphiretech.com/presentation/events/0010/PDF/14.lanbaoshiINTELzhubanRAIDdeshujuhuifufangfa.pdf

lidexiang 发表于 2014-04-14 09:45

添加了一块安装windows 的硬盘, 用The Intel Matrix Storage Manager查看也好像恢复不了。

lidexiang 发表于 2014-04-15 16:01

问题解决。
方法:
1. 将还完好的第二块硬盘拆到其他机器,设置启动顺序为这块硬盘,系统就可以启动了。 然后备份重要数据。
2. 将第二块硬安装回服务器;
3. 用新硬盘替换旧硬盘;
4. 启动系统,Ctrl+I进入Intel raid控制界面, 然后将完好的第二块硬盘设置成Non-raid member(主截面的第三个选项)。会提示设置non-raid 会删除数据,这只是个提示,不会真的删除数据(intel工程师说的)。
5. 关闭系统。
6. 弄块windows硬盘,然后启动windows系统;
7. 安装最新版本的Intel® Rapid Storage Technology (Intel® RST)(我安装的是2013年的某个版本)
8. 重新建立raid。主要要选保留数据(也就是第二块硬盘数据),选的时候注意下,就会看到这个选项。
9. 重建开始。。。。
10. 从raid1启动。
11.完成。

以上是raid1的我上面遇到的问题的解决方法。
数据安全第一,一切操作有风险

谢谢围观
页: [1]
查看完整版本: RAID1 硬盘坏了一块,换新的后不会自动镜像,系统也启动不了 - 已经解决