免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2365 | 回复: 0
打印 上一主题 下一主题

[RAID与磁盘阵列] 当一个硬盘掉线后如何重建阵列 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-12-29 11:02 |只看该作者 |倒序浏览

使用SMOR Configuration Utility 来替换掉线硬盘
用一个新的硬盘替换掉掉线的硬盘。请注意把这个新的硬盘的SCSI ID设置成原来掉线硬盘一样的SCSI ID。新的硬盘的容量至少要和旧硬盘的大小一样,否则不能进行重建硬盘。
重启系统,在PC自检时,当RAID卡提示按Ctrl+A时请同时按Ctrl+A键
进入RAID的BIOS以后,在控制区的左侧选中有硬盘掉线的阵列。这个阵列会被高亮显示。
请同时按Alt+R键来打开阵列菜单
选择Rebuild以开始阵列的重建
使用软件Storage Manager Pro来替换掉线硬盘
用一个新的硬盘替换掉掉线的硬盘。请注意把这个新的硬盘的SCSI ID设置成原来掉线硬盘一样的SCSI ID。新的硬盘的容量至少要和旧硬盘的大小一样,否则不能进行重建硬盘。
重起操作系统
打开Storage Manager Pro管理软件
选择local system 图标然后选择Open System以显示阵列信息
选择Logical Configuration View
双击阵列组图标来打开Array Group Information窗口
点击在Array Group Information 窗口点击Rebuild来启动重建阵列过程
注意:当重建过程开始后,这个硬盘会显示一个小旗在它的旁边。重建完成的百分比也会被显示出来。
Q3:什么是NVRAM?
NVRAM是非易变RAM,是Adaptec 阵列卡存储基本的建立在硬盘上的阵列信息的地方。NVRAM可以存放的信息不会因为关机或者断电而丢失。但是NVRAM里存放的信息在一定情况下是可以改变的。
Q4:安装SCSI卡时为什么显示信息
每次把SCSI/RAID卡安装在系统里,都会出现这个错误信息“Expansion ROM not Initialized”;把卡取出错误就会消失。怎么样解决这个问题呢?
“Expansion ROM not Initialized”是由于主板的内存扩展不足引起的。通常可以用更新主板的BIOS来解决,但是这个并不是SCSI卡的功能。
一些主板会有一个可使用的上位内存区(upper memory area);另一些没有上位内存区,而是只能支持一个扩展内存(extended memory)。一些制造商会保留这块内存作为自己使用,如USB或者其它系统里的专有I/O设备。有限的可用上位内存可能限制外加卡的ROM被装载,如在Adaptec SCSI 卡的ROM。
通常这种情况可由下列错误信息识别出来:
? 在卡的BIOS自检时机器停住不动;
? 在卡自检时显示错误信息“Expansion ROM error”或者“Expansion ROM not Initialized”
? 不能进入卡的BIOS
在这里由于主板的BIOS特点,您只能去检查主板制造商有没有固件的更新或者是可以改变系统BIOS的上位内存区。如果这个上位内存区被禁用,您就可能没有办法来在这个主板上使用Adaptec的适配卡。
注意:如果主板支持EBDA(Extended BIOS Data Area),那么您所使用的适配卡也要支持这个功能。双方同时支持这个功能,改功能才会生效。但是Adaptec SCSI卡不支持该功能。
我们看到用户在每次冷启动遇到“Expansion ROM”错误信息,但是仍然可以在操作系统里正常使用这个适配卡(不做为启动设备)。
多数操作系统,如Windows系统在其完全启动后不使用BIOS来控制设备。他们通过系统里的虚拟驱动程序来控制设备。这就是这些卡在系统过了BIOS,ROM的错误信息仍然可以工作的原因。
Q5:当一个硬盘坏了,换了硬盘后,卡BIOS 里显示那个硬盘”Missing Member”。为何不能重建?
当阵列因为硬盘在某种情况下(硬盘损坏,硬盘被拔出 或 阵列信息损坏),在换了新的硬盘后还是显示”Missing”。 卡没有自动重建。在BIOS 里设了(Automatic Failover”, 换了硬盘,Initialize 了新的硬盘), 但是阵列就不能重建。要如何才能重建呢?
若要重建阵列, 需要把新加的硬盘设置成热备盘(Hotspare)才能重建。热备可以在卡的BIOS Array Configuration Utility 里设置,CLI 或是Adaptec Storage Manager (ASM) 管理软件。
注意:Automatic Failover只有在硬盘柜支持热插拔功能,并且把硬盘插会原来的位置时阵列才会自动重建。
Q6:当系统启动自检时,SCSI卡显示 "no boot devices available" 或者 "no INT13 devices", 然后显示 "BIOS not installed”
SCSI卡的BIOS是被用作bootstrap loader,来通过IVT(Interrupt vector table)链接硬盘(INT13设备)到系统的BIOS里的,
当没有任何硬盘链接到SCSI卡时,SCSI卡自检的消息是正常的。BIOS会扫描SCSI ID 0,1 和2,如果没有发现任何设备,“BIOS not installed”会显示出来。当您需要从连在卡上的设备启动时,您才需要这个BIOS功能。
如果不要显示这个消息,可以在BIOS里把这个功能禁用。
您可以启动您的系统,当卡有提示信息的时候,按Ctrl+A,进入SCSISelect,然后选择Configure/View Host Adapter Settings-> Advanced Configuration, 在里面选择Host Adapter BIOS 或者 SCSI Controller Int-13 Support,然后根据卡的版本选择Disable or Disable Scan Bus。
注意:这个消息只是BIOS显示的一个信息,并不是一个错误信息。启动卡的BIOS并不会把信息装载到内存里,所有对设备的控制都是通过驱动程序来进行的。
Q7:什么时候SCSI卡的BIOS需要被禁用呢?
当您需要从连在卡上的设备启动时,您才需要启动SCSI卡BIOS功能。
您需要在这个时候禁用BIOS或者Int13 support:
? SCSI卡没有需要操作任何硬盘
? 这个机器需要从ATA硬盘启动
? 多个SCSI卡装在同一个系统里,这个卡没有连接要启动的系统盘
注意:当您受到" BIOS not installed "这个消息,并且卡上没有连接任何硬盘时,您可以安全的禁用卡的BIOS。这个卡仍然可以正常工作即使BIOS被禁用。
在多数情况下,不需要启动卡的BIOS就可以在连接到SCSI卡上的CD-ROM启动。
Q8: 怎么才能检验我的RAID阵列是否冗余?
很多用户希望在将服务器投入使用前,测试一下RAID卡和阵列是否具冗余性。本文就阐述了最逼真的仿真一个实际故障的正确方法。
请勿使用下列任何方法来仿真故障。
?用下列手段将造成无法预料的结果和系统不稳定:
请勿在系统开机时拔掉硬盘电源
请勿在系统开机时拔掉SCSI线缆
请勿在拔掉硬盘电源后,启动系统
请勿拔掉SCSI线缆后,启动系统
请勿从外部机架中拔出硬盘
上述任何手段都不能精确地模拟真实故障,并且会对元件造成损坏。
请遵照下面的步骤来正确地在冗余阵列上模拟故障:
首先创建RAID1,5,0/1,0/5。然后安装操作系统。您不必等到阵列创建完毕后再安装操作系统。本文假设操作系统是Windows2000。当操组系统安装好后,安装给适配卡 配备的
Adaptec Storage Manager 软件。
必须等阵列完成建立过程,如此RAID才能处于理想状态。阵列如果不是在理想条件或状态下,是无法容错或冗余的。
当完成创建且阵列状态为理想(optimal)时,启动Storage Manager 工具。您应当可以看到RAID控制卡以及连到卡上的硬盘。属于阵列内部的硬盘将在硬盘图标上有一个蓝色的RAID字样。假如您把某个硬盘设为热备份硬盘,该盘会在硬盘图标上有一个红色的圈和一个白色的加号。我们建议在故障仿真中不要使用热备份设置,除非您打算测试特定的功能。
下一步,双击RAID阵列中的一员。屏幕上会显示出SCSI设备的信息。在屏幕上有一个标示为故障硬盘的按钮。选中“故障硬盘”则会把该盘标记为故障盘。为避免意外的阵列损失,您用这个方法只能假定一个故障盘。
在指定故障盘后,系统应当继续正常运转。系统能在降级模式(Degraded Mode)下重新启动。当测试完成后,再打开Storage Manager工具,双击代表故障RAID阵列的LSU(Logic Storage Unit),并选择重建。确保阵列在做其他测试前重建完毕。
假如您测试热备份功能,一旦“故障盘”按钮按下,热备份盘会介入,并自动开始阵列重建。假如重建未开始,那就激活某些硬盘操作如双击“我的电脑”,再访问RAID。这也将启动重建过程。
还有另外一个替代方法来测试阵列冗余性,此法无需安装操作系统或Storage Manager.
首先建立冗余RAID1,5,0/1,0/5。假如你要测试系统能够启动,打开fdisk并创建一个小的DOS分区。重启系统并用/s指令格式化该分区。一旦阵列建立完毕,重启系统并进入SMOR。
一旦进入SMOR,按下Alt+F10+o(字母o而非数字0)。选中RAID阵列中的某一成员,按下Alt+a。跳出的选项之一是“令硬盘失效”。选择该选项就会把该硬盘标为故障盘。为避免阵列的意外损失,此法只能指定一个故障盘。
在指定一个故障盘后,系统应当可以继续正常运行。并且能以降级模式重新启动。
假如您测试热备份功能,一旦“故障盘”按钮按下,热备份盘会介入,并自动开始阵列重建。我们建议在故障仿真中不要使用热备份设置,除非您打算测试特定的功能。
当测试完毕,进入SMOR工具,按下ALT+R并选择重建。确保阵列在做其他测试前完成重建。
小心:上述方法仅作为举例。在模拟故障时要极为小心。总是存在丢失所有的数据的风险。如果您事先未备份关键数据,您可能会永远失去它们。
Q9:怎么才能迫使阵列中失效的硬盘恢复到理想状态?
在阵列中的一个或多个硬盘被标为失效,但是我们相当肯定它们是完好的,能否强行将失效硬盘恢复到理想状态并加回到阵列中,而不必将它们重建回阵列。
的确,当某个硬盘被控制卡认为有故障时,通常假定硬盘存在某种形式的缺陷,应当迅速予以更换,以防止由于阵列总是试图将它重建而导致阵列崩溃。
然而,在极少情况下,硬盘被标为故障,但其实是故障警告过早。也就是说硬盘由于其他某些环境因素而被踢出局且标为“故障盘”,但事实上硬盘没有任何物理问题,完全可以安全地编入现有的阵列中。
发生这种情况时,可以强行把硬盘设回理想状态而不用经过耗时的重建。
下面是操作的具体步骤:
1.         启动系统,按下(Ctrl+A或 Ctrl+D,根据您的系统的具体设定),进入控制卡BIOS。
2.         在控制卡BIOS窗口的右方,选中RAID图标并回车,将图标放大。
3.         选择阵列中处于故障状态的硬盘,同时按下 (Alt + F10 + O) ,注:是字母“O”而不是数字“0”。
4.         然后,按下(Alt + A)进入“执行(Action)”菜单,选择“令其理想化(Make Optimal)
5.         此时,故障盘就恢复到原来的理想状态。继续选择阵列中其他相信是完好的盘直到所有硬盘都达到理想状态。而后,您就可以实施正常的阵列操作。
这种方法适用于阵列中的每个硬盘都被标为“故障”,而其实早先操作系统处于无法访问状态。
但是,假如在任何RAID结构中有两个以上硬盘确实有问题,这个办法就不是恢复硬盘的可行之选,因为被迫理想化的硬盘通常会很快再度失效.


本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u2/66684/showart_1758156.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP