免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2987 | 回复: 0
打印 上一主题 下一主题

[存储备份] PCI-X SCSI RAID Controller for AIX参考指南(3) [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-08-05 12:23 |只看该作者 |倒序浏览
PCI-X SCSI RAID控制器维护



这部分内容主要是提供辅助信息,确保PCI-X SCSI RAID控制器发挥最佳的性能
为了避免PCI-X SCSI RAID控制器和disk array出现问题,需要注意下面的提示:
1)在物理的替换或移除RAID卡或disk array的member时,总是执行正常系统关机。正常系统关机将冲掉卡
  的write cache和移除在卡和pdisks之间的依存关系。通过在控制器上执行rmdev(例如,rmdev -Rl
  sisioa3)可以实现同样的效果。
  注意:在系统继续运行的情况下,pdisks当作为一个Degraded disk array的Failed 成员时,可以被
       替换和disk array reconstructed。
2)你可以物理的把pdisks从一个卡移到另外一个卡上,然而,如果pdisks是一个disk array的成员时,确
  保从group里移除所有的disks。在disk的迁移前,确保disk array不是处于Degraded的状态(由于
  disk failure)。

3)当物理的除去一块pdisks(作为一个disk array的成员),不需要保留其中的数据且不需要在使用这个
  disk array,在移除disks前删除disk array。这个操作可以在下次这些disk被再次使用时避免disk-|
  array 相关问题出现。

4)总是使用SCSI和SCSI RAID Hot Plug管理器去移除和替换pdisk。

5)如果一个disk array在在被作为启动设备使用,因为一个可疑disk array问题,系统启动失败,使用
  standalone diagnostic盘启动。使用在standalone diagnostics中的Error Log Analysis,
  AIX error logs,PCI-X SCSI Disk Array管理器和其他可获得的工具来帮助确定和解决disk
  array 的问题
6)不要尝试通过交换卡和磁盘来解决问题,除非你在服务操作的指导下这么做。使用Error Log Analysis
  去决定什么样的操作被执行和何时执行,依据合适的MAPs(问题诊断)。如果多个错误在几乎同一个时间发
  生,需要仔细查看,如果是通常的错误,可作为整体去考虑。

7)不用对cache directory card困扰,它只是一个带圆形按钮电池的小的长方形的卡(对于cache
  card)。nonvolatile write cache memory被集成到整体的卡之上,对于新的卡,被集成到可移除的
  cache card上.memroy本身不能被移除,它是通过大的、可充电的cache Battery pack的电池维持的。
  cache directory card只包含另外一份write cache directory的拷贝,没有cache data,除了在
  MAPs中的特定原因,永远不要移除。
8)不要在没有依照本节和MAPs中的步骤的情况下,拔开或交换一个cache battery pack。

9)当为PCI-X SCSI RAID控制器调用diagnostic routines过程中,推荐使用Problem Determination
(PD)模式,而不是使用System Verification(SV)模式,除非有特定的原因要求使用SV模式(例如,MAP
指导使用SV模式)。
10)当PCI-X SCSI RAID控制器的diagnostic routines处于SV模式时,推荐使用在PD模式下进行
   diagnostics来确保新的错误可以被分析。这些操作在使用standalone diagnostic盘的特别要执行。



*****升级PCI-X SCSI RAID控制器微码*****
确认是否对PCI-X SCSI RAID控制器需要升级,按照要求执行:
http://techsupport.services.ibm.com/server/mdownload/download.html
如果升级需要,按步骤下载。
安装更新到PCI-X SCSI RAID控制器,按照以下步骤。
1.执行smit
2.选择devices
3.选择disk array
4.选择IBM PCI-X SCSI Disk Array
5.选择Download microcode to a PCI-X SCSI RAID Controller
6.选择CI-X SCSI RAID Controller.
7.按照指导完成更新



*****changing pdisks to hdisks*****
改变Array Candidate pdisks(522 bytes/sector)为standalone hdisks(512 bytes/sector),
必须删除和格式化pdisks
注意: pdisks是disk arrya 的成员或hot spares时不能被改变为standalone hdisks。

改变pdisks为standalone hdisks,执行下列步骤:
1.打开PCI-X SCSI Disk Array Manager管理器
2.选择Change/Show PCI=X SCSI pdisk status
3.选择delete an array candidate pdisk and format to 512 byte sectors
4.选择合适的PCI-X SCSI RAID控制器
5.选择522 bytes/sector pdisks to be formatted to 512 bytes/sector standalone hdisks
注意:执行此操作将格式化disks。所有盘上的数据将丢失。当格式化完成时,pdisk被删除并被hdisk替代。



*****Rechargeable Battery维护*****
可充电电池维护任务在此节介绍,包括现实可充电电池信息,强迫一个可充电电池error状态以及
替换rechargeable cache battery pack.


显示可充电电池信息
1.打开PCI-X SCSI Disk Array Manager
2.选择Diagnostics and Recovery Options
3.选择Controller Rechargeable Battery Maintenance
4.选择display controller Rechargeable battery information
5.选择PCI-X SCSI RAID Controller
6.屏幕信息显示如下:



可充电电池信息显示有如下参数
RAID Adapter:
被选择的控制器的名字

Battery Type:
rechargeable cache battery pack的类型

Battery State:标识是否有与rechargeable cache battery pack相关的错误情况存在。
                     可能的值包括:
                     No Battery warning/error
                     没有警告或错误情况存在
                     warning condition
                     当前存在一个警告信息,且错误已经被logged
                     error condition
                     当前存在一个错误信息,且错误已经被logged
                     unknown
                     没有可获得的信息去确认是否当前存在警告或错误信息
Power-on time(days):
标识Rechargeable cache battery pack的raw power-on time(单位为天)
Adjusted power-on time(days):
标识Rechargeable cache battery pack的adjusted(prorated) power-on time(单位为天)
注:一些rechargeable cache battery packs受高温度影响。因此可prorated的时间基于在各种周围温度影响下使用的时间

Estimated time to warning(days):
estimated time(单位为天),直到信息显示替换Rechargeable cache battery pack需要被提到日程当中。
estimated time to error(days):
estimated time(单位为天),知道一个错误信息被报告,表明rechargeable cache battery pack必须被替换。

concurrently maintainable battery pack:
标识在卡在运转同时,rechargeable cache battery pack可以被替换

Battery pack can be safely replaced:
标识卡的write cache已经被disabled,且rechargeable cache battery pack能被安全替换。



*****foring a rechargeable battery error*****

此选项允许你强制PCI-X SCSI RAID Controller使之Cache battery pack处于error状态。此状态需要电池的替换。通常,执行此任务可以确保write cache先于cache battery pack替换前停止工作。

强制电池处于错误状态将出现下面的情况:
1)系统日志出现error
2)在选择的控制器上data caching变为disable
3)系统性能处于degraded状态,直到cache battery pack在选择的控制器上被替换。

确保有有正确型号和性能的cache battery packs完成替换操作。继续正常的操作替换cache battery pack.

强迫电池处于error状态,执行下列操作:
1.打开PCI-X SCSI Disk Array Manager
2.选择Diagnostics and Recovery Options
3.选择Controller Rechargeable Battery Maintenance
4.选择Force Controller Rechargeable Battery Error
5.选择需要替换电池的PCI-X SCSI RAID控制器
注:使用此选项将把电池置于error状态,使之需要被替换
6.enter确认
7.替换cache battery pack,按照"Replacing th Rechargeable Cache Battery Pack"中的描述



*****Replacing the Rechargeable Cache Battery Pack*****

此章节提供了对rechargeable cache battery pack替换的指导

:当替换cache battery pack时,在连接新电池前电池必须被断开连接至少60秒。这是让卡认识到电视
   被替换的最小的时间值。

警告: 如果cache battery pack没有处于error状态,在进行阻止数据丢失的活动前,按照在"Forcing
      a Rechargeable Battery Error"中的操作执行。电池处于error状态后,用新电池做替换的操作
      如下:

procedure for non-concurrently maintainable battery packs

1.确认替换cache  battery pack是否处于安全状态,可以通过”displaying rechargeable battery information"获得信息。在“battery pack can be safely replaced”后显示yes表明替换cache battery pack处于安全状态
2.从系统中移除卡
3.使用以下的图解去定位所使用的卡的类型



A battery pack casing
              B cache directory card(不要对它操作)
1.plastic rivet pins

4.移除连接电池单元和卡的插头
5.做以下操作中的一项
   ->对卡而言,如果是有硬塑料casing包裹的电池,压紧A充卡上移除电池单元。从电池casing中移除电池
     单元。保护电池casing可以再次使用在替换的batterypack上
   ->对电池而言,如果是被附加到卡之上通过钉子,从卡的背面操作去移除塑料的两个pins。一个移除塑料
     rivets的提示是使用适中的课伸缩的圆珠笔,在可伸缩的位置,去挤压钉子通过battery pack的tab
   
     注:确保cache battery pack在连接新电池前断开连接至少60秒。这是让卡认识到电视被替换的最小
        的时间值。
6.通过相反的操作过程安装新的cache battery pack
procedure for concurrently maintainable battery packs
1.确认替换cache  battery pack是否处于安全状态,可以通过"displaying rechargeable battery
  information"获得信息。在“battery pack can be safely replaced”后显示yes表明替换cache
  battery pack处于安全状态
2.使用下面图解去定位metal cover(A)控制着batterypack,从push-rivet上拔出并放开metal cover(A)



A Battery Pack Cover
B Cache Diretory Card
3.轻拔插头,通过挤压retaining latch,移除连接电池单元和卡的插头
  注:插头(plug)只适合一种方向插入,因此在替换过程中不能不正确的插入
4.通过轻拔,移除battery unit
5.安装新的cache battery pack通过相反的操作
6.重新启动卡的write cache,通过以下步骤:
   1)启动PCI-X SCSI Disk Array Manager
   2)选择Diagnostics and Recovery Options
   3)选择start adapter cache
   4)选择需要替换电池的PCI-X SCSI RAID Controller
   5)enter确认
   
   这些操作步骤只在有Isolation Procedure(MAP)的指导下执行
   
   
*****Replacing pdisks*****

如有可能尽快替换Failed pdisks,甚至在一个控制器的重建操作开始的情况下(有hot spare)。在SCSI and SCSI RAID Hot Plug Manger 中Replace/REmove a Device Attached to an SCSI Hot Swap Enclosure Device可以用来替换Failed pdisks.PCI-X SCSI Disk Array Manager提供了SCSI AND SCSI RAID Hot Plug Manager的shortcut。SCSI  and SCSI RAID Hot Plug Manager允许执行下面的任务。
1)列出所有SCSI hot swp slots和他们的conternts
2)Set  the  identify  indication  for  a  device  attached  to  a  SCSI  hot  swap  enclosure  device
3)添加一个 device到SCSI hot swap enclosure device
4)替换和删除a hot swap device
5)配置已添加和替换的devices


启动SCSI and SCSI RAID Hot Plug Manager,执行以下步骤:
1.启动PCI-X SCSI Disk Array Manager
2.选择Diagnostics and Recovery Options
3.选择SCSI and SCSI RAID Hot Plug Manager
4.选择你需要执行的操作,并按照屏幕的指示完成所选择的操作
警告: 总是为attached到PCI-X SCSI RAID控制器上的设备使用SCSI and SCSI RAID Hot Plug Manager。不要使用为其他RAID产品准备的工具,例如RAID Hot Plug Devices



*****Reconvery Procedures for Disk Failures*****

PCI-X SCSI RAID控制器依据RAID级别不同,处理磁盘故障的方法不同。
此章节描述每种RAID级别的恢复过程

RAID级别0
一个单盘的故障将导致一个RAID级别0的array 变为 Failed状态。删除disk array上的逻辑卷和文件系统,从卷组中移除disk array,删除disk array ,替换Failed disk,然后重新创建disk array。
然后必须把disk array重新加入到卷组中,重新创建disk array逻辑卷和文件系统,从备份介质中拷贝数据回到被回复的disk array中。


RAID级别5
1)单盘故障
无论何时RAID级别5的disk array中有单个磁盘变为Failed状态,disk array状态都会变为Degraded.由于Failed disk上的数据通过使用还保留的disks上的parity和data能被重建,disk array保持原有的功能。无论何时disk被标记为Failed,尽可能早替换。如果hot spare disk被定义,控制器可以自动重建数据在上面。如果hot spare 没有被控制器发起,替换Failed disk,然后发起reconstruct
发起reconstruct,执行以下步骤:
1.启动PCI-X SCSI Disk Array Manager
2.选择Reconstruct a PCI-X SCSI Disk Array
3.进行之前,确保已经替换了Failed disk
4.选择需要reconstruct的pdisk

2)多盘故障
如果RAID级别5的disk array中的第二块盘故障,array将被标识为Failed,数据将不可以被访问。删除disk array上的逻辑卷和文件系统并从卷组中移除disk array,删除disk array,
替换Failed disks,然后重新创建disk array。必须增加disk array到卷组,重新创建disk array逻辑卷和文件系统,从备份介质中拷贝数据到恢复的disk array中。

RAID级别6
1)单盘和双盘故障
无论何时RAID级别6的disk array中的单盘或两块盘变为Failed state,disk array状态将变为Degraded。由于Failed disk上的数据通过使用还保留的disks上的"P"和"Q"parity和data能被重建,disk array保持原有的功能。
无论何时disk被标记为Failed,尽可能早替换。如果hot spare disk被定义,控制器可以自动重建数据在上面。如果hot spare 没有被控制器发起,替换Failed disk,然后发起reconstruct发起reconstruct,执行以下步骤:
1.启动PCI-X SCSI Disk Array Manager
2.选择Reconstruct a PCI-X SCSI Disk Array
3.进行之前,确保已经替换了Failed disk
4.选择需要reconstruct的pdisk

2)三块盘故障
如果RAID级别6的disk array中的第三块盘故障,array将被标识为Failed,数据将不可以被访问。删除disk array上的逻辑卷和文件系统并从卷组中移除disk array,删除disk array,替换Failed disks,然后重新创建disk array。必须增加disk array到卷组,重新创建disk array逻辑卷和文件系统,从备份介质中拷贝数据到恢复的disk array中。
RAID级别10

1)单盘故障
无论何时RAID级别10的disk array中的单盘变为Failed state,disk array状态将变为Degraded。由于Failed disk上的数据也可以通过使用存储在mirrored pair上的其他成员的数据获得,disk array保持原有的功能。
无论何时disk被标记为Failed,尽可能早替换。如果hot spare disk被定义,控制器可以自动重建数据在上面。如果hot spare 没有被控制器发起,替换Failed disk,然后发起reconstruct发起reconstruct,执行以下步骤:
1.启动PCI-X SCSI Disk Array Manager
2.选择Reconstruct a PCI-X SCSI Disk Array
3.进行之前,确保已经替换了Failed disk
4.选择需要reconstruct的pdisk

2)多盘故障
如果每个Failed disk属于不同的mirrored pair,array将处于Degraded状态(由于每个Failed disk上的数据依旧可以通过mirrrored pair获得)。恢复过程对于这种情况下河单盘故障情况相同。替换完Failed disks后,发起reconstruct操作。
当mirrrord pair中的两个成员fail,disk array状态将被变为Failed.删除disk array上的逻辑卷和文件系统并从卷组中移除disk array,删除disk array,替换Failed disks,然后重新创建disk array。必须增加disk array到卷组,重新创建disk array逻辑卷和文件系统,从备份介质中拷贝数据到恢复的disk array中。


本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u/28303/showart_2018480.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP