免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: 26320401
打印 上一主题 下一主题

[存储备份] 求教:P630更换内置磁盘 [复制链接]

论坛徽章:
0
1 [报告]
发表于 2008-12-23 23:21 |显示全部楼层
Disk Replacement (Local rootvg hot-swapped SCSI disk)

When a failed local disk is detected, the SA should open a hardware call with IBM support (with the pSeries S/N  prtconf ), and run diagnostics to determine the disk is real failed.
a)        Check the error log for relevant errors.
errpt |more
errpt –aN hdiskname | more
b)        Check and record disk attribute (S/N and location )
lscfg –vl hdiskname  
c)        Check VG membership for disk
lspv –L hdiskname
d)        Check VG
lsvg –L rootvg
lsvg –p rootvg
e)        Check LV on the disk
lspv –l hdiskname
lsvg –l rootvg
f)        Remove any unmirrored LV on the disk
rmlv lvname
g)        Unmirror rootvg from disk
Unmirrorvg rootvg hdiskname
h)        Remove disk from VG
reducevg rootvg hdiskname
i)        Use # diag to physically identify the disk in the server (LED blink )
diag->task selection ->hot plug task -> SCSI and SISC RAID hot plug manage -> identify a device attached to a SCSI hot swap enclosure device
j)        Remove device definitions for disk
rmdev –d –l hdiskname
lspv | more  (check)
k)        Physical replace the disk, same or larger size than the failed disk, check S/N
l)        add new disk in rootvg
cfgmgr –v                      Create the newdisk device definition
lspv                           Check
extendvg rootvg newdisk          Add the disk to rootvg
lspv                           Check
mirrorvg rootvg newdisk          Mirror VG
syncvg –v rootvg                Sync VG
bosboot –a –d /dev/ newdisk
Chvg –a’y’ –Q’n’ –x’n’ rootvg
bootlist –m normal -o
m)        recreate the removed LV
n)        check final configuration
boot_check -y     verify your work done

论坛徽章:
0
2 [报告]
发表于 2008-12-23 23:23 |显示全部楼层
1. The disk failure infomation.

iedm2b02:root:/home/fkung1
# errpt   
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
49A83216   0127030008 T H hdisk0         DISK OPERATION ERROR
49A83216   0127023408 T H hdisk0         DISK OPERATION ERROR
2F3E09A4   0127011208 I H hdisk0         REPAIR ACTION
49A83216   0127003608 T H hdisk0         DISK OPERATION ERROR
49A83216   0127003008 T H hdisk0         DISK OPERATION ERROR

DIAG
Advanced Diagnostics Routines
System Verification
Problem Determination

No trouble was found.  However, the resource was not tested because
the device driver indicated that the resource was in use.

The resource needed is
- hdisk0           U1.1-P1/Z1-A8        16 Bit LVD SCSI Disk Drive (36400 MB)

Use Enter to continue.

1.1 Call IBM System Support.
Jacques (J.) Br...        01A0 - Server error; Command not accepted while NOT in Retract. Disk need replace.         


2. Replace disk
2.1make sure all lv's are mirrored
# lsvg -l rootvg

2.2 Unmirror hdisk0
# unmirrorvg -c 1 rootvg hdisk0
# reducevg rootvg hdisk0

2.3 Replace the failing disk
# DIAG

-> Task Selection
-> Hot Plug Task                                                                                                         -> SCSI and SCSI RAID Hot Plug Manager
-> Identify a Device Attached to a SCSI Hot Swap Enclosure Device
Selecting a slot will set the LED indicator to Identify.

Make selection, use Enter to continue.

                U1.1-
  ses0            P1/Z1-AF
     slot  1      P1/Z1-A8             hdisk0
     slot  2                           [empty slot]
     slot  3      P1/Z1-AA             hdisk1
     slot  4                           [empty slot]
  

                                  lqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqk
                                  x Processing data ...                                  x
F1=Help                        Escmqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqj
SCSI and SCSI RAID HOT PLUG MANAGER                                                                                   
-> REMOVE OR REPLACE DEVICE ATTACHED TO A SCSI HOT SWAP ENCLOSURE DEVICE                                                 802485

The following is a list of configured, unconfigured and populated
SCSI Hot Swap Enclosure device slots. Select a slot to remove or
replace the device attached to that slot.
ENSURE THAT NO OTHER HOST IS USING THE DEVICE BEFORE REMOVING IT.

Make selection, use Enter to continue.

                 U1.1-
  ses0            P1/Z1-AF
     slot  1      P1/Z1-A8             hdisk0
     slot  3      P1/Z1-AA             hdisk1


                                   
                                  lqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqk
                                  x Running rmdev on hdisk0                              x
F1=Help                        Escmqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqj

            X The LED should be in the Remove state for the        x
            x selected device.                                     x
            x                                                      x
            x You may now remove or replace the device.            x
            x Use 'Enter' to indicate you are finished.            x
            x                                            

-> REMOVE OR REPLACE DEVICE ATTACHED TO A SCSI HOT SWAP ENCLOSURE DEVICE                                                

The following is a list of configured, unconfigured and populated
SCSI Hot Swap Enclosure device slots. Select a slot to remove or
replace the device attached to that slot.
ENSURE THAT NO OTHER HOST IS USING THE DEVICE BEFORE REMOVING IT.

Make selection, use Enter to continue.

                U1.1-
  ses0            P1/Z1-AF
     slot  1                           [populated]
     slot  3      P1/Z1-AA             hdisk1





                                  lqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqk
                                  x Processing data ...                                  x
F1=Help                        Escmqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqj

-> Configure Added/Replaced Devices



            lqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqk
            x Configuring scsi0                                    x
F1=Help     mqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqq




                                  lqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqk
                                  x                                                      x
                                  x Building Resource Database.                          x
                                  x Please stand by.                                     x
                                  mqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqqj



iedm2d15:root:/
# lspv hdisk0
0516-304 : Unable to find device id hdisk0 in the Device
        Configuration Database.

# extendvg rootvg hdisk0
0516-1254 extendvg: Changing the PVID in the ODM.
iedm2b02:root:/home/fkung1
# lspv                  
hdisk0          00293f7abb3ed790                    rootvg          active
hdisk1          00293f7a06546bcf                    rootvg          active

iedm2b02:root:/home/fkung1
# mirrorvg rootvg hdisk0 hdisk1
0516-1124 mirrorvg: Quorum requirement turned off, reboot system for this
        to take effect for rootvg.
0516-1126 mirrorvg: rootvg successfully mirrored, user should perform
        bosboot of system to initialize boot records.  Then, user must modify
        bootlist to include:  hdisk1 hdisk0.

iedm2b02:root:/home/fkung1
# bosboot -a  

bosboot: Boot image is 33055 512 byte blocks.

iedm2b02:root:/home/fkung1
# bootlist -om normal hdisk0 hdisk1
hdisk0 blv=hd5
hdisk1 blv=hd5

iedm2b02:root:/
# lsvg -l rootvg
rootvg:
LV NAME             TYPE       LPs   PPs   PVs  LV STATE      MOUNT POINT
hd5                 boot       1     2     2    closed/syncd  N/A
hd6                 paging     64    128   2    open/syncd    N/A
hd8                 jfs2log    1     2     2    open/syncd    N/A
hd4                 jfs2       2     4     2    open/syncd    /
hd2                 jfs2       48    96    2    open/syncd    /usr
hd9var              jfs2       9     18    2    open/syncd    /var
hd3                 jfs2       4     8     2    open/syncd    /tmp
hd1                 jfs2       4     8     2    open/syncd    /home
hd10opt             jfs2       4     8     2    open/syncd    /opt
admin               jfs2       2     4     2    open/syncd    /admin
hd7                 sysdump    4     8     2    open/stale    N/A
unixsup             jfs2       30    60    2    open/syncd    /unixsup

iiedm2b02:root:/
# lspv
hdisk0          00293f7abb3ed790                    rootvg          active
hdisk1          00293f7a06546bcf                    rootvg          active
hdisk2          none                                None            
hdisk3          none                                None            
vpath0          00293f7ae01d2ed8                    vg01            active
hdisk4          none                                None            
hdisk5          none                                None            
vpath1          00293f7a68894181                    vg01            active
hdisk6          none                                None            
hdisk7          none                                None            
vpath2          00293f7ad2009f0d                    vg01            active

iedm2b02:root:/
# diag
-> Task Selection (Diagnostics, Advanced Diagnostics, Service Aids, etc.)
-> Log Repair Action
-> Choose hdisk0 and enter
   Esc+7 to Commit   

A repair action for each of the following resources have been
logged. Obsolete error log entries for these resources will no
longer be analyzed by diagnostics.

    hdisk0

Use Enter to continue.
REPAIR ACTION COMPLETED

iedm2b02:root:/
# errpt
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
2F3E09A4   0127055908 I H hdisk0         REPAIR ACTION
2F3E09A4   0127055708 I H hdisk0         REPAIR ACTION
49A83216   0127030008 T H hdisk0         DISK OPERATION ERROR

49A83216   0127023408 T H hdisk0         DISK OPERATION ERROR
2F3E09A4   0127011208 I H hdisk0         REPAIR ACTION
49A83216   0127003608 T H hdisk0         DISK OPERATION ERROR
49A83216   0127003008 T H hdisk0         DISK OPERATION ERROR

论坛徽章:
0
3 [报告]
发表于 2008-12-23 23:31 |显示全部楼层
另外要特别注意下面的问题:
主要针对sysdumpdev
1. remove any unmirrored LV before unmirror the failed disk but boot disk.
2. if the LV is mirred, you need not do this.

我的意思是如果sysdump 没有mirroe,先mirror了,这样省事。如果不需要可以换完盘之后再unmirror。

[ 本帖最后由 allanwang77 于 2008-12-23 23:46 编辑 ]

论坛徽章:
0
4 [报告]
发表于 2008-12-23 23:34 |显示全部楼层
这是IBM的标准操作程序,不知道能不能帮到你。如果情况不一样,要查书。

论坛徽章:
0
5 [报告]
发表于 2008-12-25 00:43 |显示全部楼层
我感觉好像不能由此判断hdisk2 坏了,只是显示nbudata vg中的 /NBUFP6 没有 sync, 应该先syncvg 看能不能解决而不是马上换盘。
大家怎么看?

另外,应该运行diag 先诊断确实是hdisk2 坏了才更换。

[ 本帖最后由 allanwang77 于 2008-12-25 00:50 编辑 ]

论坛徽章:
0
6 [报告]
发表于 2009-01-07 03:07 |显示全部楼层
哥哥,我实在没话说了。那么完整的操作程序你不按照做utu:" /> 另外,给你的命令后面的选项如果你不明白,不能就省了,应该去man一下,知道为什么要加他。
学习要系统,虽然是练习,也不能靠撞大运吧。

论坛徽章:
0
7 [报告]
发表于 2009-01-07 03:08 |显示全部楼层
按照我的操作程序重新来,还来得及。你多玩几趟,有可能就真乱套了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP