免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 5716 | 回复: 7
打印 上一主题 下一主题

急:hdiskpower丢失 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-11-22 07:09 |只看该作者 |倒序浏览
环境: 操作系统AIX5.3,HA 5.4  IBM P52A机器 分别为APP和DB主机,各自有自己的资源组 EMC磁阵 该系统运行着重要业务
操作目的: 为HA双机(P52A机型)增加SCSI卡,以连接外置磁带机
操作步骤:先将DB主机切换到APP,DB释放资源组和IP,由APP主机接管.操作成功,然后DB主机关机,装SCSI卡.DB关机之后,先将DB上光纤\电源线\网线\心跳线都给拔下来了,安装上SCSI卡后,又重新接上.位置都没有接错.重起DB主机,接磁带机,磁带机正常.起DB系统双机软件,报错:
ERROR: Cluster verification detected that some of the disks on the cluster
use both hdisks and device paths on different nodes. To ensure correct
device processing, please confgure all nodes to use either hdisk
or vpath devices for the following PVIDs:
WARNING: Application monitors are required for detecting application failures
in order for HACMP to recover from them.  Application monitors are started
by HACMP when the resource group in which they participate is activated.
The following application(s), shown with their associated resource group,
do not have an application monitor configured:

  Application Server                Resource Group
  --------------------------------  ---------------------------------
   app_srv                           app_rg
   db_srv                            db_rg

                                                           COMMAND STATUS

Command: running       stdout: yes           stderr: no
之后,检查系统错误:
# errpt -d H
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
0BA49C99   1122032408 T H scsi2          SCSI BUS ERROR
0BA49C99   1122032308 T H scsi2          SCSI BUS ERROR
0BA49C99   1122025008 T H scsi2          SCSI BUS ERROR
lspv发现hdiskpower3丢失:
# lspv
hdisk0          0008f2421ffe51c6                    rootvg          active
hdisk1          0008f24224048f3d                    rootvg          active
hdisk2          none                                None            
hdisk3          none                                None            
hdisk4          none                                None            
hdisk5          none                                None            
hdisk6          none                                None            
hdisk7          none                                None            
hdisk9          none                                None            
hdisk10         none                                None            
hdisk11         none                                None            
hdisk12         none                                None            
hdisk13         none                                None            
hdisk14         none                                None            
hdisk15         none                                None            
hdisk17         none                                None            
hdiskpower0     0008f28847e6dc34                    logvg           
hdiskpower1     0008f28847e5a383                    oravg           
hdiskpower2     0008f28847f149c6                    oravg           
hdiskpower3     none                                None            
hdisk18         none                                None            
hdisk19         none                                None      
检查磁阵状态发现 hdiskpower3链路有问题:
# powermt display dev=all
Pseudo name=hdiskpower2
CLARiiON ID=CK200050800542 [SMG4]
Logical device ID=60060160359414000C2F2F7155BEDC11 [LUN 10]
state=alive; policy=CLAROpt; priority=0; queued-IOs=0
Owner: default=SP B, current=SP B       Array failover mode: 1
==============================================================================
---------------- Host ---------------   - Stor -   -- I/O Path -  -- Stats ---
###  HW Path                I/O Paths    Interf.   Mode    State  Q-IOs Errors
==============================================================================
   1 fscsi1                    hdisk11   SP A1     active  alive      0      0
   1 fscsi1                    hdisk15   SP B1     active  alive      0      0
   0 fscsi0                    hdisk3    SP A0     active  alive      0      0
   0 fscsi0                    hdisk7    SP B0     active  alive      0      0

Pseudo name=hdiskpower3
CLARiiON ID=CK200050800542 [SMG4]
Logical device ID=600601603594140015015EAF59BEDC11 [LUN 20]
state=alive; policy=CLAROpt; priority=0; queued-IOs=0
Owner: default=SP B, current=SP B       Array failover mode: 1
==============================================================================
---------------- Host ---------------   - Stor -   -- I/O Path -  -- Stats ---
###  HW Path                I/O Paths    Interf.   Mode    State  Q-IOs Errors
==============================================================================
   1 fscsi1                    hdisk12   SP A1     active  alive      0      0
   1 fscsi1                    hdisk16   SP B1     active  dead       0      0
   0 fscsi0                    hdisk18   SP B0     active  alive      0      0
   1 fscsi1                    hdisk19   SP B1     active  alive      0      0
   0 fscsi0                    hdisk4    SP A0     active  alive      0      0
   0 fscsi0                    hdisk8    SP B0     active  dead       0      0


各位大哥,有没有碰到这种情况,帮忙分析一下啊.

论坛徽章:
0
2 [报告]
发表于 2008-11-22 09:11 |只看该作者
就算是死了二条路,还有4条是活的,还是能够访问的。EMC上的我碰到过一次小型机重启之后几个盘丢失,然后用lquerypv都看不到pvid等,感觉象是换了一块新盘。
EMC的人也没查出什么问题。由于当时只是备份系统,最后也没有去查出错原因。楼主不会这么惨吧。

论坛徽章:
0
3 [报告]
发表于 2008-11-22 10:38 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
4 [报告]
发表于 2008-11-22 18:18 |只看该作者
目前系统APP依旧正常,所有业务都在APP上跑着,APP访问hdiskpower3正常。DB主机hdiskpower3的pvid丢失。三楼的兄弟升级微码能否给出详解,升级主机微码还是磁阵。今天晚上又要接着奋斗了。

论坛徽章:
0
5 [报告]
发表于 2008-11-23 20:15 |只看该作者
这个盘还在~~~没有丢失,那2条路径是重复的
你现在pvid没有看到,如果hdiskpower3真的在用的话,你需要在另外一台主机上把vg varyoff掉,然后在目前报错主机cfgmr,把pv id刷出来

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
6 [报告]
发表于 2008-11-23 20:27 |只看该作者
典型错误,集群中某一个节点正挂着VG(非Concurrent VG),而其他机器启动的时候,会因为Reservation的原因,不能读取磁盘所致。

论坛徽章:
0
7 [报告]
发表于 2008-11-23 21:29 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
8 [报告]
发表于 2008-11-29 10:27 |只看该作者
感谢各位的支持和帮助,这个问题已经解决,一直都没有时间上来回复结果.操作步骤如下:先在另外一台机器上varyoffvg .然后在出问题的机器上cfgmgr -v,PVID没有识别.之后,chdev -l hdiskpower3 -a pv=yes,PVID识别出来了.
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP