免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 13515 | 回复: 5
打印 上一主题 下一主题

[故障求助] P570双VIO报警 冰天雪地盼好心 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-12-09 17:01 |只看该作者 |倒序浏览
我这里一台生产物理机,双VIOS,悲惨的是 双双报错...


先HMC 截图:



3个报错的细节如下:






然后我去两台VIOS上查看errpt log:

第一台VIOS# errpt | head -20

IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION

E86653C3   1208232815 P H LVDD           I/O ERROR DETECTED BY LVM

747725D9   1208232815 P H hdisk2         DISK OPERATION ERROR

12296806   1208232815 T H sissas0        SAS ERROR

12296806   1208232815 T H sissas0        SAS ERROR

80D3764C   1208232815 U H LVDD           PV NO LONGER RELOCATING NEW BAD BLOCKS

E86653C3   1208232815 P H LVDD           I/O ERROR DETECTED BY LVM

747725D9   1208232815 P H hdisk2         DISK OPERATION ERROR

80D3764C   1208232815 U H LVDD           PV NO LONGER RELOCATING NEW BAD BLOCKS

E86653C3   1208232815 P H LVDD           I/O ERROR DETECTED BY LVM

747725D9   1208232815 P H hdisk2         DISK OPERATION ERROR

80D3764C   1208232815 U H LVDD           PV NO LONGER RELOCATING NEW BAD BLOCKS

E86653C3   1208232815 P H LVDD           I/O ERROR DETECTED BY LVM

747725D9   1208232815 P H hdisk2         DISK OPERATION ERROR

E86653C3   1208232815 P H LVDD           I/O ERROR DETECTED BY LVM

747725D9   1208232815 P H hdisk2         DISK OPERATION ERROR

12296806   1208232815 T H sissas0        SAS ERROR

12296806   1208232815 T H sissas0        SAS ERROR


另外一台类似:

第二台VIOS# errpt

IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION

DCB47997   1116134515 T H hdisk1         DISK OPERATION ERROR

DCB47997   1111234315 T H hdisk1         DISK OPERATION ERROR


看起来 可能硬盘怀了,但是我看到报警的hdisk上的LV貌似正常(是否要检查更多):

第一台VIOS:# lspv | grep hdisk2

hdisk2          00c99e90b290c499                    LPAR_ROOTVG     active

# lspv -l hdisk2

hdisk2:

LV NAME               LPs     PPs     DISTRIBUTION          MOUNT POINT

TEDW_rvg              400     400     00..219..181..00..00  N/A

sgsniyzsyslog         293     293     219..00..00..00..74   N/A

TEMSTEPS1_rvg         400     400     00..00..37..218..145  N/A

# lsvg -l LPAR_ROOTVG

LPAR_ROOTVG:

LV NAME             TYPE       LPs     PPs     PVs  LV STATE      MOUNT POINT

TEDW_rvg            jfs        400     400     1    open/syncd    N/A

RTEMS1PR_rvg        jfs        400     400     1    open/syncd    N/A

TEMSTEPS1_rvg       jfs        400     400     1    open/syncd    N/A

sgsniyznetview      jfs        293     293     1    open/syncd    N/A

sgsniyzsyslog       jfs        293     293     1    open/syncd    N/A

RTEMS1PRAPPSvg      jfs        120     120     1    open/syncd    N/A

RTEMS3_SRV_dvg      jfs        160     160     1    open/syncd    N/A

# lspath | grep hdisk2

Enabled   hdisk2 sas0


第二台VIOS# lspv | grep hdisk1

hdisk1          00c99e90b02de13b                    LPAR_ROOTVG     active

# lspv -l hdisk1

hdisk1:

LV NAME               LPs     PPs     DISTRIBUTION          MOUNT POINT

TEDW_rvg              400     400     00..00..144..218..38  N/A

sgsniyzsyslog         293     293     00..219..74..00..00   N/A

# lsvg -l LPAR_ROOTVG

LPAR_ROOTVG:

LV NAME             TYPE       LPs     PPs     PVs  LV STATE      MOUNT POINT

TEDW_rvg            jfs        400     400     1    open/syncd    N/A

RTEMS1PR_rvg        jfs        400     400     1    open/syncd    N/A

sgsniyznetview      jfs        293     293     1    open/syncd    N/A

sgsniyzsyslog       jfs        293     293     1    open/syncd    N/A

RTEMS1PRAPPSvg      jfs        120     120     1    open/syncd    N/A

RTEMS3_SRV_dvg      jfs        160     160     1    open/syncd    N/A

TEMSTEPS11_rvg      jfs        400     400     1    open/syncd    N/A

# lspath | grep hdisk1

Enabled   hdisk1 sas1


诚心求教各位大哥 ,如果需要更详细的信息 我更新下

论坛徽章:
0
2 [报告]
发表于 2015-12-10 15:49 |只看该作者
好心人呢...我可能要换VIOS硬盘了,什么方案较好啊

论坛徽章:
0
3 [报告]
发表于 2015-12-10 16:52 |只看该作者
没看出多严重的问题来啊
你从哪儿看出来要更换硬盘?
看看vg中stale pp的情况

lsvg xxvg

论坛徽章:
0
4 [报告]
发表于 2015-12-15 16:02 |只看该作者
回复 3# hello_unix

版主大大好~

这个VIOS盘现在隔三差五的报警 errpt 里的 P H ,一来就好几条(在主楼里有),但是LP PP状态确实目前显示正常

$ lsvg LPAR_ROOTVG
VOLUME GROUP:       LPAR_ROOTVG              VG IDENTIFIER:  00c99e9000004c0000000130b290c4d1
VG STATE:           active                   PP SIZE:        128 megabyte(s)
VG PERMISSION:      read/write               TOTAL PPs:      4420 (565760 megabytes)
MAX LVs:            1024                     FREE PPs:       2354 (301312 megabytes)
LVs:                7                        USED PPs:       2066 (264448 megabytes)
OPEN LVs:           7                        QUORUM:         2 (Enabled)
TOTAL PVs:          3                        VG DESCRIPTORS: 3
STALE PVs:          0                        STALE PPs:      0
ACTIVE PVs:         3                        AUTO ON:        yes
MAX PPs per VG:     1048576                  MAX PVs:        1024
LTG size (Dynamic): 1024 kilobyte(s)         AUTO SYNC:      no
HOT SPARE:          no                       BB POLICY:      relocatable
   
我找了hardware工程师,他们建议我换掉那个盘,以防万一,也是烦报警。

现在我主要是对于这个换VIOS盘的方案有个想法,因为这个VIOS盘所在的VG里有个好盘剩余空间足够,所以我想能不能用 migratepv -lv xxxx hdisk2 hdisk5
但是有个疑问: 1 能不能这么去操作 上层建了LPAR的 LV   2 如果能这么操作 会不会对LPAR有很大影响  3 需不需要改map关系 毕竟数据换到了另外一个物理盘
很头疼,希望版主大大给点建议 :)


论坛徽章:
0
5 [报告]
发表于 2015-12-20 16:00 |只看该作者
如果有槽位的话,把更换的硬盘加上去,然后扩vg,migratepv的方式来做最简单
migratepv不能跨vg哦,注意

论坛徽章:
0
6 [报告]
发表于 2015-12-21 17:05 |只看该作者
回复 5# hello_unix

嗯嗯 我已经开了change处理完了
一开始也是想用migratepv的方式,但是物理盘坏块了,migrate失败,后来只好用比较麻烦的方法 破除盘上LV所在的lpar里的mirror rootvg, 破除VIO里的map,换盘,map,LPAR里mirror
还是谢谢拉 :)


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP