免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 7258 | 回复: 15

SAN奇怪问题求助!!! [复制链接]

论坛徽章:
0
发表于 2009-04-08 14:27 |显示全部楼层
在一个SAN网络中挂载有2个SUN的3510磁盘阵列,使用正常。

后来又接入了一个SUN的6140磁盘阵列,问题就来了:

1、最初是在应用中发现的,业务处理程序出现异常,磁盘IO非常高。
iostat -xtn 1 10
显示应用所在磁盘(是3510阵列中的一个逻辑盘)IO非常高。%b的值近乎100%
2、dmesg信息:

Apr  8 11:37:53 ZZ-K5-SMMC1-PUSH scsi: [ID 799468 kern.info] ssd32 at scsi_vhci0: name g600a0b800048213a0000041749dbbc54, bus address g600a0b800048213a0000041749dbbc54
Apr  8 11:37:53 ZZ-K5-SMMC1-PUSH genunix: [ID 936769 kern.info] ssd32 is /scsi_vhci/ssd@g600a0b800048213a0000041749dbbc54
Apr  8 11:37:54 ZZ-K5-SMMC1-PUSH scsi: [ID 107833 kern.warning] WARNING: /scsi_vhci/ssd@g600c0ff000000000099bd9626d053400 (ssd27):
Apr  8 11:37:54 ZZ-K5-SMMC1-PUSH        Error for Command: write(10)               Error Level: Retryable
Apr  8 11:37:54 ZZ-K5-SMMC1-PUSH scsi: [ID 107833 kern.notice]  Requested Block: 46962192                  Error Block: 46962192
Apr  8 11:37:54 ZZ-K5-SMMC1-PUSH scsi: [ID 107833 kern.notice]  Vendor: SUN                                Serial Number: 626D0534-00
Apr  8 11:37:54 ZZ-K5-SMMC1-PUSH scsi: [ID 107833 kern.notice]  Sense Key: Unit Attention
Apr  8 11:37:54 ZZ-K5-SMMC1-PUSH scsi: [ID 107833 kern.notice]  ASC: 0x29 (power on, reset, or bus reset occurred), ASCQ: 0x0, FRU: 0x0
Apr  8 11:37:54 ZZ-K5-SMMC1-PUSH genunix: [ID 408114 kern.info] /scsi_vhci/ssd@g600a0b800048213a0000041749dbbc54 (ssd32) online
Apr  8 11:37:54 ZZ-K5-SMMC1-PUSH genunix: [ID 834635 kern.info] /scsi_vhci/ssd@g600a0b800048213a0000041749dbbc54 (ssd32) multipath status: degraded, path /pci@7c0/pci@0/pci@1/pci@0,2/SUNW,qlc@1/fp@0,0 (fp0) to target address: w201300a0b848213a,0 is standby Load balancing: round-robin
Apr  8 11:37:55 ZZ-K5-SMMC1-PUSH fctl: [ID 517869 kern.warning] WARNING: fp(1)::N_x Port with D_ID=10700, PWWN=210000e08b85a411 reappeared in fabric
Apr  8 11:37:55 ZZ-K5-SMMC1-PUSH genunix: [ID 834635 kern.info] /scsi_vhci/ssd@g600a0b8000485f500000040349dbbc98 (ssd31) multipath status: optimal, path /pci@7c0/pci@0/pci@1/pci@0,2/SUNW,qlc@2/fp@0,0 (fp1) to target address: w201200a0b848213a,1 is standby Load balancing: round-robin
Apr  8 11:37:55 ZZ-K5-SMMC1-PUSH genunix: [ID 834635 kern.info] /scsi_vhci/ssd@g600a0b800048213a0000041749dbbc54 (ssd32) multipath status: optimal, path /pci@7c0/pci@0/pci@1/pci@0,2/SUNW,qlc@2/fp@0,0 (fp1) to target address: w201200a0b848213a,0 is online Load balancing: round-robin
Apr  8 11:37:56 ZZ-K5-SMMC1-PUSH scsi: [ID 107833 kern.warning] WARNING: /scsi_vhci/ssd@g600c0ff000000000099bd9626d053400 (ssd27):
Apr  8 11:37:56 ZZ-K5-SMMC1-PUSH        Error for Command: write(10)               Error Level: Retryable
Apr  8 11:37:56 ZZ-K5-SMMC1-PUSH scsi: [ID 107833 kern.notice]  Requested Block: 46899968                  Error Block: 46899968
Apr  8 11:37:56 ZZ-K5-SMMC1-PUSH scsi: [ID 107833 kern.notice]  Vendor: SUN                                Serial Number: 626D0534-00
Apr  8 11:37:56 ZZ-K5-SMMC1-PUSH scsi: [ID 107833 kern.notice]  Sense Key: Unit Attention
Apr  8 11:37:56 ZZ-K5-SMMC1-PUSH scsi: [ID 107833 kern.notice]  ASC: 0x29 (power on, reset, or bus reset occurred), ASCQ: 0x0, FRU: 0x0
Apr  8 12:17:01 ZZ-K5-SMMC1-PUSH fctl: [ID 517869 kern.warning] WARNING: fp(1)::GPN_ID for D_ID=10d00 failed
Apr  8 12:17:01 ZZ-K5-SMMC1-PUSH fctl: [ID 517869 kern.warning] WARNING: fp(1)::N_x Port with D_ID=10d00, PWWN=201200a0b848213a disappeared from fabric
Apr  8 12:17:04 ZZ-K5-SMMC1-PUSH fctl: [ID 517869 kern.warning] WARNING: fp(0)::GPN_ID for D_ID=10d00 failed
Apr  8 12:17:04 ZZ-K5-SMMC1-PUSH fctl: [ID 517869 kern.warning] WARNING: fp(0)::N_x Port with D_ID=10d00, PWWN=201300a0b848213a disappeared from fabric
Apr  8 12:17:20 ZZ-K5-SMMC1-PUSH scsi: [ID 243001 kern.info] /pci@7c0/pci@0/pci@1/pci@0,2/SUNW,qlc@2/fp@0,0 (fcp1):
Apr  8 12:17:20 ZZ-K5-SMMC1-PUSH        offlining lun=1 (trace=0), target=10d00 (trace=2800004)
Apr  8 12:17:20 ZZ-K5-SMMC1-PUSH scsi: [ID 243001 kern.info] /pci@7c0/pci@0/pci@1/pci@0,2/SUNW,qlc@2/fp@0,0 (fcp1):
Apr  8 12:17:20 ZZ-K5-SMMC1-PUSH        offlining lun=1f (trace=0), target=10d00 (trace=2800004)
Apr  8 12:17:20 ZZ-K5-SMMC1-PUSH scsi: [ID 243001 kern.info] /pci@7c0/pci@0/pci@1/pci@0,2/SUNW,qlc@2/fp@0,0 (fcp1):
Apr  8 12:17:20 ZZ-K5-SMMC1-PUSH        offlining lun=0 (trace=0), target=10d00 (trace=2800004)

后来把6140从SAN中拔掉,重启了3510阵列。恢复正常。

请高手帮忙分析一下,到底是什么原因导致了上述的异常?

谢谢。

论坛徽章:
0
发表于 2009-04-08 14:43 |显示全部楼层
新加的6140分给了同一台(多台)主机?

multi-path degrade不知道是不是有问题

论坛徽章:
0
发表于 2009-04-08 15:04 |显示全部楼层
新加的6140阵列应该是多台主机都能看到。
多路径启用了的。
应该没有问题吧。

论坛徽章:
0
发表于 2009-04-08 15:34 |显示全部楼层
太复杂,这两款是O的lsi的吧,应该只是failover模式?

zone符合要求?

论坛徽章:
0
发表于 2009-04-08 15:54 |显示全部楼层
看样子总发生fc scsi reset.看看补丁达到6140要求没?6140最好也用最新cam升级到6.60
Solaris 8:
.• STK6X40: Update 4, & 108974-49 &
SFK 4.4.10
Solaris 9:
• STK6X40: FCS, & 113277-44 & SFK
4.4.10
Solaris 10
• STK6X40: Update 2 & 118833-16

论坛徽章:
0
发表于 2009-04-08 15:55 |显示全部楼层
如果fc swtich是brocade的,把porterrshow贴出来看看,并注明阵列连接了那个端口

论坛徽章:
0
发表于 2009-04-08 16:57 |显示全部楼层
Switch 是 brocade的。
明天将porterrshow贴出来。

论坛徽章:
62
洛杉矶湖人
日期:2015-02-10 09:56:11黑曼巴
日期:2016-06-28 17:41:282015-2016NBA季后赛纪念章
日期:2016-06-28 17:41:282016猴年福章徽章
日期:2016-02-18 15:30:34圣安东尼奥马刺
日期:2015-05-04 22:46:00菠菜神灯
日期:2015-05-04 22:35:07新奥尔良黄蜂
日期:2015-03-17 13:54:52明尼苏达森林狼
日期:2015-03-16 21:51:15萨克拉门托国王
日期:2015-03-02 16:10:58华盛顿奇才
日期:2015-03-02 16:10:58迈阿密热火
日期:2015-03-02 16:10:582016科比退役纪念章
日期:2016-06-28 17:41:28
发表于 2009-04-09 16:56 |显示全部楼层

论坛徽章:
0
发表于 2009-05-14 16:03 |显示全部楼层

回复 #1 wstar 的帖子

问题的关键是连接st6140的两个FC口为何会自动消失了呢?难道是光纤有问题?
Apr  8 12:17:01 ZZ-K5-SMMC1-PUSH fctl: [ID 517869 kern.warning] WARNING: fp(1)::N_x Port with D_ID=10d00, PWWN=201200a0b848213a disappeared from fabric
Apr  8 12:17:04 ZZ-K5-SMMC1-PUSH fctl: [ID 517869 kern.warning] WARNING: fp(0)::GPN_ID for D_ID=10d00 failed
Apr  8 12:17:04 ZZ-K5-SMMC1-PUSH fctl: [ID 517869 kern.warning] WARNING: fp(0)::N_x Port with D_ID=10d00, PWWN=201300a0b848213a disappeared from fabric
而后这两个FC又会自动出现。出现的时候就会影响到sun3510的lun,出现一个告警:
Apr  8 11:37:55 ZZ-K5-SMMC1-PUSH fctl: [ID 517869 kern.warning] WARNING: fp(1)::N_x Port with D_ID=10700, PWWN=210000e08b85a411 reappeared in fabric
Apr  8 11:37:55 ZZ-K5-SMMC1-PUSH genunix: [ID 834635 kern.info] /scsi_vhci/ssd@g600a0b8000485f500000040349dbbc98 (ssd31) multipath status: optimal, path /pci@7c0/pci@0/pci@1/pci@0,2/SUNW,qlc@2/fp@0,0 (fp1) to target address: w201200a0b848213a,1 is standby Load balancing: round-robin
Apr  8 11:37:55 ZZ-K5-SMMC1-PUSH genunix: [ID 834635 kern.info] /scsi_vhci/ssd@g600a0b800048213a0000041749dbbc54 (ssd32) multipath status: optimal, path /pci@7c0/pci@0/pci@1/pci@0,2/SUNW,qlc@2/fp@0,0 (fp1) to target address: w201200a0b848213a,0 is online Load balancing: round-robin
Apr  8 11:37:56 ZZ-K5-SMMC1-PUSH scsi: [ID 107833 kern.warning] WARNING: /scsi_vhci/ssd@g600c0ff000000000099bd9626d053400 (ssd27):
Apr  8 11:37:56 ZZ-K5-SMMC1-PUSH        Error for Command: write(10)               Error Level: Retryable
Apr  8 11:37:56 ZZ-K5-SMMC1-PUSH scsi: [ID 107833 kern.notice]  Requested Block: 46899968                  Error Block: 46899968
Apr  8 11:37:56 ZZ-K5-SMMC1-PUSH scsi: [ID 107833 kern.notice]  Vendor: SUN                                Serial Number: 626D0534-00
Apr  8 11:37:56 ZZ-K5-SMMC1-PUSH scsi: [ID 107833 kern.notice]  Sense Key: Unit Attention
Apr  8 11:37:56 ZZ-K5-SMMC1-PUSH scsi: [ID 107833 kern.notice]  ASC: 0x29 (power on, reset, or bus reset occurred), ASCQ: 0x0, FRU: 0x0

[ 本帖最后由 小笨牛 于 2009-5-14 16:05 编辑 ]

论坛徽章:
0
发表于 2009-05-15 10:59 |显示全部楼层
原帖由 wstar 于 2009-4-8 16:57 发表
Switch 是 brocade的。
明天将porterrshow贴出来。


        frames  enc  crc  too  too  bad  enc disc link loss loss frjt fbsy
       tx   rx   in  err shrt long  eof  out   c3 fail sync  sig
     =====================================================================
  0:  2.6g 3.3g   0    0    0    0    0  1.4k  46    0    8   10    0    0
  1:  2.3g 2.5g   0    0    0    0    0  358   44    0    7    9    0    0
  2:  586m 3.0g   0    0    0    0    0  461   49    0    8   10    0    0
  3:  2.0g 1.6g   0    0    0    0    0   60   55    0    4    6    0    0
  4:  2.6g 3.4g   0    0    0    0    0  651   40    0    8   10    0    0
  5:  1.6g 147m   0    0    0    0    0  2.0k  39    0    9   11    0    0
  6:  771m  41m   0    0    0    0    0  2.1k  43    0   10   12    0    0
  7:  346k  21k   0    0    0    0    0   88k   0    0   20   21    0    0
  8:    0    0    0    0    0    0    0    0    0    0    0    2    0    0
  9:    0    0    0    0    0    0    0    0    0    0    0    2    0    0
10:    0    0    0    0    0    0    0    0    0    0    0    2    0    0
11:    0    0    0    0    0    0    0    0    0    0    0    2    0    0
12:    0    0    0    0    0    0    0    0    0    0    0    2    0    0
13:  9.2k 152k   0    0    0    0    0  681    0    1    4    5    0    0
14:  1.6g 2.0g   0    0    0    0    0   25    0    1    2    4    0    0
15:  3.9g 2.0g   0    0    0    0    0  390m 122    0    4    7    0    0
16:    0    0    0    0    0    0    0    0    0    0    0    0    0    0

0-7sun主机
13口6140
14、15口3510
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP