DS4800的LUN在控制器之间飘动的问题
一台DS4800,连接两台光线交换机,每个控制器都接到两台光纤交换机上;主机有两张HBA卡,各连到上述两台光纤交换机上;
主机OS:Windows 2003 x86 安装 IBM System Storage DS4000/FAStT Storage Manager 10.60
控制器微码:07.15.07.00
报错:Logical Drive Not On Preferred Path ,能观察到部分 Array/LUN 飘到到非preferred controller 上。
以前怀疑是Windows MPIO及驱动的问题,下载了10.60的SM安装后故障依旧,重启主机可使Array/LUN恢复到preferred controller上。
手动将Array/Lun挂在preferred controller上后,一旦发生IO,该Array/LUN又会飘到另一个Controller上,继续报Logical Drive Not On Preferred Path 。
出现频率约12小时~24小时。
现在打算Check一下交换机ZONE的配置。
BTW: IBM 推荐的zone配置是不是一个zone里面仅包含一个主机端口和一个存储端口? 看一下交换机的日志 看看你的系统是升级到Windows 2003 Service Pack2和KB932755了? 我中午去查一下交换机的日志和zone配置。稍后贴上来。
OS是 Windows 2003 SP2 32bit Enterprise , KB932755 就不清楚以前的管理员有没有打,我再打一次发现这个补丁不会提示以前是否安装,最终还是会装一次 。。。 :shock:
刚才重启了一下主机,Array/LUN飘回到了 preferred controller 上面了,报警解除。
再补充一个现象:
DS4800有多个Array和LUN,分布在Controller A和B,今天早上一共发生了两个Array的飘移,一个从A飘到B,一个从B飘到A。 IBM是这么建议的:每一个 Zone 必须只包含两个成员,一个对应主机的一张光纤卡的一个端口,另一个对应
DS4000 的一个控制器的一个端口。 两个FC交换机的配置很相似:
从0开始编号啊,有SFP的端口是0~7。
其中:
--FC Switch A----FC Switch B--
port device port device
------ -------------- --------
0 Server 0 Server
1Storage 1Storage
2 Server 2 Server
3 3
4 Server 4 Server
5Storage 5Storage
6 6
7 7
在 FC Switch B 串口用zoneshow命令查询的输出:
IBM_2005_B16_B:admin> zoneshow
Defined configuration:
cfg: sw2cfgX3650A_DS4800A; X3650A_DS4800B; X3650B_DS4800A;
X3650B_DS4800B; X3650C_DS4800; X3650D_DS4800
zone:X3650A_DS4800A
Ds4800A_1; X3650A
zone:X3650A_DS4800B
Ds4800B_1; X3650A
zone:X3650B_DS4800A
Ds4800A_1; x3650B
zone:X3650B_DS4800B
Ds4800B_1; x3650B
zone:X3650C_DS4800
1,1; 1,2; 1,5
zone:X3650D_DS4800
1,1; 1,5; 1,6
alias: Ds4800A_1
1,0
alias: Ds4800B_1
1,4
alias: X3650A1,1
alias: x3650B1,5
Effective configuration:
cfg: sw2cfg
zone:X3650A_DS4800A
1,0
1,1
zone:X3650A_DS4800B
1,4
1,1
zone:X3650B_DS4800A
1,0
1,5
zone:X3650B_DS4800B
1,4
1,5
zone:X3650C_DS4800
1,1
1,2
1,5
zone:X3650D_DS4800
1,1
1,5
1,6 FC交换的日志没有什么特别有用的信息,除了登陆失败什么的...
交换机是IBM的2005-B16,OEM Brocade的。 本帖最后由 killkill_shadow 于 2010-11-03 17:26 编辑
非常奇怪的一件事,我观察的主机是接在FC Switch A和B 的 Port 0 上面的,而含有Port 0 的zone(X3650A_DS4800A 和 X3650B_DS4800A)是主机端口和存储端口1对1的zone.....
而另一台主机的却在那个Host:Storage=1:2的zone中。
这个非常让人郁闷. :cry: Lun的切换是I/O没有从preferred path去访问,这个应该和mpio有关系,应该是mpio分配I/O的时候分配到了错误的路径,然后导致盘阵端path的切换. 回复 9# fenglimian
我也怀疑是这个问题,但是有没有办法设置 MPIO 的策略呢,Windows的系统。