killkill_shadow 发表于 2010-11-03 11:23

DS4800的LUN在控制器之间飘动的问题

一台DS4800,连接两台光线交换机,每个控制器都接到两台光纤交换机上;
主机有两张HBA卡,各连到上述两台光纤交换机上;
主机OS:Windows 2003 x86 安装 IBM System Storage DS4000/FAStT Storage Manager 10.60
控制器微码:07.15.07.00
报错:Logical Drive Not On Preferred Path ,能观察到部分 Array/LUN 飘到到非preferred controller 上。

以前怀疑是Windows MPIO及驱动的问题,下载了10.60的SM安装后故障依旧,重启主机可使Array/LUN恢复到preferred controller上。
手动将Array/Lun挂在preferred controller上后,一旦发生IO,该Array/LUN又会飘到另一个Controller上,继续报Logical Drive Not On Preferred Path 。
出现频率约12小时~24小时。

现在打算Check一下交换机ZONE的配置。
BTW: IBM 推荐的zone配置是不是一个zone里面仅包含一个主机端口和一个存储端口?

lfzw 发表于 2010-11-03 11:32

看一下交换机的日志

无牙 发表于 2010-11-03 11:44

看看你的系统是升级到Windows 2003 Service Pack2和KB932755了?

killkill_shadow 发表于 2010-11-03 11:49

我中午去查一下交换机的日志和zone配置。稍后贴上来。

OS是 Windows 2003 SP2 32bit Enterprise , KB932755 就不清楚以前的管理员有没有打,我再打一次发现这个补丁不会提示以前是否安装,最终还是会装一次 。。。 :shock:

刚才重启了一下主机,Array/LUN飘回到了 preferred controller 上面了,报警解除。

再补充一个现象:
DS4800有多个Array和LUN,分布在Controller A和B,今天早上一共发生了两个Array的飘移,一个从A飘到B,一个从B飘到A。

无牙 发表于 2010-11-03 11:56

IBM是这么建议的:每一个 Zone 必须只包含两个成员,一个对应主机的一张光纤卡的一个端口,另一个对应
DS4000 的一个控制器的一个端口。

killkill_shadow 发表于 2010-11-03 16:57

两个FC交换机的配置很相似:
从0开始编号啊,有SFP的端口是0~7。
其中:
--FC Switch A----FC Switch B--
port   device    port   device
------ -------------- --------
   0   Server       0   Server
   1Storage       1Storage
   2   Server       2   Server
   3                3         
   4   Server       4   Server
   5Storage       5Storage
   6                6         
   7                7   
在 FC Switch B 串口用zoneshow命令查询的输出:
IBM_2005_B16_B:admin> zoneshow                                 
Defined configuration:                                       
cfg:   sw2cfgX3650A_DS4800A; X3650A_DS4800B; X3650B_DS4800A;
                X3650B_DS4800B; X3650C_DS4800; X3650D_DS4800   
zone:X3650A_DS4800A                                       
                Ds4800A_1; X3650A                              
zone:X3650A_DS4800B                                       
                Ds4800B_1; X3650A                              
zone:X3650B_DS4800A                                       
                Ds4800A_1; x3650B                              
zone:X3650B_DS4800B                                       
                Ds4800B_1; x3650B                              
zone:X3650C_DS4800                                          
                1,1; 1,2; 1,5                                 
zone:X3650D_DS4800                                          
                1,1; 1,5; 1,6                                 
alias: Ds4800A_1                                             
                1,0                                          
alias: Ds4800B_1                                             
                1,4                                          
alias: X3650A1,1                                          
alias: x3650B1,5                                          
                                                               
Effective configuration:                                       
cfg:   sw2cfg                                                
zone:X3650A_DS4800A                                       
                1,0                                          
                1,1                                          
zone:X3650A_DS4800B                                       
                1,4                                          
                1,1                                          
zone:X3650B_DS4800A                                       
                1,0                                          
                1,5                                          
zone:X3650B_DS4800B                                       
                1,4                                          
                1,5                                          
zone:X3650C_DS4800                                          
                1,1                                          
                1,2                                          
                1,5                                          
zone:X3650D_DS4800                                          
                1,1                                          
                1,5                                          
                1,6      

killkill_shadow 发表于 2010-11-03 16:58

FC交换的日志没有什么特别有用的信息,除了登陆失败什么的...
交换机是IBM的2005-B16,OEM Brocade的。

killkill_shadow 发表于 2010-11-03 17:16

本帖最后由 killkill_shadow 于 2010-11-03 17:26 编辑

非常奇怪的一件事,我观察的主机是接在FC Switch A和B 的 Port 0 上面的,而含有Port 0 的zone(X3650A_DS4800A 和 X3650B_DS4800A)是主机端口和存储端口1对1的zone.....

而另一台主机的却在那个Host:Storage=1:2的zone中。

这个非常让人郁闷. :cry:

fenglimian 发表于 2010-11-03 17:20

Lun的切换是I/O没有从preferred path去访问,这个应该和mpio有关系,应该是mpio分配I/O的时候分配到了错误的路径,然后导致盘阵端path的切换.

killkill_shadow 发表于 2010-11-03 17:27

回复 9# fenglimian


    我也怀疑是这个问题,但是有没有办法设置 MPIO 的策略呢,Windows的系统。
页: [1] 2 3
查看完整版本: DS4800的LUN在控制器之间飘动的问题