免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4925 | 回复: 5
打印 上一主题 下一主题

系统重启后,与存储阵列的连接会莫名丢失!紧急求助~ [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-04-11 11:20 |只看该作者 |倒序浏览
某项目,硬件环境为:
HP DL380G5 两台
HP FC2242SR HBA卡2块,分别装在两台服务器上
HP 光纤交换机一台
HP MSA1000盘阵

RedHat Linux Enterprise Server 4 Update 5

安装完操作系统后,所有驱动都识别正常,盘阵上划分的分区也都能找到。

(借用一下别人显示信息,我的是类似!)
#fdisk -l
Disk /dev/cciss/c0d0: 146.7 GB, 146778685440 bytes
255 heads, 32 sectors/track, 35132 cylinders
Units = cylinders of 8160 * 512 = 4177920 bytes

           Device Boot    Start       End    Blocks   Id  System
/dev/cciss/c0d0p1   *         1        64    261104   83  Linux
/dev/cciss/c0d0p2            65     10383  42101520   83  Linux
/dev/cciss/c0d0p3         10384     15542  21048720   83  Linux
/dev/cciss/c0d0p4         15543     35132  79927200    f  Win95 Ext'd (LBA)
/dev/cciss/c0d0p5         15543     20701  21048704   83  Linux
/dev/cciss/c0d0p6         20702     24828  16838144   82  Linux swap
/dev/cciss/c0d0p7         24829     35132  42040304   83  Linux

Disk /dev/sda: 83.8 GB, 83884277760 bytes
255 heads, 63 sectors/track, 10198 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes

   Device Boot    Start       End    Blocks   Id  System
/dev/sda1             1     10198  81915403+  83  Linux

Disk /dev/sdb: 377.4 GB, 377488408064 bytes
255 heads, 63 sectors/track, 45893 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes

   Device Boot    Start       End    Blocks   Id  System
/dev/sdb1             1     45893 368635491   83  Linux


重启服务器后,发现服务器与盘阵的连接丢失。

#fdisk -l
Disk /dev/cciss/c0d0: 146.7 GB, 146778685440 bytes
255 heads, 32 sectors/track, 35132 cylinders
Units = cylinders of 8160 * 512 = 4177920 bytes

           Device Boot    Start       End    Blocks   Id  System
/dev/cciss/c0d0p1   *         1        64    261104   83  Linux
/dev/cciss/c0d0p2            65     10383  42101520   83  Linux
/dev/cciss/c0d0p3         10384     15542  21048720   83  Linux
/dev/cciss/c0d0p4         15543     35132  79927200    f  Win95 Ext'd (LBA)
/dev/cciss/c0d0p5         15543     20701  21048704   83  Linux
/dev/cciss/c0d0p6         20702     24828  16838144   82  Linux swap
/dev/cciss/c0d0p7         24829     35132  42040304   83  Linux


再重启,又会出现。并不是每次重启服务器都会丢失,机率大概是2/5,丢失以后再重启一下又好了。

上网查了一下,说是有可能是HBA卡的问题。打电话给HP的工程师,他以前也没有遇到过这种情况。不太可能是盘阵的问题,上面的数据都是完好,只是与服务器的连接丢失。

请教一下各位高人,这到底是怎么一回事?小弟是超级新手,第一次接触这类设备。不胜感谢~~~~

论坛徽章:
0
2 [报告]
发表于 2008-04-18 09:26 |只看该作者
让hp或redhat的工程师上门啊,买了服务白花钱啊,不行让他们一起来

论坛徽章:
0
3 [报告]
发表于 2008-04-18 09:33 |只看该作者
你需要查看一下,没有看到盘的时候
HBA卡的驱动模块有没有加载上,再查看dmesg信息,你这样之说现象,除非有人碰到过相同的情况,否则很难帮你查找问题所在

论坛徽章:
0
4 [报告]
发表于 2008-04-18 16:28 |只看该作者
HP的800估计已经被我骚扰死了,也问过HP的工程师,无非是说升级驱动,重装系统之类的,根本没办法解决!再有就说想办法检查HBA卡,如果是硬件问题就能更换,问题是我不知道怎么样检测HBA卡,现在也不是不能用,就是出现这种一会儿好一会不好的问题,真的是头痛啊!

不管能不能用fdisk l 看到/dev/sda1 设备,dsmeg 下的 HBA卡的驱动模块都是加载上的!

论坛徽章:
0
5 [报告]
发表于 2008-04-22 09:23 |只看该作者
原帖由 itrobbie 于 2008-4-18 16:28 发表
HP的800估计已经被我骚扰死了,也问过HP的工程师,无非是说升级驱动,重装系统之类的,根本没办法解决!再有就说想办法检查HBA卡,如果是硬件问题就能更换,问题是我不知道怎么样检测HBA卡,现在也不是不能用, ...



看不到盘阵的时候,把HBA卡驱动模块 modprobe -r XXX 然后再 modprobe XXX  看看有什么信息输出么?

论坛徽章:
0
6 [报告]
发表于 2008-04-22 10:07 |只看该作者
关键要看你的dmesg的信息是什么,把能识别和不能识别的dmesg信息拿来对比一下应该有收获。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP