Chinaunix

标题: cluster2.2单节点更换硬件问题 [打印本页]

作者: jisheiry    时间: 2010-03-10 17:44
标题: cluster2.2单节点更换硬件问题
环境:\r\nSUN netra T1405*2\r\nOS Solaris5.6\r\nSUN cluster2.2\r\n\r\n情况:\r\n应用都在主机1上,主机2有硬件故障,需要从机柜上搬下来进行更换。\r\n在主机2上操作:\r\n#scadmin stopnode\r\n#init 0\r\nOK poweroff\r\n主机1上显示主机2已经退出cluster,然后移除主机2的心跳线、网线和电源线进行硬件更换。\r\n\r\n换到一半的时候,忽然发现主机1上有大量报错(以为不会有这样的情况,没有对输出做log,大致是报cluster找不到节点1也就是主机2了),并且部分业务中断。\r\n\r\n问题:\r\n除了没对主机1的输出做log之外,我的操作存在什么错误?\r\n将主机2从cluster模式退出后,心跳线能拔掉吗?如果不能,我该怎么操作才能进行硬件更换呢?(比如需要什么命令能达到允许拔掉心跳线的状态)\r\n\r\n\r\n\r\n\r\n现在业务都恢复了,在寻找原因。我不知道Solaris这边是否还有人关注,但愿还有。
作者: 东方蜘蛛    时间: 2010-03-11 08:57
在关闭其中一个node前请确保锁盘是正常的,否则这样操作的后果很严重
作者: yuhuohu    时间: 2010-03-11 09:48
我觉得操作没问题啊,又没动到存储
作者: jisheiry    时间: 2010-03-11 14:13
多谢各位的解答,过几天还要进行相同环境的硬件更换操作,怕怕的...
作者: 沙中有金    时间: 2010-03-11 17:28
用的什么阵列,那时候都是scsi的吧,看看是不是终结的问题
作者: jisheiry    时间: 2010-03-11 17:55
用的multipack,是SCSI的,但是你说的终结,不明白是什么意思...
作者: zyl555    时间: 2010-03-11 18:19
很大可能就是scsi终结问题了,你换之前,要把所有主机都下电。也就是停业务换。
作者: cwnlinux    时间: 2010-03-11 20:19
主机2更换硬件的时候是不是把连接阵列的SCSI线给拔了,是的话就是SCSI终结问题了。\r\nSCSI的架构决定了SCSI必须是一个回路。所以更换硬件主机2的硬件的时候可以关机,但是SCSI线不能拔。要不就要把两台主机都关机了再进行更换。否则,就会因为SCSI终结问题导致共享盘出错,从而导致应用故障。
作者: jisheiry    时间: 2010-03-12 09:43
了解了,谢谢各位。\r\n这套老设备还在用...而且设备还不少
作者: doging    时间: 2010-03-12 10:10
Netra 1405+ unipack+ cluster +vxvm\r\n\r\n具说这边拔scsi线揽---》那边panic ----》vxvm dg卷组信息丢失
作者: yuanquan44    时间: 2010-03-23 16:13
{:3_190:}我最近也遇到这个系列的机器,现在还没搞定 我热。。




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2