- 论坛徽章:
- 0
|
一起事故处理,给大家共享一下,在很多老设备上会发生的:
系统硬件平台:N1125 x 2 + MultiPack x 2
系统软件平台:Solaris 2.6 98/05 + SC2.2
在cluster的一个节点的系统全部毁坏(硬盘损坏,镜像失效),通过从另外一个的节点系统恢复毁坏的系统。
在cluster 2.2的系统中,两台主机的文件系统的主要差别在于两台主机的主机名称不相同,IP地址存在不同,以及volume manager的license 不相同,其余的系统的补丁版本,系统的配置文件或者cluster软件的配置文件都是完全的相同。
因此在恢复系统的时候,我们可将出现故障的主机的硬盘插入到工作正常的系统中去,将工作正常的系统拷贝到新插入的硬盘上,在数据拷贝完成后,修改拷贝数据上的主机名和IP地址的配置文件,然后在新插入的硬盘上创建引导分区,对新插入的硬盘做Volume Manager的解封装的步骤。
将新插入的硬盘从工作正常的机器上拔出,并插入回原有的系统。这个时候故障主机便能够正常启动了,且能够加入到cluster中。
在故障主机上重新创建rootdg,如果原有的系统有本地硬盘镜像,则将镜像重新创建。
处理过程
以下例子中1号机为故障主机,2号机为工作正常的主机。
1.将故障主机的硬盘拔下,在确保拔下的硬盘为无故障的情况下,插入到2号机器上的空余槽位上。否则会引起2号机器的非正常工作。
2.在2号机器上识别到新插入的硬盘上。
# drvconfig;disks;devlinks
# format(用于检查是否已经认识到新硬盘)
3.采用format命令对新插入的硬盘进行重新分区,创建与原有的硬盘相同的分区大小和标志。注意,不要采用硬盘的第3,4分区,同时需要系统还要保留最少100M的空间。
4.对分区做文件系统。(以下为举例说明,具体情况可能各不相同。)
# newfs /dev/rdsk/c0t1d0s0
# newfs /dev/rdsk/c0t1d0s5
5.将文件系统挂接上临时目录并将2号机器的系统拷贝到新插入的硬盘上。
# mkdir /tmp/root2;mkdir /tmp/opt2
# mount /dev/dsk/c0t1d0s0 /tmp/root2; mount /dev/dsk/c0t1d0s5 /tmp/opt2
# ufsdump 0f - /dev/rdsk/c0t0d0s0 | (cd /tmp/root2; ufsrestore xf -)
# ufsdump 0f - /dev/rdsk/c0t0d0s5 | (cd /tmp/opt2; ufsrestore xf -)
6.修改新硬盘上的主机名和IP地址的配置文件,如下文件需要修改。
/etc/hosts
/etc/hostname*
/etc/nodename
/etc/net/*/hosts
7.删除原有硬盘的rootdg信息
删除/etc/system中两行
rootdev:/pseudo/vxio@0:0
set vxio:vol_rootdev_is_volume=1
创建install-db文件
在/tmp/root2/etc/vx/reconfig.d/state.d/目录中touch 一个文件 install-db
# touch /tmp/root2/etc/vx/reconfig.d/state.d/install-db
修改vfstab文件,如果原有的系统采用封装的方式则需要将vfstab文件中的volume改为dsk的形式,如果原有的系统中采用一个分区创建的rootdg则不用修改该文件。
#vi /tmp/root2/etc/vfstab
8.umount临时文件系统并创建引导块
# cd / ; umount /tmp/root2; umount /tmp/opt2
#/usr/sbin/installboot /usr/platform/`uname -i`/lib/fs/ufs/bootblk \\ /dev/rdsk/c0t1d0s0。
9.将新插入的硬盘拔出,并插还原到1号机器的正确的插槽中。并启动1号机器。
10.在1号机器正常启动结束后,输入1号机器的原有的volume manager的license。
# vxlicense -c
11.在1号机器上创建rootdg
创建rootdg的方式有两种,一个是采用一个分区的方式创建rootdg,一个是采用封装整个硬盘的方式创机rootdg,这需要看原有系统是如何配置的。具体的创建步骤由SUN工程师来完成。
在创建完成rootdg后系统就恢复正常了并可以成功加到cluster 中。 |
|