Chinaunix

标题: Legato AAM现场实施记录,与大家共享 [打印本页]

作者: in_my_position    时间: 2007-06-17 11:23
标题: Legato AAM现场实施记录,与大家共享
XX联通Legato Cluster(LAAM)的实施\r\nChinese Dragon\r\n\r\n检查两台机器的安装情况。\r\n搞清楚的块分区是用做应用的共享盘。测试在两个机器上能不能都手工mount\r\n这个分区,挂上之后能不能touch文件,并且这时候,oracle能不能手工启动\r\n,正常使用,正常shutdown.正常umount这块盘,在另一台机器上同样。\r\n搞清楚IP的分配情况。\r\n  \r\n比方说有两台SUN Solaris8的机器,我们先在第一台上安装Legato Cluster软件\r\n该机器比方说叫hbcz-1,将介质放入该机器的CD-ROM中,Solaris会自动mount上,\r\n使用root用户来进行安装,\r\n如:#pkgadd -d /cdrom/avail_replic_products/CLUSTER/SOLARIS/.该过程\r\n没有什么特殊的地方,按缺省的即可。选择全部安装。安装完介质后成功退出。\r\n\r\n接下来我们要设置四个环境变量,他们分别是FT_DIR,FT_DOMAIN,FT_CONSOLE_DIR\r\n和PATH路径(我们完全可以将这些环境变量设置在/etc/profile中),如下所示:\r\nFT_DIR=/opt/LGTOlc451\r\nFT_DOMAIN=HBLT\r\nFT_CONSOLE_DIR=/opt/LGTOlc451/console\r\nPATH=$PATH:/opt/LGTOlc451/bin:/opt/LGTOlc451/console\r\nexport FT_DIR FT_DOMAIN FT_CONSOLE_DIR PATH\r\n\r\n然后,我们需要使用/opt/LGTOlc451/bin/ft_setup进行设置,这里也没有特殊的\r\n,只是Temp License千万不要输错,要不然前面的工作将前功尽弃,在这一步完成\r\n之后我们就可以在这台机器上启动控制台界面了,使用ftconsole\r\n命令。在这里主要有两件事要做,将另一台机器Add Node to Domain,加入主机名\r\n然后确定。当然在这时这另一台机器是No Agent状态了。然后,在Node->;Security\r\n中加入另一台机器的root Account并赋予Full Control权限。\r\n\r\n接下来,我们就可以在另一台机器上面差不多与安装第一台一样的步骤来安装了,\r\n一般都安装在/opt/LGTOlc451的目录下面。然后,运行/opt/LGTOli451/bin/ft_setup\r\n来配置。这时,该节点应该是从节点(secondary Agent),我们需要进入控制台\r\n将该机器提升为 \"主节点\",特别注意:在切换Oracle应用的时候,尤其需要将\r\n两台节点都设置为\'primary Agent\' , 注意:在这个时候可以将第二台机器的root \r\naccount设置为Read Only,这样会避免一些混乱,有的时候会非常头疼的。\r\n\r\n然后,我们可以assign Oracle应用的虚拟IP地址,比如说130.71.1.12,这个地址\r\n只需要在/etc/hosts文件中设置,其余的地方不用管。在assign的时候,因为我们\r\n的/etc/hosts文件中有解析,所以我们可以直接地使用hostname来assign. 在Assign\r\n的时候,我们可以选择将该虚拟的IP assign到哪一台机器的哪块网卡上。而且这些\r\n目标网卡可以是在/etc/hostname.xxx没有设置的网卡,Legato Cluster可以使用。\r\n\r\n\r\n接下来,我们需要配置Data source, SUN Solaris如果使用P1000阵列就比较简单,\r\n就不会使用SDS,一般可能会是UNIX FILE System,这时比较简单,在FS tab file entry\r\n中写全在/etc/vfstab的一整行,比如:\r\n/dev/dsk/c1t5d0s2       /dev/rdsk/c1t5d0s2      /array  ufs     2       no     -\r\n下面是mount点,比如: /array\r\n将该data source 赋予所有的节点,然后做挂接实验,确保两台机器都能完好地挂接。\r\n\r\n然后,将Avail Module的光盘放入第一台机器里,到/opt/LGTOlc451/bin的目录下并执行\r\nftPerl cdrom/cdrom0/Cluster/MODULES/oracle_setup.pl,注意Oracle Home Direcotory\r\n应该输入$ORACLE_HOME目录,SQLxx可以不设,并且请注意,安装时会出现xxOracle.def\r\n文件不存在,不管它。而且,在第二台机器上面,我们不需要用介质安装,只要建一个\r\nlog目录并且授予权限即可,如下所示:\r\n#mkdir $FT_DIR/modules/Oracle/log\r\n#chown oracle $FT_DIR/modules/Oracle/log\r\n#chgrp dba $FT_DIR/modules/Oracle/log\r\n\r\n在这个时候,当你在第一台机器上运行ftconsole的时候,你可以看到有一个名叫oracle\r\n的资源组,编辑该资源组,将应该加入的资源,比如说IP/Datasource等加入进去,然后\r\n请特别注意,一定要存盘,如果不存盘,将不能使用Legato Cluster。在这时候,我们\r\n可以做切换测试了。Oracle的其余东西都不用设置。\r\n\r\n对于有Oracle模块的安装,我们需要注意的有:\r\n  1 Oracle_home/bin下的dbstart和dbshut脚本有没有问题,一般dbshut没有问题,可能\r\n    dbstart会存在问题,有可能我们需要加入一句:  VERSION=\"8.1\"\r\n  2. /var/opt/oracle/目录下有oratab文件,如果该文件不对的话,dbstart和dbshut都\r\n    会有问题,在文件的第一行必须这样写:\r\n        $ORACLE_SIDORACLE_HOME:Y\r\n  \r\n常见的问题:\r\n  如果重新启动两台计算机,在计算机都启动起来之后,有时你会发现节点1显示节点1的\r\nagent在runing,而节点2的状态是Failed,相反在节点2上你会发现节点2的agent在runing\r\n,而节点1的状态是Failed,解决这个问题的办法是:\r\n  在每一台机器的/opt/LGTOlc451/bin的下面创建两个文件:1 start_cluster\r\n  2 stop_cluster ,这两个文件的内容是/etc/rc3.d/S32LGTOlc451_HBLT start和\r\n  /etc/rc3.d/S32LGTOlc451_HBLT stop,分别chmod 777 start_cluster和\r\n  chmod 777 stop_cluster,那么在出现这个问题之后,在任意一台机器上先执行stop_cluster\r\n  ,然后再使用start_cluster启动,那么请再耐心地等一会,你会发现两台机器的agent都\r\n是runing .  \r\n\r\n如何测试:\r\n   1. 在Legato Cluster的console界面上,使用relocate 选项可以将Resource group切换到\r\n      另一台机器上面去\r\n   2. 比方说,现在resource group在节点1上,那么我们可以将节点1 reboot,那么过一会,\r\n      resource group会切换到节点2上面去。但是在节点1启动起来的时候,有可能在节点2\r\n      上还会认为是Failed,所以需要人为地执行stop_cluster脚本和start_cluster.\r\n   3. 还有一种方式是拔网线,比如说oracle的虚拟IP在qfe3网卡上面,现在resource group\r\n      运行在节点1上,那么当我们将节点1的qfe3的网线拔掉的时候,过一会,resource group\r\n      会切换到节点2上面。\r\n\r\nXX联通的网卡配置:\r\n\r\n   Node1: hostname:hbcz-1:  有5块网卡\r\n        hme0: 用做系统用(telnet) etc/下有hostname.hme0(hbcz-1)  IP: 130.71.1.13\r\n        qfe0: 用做心跳线           etc/下有hostname.qfe0(hb-1)    IP: 172.30.30.1\r\n        qfe1: 用做心跳线           etc/下有hostname.qfe1(hb-2)    IP: 172.30.31.1\r\n        qfe2: 没有用到\r\n        qfe3: 用做Oracle应用       etc/下没有文件,Cluster管      IP: 130.71.1.12\r\n\r\n   Node2: hostname:hbcz-2:  有5块网卡\r\n        hme0: 用做系统用(telnet) etc/下有hostname.hme0(hbcz-2)  IP: 130.71.1.14\r\n        qfe0: 用做心跳线           etc/下有hostname.qfe0(hb-01)    IP: 172.30.30.2\r\n        qfe1: 用做心跳线           etc/下有hostname.qfe1(hb-02)    IP: 172.30.31.2\r\n        qfe2: 没有用到\r\n        qfe3: 用做Oracle应用       etc/下没有文件,Cluster管      IP: 130.71.1.12\r\n\r\n\r\n    \r\n                                            编写:Chinese Dragon
作者: haohan111    时间: 2007-06-17 12:10
讲的有道理,好文章,长知识了




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2