vcdog 发表于 2011-12-23 01:42

ORACLE RAC之--安装过程中碰到的问题及解决方法

<P>ORACLE RAC之--安装过程中碰到的问题及解决方法</P>
<P>&nbsp;</P>
<P>这一篇主要讨论整个RAC安装过程中碰到的问题以及是如何解决的。</P>
<P>错误一:</P>
<P>配置共享磁盘的问题。如果共享磁盘本身有内容,可能会导致在安装完CLUSTERWARE后,执行root.sh时出错,错误信息为:Failed to upgrade Oracle Cluster Registry configuration。</P>
<P>这时可以利用dd命令来清除ocr和voting disk的共享磁盘。类似命令为:</P>
<P>dd if=/dev/zero of=/dev/rdsk/c2t0d2s3 bs=1073741824 count=1</P>
<P>其中of指定需要清除的共享磁盘设备,而bs指定该设备的空间大小。</P>
<P>清除之后,再次运行root.sh,则问题消失。</P>
<P>错误二:</P>
<P>Oracle默认不会使用s0分区,如果指定了s0分区作为ocr或voting disk,那么在执行root.sh时也会收到同样的错误信息:Failed to upgrade Oracle Cluster Registry configuration。</P>
<P>这个时候可以指定其他的分区来替换s0分区。</P>
<P>错误三:</P>
<P>vip找不到public interface的问题。这个问题实际上是Oracle的bug。</P>
<P>Oracle认为192.168.*.*、10.*.*.*、172.16.*.*——172.31.*.*等ip属于private IP。因此无法自动绑定到interface上。</P>
<P>在使用cluvfy工具验证时会出现下面的错误:</P>
<P>ERROR: <BR><FONT color=#ff0000>Could not find a suitable set of interfaces for VIPs.</FONT></P>
<P>而在安装完ClusterWare后,第二个节点执行root.sh脚本之后,会出现下面的错误:</P>
<P>The given interface(s), "ce0" is not public. Public interfaces should be used to configure virtual IPs.</P>
<P>这个的解决方法就是用root身份手工启动VIPCA,进行手工配置。</P>
<P>Oracle对这个问题的详细描述是:Doc ID:Note:316583.1:Subject:VIPCA FAILS COMPLAINING THAT INTERFACE IS NOT PUBLIC。</P>
<P>相关的bug信息是:Bug 4437727 - VIPCA FAILS COMPLAINING THAT INTERFACE IS NOT PUBLIC。</P>
<P>&nbsp;</P>
<P>错误四:</P>
<P>那就是如果没有设置默认的网关信息,那么手工配置VIPCA的时候会出错。</P>
<P>如果/etc/defaultrouter没有正确的配置,那么启动vipca后,进行正确的配置。Oracle会执行6个步骤,Create VIP application resource、Create GSD application resource、Create ONS application resource、Start VIP application resource、Start GSD application resource、Start ONS application resource。</P>
<P>当执行到第四个步骤Starting VIP application resource时后出现错误。错误信息为:</P>
<P><FONT color=#ff0000>CRS-1006: No more members to consider <BR>CRS-0215: Could not start resource 'racnode1-vip'. <BR>CRS-1006: No more members to consider <BR>CRS-0215: Could not start resource 'racnode2-vip'.</FONT></P>
<P>配置了默认路由,就可以解决这个问题了。</P>
<P>错误五:</P>
<P>也是在安装ClusterWare时碰到的。对于绑定PRIVATE ID的概念理解的不是很清晰,在加上cluvfy工具验证时出现的错误:</P>
<P>ERROR: <BR>Could not find a suitable set of interfaces for VIPs.</P>
<P>因此尝试手工通过下面的命令绑定VIP。</P>
<P>ifconfig eth0:1 plumb <BR>ifconfig eth0:1 172.25.198.224 netmask 255.255.0.0 broadcast 172.25.255.255 up</P>
<P>但是Oracle需要自动绑定这个虚拟IP,这种通过手工绑定的方式会导致ClusterWare安装配置IP时出现下面的错误:</P>
<P>SEVERE: The virtual hostname(s), vip-node1,vip-node2, you have specified appears to be already assigned to another system on the network</P>
<P>解决方法就是去掉手工绑定的VIP,通过Oracle的配置工具使得Oracle自动进行绑定。</P>
<P>错误六:</P>
<P>在数据库安装阶段碰到了。在Oracle编译racg_install时出现编译错误。检查log文件发现类似下面的问题:</P>
<P>makefile '/data/oracle/product/10.2/racg/lib/ins_has.mk' 的目标 'racg_install' 时出错。</P>
<P>在make.log中出现类型下面的错误:</P>
<P>racg_install// data /oracle/product/10.2/racg/lib/ins_has.mk:7: /data/oracle/product/10.2/crs/lib/env_has.mk: 没有那个文件或目录 make: *** 没有规则可以创建目标“/data/oracle/product/10.2/crs/lib/env_has.mk”。 停止。</P>
<P>根据错误信息发现是找不到env_has.mk文件造成的问题。而这个错误居然在METALINK和GOOGLE上都找不到产生问题的原因。</P>
<P>到$ORACLE_HOME/crs/lib目录下,确实找不到相应的env_has.mk。但是在$ORACLE_HOME/crs/crs/lib目录下可以找到这个文件。</P>
<P>造成这个错误出现的主要原因是CRS的主目录和ORACLE_HOME主目录出现冲突。</P>
<P>当时设置的ORACLE_HOME是/data/oracle/product/10.2,而安装Oracle的ClusterWare时指定的主目录是/data/oracle/product/10.2/crs。由于两个目录存在着嵌套关系,导致了这个问题的产生。</P>
<P>而后将ORACLE_HOME设置为/data/oracle/product/10.2/database,而Oracle的ClusterWare目录不变,仍为/data/oracle/product/10.2/crs,错误不在出现。</P>
<P>错误七:</P>
<P>在第二次重建系统时出现的。由于存储设备没有进行格式化。因此存储设备本身保留了ASM的配置信息。</P>
<P>这种情况下第一次已经分配的ASM磁盘对于新的ASM实例是不可用的。</P>
<P>解决方法是通过第一个问题中介绍的清除ocr和voting disk的方式来清除裸设备的信息,比如:</P>
<P>dd if=/dev/zero of=/dev/rdsk/c2t0d2s3 bs=1073741824 count=1</P>
<P>更为重要的是,选择ASM磁盘组的时候,不能选择和上次配置同名的磁盘组,否则会出现错误信息:ORA-15032和ORA-15063。</P>
<P>指定另外的ASM磁盘组名称后,问题得以解决。</P>
<P>错误八:</P>
<P>在安装5117016补丁集后出现的节点2上的数据库无法启动的错误。</P>
<P>错误信息为:</P>
<P>ORA-01078: failure in processing system parameters <BR>ORA-01565: error in identifying file '+DISK/testrac/spfiletestrac.ora' <BR>ORA-17503: ksfdopn:2 Failed to open file +DISK/testrac/spfiletestrac.ora <BR>ORA-03113: end-of-file on communication channel</P>
<P>同时从后台的alert文件中可以看到如下的错误:</P>
<P>Errors in file /data/oracle/admin/testrac/udump/testrac2_ora_4598.trc: <BR>ORA-07445: 出现异常错误: 核心转储 [] []</P>
<P>Oracle的Note:390591.1上有详细的描述和解决方法。</P>
<P>整个过程碰到的比较麻烦和难于处理的问题都已经列出来了。安装过程中碰到的小问题更多。可能这些问题对于一个有了一定安装经验的人来说,不算什么。但是对于缺少安装经验的人或者第一次尝试安装RAC环境的人,每个问题都是一次考验。考验你是否进行了充分的知识准备;考验你的问题分析、解决能力;考验你搜索、寻找问题解决方法的能力;最重要的是考验你的信心、耐心和毅力。</P>
页: [1]
查看完整版本: ORACLE RAC之--安装过程中碰到的问题及解决方法