免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3470 | 回复: 6
打印 上一主题 下一主题

sun cluster安装配置问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-08-20 02:24 |只看该作者 |倒序浏览
环境是在虚拟机上安装进行的 Solaris 10 10/09  cluster 3.2 11/09  
   配置sun cluster出现这样情况,停留到这里就没有反映 不再往下进行继续配置节点1了  (说明此时2节点test02已经重启完成):
  
  群集创建

    日志文件 - /var/cluster/logs/install/scinstall.log.6313

    正在测试 "/globaldevices"(在 "test01" 上)...完成
    正在测试 "/globaldevices"(在 "test02" 上)...完成

    启动群集传输配置的搜索功能。

    从此节点 (test01) 所配置的所有传输适配器中发出探测信号。 但是, 所有其
    他 节点都未接收到这些探测信号。 产生这一现象的原因有很多, 其中包括 电
    缆 连接不当或转换器被探测信号干扰等。

    您可以尝试解决问题并再次尝试探测,也可以手动配置传输。为了解决问题,
    可能会涉及到重新连接电缆、更改配置或修复硬件。您必须手动配置传输才能
    在同一专用互连 VLAN 上配置标记的 VLAN 适配器和非标记的 VLAN 适配器。

    是否要重试 (yes/no) [yes]?  


    已搜索到以下连接:

     test01:e1000g2  switch1  test02:e1000g2
        test01:e1000g3  switch2  test02:e1000g3

    完成群集传输配置的搜索。

    已在 "test01" 上启动 cluster check 。
    已在 "test02" 上启动 cluster check 。

    cluster check 已完成,没有出现 "test01" 的错误或警告。
    cluster check 已完成,没有出现 "test02" 的错误或警告。


   正在配置 "test02" ...完成
    正在重新引导 "test02" ...

就一直停留到这无反应。。。

打印日志如下:


*** 创建新群集 ***
2010年08月19日 星期四 22时49分14秒 CST

    正在试图联系 "test02" ...

    正在搜索远程配置方法...

scrcmd -N test02 test isfullyinstalled
The Sun Cluster framework software is installed.
scrcmd 到 "test02" - 返回状态 1。

rsh test02 -n "/bin/sh -c '/bin/true; /bin/echo SC_COMMAND_STATUS=\$?'"
SC_COMMAND_STATUS=0
rsh 到 "test02" - 返回状态 0。

ssh root@test02 -o "BatchMode yes" -o "StrictHostKeyChecking yes" -n "/bin/sh -c '/bin/true; /bin/echo SC_COMMAND_STATUS=\$?'"
没有 RSA 主机密钥对于 test02 是已知的,并且您已要求严格检查。
主机密钥校验失败。
ssh 到 "test02" 失败。

    Sun Cluster 框架能够完成配置进程,而不必访问远程 shell。

    正在检测网络地址 172.16.0.0(在适配器 e1000g2 上)>> 不重复 ... 完成    正在检测网络地址 172.16.0.0(在适配器 e1000g3 上)>> 不
重复 ... 完成----------------------------------
- 群集创建 -
----------------------------------

    正在测试 "/globaldevices"(在 "test01" 上)...
    正在测试 "/globaldevices"(在 "test02" 上)...

scrcmd -N test02 chk_globaldev fs /globaldevices


    启动群集传输配置的搜索功能。

===========================
test01
===========================
scrconf -n cmd=discover_send,adapters=e1000g2:e1000g3,vlans=0:0,token=suncluster_test-cluster,sendcount=30

===========================
test02
===========================

scrcmd -N test02 autodiscovery 0:0 suncluster_test-cluster 2 30
quit

===========================

    从此节点 (test01) 所配置的所有传输适配器中发出探测信号。 但是, 所有其
    他 节点都未接收到这些探测信号。 产生这一现象的原因有很多, 其中包括 电
    缆 连接不当或转换器被探测信号干扰等。

    您可以尝试解决问题并再次尝试探测,也可以手动配置传输。为了解决问题,
    可能会涉及到重新连接电缆、更改配置或修复硬件。您必须手动配置传输才能
    在同一专用互连 VLAN 上配置标记的 VLAN 适配器和非标记的 VLAN 适配器。

===========================
test01
===========================
scrconf -n cmd=discover_send,adapters=e1000g2:e1000g3,vlans=0:0,token=suncluster_test-cluster,sendcount=30

===========================
test02
===========================

scrcmd -N test02 autodiscovery 0:0 suncluster_test-cluster 2 30
e1000g2:0:test01:e1000g2:0
e1000g3:0:test01:e1000g3:0
quit

===========================

    已搜索到以下连接:

        test01:e1000g2  switch1  test02:e1000g2
        test01:e1000g3  switch2  test02:e1000g3

    完成群集传输配置的搜索。

    已在 "test01" 上启动 cluster check 。
    已在 "test02" 上启动 cluster check 。

    cluster check 已完成,没有出现 "test01" 的错误或警告。
    cluster check 已完成,没有出现 "test02" 的错误或警告。

===========================
test01
===========================

/usr/cluster/lib/scadmin/lib/cmd_sccheck
cluster check -X -k installtime -v -o /var/cluster/logs/install/cluster_check
  initializing...
  initializing xml output...
  loading auxiliary data...
  filtering out checks not marked with one of keywords: installtime
  starting check run...
     test01:     M6708613       skipped: not a keyword match
     test01:     S6708496.... starting:  Cluster node (3.1 or later) OpenBoot Prom (O...
     test01:     S6708496       not applicable
     test01:     M6336822       skipped: not a keyword match
     test01:     S6708255       skipped: not a keyword match
     test01:     S6708479       skipped: not a keyword match
     test01:     S6708586       skipped: not a keyword match
     test01:     S6708502       skipped: not a keyword match
     test01:     S6708599       skipped: not a keyword match
     test01:     S6708605.... starting:  The /dev/rmt directory is missing.         
     test01:     S6708605       passed
     test01:     S6708589       skipped: not a keyword match
     test01:     S6708592       skipped: not a keyword match
     test01:     S6708606.... starting:  Multiple network interfaces on a single subn...
     test01:     S6708606       passed
     test01:     S6708644       skipped: not a keyword match
     test01:     S6708638.... starting:  Node has insufficient physical memory.      
     test01:     S6708638       passed
     test01:     S6708641       skipped: not a keyword match
     test01:     S6708689       skipped: not a keyword match
     test01:     S6708642.... starting:  /proc fails to mount periodically during reb...
        searching /var/adm/messages
        searching /var/adm/messages.0
        searching /var/adm/messages.1
     test01:     S6708642       passed
  finished check run
  finishing xml output...
  Maximum severity of all violations: No Violations
  Reports in: /var/cluster/logs/install/cluster_check/
  cleaning up...
***************************************************************************
*
*       cluster check           (ver 1.0)
*
***************************************************************************

    Report Date:        2010.08.19 at 23.13.27 CST
                        2010.08.19 at 15.13.27 GMT
    Command run on host:
                        3275f063- test01
    Checks run on nodes:
                        test01

    Unique Checks: 5

===========================================================================
*
*       Summary of Single Node Check Results for test01
*
===========================================================================
        
        Checks Considered: 5
        
        Results by Status
        -----------------
            Violated          :   0
            Insufficient Data :   0
            Execution Error   :   0
            Unknown Status    :   0
            Information Only  :   0
            Not Applicable    :   1
            Passed            :   4
        
        Violations by Severity
        ----------------------
            Critical          :   0
            High              :   0
            Moderate          :   0
            Low               :   0
        
---------------------------------------------------------------------------
*
*       Details for 1 Not Applicable Check on test01
*
---------------------------------------------------------------------------

        *  Check ID: S6708496  ***
        --------------------------
            *  Severity: Moderate

            *  Problem Statement: Cluster node (3.1 or later) OpenBoot Prom (OBP) has local-mac-address? variable set to 'false'.

            *  Applicability: Applicable to SPARC architecture only.

---------------------------------------------------------------------------
*
*       Details for 4 Passed Checks on test01
*
---------------------------------------------------------------------------

        *  Check ID: S6708605  ***
        --------------------------
            *  Severity: Critical

            *  Problem Statement: The /dev/rmt directory is missing.


        *  Check ID: S6708606  ***
        --------------------------
            *  Severity: Moderate

            *  Problem Statement: Multiple network interfaces on a single subnet have the same MAC address.


        *  Check ID: S6708638  ***
        --------------------------
            *  Severity: Moderate

            *  Problem Statement: Node has insufficient physical memory.


        *  Check ID: S6708642  ***
        --------------------------
            *  Severity: Critical

            *  Problem Statement: /proc fails to mount periodically during reboots.



===========================================================================
*
*       End of Report 2010.08.19 at 23.13.27 CST
*
===========================================================================

===========================
test02
===========================

scrcmd -N test02 sccheck
cluster check -X -k installtime -v -o /var/cluster/logs/install/cluster_check
  initializing...
  initializing xml output...
  loading auxiliary data...
  filtering out checks not marked with one of keywords: installtime
  starting check run...
     test02:     M6708613       skipped: not a keyword match
     test02:     S6708496.... starting:  Cluster node (3.1 or later) OpenBoot Prom (O...
     test02:     S6708496       not applicable
     test02:     M6336822       skipped: not a keyword match
     test02:     S6708255       skipped: not a keyword match
     test02:     S6708479       skipped: not a keyword match
     test02:     S6708586       skipped: not a keyword match
     test02:     S6708502       skipped: not a keyword match
     test02:     S6708599       skipped: not a keyword match
     test02:     S6708605.... starting:  The /dev/rmt directory is missing.         
     test02:     S6708605       passed
     test02:     S6708589       skipped: not a keyword match
     test02:     S6708592       skipped: not a keyword match
     test02:     S6708606.... starting:  Multiple network interfaces on a single subn...
     test02:     S6708606       passed
     test02:     S6708644       skipped: not a keyword match
     test02:     S6708638.... starting:  Node has insufficient physical memory.      
     test02:     S6708638       passed
     test02:     S6708641       skipped: not a keyword match
     test02:     S6708689       skipped: not a keyword match
     test02:     S6708642.... starting:  /proc fails to mount periodically during reb...
        searching /var/adm/messages
        searching /var/adm/messages.0
        searching /var/adm/messages.1
     test02:     S6708642       passed
  finished check run
  finishing xml output...
  Maximum severity of all violations: No Violations
  Reports in: /var/cluster/logs/install/cluster_check/
  cleaning up...
***************************************************************************
*
*       cluster check           (ver 1.0)
*
***************************************************************************

    Report Date:        2010.08.19 at 23.13.09 CST
                        2010.08.19 at 15.13.09 GMT
    Command run on host:
                        1db0c67f- test02
    Checks run on nodes:
                        test02

    Unique Checks: 5

===========================================================================
*
*       Summary of Single Node Check Results for test02
*
===========================================================================
        
        Checks Considered: 5
        
        Results by Status
        -----------------
            Violated          :   0
            Insufficient Data :   0
            Execution Error   :   0
            Unknown Status    :   0
            Information Only  :   0
            Not Applicable    :   1
            Passed            :   4
        
        Violations by Severity
        ----------------------
            Critical          :   0
            High              :   0
            Moderate          :   0
            Low               :   0
        
---------------------------------------------------------------------------
*
*       Details for 1 Not Applicable Check on test02
*
---------------------------------------------------------------------------

        *  Check ID: S6708496  ***
        --------------------------
            *  Severity: Moderate

            *  Problem Statement: Cluster node (3.1 or later) OpenBoot Prom (OBP) has local-mac-address? variable set to 'false'.

            *  Applicability: Applicable to SPARC architecture only.

---------------------------------------------------------------------------
*
*       Details for 4 Passed Checks on test02
*
---------------------------------------------------------------------------

        *  Check ID: S6708605  ***
        --------------------------
            *  Severity: Critical

            *  Problem Statement: The /dev/rmt directory is missing.


        *  Check ID: S6708606  ***
        --------------------------
            *  Severity: Moderate

            *  Problem Statement: Multiple network interfaces on a single subnet have the same MAC address.


        *  Check ID: S6708638  ***
        --------------------------
            *  Severity: Moderate

            *  Problem Statement: Node has insufficient physical memory.


        *  Check ID: S6708642  ***
        --------------------------
            *  Severity: Critical

            *  Problem Statement: /proc fails to mount periodically during reboots.



===========================================================================
*
*       End of Report 2010.08.19 at 23.13.09 CST
*
===========================================================================

===========================



===========================
test02
===========================


scrcmd -N test02 test isinstalling
"" is not running.

scrcmd -N test02 test isconfigured
Sun Cluster is not configured.

    正在配置 "test02" ...

scrcmd -N test02 install -logfile /var/cluster/logs/install/scinstall.log.6313 -k -C test-cluster -F -T node=test01,node=test02,auth
type=sys -w netaddr=172.16.0.0,netmask=255.255.240.0,maxnodes=64,maxprivatenets=10,numvirtualclusters=12 -A trtype=dlpi,name=e1000g2
-A trtype=dlpi,name=e1000g3 -B type=switch,name=switch1 -B type=switch,name=switch2 -m endpoint=:e1000g2,endpoint=switch1 -m endpoi
nt=:e1000g3,endpoint=switch2

正在检查用于全局设备文件系统的设备 ...完成

正在将群集名初始化为 "test-cluster" ...完成
正在初始化验证选项 ...完成
正在初始化适配器 "e1000g2" 的配置 ...完成
正在初始化适配器 "e1000g3" 的配置 ...完成
正在初始化交换机 "switch1" 的配置...完成
正在初始化交换机 "switch2" 的配置...完成
正在初始化电缆配置 ...完成
正在初始化电缆配置 ...完成
正在初始化专用网络地址选项 ...完成



正在为 "test02" 设置节点 ID ...完成 (id=1)


正在检查全局设备中的全局文件系统 ...完成
正在更新 vfstab ...完成

正在检验是否配置了 NTP ...完成
正在初始化 NTP 配置...完成

正在更新 nsswitch.conf ...完成

正在将群集节点条目添加到 /etc/inet/hosts 中...完成


正在配置 IP 多路径组 ...完成


正在检验是否未配置电源管理 ...完成
正在取消电源管理配置 ...完成
已将 /etc/power.conf 重命名为 /etc/power.conf.081910231404
电源管理与群集的 HA 目标不兼容。
请勿试图重新配置电源管理。

请确保已禁止网络路由 ...完成
已通过创建 /etc/notrouter 在此节点上禁止网络路由。
Sun Cluster 不支持将群集节点用作路由器。
请勿重新激活网络路由。

请重新引导此计算机。


日志文件 - /var/cluster/logs/install/scinstall.log.6313


scrcmd -N test02 test hasbooted
This node has not yet been booted as a cluster node.
    正在重新引导 "test02" ...

scrcmd -N test02 reboot

scrconf -x 86400 -N test02

以上是在节点1test01上安装时的日志。

之后又尝试了先安装完一个节点,再将另一节点加入到集群当中也是不成功,始终无法与支持节点联系上 总是报错超时,情况如下:

>>> 群集名 <<<

    每个群集都有指定的名称。在群集中添加节点时,您必须标识试图加入 的群 集
    的名称。执行完整性检查,以检验“支持”节点是否为该群集的成员。

    要加入的群集的名称是什么?  test-cluster

   正在试图联系 "test02" ...已超时

此时无法联系 "test02"。

    是否要重试 (yes/no) [yes]?  

    正在试图联系 "test02" ...已超时

此时无法联系 "test02"。

   是否要重试 (yes/no) [yes]?  no

    是否要尝试其他的支持节点 (yes/no) [no]?  

  >>> 检查 <<<

    通过此步骤可以运行群集检查来验证是否满足某些基本的硬件和软件预配置要求
    。如果群集检查检测到将此计算机配置为群集节点存在潜在的问题,则将准备一
    个违规检查报告,并可以在屏幕上显示。

    是否要运行 cluster check (yes/no) [yes]?  

    正在运行 cluster check ...

  initializing...
  initializing xml output...
  loading auxiliary data...
  filtering out checks not marked with one of keywords: installtime
  starting check run...
     test01:     S6708496.... starting:  Cluster node (3.1 or later) OpenBoot Prom (O...
     test01:     S6708496       not applicable
     test01:     S6708605.... starting:  The /dev/rmt directory is missing.         
     test01:     S6708605       passed
     test01:     S6708606.... starting:  Multiple network interfaces on a single subn...
     test01:     S6708606       passed
     test01:     S6708638.... starting:  Node has insufficient physical memory.      
     test01:     S6708638       passed
     test01:     S6708642.... starting:  /proc fails to mount periodically during reb...
        searching /var/adm/messages
        searching /var/adm/messages.0
        searching /var/adm/messages.1
     test01:     S6708642       passed
  finished check run
  finishing xml output...
  Maximum severity of all violations: No Violations
  Reports in: /var/cluster/logs/install/cluster_check/
  cleaning up...



   
按 Enter 键继续:  

printf: test01 预期的数值

>>> 自动搜索群集传输 <<<

    如果要使用以太网或 Infiniband 适配器作为群集传输适配器,则配置群集传
    输的最佳方法是使用自动搜索。

无法从 "test02" 中获得配置数据。

   
按 Enter 键继续:  

命令都不能用 会提示此节点当前不在集群中
以上是相关信息,已经反复安装配置不下N次了 都是一样的结果 。之前用的是比较老点的版本,换成现在这版本情况依旧,请各位朋友帮助分析看看,已接近崩溃边缘了。

论坛徽章:
2
双鱼座
日期:2014-02-23 12:10:03操作系统版块每日发帖之星
日期:2015-12-17 06:20:00
2 [报告]
发表于 2010-08-20 09:34 |只看该作者
2个节点一起配置的?试试分开配置吧!

论坛徽章:
0
3 [报告]
发表于 2010-08-20 11:08 |只看该作者
回复 2# 东方蜘蛛


    楼上兄弟,是一起配置的。 但也尝试了单独配置,先安装配置完节点1,再将节点2加到已存在的集群中还是一样。先前配置的节点好像始终成为不了集群成员。报错就是第一个帖子描述一样:

>>> 群集名 <<<

    每个群集都有指定的名称。在群集中添加节点时,您必须标识试图加入 的群 集
    的名称。执行完整性检查,以检验“支持”节点是否为该群集的成员。

    要加入的群集的名称是什么?  test-cluster

  正在试图联系 "test02" ...已超时

此时无法联系 "test02"。

    是否要重试 (yes/no) [yes]?  

    正在试图联系 "test02" ...已超时

此时无法联系 "test02"。


麻烦兄弟看看还有啥其他方法。

论坛徽章:
2
双鱼座
日期:2014-02-23 12:10:03操作系统版块每日发帖之星
日期:2015-12-17 06:20:00
4 [报告]
发表于 2010-08-20 17:24 |只看该作者
估计是心跳没配好

论坛徽章:
0
5 [报告]
发表于 2010-08-23 12:08 |只看该作者
先看看自己的虚拟机是多少位的solaris吧 cluster3.2只支持64位系统哦

论坛徽章:
0
6 [报告]
发表于 2010-08-23 12:28 |只看该作者
虚拟机搞cluster,网卡经常会莫名其妙不见,遇见此类问题,就多多重新识别网卡配置网卡的操作

论坛徽章:
0
7 [报告]
发表于 2010-11-30 16:56 |只看该作者
我遇见和楼主相同的问题
硬件环境是HP 380 G7的服务器装SUN CLUSTER 3.22
纠结中。。。
别说你也是SUN以外平台的服务器哈。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP