免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2371 | 回复: 9
打印 上一主题 下一主题

vmare+suncluster3.2 出错,求救! [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-01-05 19:29 |只看该作者 |倒序浏览
用vmware安装两台solaris 10,配了4个网口,e1000g0主网络,e1000g1连接共享磁盘,这两个是以桥接形式(bridge)的,另外两个网口没做配置,e1000g2和e1000g3,作为之后的群集传输适配器,是以“自定义:制定虚拟网络(host-only)”形式的,安装都没问题,但在重新引导第二个节点的时候出错,无法配置,是怎么回事啊?log如下:

*** 创建新群集 ***
2010年01月05日 星期二 16时02分08秒 CST

    正在试图联系 "fs02" ...

    正在搜索远程配置方法...

scrcmd -N fs02 test isfullyinstalled
The Sun Cluster framework software is installed.
scrcmd 到 "fs02" - 返回状态 1。

rsh fs02 -n "/bin/sh -c '/bin/true; /bin/echo SC_COMMAND_STATUS=\$?'"
SC_COMMAND_STATUS=0
rsh 到 "fs02" - 返回状态 0。

ssh root@fs02 -o "BatchMode yes" -o "StrictHostKeyChecking yes" -n "/bin/sh -c '/bin/true; /bin/echo SC_COMMAND_STATUS=\$?'"
没有 RSA 主机密钥对于 fs02 是已知的,并且您已要求严格检查。
主机密钥校验失败。
ssh 到 "fs02" 失败。

    Sun Cluster 框架能够完成配置进程,而不必访问远程 shell。

    正在检测网络地址 172.16.0.0(在适配器 e1000g2 上)>> NOT DUPLICATE ... done
    正在检测网络地址 172.16.0.0(在适配器 e1000g3 上)>> NOT DUPLICATE ... done
----------------------------------
- 群集创建 -
----------------------------------

    正在测试 "/globaldevices"(在 "fs01" 上)...
    正在测试 "/globaldevices"(在 "fs02" 上)...

scrcmd -N fs02 chk_globaldev fs /globaldevices


    启动群集传输配置的搜索功能。

===========================
fs01
===========================
scrconf -n cmd=discover_send,adapters=e1000g2:e1000g3,vlans=0:0,token=suncluster_mycluster,sendcount=30

===========================
fs02
===========================

scrcmd -N fs02 autodiscovery 0:0 suncluster_mycluster 2 30
quit

===========================

    从此节点 (fs01) 所配置的所有传输适配器中发出探测信号。 但是, 所有其
    他 节点都未接收到这些探测信号。 产生这一现象的原因有很多, 其中包括 电
    缆 连接不当或转换器被探测信号干扰等。

    您可以尝试解决问题并再次尝试探测,也可以手动配置传输。为了解决问题,
    可能会涉及到重新连接电缆、更改配置或修复硬件。您必须手动配置传输才能
    在同一专用互连 VLAN 上配置标记的 VLAN 适配器和非标记的 VLAN 适配器。


===========================
fs01
===========================
scrconf -n cmd=discover_send,adapters=e1000g2:e1000g3,vlans=0:0,token=suncluster_mycluster,sendcount=30

===========================
fs02
===========================

scrcmd -N fs02 autodiscovery 0:0 suncluster_mycluster 2 30
e1000g2:0:fs01:e1000g2:0
e1000g2:0:fs01:e1000g3:0
e1000g3:0:fs01:e1000g2:0
quit

===========================

    已搜索到以下连接:

        fs01:e1000g2  switch1  fs02:e1000g2
        fs01:e1000g2  switch1  fs02:e1000g3
        fs01:e1000g3  switch2  fs02:e1000g2

找到了 "fs02" 的 134512006 个连接。

    发现的连接数超过预期。可在以后使用 clsetup(1M) 或其他工具添加其他专用
    网络。

    完成群集传输配置的搜索。

    已在 "fs01" 上启动 cluster check 。
    已在 "fs02" 上启动 cluster check 。

    cluster check 已完成,没有出现 "fs01" 的错误或警告。
    cluster check 已完成,没有出现 "fs02" 的错误或警告。

===========================
fs01
===========================

/usr/cluster/lib/scadmin/lib/cmd_sccheck
cluster check -X -k installtime -v -o /var/cluster/logs/install/cluster_check
  initializing...
  initializing xml output...
  loading auxiliary data...
  filtering out checks not marked with one of keywords: installtime
  starting check run...
     fs01:         M6708613       skipped: not a keyword match
     fs01:         S6708479       skipped: not a keyword match
     fs01:         M6336822       skipped: not a keyword match
     fs01:         S6708496.... starting:  Cluster node (3.1 or later) OpenBoot Prom (O...
     fs01:         S6708496       not applicable
     fs01:         S6708599       skipped: not a keyword match
     fs01:         S6708255       skipped: not a keyword match
     fs01:         S6708606.... starting:  Multiple network interfaces on a single subn...
     fs01:         S6708606       passed
     fs01:         S6708589       skipped: not a keyword match
     fs01:         S6708502       skipped: not a keyword match
     fs01:         S6708605.... starting:  The /dev/rmt directory is missing.         
     fs01:         S6708605       passed
     fs01:         S6708592       skipped: not a keyword match
     fs01:         S6708586       skipped: not a keyword match
     fs01:         S6708642.... starting:  /proc fails to mount periodically during reb...
          searching /var/adm/messages
          searching /var/adm/messages.0
     fs01:         S6708642       passed
     fs01:         S6708638.... starting:  Node does has insufficient physical memory.
     fs01:         S6708638       passed
     fs01:         S6708641       skipped: not a keyword match
     fs01:         S6708644       skipped: not a keyword match
     fs01:         S6708689       skipped: not a keyword match
  finished check run
  finishing xml output...
  Maximum severity of all violations: No Violations
  Reports in: /var/cluster/logs/install/cluster_check/
  cleaning up...
***************************************************************************
*
*        cluster check                (ver 1.0)
*
***************************************************************************

    Report Date:        2010.01.05 at 16.10.51 CST
                            2010.01.05 at 08.10.51 GMT
    Command run on host:
                        3b31a535- fs01
    Checks run on nodes:
                        fs01

    Unique Checks: 5

===========================================================================
*
*        Summary of Single Node Check Results for fs01
*
===========================================================================
        
        Checks Considered: 5
        
        Results by Status
        -----------------
            Violated          :   0
            Insufficient Data :   0
            Execution Error   :   0
            Unknown Status    :   0
            Information Only  :   0
            Not Applicable    :   1
            Passed            :   4
        
        Violations by Severity
        ----------------------
            Critical          :   0
            High              :   0
            Moderate          :   0
            Low               :   0
        
---------------------------------------------------------------------------
*
*        Details for 1 Not Applicable Check on fs01
*
---------------------------------------------------------------------------

        *  Check ID: S6708496  ***
        --------------------------
            *  Severity: Moderate

            *  Problem Statement: Cluster node (3.1 or later) OpenBoot Prom (OBP) has local-mac-address? variable set to 'false'.

            *  Applicability: Applicable to SPARC architecture only.

---------------------------------------------------------------------------
*
*        Details for 4 Passed Checks on fs01
*
---------------------------------------------------------------------------

        *  Check ID: S6708606  ***
        --------------------------
            *  Severity: Moderate

            *  Problem Statement: Multiple network interfaces on a single subnet have the same MAC address.


        *  Check ID: S6708605  ***
        --------------------------
            *  Severity: Critical

            *  Problem Statement: The /dev/rmt directory is missing.


        *  Check ID: S6708642  ***
        --------------------------
            *  Severity: Critical

            *  Problem Statement: /proc fails to mount periodically during reboots.


        *  Check ID: S6708638  ***
        --------------------------
            *  Severity: Moderate

            *  Problem Statement: Node does has insufficient physical memory.



===========================================================================
*
*        End of Report 2010.01.05 at 16.10.51 CST
*
===========================================================================

===========================
fs02
===========================

scrcmd -N fs02 sccheck
cluster check -X -k installtime -v -o /var/cluster/logs/install/cluster_check
  initializing...
  initializing xml output...
  loading auxiliary data...
  filtering out checks not marked with one of keywords: installtime
  starting check run...
     fs02:         M6708613       skipped: not a keyword match
     fs02:         S6708479       skipped: not a keyword match
     fs02:         M6336822       skipped: not a keyword match
     fs02:         S6708496.... starting:  Cluster node (3.1 or later) OpenBoot Prom (O...
     fs02:         S6708496       not applicable
     fs02:         S6708599       skipped: not a keyword match
     fs02:         S6708255       skipped: not a keyword match
     fs02:         S6708606.... starting:  Multiple network interfaces on a single subn...
     fs02:         S6708606       passed
     fs02:         S6708589       skipped: not a keyword match
     fs02:         S6708502       skipped: not a keyword match
     fs02:         S6708605.... starting:  The /dev/rmt directory is missing.         
     fs02:         S6708605       passed
     fs02:         S6708592       skipped: not a keyword match
     fs02:         S6708586       skipped: not a keyword match
     fs02:         S6708642.... starting:  /proc fails to mount periodically during reb...
          searching /var/adm/messages
          searching /var/adm/messages.0
     fs02:         S6708642       passed
     fs02:         S6708638.... starting:  Node does has insufficient physical memory.
     fs02:         S6708638       passed
     fs02:         S6708641       skipped: not a keyword match
     fs02:         S6708644       skipped: not a keyword match
     fs02:         S6708689       skipped: not a keyword match
  finished check run
  finishing xml output...
  Maximum severity of all violations: No Violations
  Reports in: /var/cluster/logs/install/cluster_check/
  cleaning up...
***************************************************************************
*
*        cluster check                (ver 1.0)
*
***************************************************************************

    Report Date:        2010.01.05 at 16.10.50 CST
                            2010.01.05 at 08.10.50 GMT
    Command run on host:
                        3b31a535- fs02
    Checks run on nodes:
                        fs02

    Unique Checks: 5

===========================================================================
*
*        Summary of Single Node Check Results for fs02
*
===========================================================================
        
        Checks Considered: 5
        
        Results by Status
        -----------------
            Violated          :   0
            Insufficient Data :   0
            Execution Error   :   0
            Unknown Status    :   0
            Information Only  :   0
            Not Applicable    :   1
            Passed            :   4
        
        Violations by Severity
        ----------------------
            Critical          :   0
            High              :   0
            Moderate          :   0
            Low               :   0
        
---------------------------------------------------------------------------
*
*        Details for 1 Not Applicable Check on fs02
*
---------------------------------------------------------------------------

        *  Check ID: S6708496  ***
        --------------------------
            *  Severity: Moderate

            *  Problem Statement: Cluster node (3.1 or later) OpenBoot Prom (OBP) has local-mac-address? variable set to 'false'.

            *  Applicability: Applicable to SPARC architecture only.

---------------------------------------------------------------------------
*
*        Details for 4 Passed Checks on fs02
*
---------------------------------------------------------------------------

        *  Check ID: S6708606  ***
        --------------------------
            *  Severity: Moderate

            *  Problem Statement: Multiple network interfaces on a single subnet have the same MAC address.


        *  Check ID: S6708605  ***
        --------------------------
            *  Severity: Critical

            *  Problem Statement: The /dev/rmt directory is missing.


        *  Check ID: S6708642  ***
        --------------------------
            *  Severity: Critical

            *  Problem Statement: /proc fails to mount periodically during reboots.


        *  Check ID: S6708638  ***
        --------------------------
            *  Severity: Moderate

            *  Problem Statement: Node does has insufficient physical memory.



===========================================================================
*
*        End of Report 2010.01.05 at 16.10.50 CST
*
===========================================================================

===========================



===========================
fs02
===========================


scrcmd -N fs02 test isinstalling
"" is not running.

scrcmd -N fs02 test isconfigured
Sun Cluster is not configured.

    正在配置 "fs02" ...

scrcmd -N fs02 install -logfile /var/cluster/logs/install/scinstall.log.848 -k -C mycluster -F -T node=fs01,node=fs02,authtype=sys -w netaddr=172.16.0.0,netmask=255.255.240.0,maxnodes=64,maxprivatenets=10,numvirtualclusters=12 -A trtype=dlpi,name=e1000g2 -A trtype=dlpi,name=e1000g2 -B type=switch,name=switch1 -B type=switch,name=switch2 -m endpoint=:e1000g2,endpoint=switch1 -m endpoint=:e1000g2,endpoint=switch2 -P task=quorum,state=INIT
scinstall:  此节点的一个或多个适配器用电缆连接了多次
使用:  scinstall
        scinstall -i {-F | -N <node>} [<FN-opts>]
        scinstall -u <upgrade-step> <upgrade-step-options>
        scinstall -a <dir> [-d <dir>]
        scinstall -c <dir> -h <node> [-d <dir>] {-F | -N <node>} [<FN-opts>]
        scinstall -r [-N <node>] [-G <mount_point>]
        scinstall -p [-v]

---------------
<FN-opts> 用于节点配置 (-i) 或 Jumpstart 客户机设置 (-c):
        [-A {<adapter> | name=<adapter>[,trtype=<type>][,vlanid=<id>][,<properties>]}] ...
        [-B {<junct> | name=<junct>[,type=<type>][,<properties>]}] ...
        [-m endpoint=[<thisnode>]:<name>[@<port>],endpoint=[[<node>]:]<name>[@<port>]] ...

---------------
配置第一个节点时,已接受附加的 <F-opts>:
        [-T node=<node>[,...][,authtype=<authtype>]]
        [-w netaddr=<netaddr>[,netmask=<netmask>]]
        [-w netaddr=<netaddr>[,maxnodes=<maxnodes>,maxprivatenets=<maxprivatenets>]]
        [-w netaddr=<netaddr>[,netmask=<netmask>,maxnodes=<maxnodes>,maxprivatenets=<maxprivatenets>]]
        [-o]

---------------
升级步骤及其选项:
        -u update [-s {<srvc>,... | all}] [-d <dir>] [-S {interact | testaddr=<ipaddr>@<adapter>[,testaddr=...]}] [-R <rootpath>] [-O]
        -u plan
        -u begin -h <node>[,...]
        -u apply
        -u status
        -u recover

---------------

scinstall:  scinstall 未成功完成!

        [-C <clustername>]
        [-G {lofi | <special> | <filesystem>}]

无法配置 "fs02"。



===========================

论坛徽章:
0
2 [报告]
发表于 2010-01-06 14:45 |只看该作者
帮你顶一下,找和尚来看看。

论坛徽章:
0
3 [报告]
发表于 2010-01-06 16:21 |只看该作者
把两台一共8个网卡都桥接看看

论坛徽章:
0
4 [报告]
发表于 2010-01-06 16:47 |只看该作者
现在正在试用8个网口全部桥接的方式,不知结果如何,之前用一个一个节点一个节点去装的话,在装第二个节点的时候又无法与第一个节点通讯成功,哭啊!网上说suncluster一定需要64位系统来做吗,我俩个solaris 10都不是的,和这个有关系吗?

论坛徽章:
0
5 [报告]
发表于 2010-01-07 11:11 |只看该作者
vmware搭建sun cluster环境是挺辛苦的,LZ坚持就是胜利

论坛徽章:
0
6 [报告]
发表于 2010-01-07 11:30 |只看该作者
lz看置顶的FAQ中的vmware

论坛徽章:
0
7 [报告]
发表于 2010-01-07 11:37 |只看该作者
VMWARE+SUN CLUSTER 3.2
1.CPU 64位
2.数据网卡用桥接,心跳网卡2块必须分别属于不同的网段,比如NAT和host-only
3.本地硬盘1台ide,1台scsi

论坛徽章:
0
8 [报告]
发表于 2010-01-07 14:28 |只看该作者
我现在把心跳网卡两快分别设成一一对应Custom(Vmnet2)和Custom(Vmnet3),结果配置fs02是过去了,但现在老停留在正在重新引导 "fs02" ... 我郁闷啊,不知道该咋弄了......

论坛徽章:
0
9 [报告]
发表于 2010-01-07 14:31 |只看该作者
在fs02上发现有这些cluster进程的,在fs01引导过程中已经重启过了,进程如下:
root@fs02#ps -ef|grep cluster
    root   300     1   0 14:00:06 ?           0:00 /usr/cluster/lib/sc/scqsd -d /var/scqsd -p 9000
    root   305   300   0 14:00:06 ?           0:00 /usr/cluster/lib/sc/scqsd -d /var/scqsd -p 9000
    root   648   444   0 14:00:44 ?           0:01 /usr/cluster/lib/sc/rpc.scadmd
    root   865   858   0 14:29:32 pts/1       0:00 grep cluster
    root   696     1   0 14:00:49 ?           0:01 /usr/lib/inet/xntpd -c /etc/inet/ntp.conf.cluster

论坛徽章:
0
10 [报告]
发表于 2010-01-07 14:41 |只看该作者
耐心,注意分析比较 vmware搭集群很累很麻烦各种意外非常多 我当初用了整整3周反复数十次才有把握在半天内搞定一次集群的创建
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP