- 论坛徽章:
- 0
|
环境是在虚拟机上安装进行的 Solaris 10 10/09 cluster 3.2 11/09
配置sun cluster出现这样情况,停留到这里就没有反映 不再往下进行继续配置节点1了 (说明此时2节点test02已经重启完成):
群集创建
日志文件 - /var/cluster/logs/install/scinstall.log.6313
正在测试 "/globaldevices"(在 "test01" 上)...完成
正在测试 "/globaldevices"(在 "test02" 上)...完成
启动群集传输配置的搜索功能。
从此节点 (test01) 所配置的所有传输适配器中发出探测信号。 但是, 所有其
他 节点都未接收到这些探测信号。 产生这一现象的原因有很多, 其中包括 电
缆 连接不当或转换器被探测信号干扰等。
您可以尝试解决问题并再次尝试探测,也可以手动配置传输。为了解决问题,
可能会涉及到重新连接电缆、更改配置或修复硬件。您必须手动配置传输才能
在同一专用互连 VLAN 上配置标记的 VLAN 适配器和非标记的 VLAN 适配器。
是否要重试 (yes/no) [yes]?
已搜索到以下连接:
test01:e1000g2 switch1 test02:e1000g2
test01:e1000g3 switch2 test02:e1000g3
完成群集传输配置的搜索。
已在 "test01" 上启动 cluster check 。
已在 "test02" 上启动 cluster check 。
cluster check 已完成,没有出现 "test01" 的错误或警告。
cluster check 已完成,没有出现 "test02" 的错误或警告。
正在配置 "test02" ...完成
正在重新引导 "test02" ...
就一直停留到这无反应。。。
打印日志如下:
*** 创建新群集 ***
2010年08月19日 星期四 22时49分14秒 CST
正在试图联系 "test02" ...
正在搜索远程配置方法...
scrcmd -N test02 test isfullyinstalled
The Sun Cluster framework software is installed.
scrcmd 到 "test02" - 返回状态 1。
rsh test02 -n "/bin/sh -c '/bin/true; /bin/echo SC_COMMAND_STATUS=\$?'"
SC_COMMAND_STATUS=0
rsh 到 "test02" - 返回状态 0。
ssh root@test02 -o "BatchMode yes" -o "StrictHostKeyChecking yes" -n "/bin/sh -c '/bin/true; /bin/echo SC_COMMAND_STATUS=\$?'"
没有 RSA 主机密钥对于 test02 是已知的,并且您已要求严格检查。
主机密钥校验失败。
ssh 到 "test02" 失败。
Sun Cluster 框架能够完成配置进程,而不必访问远程 shell。
正在检测网络地址 172.16.0.0(在适配器 e1000g2 上)>> 不重复 ... 完成 正在检测网络地址 172.16.0.0(在适配器 e1000g3 上)>> 不
重复 ... 完成----------------------------------
- 群集创建 -
----------------------------------
正在测试 "/globaldevices"(在 "test01" 上)...
正在测试 "/globaldevices"(在 "test02" 上)...
scrcmd -N test02 chk_globaldev fs /globaldevices
启动群集传输配置的搜索功能。
===========================
test01
===========================
scrconf -n cmd=discover_send,adapters=e1000g2:e1000g3,vlans=0:0,token=suncluster_test-cluster,sendcount=30
===========================
test02
===========================
scrcmd -N test02 autodiscovery 0:0 suncluster_test-cluster 2 30
quit
===========================
从此节点 (test01) 所配置的所有传输适配器中发出探测信号。 但是, 所有其
他 节点都未接收到这些探测信号。 产生这一现象的原因有很多, 其中包括 电
缆 连接不当或转换器被探测信号干扰等。
您可以尝试解决问题并再次尝试探测,也可以手动配置传输。为了解决问题,
可能会涉及到重新连接电缆、更改配置或修复硬件。您必须手动配置传输才能
在同一专用互连 VLAN 上配置标记的 VLAN 适配器和非标记的 VLAN 适配器。
===========================
test01
===========================
scrconf -n cmd=discover_send,adapters=e1000g2:e1000g3,vlans=0:0,token=suncluster_test-cluster,sendcount=30
===========================
test02
===========================
scrcmd -N test02 autodiscovery 0:0 suncluster_test-cluster 2 30
e1000g2:0:test01:e1000g2:0
e1000g3:0:test01:e1000g3:0
quit
===========================
已搜索到以下连接:
test01:e1000g2 switch1 test02:e1000g2
test01:e1000g3 switch2 test02:e1000g3
完成群集传输配置的搜索。
已在 "test01" 上启动 cluster check 。
已在 "test02" 上启动 cluster check 。
cluster check 已完成,没有出现 "test01" 的错误或警告。
cluster check 已完成,没有出现 "test02" 的错误或警告。
===========================
test01
===========================
/usr/cluster/lib/scadmin/lib/cmd_sccheck
cluster check -X -k installtime -v -o /var/cluster/logs/install/cluster_check
initializing...
initializing xml output...
loading auxiliary data...
filtering out checks not marked with one of keywords: installtime
starting check run...
test01: M6708613 skipped: not a keyword match
test01: S6708496.... starting: Cluster node (3.1 or later) OpenBoot Prom (O...
test01: S6708496 not applicable
test01: M6336822 skipped: not a keyword match
test01: S6708255 skipped: not a keyword match
test01: S6708479 skipped: not a keyword match
test01: S6708586 skipped: not a keyword match
test01: S6708502 skipped: not a keyword match
test01: S6708599 skipped: not a keyword match
test01: S6708605.... starting: The /dev/rmt directory is missing.
test01: S6708605 passed
test01: S6708589 skipped: not a keyword match
test01: S6708592 skipped: not a keyword match
test01: S6708606.... starting: Multiple network interfaces on a single subn...
test01: S6708606 passed
test01: S6708644 skipped: not a keyword match
test01: S6708638.... starting: Node has insufficient physical memory.
test01: S6708638 passed
test01: S6708641 skipped: not a keyword match
test01: S6708689 skipped: not a keyword match
test01: S6708642.... starting: /proc fails to mount periodically during reb...
searching /var/adm/messages
searching /var/adm/messages.0
searching /var/adm/messages.1
test01: S6708642 passed
finished check run
finishing xml output...
Maximum severity of all violations: No Violations
Reports in: /var/cluster/logs/install/cluster_check/
cleaning up...
***************************************************************************
*
* cluster check (ver 1.0)
*
***************************************************************************
Report Date: 2010.08.19 at 23.13.27 CST
2010.08.19 at 15.13.27 GMT
Command run on host:
3275f063- test01
Checks run on nodes:
test01
Unique Checks: 5
===========================================================================
*
* Summary of Single Node Check Results for test01
*
===========================================================================
Checks Considered: 5
Results by Status
-----------------
Violated : 0
Insufficient Data : 0
Execution Error : 0
Unknown Status : 0
Information Only : 0
Not Applicable : 1
Passed : 4
Violations by Severity
----------------------
Critical : 0
High : 0
Moderate : 0
Low : 0
---------------------------------------------------------------------------
*
* Details for 1 Not Applicable Check on test01
*
---------------------------------------------------------------------------
* Check ID: S6708496 ***
--------------------------
* Severity: Moderate
* Problem Statement: Cluster node (3.1 or later) OpenBoot Prom (OBP) has local-mac-address? variable set to 'false'.
* Applicability: Applicable to SPARC architecture only.
---------------------------------------------------------------------------
*
* Details for 4 Passed Checks on test01
*
---------------------------------------------------------------------------
* Check ID: S6708605 ***
--------------------------
* Severity: Critical
* Problem Statement: The /dev/rmt directory is missing.
* Check ID: S6708606 ***
--------------------------
* Severity: Moderate
* Problem Statement: Multiple network interfaces on a single subnet have the same MAC address.
* Check ID: S6708638 ***
--------------------------
* Severity: Moderate
* Problem Statement: Node has insufficient physical memory.
* Check ID: S6708642 ***
--------------------------
* Severity: Critical
* Problem Statement: /proc fails to mount periodically during reboots.
===========================================================================
*
* End of Report 2010.08.19 at 23.13.27 CST
*
===========================================================================
===========================
test02
===========================
scrcmd -N test02 sccheck
cluster check -X -k installtime -v -o /var/cluster/logs/install/cluster_check
initializing...
initializing xml output...
loading auxiliary data...
filtering out checks not marked with one of keywords: installtime
starting check run...
test02: M6708613 skipped: not a keyword match
test02: S6708496.... starting: Cluster node (3.1 or later) OpenBoot Prom (O...
test02: S6708496 not applicable
test02: M6336822 skipped: not a keyword match
test02: S6708255 skipped: not a keyword match
test02: S6708479 skipped: not a keyword match
test02: S6708586 skipped: not a keyword match
test02: S6708502 skipped: not a keyword match
test02: S6708599 skipped: not a keyword match
test02: S6708605.... starting: The /dev/rmt directory is missing.
test02: S6708605 passed
test02: S6708589 skipped: not a keyword match
test02: S6708592 skipped: not a keyword match
test02: S6708606.... starting: Multiple network interfaces on a single subn...
test02: S6708606 passed
test02: S6708644 skipped: not a keyword match
test02: S6708638.... starting: Node has insufficient physical memory.
test02: S6708638 passed
test02: S6708641 skipped: not a keyword match
test02: S6708689 skipped: not a keyword match
test02: S6708642.... starting: /proc fails to mount periodically during reb...
searching /var/adm/messages
searching /var/adm/messages.0
searching /var/adm/messages.1
test02: S6708642 passed
finished check run
finishing xml output...
Maximum severity of all violations: No Violations
Reports in: /var/cluster/logs/install/cluster_check/
cleaning up...
***************************************************************************
*
* cluster check (ver 1.0)
*
***************************************************************************
Report Date: 2010.08.19 at 23.13.09 CST
2010.08.19 at 15.13.09 GMT
Command run on host:
1db0c67f- test02
Checks run on nodes:
test02
Unique Checks: 5
===========================================================================
*
* Summary of Single Node Check Results for test02
*
===========================================================================
Checks Considered: 5
Results by Status
-----------------
Violated : 0
Insufficient Data : 0
Execution Error : 0
Unknown Status : 0
Information Only : 0
Not Applicable : 1
Passed : 4
Violations by Severity
----------------------
Critical : 0
High : 0
Moderate : 0
Low : 0
---------------------------------------------------------------------------
*
* Details for 1 Not Applicable Check on test02
*
---------------------------------------------------------------------------
* Check ID: S6708496 ***
--------------------------
* Severity: Moderate
* Problem Statement: Cluster node (3.1 or later) OpenBoot Prom (OBP) has local-mac-address? variable set to 'false'.
* Applicability: Applicable to SPARC architecture only.
---------------------------------------------------------------------------
*
* Details for 4 Passed Checks on test02
*
---------------------------------------------------------------------------
* Check ID: S6708605 ***
--------------------------
* Severity: Critical
* Problem Statement: The /dev/rmt directory is missing.
* Check ID: S6708606 ***
--------------------------
* Severity: Moderate
* Problem Statement: Multiple network interfaces on a single subnet have the same MAC address.
* Check ID: S6708638 ***
--------------------------
* Severity: Moderate
* Problem Statement: Node has insufficient physical memory.
* Check ID: S6708642 ***
--------------------------
* Severity: Critical
* Problem Statement: /proc fails to mount periodically during reboots.
===========================================================================
*
* End of Report 2010.08.19 at 23.13.09 CST
*
===========================================================================
===========================
===========================
test02
===========================
scrcmd -N test02 test isinstalling
"" is not running.
scrcmd -N test02 test isconfigured
Sun Cluster is not configured.
正在配置 "test02" ...
scrcmd -N test02 install -logfile /var/cluster/logs/install/scinstall.log.6313 -k -C test-cluster -F -T node=test01,node=test02,auth
type=sys -w netaddr=172.16.0.0,netmask=255.255.240.0,maxnodes=64,maxprivatenets=10,numvirtualclusters=12 -A trtype=dlpi,name=e1000g2
-A trtype=dlpi,name=e1000g3 -B type=switch,name=switch1 -B type=switch,name=switch2 -m endpoint=:e1000g2,endpoint=switch1 -m endpoi
nt=:e1000g3,endpoint=switch2
正在检查用于全局设备文件系统的设备 ...完成
正在将群集名初始化为 "test-cluster" ...完成
正在初始化验证选项 ...完成
正在初始化适配器 "e1000g2" 的配置 ...完成
正在初始化适配器 "e1000g3" 的配置 ...完成
正在初始化交换机 "switch1" 的配置...完成
正在初始化交换机 "switch2" 的配置...完成
正在初始化电缆配置 ...完成
正在初始化电缆配置 ...完成
正在初始化专用网络地址选项 ...完成
正在为 "test02" 设置节点 ID ...完成 (id=1)
正在检查全局设备中的全局文件系统 ...完成
正在更新 vfstab ...完成
正在检验是否配置了 NTP ...完成
正在初始化 NTP 配置...完成
正在更新 nsswitch.conf ...完成
正在将群集节点条目添加到 /etc/inet/hosts 中...完成
正在配置 IP 多路径组 ...完成
正在检验是否未配置电源管理 ...完成
正在取消电源管理配置 ...完成
已将 /etc/power.conf 重命名为 /etc/power.conf.081910231404
电源管理与群集的 HA 目标不兼容。
请勿试图重新配置电源管理。
请确保已禁止网络路由 ...完成
已通过创建 /etc/notrouter 在此节点上禁止网络路由。
Sun Cluster 不支持将群集节点用作路由器。
请勿重新激活网络路由。
请重新引导此计算机。
日志文件 - /var/cluster/logs/install/scinstall.log.6313
scrcmd -N test02 test hasbooted
This node has not yet been booted as a cluster node.
正在重新引导 "test02" ...
scrcmd -N test02 reboot
scrconf -x 86400 -N test02
以上是在节点1test01上安装时的日志。
之后又尝试了先安装完一个节点,再将另一节点加入到集群当中也是不成功,始终无法与支持节点联系上 总是报错超时,情况如下:
>>> 群集名 <<<
每个群集都有指定的名称。在群集中添加节点时,您必须标识试图加入 的群 集
的名称。执行完整性检查,以检验“支持”节点是否为该群集的成员。
要加入的群集的名称是什么? test-cluster
正在试图联系 "test02" ...已超时
此时无法联系 "test02"。
是否要重试 (yes/no) [yes]?
正在试图联系 "test02" ...已超时
此时无法联系 "test02"。
是否要重试 (yes/no) [yes]? no
是否要尝试其他的支持节点 (yes/no) [no]?
>>> 检查 <<<
通过此步骤可以运行群集检查来验证是否满足某些基本的硬件和软件预配置要求
。如果群集检查检测到将此计算机配置为群集节点存在潜在的问题,则将准备一
个违规检查报告,并可以在屏幕上显示。
是否要运行 cluster check (yes/no) [yes]?
正在运行 cluster check ...
initializing...
initializing xml output...
loading auxiliary data...
filtering out checks not marked with one of keywords: installtime
starting check run...
test01: S6708496.... starting: Cluster node (3.1 or later) OpenBoot Prom (O...
test01: S6708496 not applicable
test01: S6708605.... starting: The /dev/rmt directory is missing.
test01: S6708605 passed
test01: S6708606.... starting: Multiple network interfaces on a single subn...
test01: S6708606 passed
test01: S6708638.... starting: Node has insufficient physical memory.
test01: S6708638 passed
test01: S6708642.... starting: /proc fails to mount periodically during reb...
searching /var/adm/messages
searching /var/adm/messages.0
searching /var/adm/messages.1
test01: S6708642 passed
finished check run
finishing xml output...
Maximum severity of all violations: No Violations
Reports in: /var/cluster/logs/install/cluster_check/
cleaning up...
按 Enter 键继续:
printf: test01 预期的数值
>>> 自动搜索群集传输 <<<
如果要使用以太网或 Infiniband 适配器作为群集传输适配器,则配置群集传
输的最佳方法是使用自动搜索。
无法从 "test02" 中获得配置数据。
按 Enter 键继续:
命令都不能用 会提示此节点当前不在集群中
以上是相关信息,已经反复安装配置不下N次了 都是一样的结果 。之前用的是比较老点的版本,换成现在这版本情况依旧,请各位朋友帮助分析看看,已接近崩溃边缘了。 |
|