免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2080 | 回复: 8
打印 上一主题 下一主题

问一个高级一点的问题,关于SunCluster [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-06-28 17:51 |只看该作者 |倒序浏览
环境:V445双机HA系统
         Solaris 10 5/08(sparc)
         Sun Cluster 3.1U4
         sybase 12.5.3

现象:sybase服务资源启动失败
说明:HA只管理一个资源组syb-rg,资源有网络、盘阵、和sybase服务(sybase-rs)。
         刚配好后,几天内都一切正常。昨天中午开始突然出现故障。        
         网络和磁盘资源都可以拉起来,只有sybase-rs资源拉不起来。
         之前所作的操作有:删除sybase中的一个库;安装gcc3.4.6;安装gdb6.6(自己编译的64bit版本);
         安装libiconv-1.11;安装make-3.81。
         其中 /opt/SUNWscsyb/log/ 相关日志中的参考内容如下,各位达人能否一起来分析一下:

……
Jun 28 17:17:31 SC[SUNWscsyb.start]:syb-rg:sybase-rs: Server owner is sybase
Jun 28 17:17:31 SC[SUNWscsyb.start]:syb-rg:sybase-rs: Starting server under tag <sybase_ASE.sybase-rs> Command: /opt/sybase/ASE-12_5/install/startserverStarting server under tag -f Command: /opt/sybase/ASE-12_5/install/RUN_SERVER
Jun 28 17:17:31 SC[SUNWscsyb.start]:syb-rg:sybase-rs: Starting Sybase ASE: SERVER. Startup file: /opt/sybase/ASE-12_5/install/RUN_SERVER
Jun 28 17:18:01 SC[SUNWscsyb.start]:syb-rg:sybase-rs: Adaptive server successfully started.
Jun 28 17:18:01 SC[SUNWscsyb.start]:syb-rg:sybase-rs: Starting wait_for_online check.
Jun 28 17:18:01 monitor started for database online check
Jun 28 17:18:01 Starting monitor child process
Jun 28 17:18:01 Probe result: error type 1 Error number: 911
Jun 28 17:18:06 Starting monitor child process
Jun 28 17:18:06 Probe result: error type 1 Error number: 911
Jun 28 17:18:11 Starting monitor child process
Jun 28 17:18:11 Probe result: error type 1 Error number: 911
Jun 28 17:18:16 Starting monitor child process
Jun 28 17:18:16 Probe result: error type 1 Error number: 911
Jun 28 17:18:21 Starting monitor child process
Jun 28 17:18:21 Probe result: error type 1 Error number: 911
Jun 28 17:18:26 Starting monitor child process
……

--------------在messages中的参考信息如下----------------------
……
Jun 27 14:00:33 server1 SC[SUNWscsyb.monitor]:syb-rg:sybsrv-rs: [ID 185465 local7.error] No action on DBMS Error DBMS_ERROR : 911
Jun 27 14:06:33 server1 last message repeated 12 times
Jun 27 14:07:03 server1 SC[SUNWscsyb.monitor]:syb-rg:sybsrv-rs: [ID 185465 local7.error] No action on DBMS Error DBMS_ERROR : 911
Jun 27 14:13:03 server1 last message repeated 12 times
Jun 27 14:13:33 server1 SC[SUNWscsyb.monitor]:syb-rg:sybsrv-rs: [ID 185465 local7.error] No action on DBMS Error DBMS_ERROR : 911
……
-------------------------------------------------------------------

论坛徽章:
0
2 [报告]
发表于 2008-06-28 19:47 |只看该作者
我觉得和cluster无关,你试试看手工启sybase,估计也不行

论坛徽章:
0
3 [报告]
发表于 2008-06-28 20:21 |只看该作者
手动是没有问题的,服务进程和备份服务进程都没有一点问题。
用SC来拉服务,只有服务进程可以起来(用SQL语言访问数据库都没有问题了),但是备份服务拉不起来!
感觉还没有到拉备份服务进程这一步。

日志其实很明确:

Jun 28 17:17:31 SC[SUNWscsyb.start]:syb-rg:sybase-rs: Server owner is sybase
Jun 28 17:17:31 SC[SUNWscsyb.start]:syb-rg:sybase-rs: Starting server under tag <sybase_ASE.sybase-rs> Command: /opt/sybase/ASE-12_5/install/startserverStarting server under tag -f Command: /opt/sybase/ASE-12_5/install/RUN_SERVER
Jun 28 17:17:31 SC[SUNWscsyb.start]:syb-rg:sybase-rs: Starting Sybase ASE: SERVER. Startup file: /opt/sybase/ASE-12_5/install/RUN_SERVER
Jun 28 17:18:01 SC[SUNWscsyb.start]:syb-rg:sybase-rs: Adaptive server successfully started.
                                                            --------- SERVER已经起来了,ASE服务进程是有的,接下来是
Jun 28 17:18:01 SC[SUNWscsyb.start]:syb-rg:sybase-rs: Starting wait_for_online check.
Jun 28 17:18:01 monitor started for database online check
                                                            ----------这一步要启动SC的monitor子进程
Jun 28 17:18:01 Starting monitor child process
Jun 28 17:18:01 Probe result: error type 1 Error number: 911
                                                            ----------然后出错了!错误类型1,错误code 911
Jun 28 17:18:06 Starting monitor child process
Jun 28 17:18:06 Probe result: error type 1 Error number: 911

论坛徽章:
0
4 [报告]
发表于 2008-06-28 20:31 |只看该作者
给一个正常时候的日志相关部分,参考分析一下:

Jun 2 17:23:14 SC[SUNWscsyb.start]:syb-rg:sybsrv-rs: Server owner is sybase
Jun 2 17:23:14 SC[SUNWscsyb.start]:syb-rg:sybsrv-rs: Starting server under tag <sybase_ASE.sybsrv-rs> Command: /opt/sybase/ASE-12_5/install/startserverStarting server under tag -f Command: /opt/sybase/ASE-12_5/install/RUN_SERVER
Jun 2 17:23:14 SC[SUNWscsyb.start]:syb-rg:sybsrv-rs: Starting Sybase ASE: SERVER. Startup file: /opt/sybase/ASE-12_5/install/RUN_SERVER
Jun 2 17:23:44 SC[SUNWscsyb.start]:syb-rg:sybsrv-rs: Adaptive server successfully started.
Jun 2 17:23:44 SC[SUNWscsyb.start]:syb-rg:sybsrv-rs: Starting wait_for_online check.
Jun 2 17:23:44 monitor started for database online check
Jun 2 17:23:44 Starting monitor child process
Jun 2 17:23:45 SC[SUNWscsyb.start]:syb-rg:sybsrv-rs: Server is online.
Jun 2 17:23:45 SC[SUNWscsyb.start]:syb-rg:sybsrv-rs: Starting server under tag <sybase_backup_server.sybsrv-rs> Command: /opt/sybase/ASE-12_5/install/startserverStarting server under tag -f Command: /opt/sybase/ASE-12_5/install/RUN_SERVER_back
Jun 2 17:23:45 SC[SUNWscsyb.start]:syb-rg:sybsrv-rs: Starting Sybase BACKUP_SERVER: SERVER_back. Startup file: /opt/sybase/ASE-12_5/install/RUN_SERVER_back
Jun 2 17:23:50 SC[SUNWscsyb.start]:syb-rg:sybsrv-rs: Backup server successfully started.

论坛徽章:
0
5 [报告]
发表于 2008-06-28 20:53 |只看该作者
系统日志messges中显示:No action on DBMS Error DBMS_ERROR : 911
从日志分析,似乎是SC的monitor没有检测到sybase的SERVER已经启动,
所以就不启动SERVER_back服务了,而且超时过后,Failover 到 server2,
以此反复,最后就都 offline了。
以上是我的个人分析,希望能与大家一起探讨。

论坛徽章:
0
6 [报告]
发表于 2008-06-28 21:47 |只看该作者
解铃还须系铃人。
刚开始以为是SC的bug,不过现在问题已经解决了,因为不是生产系统,所以可以一顿海扁。
问题不是单方面的SC或者sybse的问题,而是二者之间的一个验证和被验证的关系。
这个和我刚开始的注册有关系,知道的已经知道我说的是什么了,
不知道的没关系,三言两语说不清楚,不过也没什么难的。

谢谢大家对这个问题的关注!

补记:
9楼的朋友myniker说的是对的,这个帖子也可以作为一个遇到类似问题的朋友们的一个参考例子。

[ 本帖最后由 viviwsq 于 2008-6-30 10:28 编辑 ]

论坛徽章:
0
7 [报告]
发表于 2008-06-29 00:34 |只看该作者
OK J结贴。。。。呵呵 搞清楚了总是令人皆大欢喜啊

论坛徽章:
221
15-16赛季CBA联赛之吉林
日期:2017-12-11 12:51:59黑曼巴
日期:2019-04-12 13:40:0515-16赛季CBA联赛之广东
日期:2019-04-23 10:41:1215-16赛季CBA联赛之辽宁
日期:2019-05-06 13:03:2815-16赛季CBA联赛之山西
日期:2019-05-09 10:56:5815-16赛季CBA联赛之青岛
日期:2019-05-17 13:57:0515-16赛季CBA联赛之新疆
日期:2019-06-10 13:39:0515-16赛季CBA联赛之天津
日期:2019-07-08 15:04:4519周年集字徽章-19
日期:2019-08-27 13:31:2619周年集字徽章-19
日期:2019-08-27 13:31:2619周年集字徽章-周
日期:2019-09-06 18:46:4715-16赛季CBA联赛之天津
日期:2019-02-27 11:24:07
8 [报告]
发表于 2008-06-29 19:30 |只看该作者
暂时收留

论坛徽章:
1
IT运维版块每日发帖之星
日期:2016-02-27 06:20:00
9 [报告]
发表于 2008-06-30 10:02 |只看该作者
-x Connect_string="xxx/xxx" 这个变动?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP