免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3556 | 回复: 7
打印 上一主题 下一主题

问一个高级一点的问题,关于SunCluster [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-06-28 17:51 |只看该作者 |倒序浏览
环境:V445双机HA系统\r\n         Solaris 10 5/08(sparc)\r\n         Sun Cluster 3.1U4\r\n         sybase 12.5.3\r\n\r\n现象:sybase服务资源启动失败\r\n说明:HA只管理一个资源组syb-rg,资源有网络、盘阵、和sybase服务(sybase-rs)。\r\n         刚配好后,几天内都一切正常。昨天中午开始突然出现故障。        \r\n         网络和磁盘资源都可以拉起来,只有sybase-rs资源拉不起来。\r\n         之前所作的操作有:删除sybase中的一个库;安装gcc3.4.6;安装gdb6.6(自己编译的64bit版本);\r\n         安装libiconv-1.11;安装make-3.81。\r\n         其中 /opt/SUNWscsyb/log/ 相关日志中的参考内容如下,各位达人能否一起来分析一下:\r\n\r\n……\r\nJun 28 17:17:31 SC[SUNWscsyb.start]:syb-rg:sybase-rs: Server owner is sybase\r\nJun 28 17:17:31 SC[SUNWscsyb.start]:syb-rg:sybase-rs: Starting server under tag <sybase_ASE.sybase-rs> Command: /opt/sybase/ASE-12_5/install/startserverStarting server under tag -f Command: /opt/sybase/ASE-12_5/install/RUN_SERVER\r\nJun 28 17:17:31 SC[SUNWscsyb.start]:syb-rg:sybase-rs: Starting Sybase ASE: SERVER. Startup file: /opt/sybase/ASE-12_5/install/RUN_SERVER\r\nJun 28 17:18:01 SC[SUNWscsyb.start]:syb-rg:sybase-rs: Adaptive server successfully started.\r\nJun 28 17:18:01 SC[SUNWscsyb.start]:syb-rg:sybase-rs: Starting wait_for_online check.\r\nJun 28 17:18:01 monitor started for database online check\r\nJun 28 17:18:01 Starting monitor child process\r\nJun 28 17:18:01 Probe result: error type 1 Error number: 911\r\nJun 28 17:18:06 Starting monitor child process\r\nJun 28 17:18:06 Probe result: error type 1 Error number: 911\r\nJun 28 17:18:11 Starting monitor child process\r\nJun 28 17:18:11 Probe result: error type 1 Error number: 911\r\nJun 28 17:18:16 Starting monitor child process\r\nJun 28 17:18:16 Probe result: error type 1 Error number: 911\r\nJun 28 17:18:21 Starting monitor child process\r\nJun 28 17:18:21 Probe result: error type 1 Error number: 911\r\nJun 28 17:18:26 Starting monitor child process\r\n……\r\n\r\n--------------在messages中的参考信息如下----------------------\r\n……\r\nJun 27 14:00:33 server1 SC[SUNWscsyb.monitor]:syb-rg:sybsrv-rs: [ID 185465 local7.error] No action on DBMS Error DBMS_ERROR : 911\r\nJun 27 14:06:33 server1 last message repeated 12 times\r\nJun 27 14:07:03 server1 SC[SUNWscsyb.monitor]:syb-rg:sybsrv-rs: [ID 185465 local7.error] No action on DBMS Error DBMS_ERROR : 911\r\nJun 27 14:13:03 server1 last message repeated 12 times\r\nJun 27 14:13:33 server1 SC[SUNWscsyb.monitor]:syb-rg:sybsrv-rs: [ID 185465 local7.error] No action on DBMS Error DBMS_ERROR : 911\r\n……\r\n-------------------------------------------------------------------

论坛徽章:
0
2 [报告]
发表于 2008-06-28 19:47 |只看该作者
我觉得和cluster无关,你试试看手工启sybase,估计也不行

论坛徽章:
0
3 [报告]
发表于 2008-06-28 20:21 |只看该作者
手动是没有问题的,服务进程和备份服务进程都没有一点问题。\r\n用SC来拉服务,只有服务进程可以起来(用SQL语言访问数据库都没有问题了),但是备份服务拉不起来!\r\n感觉还没有到拉备份服务进程这一步。\r\n\r\n日志其实很明确: \r\n\r\nJun 28 17:17:31 SC[SUNWscsyb.start]:syb-rg:sybase-rs: Server owner is sybase\r\nJun 28 17:17:31 SC[SUNWscsyb.start]:syb-rg:sybase-rs: Starting server under tag <sybase_ASE.sybase-rs> Command: /opt/sybase/ASE-12_5/install/startserverStarting server under tag -f Command: /opt/sybase/ASE-12_5/install/RUN_SERVER\r\nJun 28 17:17:31 SC[SUNWscsyb.start]:syb-rg:sybase-rs: Starting Sybase ASE: SERVER. Startup file: /opt/sybase/ASE-12_5/install/RUN_SERVER\r\nJun 28 17:18:01 SC[SUNWscsyb.start]:syb-rg:sybase-rs: Adaptive server successfully started.\r\n                                                            --------- SERVER已经起来了,ASE服务进程是有的,接下来是\r\nJun 28 17:18:01 SC[SUNWscsyb.start]:syb-rg:sybase-rs: Starting wait_for_online check.\r\nJun 28 17:18:01 monitor started for database online check\r\n                                                            ----------这一步要启动SC的monitor子进程\r\nJun 28 17:18:01 Starting monitor child process\r\nJun 28 17:18:01 Probe result: error type 1 Error number: 911\r\n                                                            ----------然后出错了!错误类型1,错误code 911\r\nJun 28 17:18:06 Starting monitor child process\r\nJun 28 17:18:06 Probe result: error type 1 Error number: 911

论坛徽章:
0
4 [报告]
发表于 2008-06-28 20:31 |只看该作者
给一个正常时候的日志相关部分,参考分析一下:\r\n\r\nJun 2 17:23:14 SC[SUNWscsyb.start]:syb-rg:sybsrv-rs: Server owner is sybase\r\nJun 2 17:23:14 SC[SUNWscsyb.start]:syb-rg:sybsrv-rs: Starting server under tag <sybase_ASE.sybsrv-rs> Command: /opt/sybase/ASE-12_5/install/startserverStarting server under tag -f Command: /opt/sybase/ASE-12_5/install/RUN_SERVER\r\nJun 2 17:23:14 SC[SUNWscsyb.start]:syb-rg:sybsrv-rs: Starting Sybase ASE: SERVER. Startup file: /opt/sybase/ASE-12_5/install/RUN_SERVER\r\nJun 2 17:23:44 SC[SUNWscsyb.start]:syb-rg:sybsrv-rs: Adaptive server successfully started.\r\nJun 2 17:23:44 SC[SUNWscsyb.start]:syb-rg:sybsrv-rs: Starting wait_for_online check.\r\nJun 2 17:23:44 monitor started for database online check\r\nJun 2 17:23:44 Starting monitor child process\r\nJun 2 17:23:45 SC[SUNWscsyb.start]:syb-rg:sybsrv-rs: Server is online.\r\nJun 2 17:23:45 SC[SUNWscsyb.start]:syb-rg:sybsrv-rs: Starting server under tag <sybase_backup_server.sybsrv-rs> Command: /opt/sybase/ASE-12_5/install/startserverStarting server under tag -f Command: /opt/sybase/ASE-12_5/install/RUN_SERVER_back\r\nJun 2 17:23:45 SC[SUNWscsyb.start]:syb-rg:sybsrv-rs: Starting Sybase BACKUP_SERVER: SERVER_back. Startup file: /opt/sybase/ASE-12_5/install/RUN_SERVER_back\r\nJun 2 17:23:50 SC[SUNWscsyb.start]:syb-rg:sybsrv-rs: Backup server successfully started.

论坛徽章:
0
5 [报告]
发表于 2008-06-28 20:53 |只看该作者
系统日志messges中显示:No action on DBMS Error DBMS_ERROR : 911\r\n从日志分析,似乎是SC的monitor没有检测到sybase的SERVER已经启动,\r\n所以就不启动SERVER_back服务了,而且超时过后,Failover 到 server2,\r\n以此反复,最后就都 offline了。\r\n以上是我的个人分析,希望能与大家一起探讨。

论坛徽章:
0
6 [报告]
发表于 2008-06-28 21:47 |只看该作者
解铃还须系铃人。\r\n刚开始以为是SC的bug,不过现在问题已经解决了,因为不是生产系统,所以可以一顿海扁。\r\n问题不是单方面的SC或者sybse的问题,而是二者之间的一个验证和被验证的关系。\r\n这个和我刚开始的注册有关系,知道的已经知道我说的是什么了,\r\n不知道的没关系,三言两语说不清楚,不过也没什么难的。\r\n\r\n谢谢大家对这个问题的关注!\r\n\r\n补记:\r\n9楼的朋友myniker说的是对的,这个帖子也可以作为一个遇到类似问题的朋友们的一个参考例子。\n\n[ 本帖最后由 viviwsq 于 2008-6-30 10:28 编辑 ]

论坛徽章:
0
7 [报告]
发表于 2008-06-29 00:34 |只看该作者
OK J结贴。。。。呵呵 搞清楚了总是令人皆大欢喜啊

论坛徽章:
1
IT运维版块每日发帖之星
日期:2016-02-27 06:20:00
8 [报告]
发表于 2008-06-30 10:02 |只看该作者
-x Connect_string=\"xxx/xxx\" 这个变动?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP