免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 11640 | 回复: 3
打印 上一主题 下一主题

写了一个复制服务器的监控脚本, 大家提提意见 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2007-12-17 10:56 |显示全部楼层 |倒序浏览
写了一个复制服务器的监控脚本, 放在crontab中, 首先监控repserver,rsm是否正常运行,如果down掉, 则重新启动进程
否则, 继续执行admin who_is_down语句, 将输出结果放到一个文件中, 逐行分析时候是否存在指定的复制关系, 有的话
则形成resume connection to "复制关系“的语句, 然后执行此语句。
#!/bin/ksh

HOME_DIR=/export/home/sybaserep
LD_LIBRARY_PATH=/export/home/sybaserep/OCS-12_5/lib:/export/home/sybaserep/OCS-12_5/lib3p:
export HOME_DIR LD_LIBRARY_PATH

PROCESS_LIST=$HOME_DIR/script/process_list
LOG=$HOME_DIR/script/log
TMPFILE=$HOME_DIR/script/tmpfile
REP_CONN_LIST=$HOME_DIR/script/rep_conn_lst

DOWN="NO"

while read LINE
do
    ps -ef | grep `echo $LINE | awk '{print $1}'` | grep -v grep
    if [ "$?" = 0 ]
    then
        DOWN = "YES"
        process_name=`echo $LINE | awk '{print $1}'`
        echo "$process_name failed at `date`" >> $LOG
        start_process=`echo $LINE | awk '{print $2" "$3}'`
        $start_process
        echo "$process_name restart at `date`" >> $LOG
        echo "--------------------------------" >> $LOG
        sleep 60
    fi
done < $PROCESS_LIST

if [ $DOWN = "YES" ]
then
    exit 1
fi

eval $HOME_DIR/OCS-12_5/bin/isql -Usa -Pxxxxxxxx -Sxxxxxxxx -i$HOME_DIR/script/getdown.sql > $TMPFILE

while read REP_CONN
do
    cat $TMPFILE | grep $REP_CONN
    echo "cat" >> $LOG
    if [ "$?" != 0 ]
    then
        sql="resume connection to $LINE"
        echo $sql > $TMP_DIR/script/resume.sql
        echo "go" >> $TMP_DIR/script/resume.sql
        eval $HOME_DIR/OCS-12_5/bin/isql -Usa -Pxxxxxxxx -Sxxxxxxxx -i$HOME_DIR/script/resume.sql >> $LOG
        sleep 30
    fi
done < $REP_CONN_LIST

date >> $LOG

论坛徽章:
0
2 [报告]
发表于 2007-12-17 13:22 |显示全部楼层
斑竹, 有个疑问, 就比如说duplicate key这方面的问题, 如果主点的数据表有主键, 那么在主点的操作不会成功的,这个操作就应该不会传到备点啊

还有dbserver的分析也应该是ftp到主点或备点的服务器上取下来再分析吧

论坛徽章:
0
3 [报告]
发表于 2008-07-21 13:39 |显示全部楼层
起码从我们这里使用来看, 还是比较稳定的,主要还得保障主点, 和备点的ASE不要出错误, 我遇到的所有关于复制服务器的问题都是由于是ASE的备点报错,导致复制服务的复制关系停掉。复制服务器的本身没啥问题。另外那种一次对主点的几万记录的修改, 通过复制服务器传递到备点是很非常非常慢, 备点的locks的数量一定要设的高些, 否则很容易由于备点锁数量不足, 导致复制关系down掉.

论坛徽章:
0
4 [报告]
发表于 2008-07-21 14:56 |显示全部楼层
请问, 有啥更好的监控方法吗?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP