Chinaunix

标题: 请教如何写一个shell监控我的一个进程状态,死了重启 [打印本页]

作者: lsupper    时间: 2009-06-22 15:01
标题: 请教如何写一个shell监控我的一个进程状态,死了重启
我现在有个应用程序./a.out,现在我想向大家求个shell脚本,想实现的功能如下:
  1.每隔1分钟检测下a.out是否挂掉,如果断掉重启之~~~
作者: 南无小和尚    时间: 2009-06-22 15:18
思想大致如此:
count=`ps -fe |grep "a.out" | grep -v "grep" | wc -l`

  if [ $count -lt 1 ]; then
        sudo /root/sh/restart.sh
  if
然后放到corntab里面。
作者: lsupper    时间: 2009-06-22 15:34
标题: 回复 #2 南无小和尚 的帖子
恩 谢谢。有空的话能帮个忙吗?shell我写的基本没有,但是又要用,能帮我写个完整的吗? 当然是在您有空的前提下~~~~
我自己也学习下 马上学~~~
作者: xuledw    时间: 2009-06-22 15:36
原帖由 lsupper 于 2009-6-22 15:34 发表
恩 谢谢。有空的话能帮个忙吗?shell我写的基本没有,但是又要用,能帮我写个完整的吗? 当然是在您有空的前提下~~~~
我自己也学习下 马上学~~~

2楼的都给出答案了 直接照猫画虎就是了
作者: kwokcn    时间: 2009-06-22 16:50
不推荐ps -ef | grep command_name的监控方法,存在command_namexxx进程时会发生误判。

应判断一下readlink /proc/pid/exe是否对应所监控程序的路径,再做相应处理。
把下面这个脚本放在被监控程序所在目录,并将其加入cron,定制为每分钟执行一次即可。
COMMAND_NAME为监控程序名。

  1. #!/bin/bash

  2. path=$(dirname $(readlink /proc/$$/fd/255))
  3. pgrep COMMAND_NAME | xargs -i readlink -f /proc/{}/exe | grep "$path/COMMAND_NAME" || { cd $path; ./COMMAND_NAME & }
复制代码

作者: Steiny    时间: 2009-06-22 17:04
喜羊羊的方法,估计楼主做不来  
作者: kwokcn    时间: 2009-06-22 17:14
标题: 回复 #6 Steiny 的帖子
呃,不会再说。

如果是网络程序,最好用nc再判断一下端口是否正确监听。
作者: 南无小和尚    时间: 2009-06-22 17:16
标题: 回复 #6 Steiny 的帖子
确实做不来,学习学习.喜洋洋的做法 让我 想起来以前一个用c写的:
  1. char* get_self_executable_directory ()
  2. {
  3.   int rval;
  4.   char link_target[1024];//目标地址
  5.   char* last_slash;
  6.   size_t result_length;//结果的长度
  7.   char* result;

  8.   /* Read the target of the symbolic link /proc/self/exe.  */
  9. 读取绝对路径
  10.   rval = readlink ("/proc/self/exe", link_target, sizeof (link_target) - 1);
  11.   if (rval == -1)
  12.     /* The call to readlink failed, so bail.  */
  13.     abort ();
  14.   else
  15.     /* NUL-terminate the target.  */
  16.     link_target[rval] = '\0';
  17.   /* We want to trim the name of the executable file, to obtain the
  18.      directory that contains it.  Find the rightmost slash.  */
  19. 找到最后一个/
  20.   last_slash = strrchr (link_target, '/');
  21. 如果是空或者是以/开头,则退出
  22.   if (last_slash == NULL || last_slash == link_target)
  23.     /* Something stange is going on.  */
  24.     abort ();
  25. last_slash保存的是最后的/的地址
  26.   /* Allocate a buffer to hold the resulting path.  */
  27. link_target开始的地址
  28.   result_length = last_slash - link_target;
  29.   result = (char*) xmalloc (result_length + 1);
  30.   /* Copy the result.  */
  31.   strncpy (result, link_target, result_length);
  32.   result[result_length] = '\0';
  33.   return result;
  34. }
复制代码

作者: lsupper    时间: 2009-06-22 17:35
标题: 回复 #5 kwokcn 的帖子
xiexie!!!
作者: kwokcn    时间: 2009-06-22 17:50
标题: 回复 #8 南无小和尚 的帖子
嗯,这个和shell脚本里的dirname $(readlink /proc/$$/fd/255)是一个效果。
其实对于C/C++编译的程序而言,这个函数的处理复杂了一些,readlink的时候获取/proc/self/cwd的link,然后判断一下返回值做一下安全处理就可以了。
作者: 南无小和尚    时间: 2009-06-22 18:03
标题: 回复 #10 kwokcn 的帖子
恩,是的,可以改下
作者: lsupper    时间: 2009-06-22 19:59
标题: 回复 #2 南无小和尚 的帖子
谢谢了,根据你的意见写了个~~~还想问下,如何写个重启shell,就是重启./a.out
作者: Aruceid    时间: 2009-06-23 11:00
楼主积分比我多:wink:
不过在这个区的帖子比较少,你直接再次执行a.out就行啊.

[ 本帖最后由 Aruceid 于 2009-6-23 11:01 编辑 ]
作者: marco_hxj    时间: 2009-06-24 10:03
#/bin/sh
while true; do
                count=`ps -fe |grep "main" | grep -v "grep"`
                if [ "$?" != "0" ]; then
    echo ">>>>no main,run it"
    else
    echo ">>>>main is running"
    fi
    sleep 2
done
---------------------------------分割线----------------------------------------------
按照2楼的方法,我的板子里没有wc,也没有crontab

我在终端上执行这个脚本./test,能正确检测,
但是我执行./test &,不管main有没有,都是输出no main,run it

---------------------------貌似解决了------------------------------------
在done后面加 &

[ 本帖最后由 marco_hxj 于 2009-6-24 10:18 编辑 ]
作者: lsupper    时间: 2009-06-24 11:24
标题: 回复 #13 Aruceid 的帖子
恩,我一般在C/C++那 呵呵~~~shell写的少,用的时候才~~~~
作者: lsupper    时间: 2009-06-24 11:25
标题: 回复 #14 marco_hxj 的帖子
在屁股后面加& 啥子作用~~~ 我不是很理解~~~
作者: 南无小和尚    时间: 2009-06-24 16:59
标题: 回复 #16 lsupper 的帖子
屁股加那个&, 就做到后台了
作者: mxcai2005    时间: 2010-12-20 16:45
#!/bin/bash
CheckProcess()
{
        if [ "$1" = ""];
        then
                return 1
        fi

    PROCESS_NUM=`ps -ef | grep "$1" | grep -v "grep" | wc -l`
    if [ $PROCESS_NUM -eq 1 ];
    then
        return 0
    else
        return 1
    fi   
}

while [ 1 ] ; do
    CheckProcess "./a.out"
    CheckQQ_RET=$?
    if [ $CheckQQ_RET -eq 1 ];
    then
     killall -9 a.out
     exec ./a.out &
    fi
    sleep 1
done




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2