Chinaunix

标题: 进程执行如何直接获取其进程ID(如果其启动了多份的情况下,精准定位是刚启动的) [打印本页]

作者: dididimeme01    时间: 2014-08-07 15:44
标题: 进程执行如何直接获取其进程ID(如果其启动了多份的情况下,精准定位是刚启动的)
大家好,我是想这样做,我有一个集群,我想在一个主机上做主控制,其他节点通过ssh的信任关系执行进程,同时通过ssh获取这些进程的执行情况和占用资源信息;
目前资源收集什么都没有问题了,维度是执行ssh root@node1 "process 100 &"这样的时候无法获取sleep命令的pid,这里要说明一下的是,process可能在node1上已经执行了多份,用ps的话会看到多个运行体,分不清那个是我刚执行的,所以希望看看有什么办法能够在执行ssh的时候直接获取pid?
作者: dididimeme01    时间: 2014-08-07 16:01
我刚才想用nohup来捕捉,但是发现nohup后显示的pid即不是标准输出也不是标准错误输出,无论用2>还是1>都是无法获取的,请问有别的办法么;
作者: dididimeme01    时间: 2014-08-07 16:46
我查看了很多资料目前,可以做到的是远程执行nohup的进程,但是还是无法回去这个执行进程的pid
ssh root@node1 <<EOF
  nohup sleep 100 >/tmp/1.txt 2>&1 &
EOF
作者: dididimeme01    时间: 2014-08-07 17:05
又发现一个恶心的地方,ssh远程执行中如果用到awk,会出现失效的情况
例如:
ssh root@node1 <<EOF
  nohup sleep 100 >/tmp/1.txt 2>&1 &
  ps -ef|grep sleep |grep -v "\<grep\>"|awk '{print $2}' 1>/tmp/1.txt
EOF
执行结果中awk根本就没有生效
作者: dididimeme01    时间: 2014-08-07 17:09
awk问题解决了,原来是转意问题
ssh root@node1 <<EOF
  nohup sleep 100 >/tmp/1.txt 2>&1 &
  ps -ef|grep sleep |grep -v "\<grep\>"|/bin/awk '{print \$2}' 1>/tmp/1.txt
EOF
就可以了
作者: dididimeme01    时间: 2014-08-07 17:17
请问大拿都在那里?给个想法吧
作者: dididimeme01    时间: 2014-08-07 17:32
再进一步,如果用单机的话
[root@node1 tmp]# nohup sleep 100 &
[1] 32013
[root@node1 tmp]# nohup: ignoring input and appending output to `nohup.out'

[root@node1 tmp]# echo $!
32013
[root@node1 tmp]#
可以获取pid
作者: Shell_HAT    时间: 2014-08-07 17:49
  1. ssh root@node1 "sleep 100 &; echo \$!"
复制代码
试试
作者: reyleon    时间: 2014-08-07 18:08
本帖最后由 reyleon 于 2014-08-07 18:19 编辑

回复 1# dididimeme01


    你是想这样么? @关阴月飞老师教的
  1. ssh 127.0.0.1 '{ sleep 100; } &>/dev/null & echo $!'
复制代码
命令最好写在大括号代码块里,否则如果有多个命令的话ssh连接是不会直接返回的
作者: reyleon    时间: 2014-08-07 18:11
回复 8# Shell_HAT


    这种情况会报语法错误呀 {:3_182:}
作者: dididimeme01    时间: 2014-08-08 09:10
ssh root@node1 '{ sleep 100; } &>/dev/null & echo $!'这个可以,我做实验没有问题,获得了pid,但是加上nohup失败了
作者: dididimeme01    时间: 2014-08-08 09:12
reyleon能解释一下,大括号和后面的&的意思么,第一&我明白是后台的意思,第二个感觉是并且执行语句的意思,但是为什么不用;呢?
作者: dididimeme01    时间: 2014-08-08 09:14
但是还有一个问题,就是我获得的pid是一个shell的pid,例如在node1上执行的结果如下:
root      7201     1  0 09:12 ?        00:00:00 bash -c { nohup sleep 100; } &>/dev/null & echo $!
root      7202  7201  0 09:12 ?        00:00:00 sleep 100

而我ssh获得的是7201而不是7202的pid
作者: dididimeme01    时间: 2014-08-08 09:16
进一步修改shell,ssh root@node1 'nohup sleep 100 &>/dev/null & echo $!' >/tmp/1.txt,目前结果正确,node1上的是
[root@node1 ~]# ps -ef|grep sleep
root      7474     1  0 09:15 ?        00:00:00 sleep 100
root      7484  6451  0 09:15 pts/0    00:00:00 grep sleep

得到的也是7474
作者: dididimeme01    时间: 2014-08-08 09:16
就是不明白第二个&的含义
作者: Shell_HAT    时间: 2014-08-08 09:19
回复 12# dididimeme01


第一个等效于:
ssh 127.0.0.1 '{ sleep 100; } >/dev/null 2>/dev/null & echo $!'

第二个才是后台吧
作者: dididimeme01    时间: 2014-08-08 09:36
不对呀,我最后的版本是ssh root@node1 'nohup sleep 100 &>/dev/null & echo $!' >/tmp/1.txt
如果说第二个是后台,那第一个呢,连接标准输出么?而且如果第二个是后台,那怎么两个语句联合在一起了呢?
作者: dididimeme01    时间: 2014-08-08 10:27
个人理解&是代表并且的意思,即前面执行sleep与后面echo是一个进程,有点像C中的先执行了sleep代码之后,另一个线程执行echo,因此pid相同,可以捕捉pid;
而分号代表的是两个进程,因此执行的pid不是一个进程,不过也有点说不通,因为我命令行分别执行sleep 100 & 之后是echo $!,这样的话,应该是两个进程才对,请明白的大拿给解释一下。

作者: reyleon    时间: 2014-08-08 11:08
回复 12# dididimeme01


第一个&是标准输出与标准错误的重定向呐

第二个&才是放到后台执行
作者: reyleon    时间: 2014-08-08 11:09
回复 18# dididimeme01


    并且是两个&&,不是一个
作者: dididimeme01    时间: 2014-08-08 13:45
标准输出不是应该这样么
>/tmp/1.txt  2>&1
作者: dididimeme01    时间: 2014-08-08 13:46
我上面给出的最后结果是执行正确的




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2