Chinaunix
标题:
进程执行如何直接获取其进程ID(如果其启动了多份的情况下,精准定位是刚启动的)
[打印本页]
作者:
dididimeme01
时间:
2014-08-07 15:44
标题:
进程执行如何直接获取其进程ID(如果其启动了多份的情况下,精准定位是刚启动的)
大家好,我是想这样做,我有一个集群,我想在一个主机上做主控制,其他节点通过ssh的信任关系执行进程,同时通过ssh获取这些进程的执行情况和占用资源信息;
目前资源收集什么都没有问题了,维度是执行ssh root@node1 "process 100 &"这样的时候无法获取sleep命令的pid,这里要说明一下的是,process可能在node1上已经执行了多份,用ps的话会看到多个运行体,分不清那个是我刚执行的,所以希望看看有什么办法能够在执行ssh的时候直接获取pid?
作者:
dididimeme01
时间:
2014-08-07 16:01
我刚才想用nohup来捕捉,但是发现nohup后显示的pid即不是标准输出也不是标准错误输出,无论用2>还是1>都是无法获取的,请问有别的办法么;
作者:
dididimeme01
时间:
2014-08-07 16:46
我查看了很多资料目前,可以做到的是远程执行nohup的进程,但是还是无法回去这个执行进程的pid
ssh root@node1 <<EOF
nohup sleep 100 >/tmp/1.txt 2>&1 &
EOF
作者:
dididimeme01
时间:
2014-08-07 17:05
又发现一个恶心的地方,ssh远程执行中如果用到awk,会出现失效的情况
例如:
ssh root@node1 <<EOF
nohup sleep 100 >/tmp/1.txt 2>&1 &
ps -ef|grep sleep |grep -v "\<grep\>"|awk '{print $2}' 1>/tmp/1.txt
EOF
执行结果中awk根本就没有生效
作者:
dididimeme01
时间:
2014-08-07 17:09
awk问题解决了,原来是转意问题
ssh root@node1 <<EOF
nohup sleep 100 >/tmp/1.txt 2>&1 &
ps -ef|grep sleep |grep -v "\<grep\>"|/bin/awk '{print \$2}' 1>/tmp/1.txt
EOF
就可以了
作者:
dididimeme01
时间:
2014-08-07 17:17
请问大拿都在那里?给个想法吧
作者:
dididimeme01
时间:
2014-08-07 17:32
再进一步,如果用单机的话
[root@node1 tmp]# nohup sleep 100 &
[1] 32013
[root@node1 tmp]# nohup: ignoring input and appending output to `nohup.out'
[root@node1 tmp]# echo $!
32013
[root@node1 tmp]#
可以获取pid
作者:
Shell_HAT
时间:
2014-08-07 17:49
ssh root@node1 "sleep 100 &; echo \$!"
复制代码
试试
作者:
reyleon
时间:
2014-08-07 18:08
本帖最后由 reyleon 于 2014-08-07 18:19 编辑
回复
1#
dididimeme01
你是想这样么?
@关阴月飞
老师教的
ssh 127.0.0.1 '{ sleep 100; } &>/dev/null & echo $!'
复制代码
命令最好写在大括号代码块里,否则如果有多个命令的话ssh连接是不会直接返回的
作者:
reyleon
时间:
2014-08-07 18:11
回复
8#
Shell_HAT
这种情况会报语法错误呀 {:3_182:}
作者:
dididimeme01
时间:
2014-08-08 09:10
ssh root@node1 '{ sleep 100; } &>/dev/null & echo $!'这个可以,我做实验没有问题,获得了pid,但是加上nohup失败了
作者:
dididimeme01
时间:
2014-08-08 09:12
reyleon能解释一下,大括号和后面的&的意思么,第一&我明白是后台的意思,第二个感觉是并且执行语句的意思,但是为什么不用;呢?
作者:
dididimeme01
时间:
2014-08-08 09:14
但是还有一个问题,就是我获得的pid是一个shell的pid,例如在node1上执行的结果如下:
root 7201 1 0 09:12 ? 00:00:00 bash -c { nohup sleep 100; } &>/dev/null & echo $!
root 7202 7201 0 09:12 ? 00:00:00 sleep 100
而我ssh获得的是7201而不是7202的pid
作者:
dididimeme01
时间:
2014-08-08 09:16
进一步修改shell,ssh root@node1 'nohup sleep 100 &>/dev/null & echo $!' >/tmp/1.txt,目前结果正确,node1上的是
[root@node1 ~]# ps -ef|grep sleep
root 7474 1 0 09:15 ? 00:00:00 sleep 100
root 7484 6451 0 09:15 pts/0 00:00:00 grep sleep
得到的也是7474
作者:
dididimeme01
时间:
2014-08-08 09:16
就是不明白第二个&的含义
作者:
Shell_HAT
时间:
2014-08-08 09:19
回复
12#
dididimeme01
第一个等效于:
ssh 127.0.0.1 '{ sleep 100; } >/dev/null 2>/dev/null & echo $!'
第二个才是后台吧
作者:
dididimeme01
时间:
2014-08-08 09:36
不对呀,我最后的版本是ssh root@node1 'nohup sleep 100 &>/dev/null & echo $!' >/tmp/1.txt
如果说第二个是后台,那第一个呢,连接标准输出么?而且如果第二个是后台,那怎么两个语句联合在一起了呢?
作者:
dididimeme01
时间:
2014-08-08 10:27
个人理解&是代表并且的意思,即前面执行sleep与后面echo是一个进程,有点像C中的先执行了sleep代码之后,另一个线程执行echo,因此pid相同,可以捕捉pid;
而分号代表的是两个进程,因此执行的pid不是一个进程,不过也有点说不通,因为我命令行分别执行sleep 100 & 之后是echo $!,这样的话,应该是两个进程才对,请明白的大拿给解释一下。
作者:
reyleon
时间:
2014-08-08 11:08
回复
12#
dididimeme01
第一个&是标准输出与标准错误的重定向呐
第二个&才是放到后台执行
作者:
reyleon
时间:
2014-08-08 11:09
回复
18#
dididimeme01
并且是两个&&,不是一个
作者:
dididimeme01
时间:
2014-08-08 13:45
标准输出不是应该这样么
>/tmp/1.txt 2>&1
作者:
dididimeme01
时间:
2014-08-08 13:46
我上面给出的最后结果是执行正确的
欢迎光临 Chinaunix (http://bbs.chinaunix.net/)
Powered by Discuz! X3.2