免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 6164 | 回复: 7
打印 上一主题 下一主题

作业管理torque和maui使用问题:error while loading shared libraries: libimf.so [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-03-16 18:26 |只看该作者 |倒序浏览
尝试组建一个集群(系统centos6.5),按照网上的安装过程http://blog.csdn.net/educast/article/details/7168467,安装了Torque2.5.13和Maui3.3.1,并且参考了南开大学张鋆的集群构建教程,安了了mpiexec 0.84替代pbs_sched.
在主机root下将pbs_server,pbs_mom,maui都正常启动了,子节点上pbs_mon也正常启动了。 pbsnodes可以看到各个节点的情况。
但是测试一个任务时$ qsub submit.pbs, terminal下没有出错信息,但是result文件是空的。查看了first_task.o0,发现里面有出错信息
/usr/local/sbin/pbs_iff: error while loading shared libraries: libimf.so: cannot open shared object file: No such file or directory
mpiexec: Error: get_hosts: pbs_connect: Unauthorized Request .
查找libimf.so,发现在/opt/intel/composer_xe_2013.3.163/compiler/lib/intel64,/opt/intel/composer_xe_2013.3.163/compiler/lib/ia32,/opt/intel/composer_xe_2013.3.163/compiler/lib/mic里面都有,尝试将他们都在/etc/profile和/etc/bashrc里面添到到LD_LIBRARY_PATH,并且source了一下。但是仍然没决决问题。

其实这 个libimf.so找到到,还发生在$sudo /etc/init.d/pbs_server start时。只有在su登录后,才能正常启动。
[root@magnetics weitong]# /etc/init.d/pbs_server start
/var/spool/torque/server_priv/serverdb
Starting TORQUE Server:                                    [确定]

[weitong@magnetics ~]$ sudo /etc/init.d/pbs_server start
[sudo] password for weitong:
/var/spool/torque/server_priv/serverdb
Starting TORQUE Server: /usr/local/sbin/pbs_server: error while loading shared libraries: libimf.so: cannot open shared object file: No such file or directory
                                                           [失败]


*附***submit.pbs*****
#!/bin/sh
#PBS -l nodes=mag02:ppn=8+magnetics:ppn=8 (使用mag02上8个CPU和magnetics上8个CPU)
#PBS -q batch
#PBS -j oe
#PBS -N first_task  (任务名字,随便取)
cd /home/weitong
/usr/local/mpitorque/bin/mpiexec  ./Work/Computing/hellocluster > result

论坛徽章:
0
2 [报告]
发表于 2014-04-19 12:18 |只看该作者
应该还是环境变量中库相关的路径没有设置正确。切换到对应用户后ldd /usr/local/sbin/pbs_server|grep "not found" 看看还有哪些库找不到,把这些库所在的目录加到LD_LIBRARY_PATH里就好了。

论坛徽章:
0
3 [报告]
发表于 2014-04-25 17:17 |只看该作者
事实上我第一个帖子里面已经说了,我已经将/opt/intel/composer_xe_2013.3.163/compiler/lib/intel64路径加入到了LD_LIBRARY_PATH。

后来我的解决办法是:将/opt/intel/composer_xe_2013.3.163/compiler/lib/intel64路径加入到/etc/ld.so.conf, 然后# ldconfig /etc/ld.so.conf,才解决问题。

但是我仍然疑惑为何LD_LIBRARY_PATH不起作用。

论坛徽章:
0
4 [报告]
发表于 2014-05-02 01:14 |只看该作者
真实调用的shell 是什么SHELL? csh/tcsh/bash? 这个要查清楚哟. 否则在console下看LD_LIBRARY_PATH和真正执行脚本可能是不一样的。

论坛徽章:
0
5 [报告]
发表于 2014-05-04 20:54 |只看该作者
回复 4# nntp

我不知道真实调用的shell是什么,如何查看。
我用的就是centos6.5默认的gnome下terminal, 可能是bash吧。


   

论坛徽章:
0
6 [报告]
发表于 2014-05-06 14:00 |只看该作者
回复 5# weitongwei

脚本的第一行#! XXXX
就是定义解释器的。

   

论坛徽章:
0
7 [报告]
发表于 2014-05-13 10:54 |只看该作者
回复 6# psfan

谢谢,指教。

那真实调用的shell又是怎么回事? 这些shell,centos6.5默认都安装了吗?


   

论坛徽章:
0
8 [报告]
发表于 2014-05-13 11:29 |只看该作者
weitongwei 发表于 2014-05-13 10:54
回复 6# psfan

谢谢,指教。


不清楚默认装哪些东西,我都是自定义安装的。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP