花了很久搞SGE集群,现将文档详细地整理出来,希望对大家有帮助
本帖最后由 heart_eternal 于 2011-08-21 12:04 编辑弄SGE集群,差不多有二十多天,其间遇到了很多问题,但是感觉相关的资料不是很多。
不过多亏了论坛、百度知道、群里的朋友们,
帮我解决了很多问题。
现将文档详细地整理出来,希望对大家有帮助,
也是回馈帮助过我的人。
谢谢大家啊。
一个人的力量很小,需要合作啊。 下载了,要顶一下的啊
求顶啊, 感谢分享。
安装的过程其实可以简化
1、将sge安装到一个共享目录中,所有节点都可以存取该目录,并且路径一致,这个可以同过nfs实现
2、在sge的安装目录中有一个start_gui_install文件,运行该文件安装即可,可以一次性将管理节点和计算节点安装好。这个文件执行需要java支持
3、将$SGE_ROOT/default/common/setting.*拷贝到/etc/profile.d目录下
以上安装环境是centos。
一般来说串行作业提交比较简单,但是并行作业的提交还需要做一些设置,并且提交的脚本要定制。SGE还可以和一些license服务结合,在一些计算软件需要lincese的时候自动判断license的数量是否足够,不过这部分我一直没有搞通过,不知道有没有高手共享? 感谢分享。
安装的过程其实可以简化
1、将sge安装到一个共享目录中,所有节点都可以存取该目录,并且路径 ...
yjs_sh 发表于 2011-08-21 16:59 http://bbs.chinaunix.net/images/common/back.gif
是的啊,一开始,我也是通过nfs共享/gridware/sge的。
由于每次开机,都要执行/gridwae/sge/default/settings.sh,后来,我想直接拷贝到每台机子上,不用通过网络,读取会快一些。所以就改了。
那个start_gui_installer,我也试了,但在添加节点的时候,一直显示unreachable,不知为什么。
设置开机执行settings.sh,我是写到/etc/profile里面的。
很高兴认识你啊,
我的qq是575967039,加个好友吧,有问题大家可以讨论啊 unreachable问题应该处在主机名的解析上或者配置无密码互相访问上。主机名必须和$SGE_ROOT/utlitbin/gethosname结果一致
如果是单网卡、单主机名使用start_gui_install应该问题不大。如果多网卡、多主机名(别名),start_gui_install经常会出现resolvable,无法下去了 我在想NFS挂了,有影响么? 当然有影响,数据都存取不到了。 顶,下了看看,学习一下,呵呵 回复 4# heart_eternal
楼主,最近我也想搞sge,多多指教!
之前是安装过测试环境了,就是不知道怎么做到并行计算!
还有,既然安装了sge,不想让用户直接运行eda工具,必须用qsh或qsub之类的sge命令,你这个是怎么做到的?? 回复heart_eternal
楼主,最近我也想搞sge,多多指教!
之前是安装过测试环境了,就是不知 ...
caixicheng 发表于 2011-08-26 16:56 http://bbs.chinaunix.net/images/common/back.gif
你好,我也就是了解一些,没什么能指教的,不过如果有问题,大家可以一起讨论。
我的qq是575967039,
很愿意一起讨论,相互学习。