heart_eternal 发表于 2011-08-21 10:32

花了很久搞SGE集群,现将文档详细地整理出来,希望对大家有帮助

本帖最后由 heart_eternal 于 2011-08-21 12:04 编辑

弄SGE集群,差不多有二十多天,其间遇到了很多问题,但是感觉相关的资料不是很多。
不过多亏了论坛、百度知道、群里的朋友们,
帮我解决了很多问题。

现将文档详细地整理出来,希望对大家有帮助,
也是回馈帮助过我的人。

谢谢大家啊。
一个人的力量很小,需要合作啊。

heart_eternal 发表于 2011-08-21 12:02

下载了,要顶一下的啊
求顶啊,

yjs_sh 发表于 2011-08-21 16:59

感谢分享。
安装的过程其实可以简化
1、将sge安装到一个共享目录中,所有节点都可以存取该目录,并且路径一致,这个可以同过nfs实现
2、在sge的安装目录中有一个start_gui_install文件,运行该文件安装即可,可以一次性将管理节点和计算节点安装好。这个文件执行需要java支持
3、将$SGE_ROOT/default/common/setting.*拷贝到/etc/profile.d目录下

以上安装环境是centos。
一般来说串行作业提交比较简单,但是并行作业的提交还需要做一些设置,并且提交的脚本要定制。SGE还可以和一些license服务结合,在一些计算软件需要lincese的时候自动判断license的数量是否足够,不过这部分我一直没有搞通过,不知道有没有高手共享?

heart_eternal 发表于 2011-08-21 20:02

感谢分享。
安装的过程其实可以简化
1、将sge安装到一个共享目录中,所有节点都可以存取该目录,并且路径 ...
yjs_sh 发表于 2011-08-21 16:59 http://bbs.chinaunix.net/images/common/back.gif

是的啊,一开始,我也是通过nfs共享/gridware/sge的。
由于每次开机,都要执行/gridwae/sge/default/settings.sh,后来,我想直接拷贝到每台机子上,不用通过网络,读取会快一些。所以就改了。

那个start_gui_installer,我也试了,但在添加节点的时候,一直显示unreachable,不知为什么。

设置开机执行settings.sh,我是写到/etc/profile里面的。

很高兴认识你啊,
我的qq是575967039,加个好友吧,有问题大家可以讨论啊

yjs_sh 发表于 2011-08-22 08:59

unreachable问题应该处在主机名的解析上或者配置无密码互相访问上。主机名必须和$SGE_ROOT/utlitbin/gethosname结果一致
如果是单网卡、单主机名使用start_gui_install应该问题不大。如果多网卡、多主机名(别名),start_gui_install经常会出现resolvable,无法下去了

Iveon 发表于 2011-08-22 10:20

我在想NFS挂了,有影响么?

yjs_sh 发表于 2011-08-22 10:40

当然有影响,数据都存取不到了。

ace_fei 发表于 2011-08-24 09:56

顶,下了看看,学习一下,呵呵

caixicheng 发表于 2011-08-26 16:56

回复 4# heart_eternal


    楼主,最近我也想搞sge,多多指教!
   之前是安装过测试环境了,就是不知道怎么做到并行计算!
   还有,既然安装了sge,不想让用户直接运行eda工具,必须用qsh或qsub之类的sge命令,你这个是怎么做到的??

heart_eternal 发表于 2011-08-26 17:59

回复heart_eternal


    楼主,最近我也想搞sge,多多指教!
   之前是安装过测试环境了,就是不知 ...
caixicheng 发表于 2011-08-26 16:56 http://bbs.chinaunix.net/images/common/back.gif


    你好,我也就是了解一些,没什么能指教的,不过如果有问题,大家可以一起讨论。
    我的qq是575967039,
    很愿意一起讨论,相互学习。
页: [1] 2 3 4 5 6 7 8
查看完整版本: 花了很久搞SGE集群,现将文档详细地整理出来,希望对大家有帮助