Chinaunix

标题: linuxAS3进行mpi并行计算,是不是出现问题,帮个忙给看看!谢谢 [打印本页]

作者: ssn22m    时间: 2006-03-10 09:55
标题: linuxAS3进行mpi并行计算,是不是出现问题,帮个忙给看看!谢谢
各位大哥,我公司使用linuxAS3进行mpi并行计算,时不时会有机器死掉,有没有预防措施?定期重起或者有软件可以控制?
作者: nntp    时间: 2006-03-10 17:33
原帖由 ssn22m 于 2006-3-10 09:55 发表
各位大哥,我公司使用linuxAS3进行mpi并行计算,时不时会有机器死掉,有没有预防措施?定期重起或者有软件可以控制?


你可不能做事后补救亚.

1. 解决crash的问题

2. 选择可靠的cluster构建方法 (节点数<32的,我建议用rocks)

3. 把cluster方案中提供的监控和调式工具都用起来 (ganglia, SGE 's debug feature ....)




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2