- 论坛徽章:
- 0
|
原帖由 nntp 于 2006-2-20 08:16 发表
你的环境写的比较清楚了,我的建议如下:
1. 不建议 hpc科学计算集群(beowulf), 因为内存和cpu交换次数多,如果用beowulf的话,计算网络这块用普通的GbE网,mpi延迟会很大, 你的预算和规模又不允许采用infiniband. AMD 64的处理器架构,由于NuMA的结构设计,在计算领域对你这种应用性能上表现得非常出色. 我已经有多个国内研究机构和IC制造行业的客户案例.
Beowulf确实不太适合IC行业,同时,openmosix我认为也不适合,原因是openmosix会内部大量通信,调度过于频繁.
2. 建议采购
AMD64 Opteron 4way 双核 服务器 内存配置 1:4或者1:8,也就是16G或32GB x 2 (比如HP DL585 DC)
AMD64 Opteron 2way 双核 服务器 内存配置 1:4 ,也就是 8GB x 1, SCSI/SAS硬盘若干,支持RAID.(比如HP DL385 DC)
为什么用双核?我一直认为双核目前看来价格过高,效率没单核快,要知道,license可是很贵的.它多用一个小时,license的费用就多很多了.
很多人向我推荐双核,我可是一直没用.我寻求的是一个性价比平衡.不过双核肯定是趋势.
3. 各服务器 角色定位
4路的机器承担主要运算工作, 安装CentOS for AMD64/EM64t 版本 , 4.2以上
2路服务器作为任务调度节点/管理节点/存储节点
存储和计算一定分开.任务调度其实可以跟计算一起
4. 我用了3台机器但是并不是集群, 所有的用户login(ssh) 到2路服务器上,在这个服务器CLI方式通过任务调度器递交计算作业,或通过 vnc/xmanager/reflectionX,用你的EDA的图形前端递交任务.
这样的方式不错.我个人建议考虑一台App--后面跟多台computing nodes,nvidia好像就是这样,当然工程师还是可以作弊,比如交互式提交
5. 2路服务器上的任务调度器,配置成不要做beowulf计算方式,把 4路的2台设备都加入到管理域里面,设置成任务分别递交到不同的服务器上(我建议按照用户的任务调度器里面的login账户来区分,这样管理上最方便,比如说 a b c 用户login到2路服务器递交作业的时候,总是分配到 第一台四路服务器,d e f 则分配到第二台. 这种配置在任务调度器里面非常容易设置)
因为不做MPI 的分布式计算,所以任务调度器我建议用SGE(Sun Grid Engine) 我用过 openPBS, PBSpro, LSF, SGE,用下来个人觉得还是SGE最方便.
从这点看,版主经验丰富.以后多多向你学习.SGE对我来说,感觉就两个字:复杂
6. 如果你的工作站或者其他服务器可以腾开的话,也可以加入到任务调度器的管理域中,废物利用.
7. 这种NuMA的方式非常适合你描述的这种计算类型, 当然如果你的EDA没有前后端的,可能我们就要另行讨论了 :")
EDA领域我做的类似你这种情况的项目用的是 Rsoft 的Fullwave(复杂光学元器件设计) 和Metor Graphic(ASIC设计)的应用计算环境.
请问Mentor的是什么软件?Calibre?还是其他?
谢谢!
good luck.
不好意思,直接引用一下. |
|