- 论坛徽章:
- 0
|
由于我们已经配置好了Server 和 Node1
我们现在增加一台服务器,取名字为Node2
你需要使用安装盘,安装网卡驱动。我们的主版为Super_micro X7DVL-E 网卡为Intel得千兆网卡。找到安装盘路径
make install
rmmod e1000
insmod /lib/modules/**/kernel/drivers/net/e1000/e1000.ko
modprobe e1000
编辑/ect/modprobe.config 增加
alias eth0 e1000
alias eth1 e1000
然后设置网络
ifconfig eth0 192.168.1.x
设置成功,你可以用ping内部其他接点来确定网络正常。
更改/etc/hosts/
192.168.1.254 server
192.168.1.1 node1
192.168.1.x node2
增加文件/etc/host.conf
multi on
更改文件/etc/sysconfig/network
HOSTNAME=node2.cluster
NISDOMAIN=cluster
并修改server 和 node1得/etc/hosts文件,增加 192.168.1.x node2
你需要确认你的node2 机器是否安装NFS. 如果没安装,则安装 nfs-utils-0.3.3-5.i386.rpm
mount -t nfs -o bg,hard,intr server.cluster:/home /home
mount -t nfs -o bg,hard,intr server.cluster:/opt /opt
mount -t nfs -o bg,hard,intr server.cluster:/usr/local /usr/local
然后启动NIS 客户端服务
domainname cluster
增加 /etc/yp.conf
domain cluster server 192.168.1.254
你需要修改node2 中 /etc/passwd 增加所有用户。这样所有的用户可通过ssh和node2 连接。
并加上"+::::::"
增加文件/etc/nsswitch.conf
passwd: nis files
shadow: nis files
group: nis files
hosts: nis files dns
你只需要把server路径下/var/spool/torque/ 拷贝到 nod2 /var/spool/ 下面
然后运行/usr/local/sbin/pbs_mom
然后更改server路径下 /var/spool/torque/server_priv/nodes 文件 添加
node2.cluster np=8
然后 运行
qmgr -c "set queue batch resources_max.ncpus=14 (为你的所有接点的cpu总数)"
然后重现启动 pbs 服务 运行
qterm
/usr/local/sbin/pbs_server
为了运行并行任务,你首先必须安装mpi,我们选择MPICH_2 安装后你可以测试,首先运行mpd,然后运行mpirun 如果你需要测试多接点,你必须运行mpdboot 然后再运行mpirun来测试。
但是由于我们现在要使用PBS中 mom守护进程来运行MPI.所以你需要安装MPI_exec。我们安装版本为mpiexec-0.82 而Torque得版本为最新。如果不是最新,你必须安装patch.
安装MPIexec必须注意由于我们使用MPICH_2。
./configure --with-default-comm=pmi
这样你就可以使用MPIexec来运行你的并行程序了,而不需要启动MPD守护进程。
本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u3/104783/showart_2090738.html |
|