免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 9332 | 回复: 1
打印 上一主题 下一主题

linpack测试 错误信息 caused collective abort of all ranks [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-11-09 16:04 |只看该作者 |倒序浏览
本人想在LINUX环境下测试本机的LINPACK值,但在实验过程中碰到如下问题:
   
    环境:    1   RHEL5.2
                     2.MPI---> /usr/local/mpi (安装没有问题)
                     3.atlas库文件来自atlas3.6.0_Linux_P4SSE2.tgz解压文件,    atlas库文件放在/usr/local/netlib下
                          (libatlas.a  libcblas.a  libf77blas.a  liblapack.a)
                     4 .HPL---> /usr/local/hpl (安装没有问题,在bin/“arch“下生成HPL.dat和xhpl)

    运行mpirun -np 4 xhpl 后出现的问题:
================================================================================
HPLinpack 2.0  --  High-Performance Linpack benchmark  --   September 10, 2008
Written by A. Petitet and R. Clint Whaley,  Innovative Computing Laboratory, UTK
Modified by Piotr Luszczek, Innovative Computing Laboratory, UTK
Modified by Julien Langou, University of Colorado Denver
================================================================================

An explanation of the input/output parameters follows:
T/V    : Wall time / encoded variant.
N      : The order of the coefficient matrix A.
NB     : The partitioning blocking factor.
P      : The number of process rows.
Q      : The number of process columns.
Time   : Time in seconds to solve the linear system.
Gflops : Rate of execution for solving the linear system.

The following parameter values will be used:

N      :      29       30       34       35
NB     :       1        2        3        4
PMAP   : Row-major process mapping
P      :       2        1        4
Q      :       2        4        1
PFACT  :    Left    Crout    Right
NBMIN  :       2        4
NDIV   :       2
RFACT  :    Left    Crout    Right
BCAST  :   1ring
DEPTH  :       0
SWAP   : Mix (threshold = 64)
L1     : transposed form
U      : transposed form
EQUIL  : yes
ALIGN  : 8 double precision words

--------------------------------------------------------------------------------

- The matrix A is randomly generated for each test.
- The following scaled residual check will be computed:
      ||Ax-b||_oo / ( eps * ( || x ||_oo * || A ||_oo + || b ||_oo ) * N )
- The relative machine precision (eps) is taken to be               1.110223e-16
- Computational tests pass if scaled residuals are less than                16.0

rank 2 in job 2  localhost.localdomain_56503   caused collective abort of all ranks
  exit status of rank 2: killed by signal 11
rank 0 in job 2  localhost.localdomain_56503   caused collective abort of all ranks
  exit status of rank 0: killed by signal 11


请问上面两行错误是怎么回事?我现在一点眉目都没有。
我在我自己的电脑上面也是按照这样装的,但在我的电脑上面可以(32bit系统)。在服务器上面(64bit系统)就不行。我自己电脑上面就安装了所有的编程软件,服务器上面安装了所有的软件包(以后需要),难道软件环境不同造成的?

/////////////////////////////////////////////////////

                                    Make.Linux_PII_CBLAS

/////////////////////////////////////////////////////


SHELL        = /bin/sh
#
CD           = cd
CP           = cp
LN_S         = ln -s
MKDIR        = mkdir
RM           = /bin/rm -f
TOUCH        = touch

# - Platform identifier ------------------------------------------------
ARCH         = Linux_PII_CBLAS

# - HPL Directory Structure / HPL library ------------------------------
TOPdir       = /usr/local/hpl-2.0
INCdir       = $(TOPdir)/include
BINdir       = $(TOPdir)/bin/$(ARCH)
LIBdir       = $(TOPdir)/lib/$(ARCH)
#
HPLlib       = $(LIBdir)/libhpl.a

# - Message Passing library (MPI) --------------------------------------

MPdir        = /usr/local/mpi
MPinc        = -I$(MPdir)/include
MPlib        = $(MPdir)/lib/libmpich.a

# - Linear Algebra library (BLAS or VSIPL) -----------------------------
LAdir        = /usr/local/netlib
LAinc        =
LAlib        = $(LAdir)/libcblas.a $(LAdir)/libatlas.a


# - F77 / C interface --------------------------------------------------
F2CDEFS      = -DAdd_ -DF77_INTEGER=int -DStringSunStyle


# - HPL includes / libraries / specifics -------------------------------
HPL_INCLUDES = -I$(INCdir) -I$(INCdir)/$(ARCH) $(LAinc) $(MPinc)
HPL_LIBS     = $(HPLlib) $(LAlib) $(MPlib)




# - Compile time options -----------------------------------------------
HPL_OPTS     = -DHPL_CALL_CBLAS
HPL_DEFS     = $(F2CDEFS) $(HPL_OPTS) $(HPL_INCLUDES)



# - Compilers / linkers - Optimization flags ---------------------------
CC           = /usr/bin/gcc
CCNOOPT      = $(HPL_DEFS)
CCFLAGS      = $(HPL_DEFS) -fomit-frame-pointer -O3 -funroll-loops
#
# On some platforms,  it is necessary  to use the Fortran linker to find
# the Fortran internals used in the BLAS library.
#
LINKER       = /usr/local/mpi/bin/mpif77
LINKFLAGS    = $(CCFLAGS)
#
ARCHIVER     = ar
ARFLAGS      = r
RANLIB       = echo
#
# ----------------------------------------------------------------------

   

论坛徽章:
0
2 [报告]
发表于 2009-11-09 19:44 |只看该作者
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP