免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4140 | 回复: 7
打印 上一主题 下一主题

测试机器,这结果,还有天理嘛?还有王法嘛?! [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-09-02 16:02 |只看该作者 |倒序浏览
机器配置:I3 2100 (关闭超线程、虚拟化,以双核使用),4G ddr3
  1. model name        : Intel(R) Core(TM) i3-2100 CPU @ 3.10GHz

  2. [fortest@Fedora Linux_PII_CBLAS]$ free -m
  3.              total       used       free     shared    buffers     cached
  4. Mem:          3390        833       2556          0         36        392
  5. -/+ buffers/cache:        405       2984
  6. Swap:         5439          0       5439

  7. 数学库:GotoBLAS2-1.13_bsd.tar.gz

  8. [fortest@Fedora Linux_PII_CBLAS]$ mpirun -V
  9. mpirun (Open MPI) 1.4.3

  10. HPL 2.0
复制代码
分别使用单进程、openmpi启双进程,测试结果如下:

单进程:

  1. The following parameter values will be used:

  2. N      :    8192
  3. NB     :     128
  4. PMAP   : Row-major process mapping
  5. P      :       1
  6. Q      :       1
  7. PFACT  :    Left    Crout    Right
  8. NBMIN  :       2        4
  9. NDIV   :       2
  10. RFACT  :    Left    Crout    Right
  11. BCAST  :   1ring
  12. DEPTH  :       0
  13. SWAP   : Mix (threshold = 64)
  14. L1     : transposed form
  15. U      : transposed form
  16. EQUIL  : yes
  17. ALIGN  : 8 double precision words

  18. --------------------------------------------------------------------------------

  19. - The matrix A is randomly generated for each test.
  20. - The following scaled residual check will be computed:
  21.       ||Ax-b||_oo / ( eps * ( || x ||_oo * || A ||_oo + || b ||_oo ) * N )
  22. - The relative machine precision (eps) is taken to be               1.110223e-16
  23. - Computational tests pass if scaled residuals are less than                16.0

  24. ================================================================================
  25. T/V                N    NB     P     Q               Time                 Gflops
  26. --------------------------------------------------------------------------------
  27. WR00L2L2        8192   128     1     1              17.86              2.052e+01
  28. --------------------------------------------------------------------------------
  29. ||Ax-b||_oo/(eps*(||A||_oo*||x||_oo+||b||_oo)*N)=        0.0008950 ...... PASSED
复制代码
open-mpi启双进程:

  1. The following parameter values will be used:

  2. N      :    8192
  3. NB     :     128
  4. PMAP   : Row-major process mapping
  5. P      :       1
  6. Q      :       2
  7. PFACT  :    Left    Crout    Right
  8. NBMIN  :       2        4
  9. NDIV   :       2
  10. RFACT  :    Left    Crout    Right
  11. BCAST  :   1ring
  12. DEPTH  :       0
  13. SWAP   : Mix (threshold = 64)
  14. L1     : transposed form
  15. U      : transposed form
  16. EQUIL  : yes
  17. ALIGN  : 8 double precision words

  18. --------------------------------------------------------------------------------

  19. - The matrix A is randomly generated for each test.
  20. - The following scaled residual check will be computed:
  21.       ||Ax-b||_oo / ( eps * ( || x ||_oo * || A ||_oo + || b ||_oo ) * N )
  22. - The relative machine precision (eps) is taken to be               1.110223e-16
  23. - Computational tests pass if scaled residuals are less than                16.0

  24. ================================================================================
  25. T/V                N    NB     P     Q               Time                 Gflops
  26. --------------------------------------------------------------------------------
  27. WR00L2L2        8192   128     1     2              20.39              1.798e+01
  28. --------------------------------------------------------------------------------
  29. ||Ax-b||_oo/(eps*(||A||_oo*||x||_oo+||b||_oo)*N)=        0.0009460 ...... PASSED
  30. ================================================================================
  31. T/V                N    NB     P     Q               Time                 Gflops
  32. --------------------------------------------------------------------------------
  33. WR00L2L4        8192   128     1     2              20.17              1.818e+01
复制代码
测试过程中使用top监控CPU使用率,发现单进程时,2个核都跑到了90%以上,xhpl进程占cpu在190%左右。

为什么单进程成绩会比多进程更好呢?

论坛徽章:
0
2 [报告]
发表于 2011-09-02 16:28 |只看该作者
忘贴系统环境了:
  1. [fortest@Fedora ~]$ uname -a
  2. Linux Fedora 2.6.40.3-0.fc15.i686 #1 SMP Tue Aug 16 04:24:09 UTC 2011 i686 i686 i386 GNU/Linux
  3. [fortest@Fedora ~]$ gcc -v
  4. Using built-in specs.
  5. COLLECT_GCC=/usr/bin/gcc
  6. COLLECT_LTO_WRAPPER=/usr/libexec/gcc/i686-redhat-linux/4.6.0/lto-wrapper
  7. Target: i686-redhat-linux
  8. Configured with: ../configure --prefix=/usr --mandir=/usr/share/man --infodir=/usr/share/info --with-bugurl=http://bugzilla.redhat.com/bugzilla --enable-bootstrap --enable-shared --enable-threads=posix --enable-checking=release --with-system-zlib --enable-__cxa_atexit --disable-libunwind-exceptions --enable-gnu-unique-object --enable-linker-build-id --enable-languages=c,c++,objc,obj-c++,java,fortran,ada,go,lto --enable-plugin --enable-java-awt=gtk --disable-dssi --with-java-home=/usr/lib/jvm/java-1.5.0-gcj-1.5.0.0/jre --enable-libgcj-multifile --enable-java-maintainer-mode --with-ecj-jar=/usr/share/java/eclipse-ecj.jar --disable-libjava-multilib --with-ppl --with-cloog --with-tune=generic --with-arch=i686 --build=i686-redhat-linux
  9. Thread model: posix
  10. gcc version 4.6.0 20110603 (Red Hat 4.6.0-10) (GCC)
  11. [fortest@Fedora ~]$ mpicc -v
  12. Using built-in specs.
  13. COLLECT_GCC=/usr/bin/gcc
  14. COLLECT_LTO_WRAPPER=/usr/libexec/gcc/i686-redhat-linux/4.6.0/lto-wrapper
  15. Target: i686-redhat-linux
  16. Configured with: ../configure --prefix=/usr --mandir=/usr/share/man --infodir=/usr/share/info --with-bugurl=http://bugzilla.redhat.com/bugzilla --enable-bootstrap --enable-shared --enable-threads=posix --enable-checking=release --with-system-zlib --enable-__cxa_atexit --disable-libunwind-exceptions --enable-gnu-unique-object --enable-linker-build-id --enable-languages=c,c++,objc,obj-c++,java,fortran,ada,go,lto --enable-plugin --enable-java-awt=gtk --disable-dssi --with-java-home=/usr/lib/jvm/java-1.5.0-gcj-1.5.0.0/jre --enable-libgcj-multifile --enable-java-maintainer-mode --with-ecj-jar=/usr/share/java/eclipse-ecj.jar --disable-libjava-multilib --with-ppl --with-cloog --with-tune=generic --with-arch=i686 --build=i686-redhat-linux
  17. Thread model: posix
  18. gcc version 4.6.0 20110603 (Red Hat 4.6.0-10) (GCC)
复制代码
  1. [fortest@Fedora Linux_PII_CBLAS]$ mpif90 -v
  2. Using built-in specs.
  3. COLLECT_GCC=/usr/bin/gfortran
  4. COLLECT_LTO_WRAPPER=/usr/libexec/gcc/i686-redhat-linux/4.6.0/lto-wrapper
  5. Target: i686-redhat-linux
  6. Configured with: ../configure --prefix=/usr --mandir=/usr/share/man --infodir=/usr/share/info --with-bugurl=http://bugzilla.redhat.com/bugzilla --enable-bootstrap --enable-shared --enable-threads=posix --enable-checking=release --with-system-zlib --enable-__cxa_atexit --disable-libunwind-exceptions --enable-gnu-unique-object --enable-linker-build-id --enable-languages=c,c++,objc,obj-c++,java,fortran,ada,go,lto --enable-plugin --enable-java-awt=gtk --disable-dssi --with-java-home=/usr/lib/jvm/java-1.5.0-gcj-1.5.0.0/jre --enable-libgcj-multifile --enable-java-maintainer-mode --with-ecj-jar=/usr/share/java/eclipse-ecj.jar --disable-libjava-multilib --with-ppl --with-cloog --with-tune=generic --with-arch=i686 --build=i686-redhat-linux
  7. Thread model: posix
  8. gcc version 4.6.0 20110603 (Red Hat 4.6.0-10) (GCC)
复制代码
求大侠指点下!!!谢谢!!!

论坛徽章:
0
3 [报告]
发表于 2011-09-02 20:17 |只看该作者
路过的高手和达人们,请留下您宝贵的箴言吧……

论坛徽章:
0
4 [报告]
发表于 2011-09-04 22:02 |只看该作者
你编译GotoBLAS的时候,使用了多线程。

ps  -Lef查看

所以,单进程也把CPU都占满了。双进程由于开了多个线程,Linpack效率就很低了。

export OMP_NUM_THREADS=1
或者
更改GotoBLAS的配置文件,重新编译。

论坛徽章:
0
5 [报告]
发表于 2011-09-07 09:01 |只看该作者
回复 4# blues083


    太感谢了!!!我回头就试。再次严重感谢!!!

论坛徽章:
0
6 [报告]
发表于 2011-09-07 10:33 |只看该作者
试验结果出来了,的确是blues083所说,感谢感谢!!!

论坛徽章:
0
7 [报告]
发表于 2011-09-07 16:17 |只看该作者
呵呵,好!

论坛徽章:
0
8 [报告]
发表于 2011-09-26 20:41 |只看该作者
CU就是牛人多啊。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP