- 论坛徽章:
- 0
|
[原创]AMBER,NAMD,GROMACS的CUDA计算性能测试(nVidia Tesla C2050 GPU)
相关搜索: Tesla, GPU, AMBER, 性能测试, CUDA
今天在AMAX提供的免费试用Tesla C2050环境下做了一些测试,把结果发上来。测试地址见 http://www.mdbbs.org/thread-28037-1-1.html
测试环境:Intel(R) Xeon(R) CPU E5520 @ 2.27GHz,双C2050显卡,16GB内存,CentOS 5.5,AMBER 11,NAMD 2.7b2,GROMACS-4.5,网络传输速度比较慢,40kb左右
Tesla C2050 GPU参数:
尺寸规格
9.75英寸PCIe x16规格
Tesla GPU的数量
1
CUDA核心数量
448
CUDA核心频率
1.15 GHz
双精度浮点性能(峰值)
515 Gflops
单精度浮点性能(峰值)
1.03 Tflops
专用存储器总容量*
Tesla C2050
Tesla C2070
3GB GDDR5
6GB GDDR5
存储器频率
1.5 GHz
存储器接口
384位
存储器带宽
144 GB/秒
功耗
238W热设计功耗
系统接口
PCIe x16 Gen2
散热解决方案
主动式风扇散热器
显示器支持
双DVI-I
显示器最大分辨率@ 60Hz
1
2560x1600
软件开发工具
CUDA C/C++/Fortran、OpenCL以及DirectCompute工具包。
针对Visual Studio的NVIDIA®(英伟达™)Parallel Nsight™
详细见:http://www.nvidia.cn/object/product_tesla_C2050_C2070_cn.html
AMBER测试情况:
显示水系统 DHFR NVE = 23,558 atoms (http://ambermd.org/gpus/benchmarks.htm#Benchmarks)
官方结果如图:
我做506ps的时间为:
| Setup CPU time: 2.40 seconds
| NonSetup CPU time: 2606.05 seconds
| Total CPU time: 2608.45 seconds 0.72 hours
| Setup wall time: 2 seconds
| NonSetup wall time: 2610 seconds
| Total wall time: 2612 seconds 0.73 hours
大概是16.75ns/day,比官方数据小一些,应该是ECC的原因,开ECC会有10%左右的速度损失。
注意到这个测试的cufoff只有8 A,设成1 nm肯定会更慢。另外AMBER只支持单GPU计算。
NAMD测试情况:
我自己的系统,比较多的真空,PME:
CPU+GPU
1)Info: Benchmark time: 2 CPUs 0.0380887 s/step 0.220421 days/ns 39.6772 MB memory
2)Info: Benchmark time: 1 CPUs 0.0623408 s/step 0.360768 days/ns 60.407 MB memory
only CPU
3)Info: Benchmark time: 8 CPUs 0.0262403 s/step 0.151854 days/ns 18.4082 MB memory
Tutor中的nanotube系统:
CPU+GPU
1)Info: Benchmark time: 2 CPUs 0.0071139 s/step 0.0823368 days/ns 5.05727 MB memory
2)Info: Benchmark time: 1 CPUs 0.0176748 s/step 0.204569 days/ns 5.17448 MB memory
only CPU
3)Info: Benchmark time: 8 CPUs 0.00473547 s/step 0.0548087 days/ns 3.77318 MB memory
自带的测试
CPU+GPU
1)Benchmark time: 2 CPUs 0.0346608 s/step 0.401167 days/ns 31.7219 MB memory
only CPU
2)Benchmark time: 8 CPUs 0.049509 s/step 0.57302 days/ns 20.4398 MB memory
对于特定的系统,GPU不见得一定比CPU快。NAMD 2.7b3还未测试,不知效率会不会有提高。
GROMACS测试情况:
AMAX提供的mdrun-openmm是4.0.5的,故自行安装了最新版本的gmx和openmm-2.0,编译openmm的时候用gcc4.4.0出错,gcc4.1.2顺利通过,安装参考我这个帖子http://www.mdbbs.org/thread-23087-1-1.html
3000+原子混合溶液体系
8CPU 0.239 hour/ns
1CPU+1GPU 0.704 hour/ns
==========================================
以上数据仅供参考,可能有操作错误之处,欢迎回帖上传测试数据。
PS:C2050的价格在2w左右,足够一台8核工作站的价格,系统小的话CPU不见得比GPU慢,系统大的话GPU因为显存不足可能不能run,更重要的是GPU的支持有功能上的限制,特别是gmx,即使是支持的功能都还存在非常多的问题。
特大好消息,狂甩了!!
tesla运算卡C2050
全新盒装正品、假一罚百!
特价火热促销中!!
可装整机!有需求者请与我单聊!!!
QQ 1511271443/13681193080 赵文
|
|