论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2011-03-09 12:08 |只看该作者 |倒序浏览

[原创]AMBER，NAMD，GROMACS的CUDA计算性能测试（nVidia Tesla C2050 GPU）
相关搜索: Tesla, GPU, AMBER, 性能测试, CUDA
今天在AMAX提供的免费试用Tesla C2050环境下做了一些测试，把结果发上来。测试地址见 http://www.mdbbs.org/thread-28037-1-1.html

测试环境：Intel(R) Xeon(R) CPU E5520  @ 2.27GHz，双C2050显卡，16GB内存，CentOS 5.5，AMBER 11，NAMD 2.7b2，GROMACS-4.5，网络传输速度比较慢，40kb左右

Tesla C2050 GPU参数：
尺寸规格
9.75英寸PCIe x16规格

Tesla GPU的数量
1

CUDA核心数量
448

CUDA核心频率
1.15 GHz

双精度浮点性能（峰值）
515 Gflops

单精度浮点性能（峰值）
1.03 Tflops

专用存储器总容量*

Tesla C2050
Tesla C2070

3GB GDDR5
6GB GDDR5

存储器频率
1.5 GHz

存储器接口
384位

存储器带宽
144 GB/秒

功耗
238W热设计功耗

系统接口
PCIe x16 Gen2

散热解决方案
主动式风扇散热器

显示器支持

双DVI-I
显示器最大分辨率@ 60Hz

1
2560x1600
软件开发工具
CUDA C/C++/Fortran、OpenCL以及DirectCompute工具包。
针对Visual Studio的NVIDIA®（英伟达™）Parallel Nsight™

详细见：http://www.nvidia.cn/object/product_tesla_C2050_C2070_cn.html

AMBER测试情况：
显示水系统 DHFR NVE = 23,558 atoms （http://ambermd.org/gpus/benchmarks.htm#Benchmarks）

官方结果如图：

我做506ps的时间为：
|  Setup CPU time:          2.40 seconds
|  NonSetup CPU time:    2606.05 seconds
|  Total CPU time:       2608.45 seconds    0.72 hours
|  Setup wall time:          2 seconds
|  NonSetup wall time:    2610 seconds
|  Total wall time:       2612 seconds    0.73 hours

大概是16.75ns/day，比官方数据小一些，应该是ECC的原因，开ECC会有10%左右的速度损失。
注意到这个测试的cufoff只有8 A，设成1 nm肯定会更慢。另外AMBER只支持单GPU计算。

NAMD测试情况：
我自己的系统，比较多的真空，PME：
CPU+GPU
1）Info: Benchmark time: 2 CPUs 0.0380887 s/step 0.220421 days/ns 39.6772 MB memory
2）Info: Benchmark time: 1 CPUs 0.0623408 s/step 0.360768 days/ns 60.407 MB memory
only CPU
3）Info: Benchmark time: 8 CPUs 0.0262403 s/step 0.151854 days/ns 18.4082 MB memory

Tutor中的nanotube系统：
CPU+GPU
1）Info: Benchmark time: 2 CPUs 0.0071139 s/step 0.0823368 days/ns 5.05727 MB memory
2）Info: Benchmark time: 1 CPUs 0.0176748 s/step 0.204569 days/ns 5.17448 MB memory
only CPU
3）Info: Benchmark time: 8 CPUs 0.00473547 s/step 0.0548087 days/ns 3.77318 MB memory

自带的测试
CPU+GPU
1）Benchmark time: 2 CPUs 0.0346608 s/step 0.401167 days/ns 31.7219 MB memory
only CPU
2）Benchmark time: 8 CPUs 0.049509 s/step 0.57302 days/ns 20.4398 MB memory

对于特定的系统，GPU不见得一定比CPU快。NAMD 2.7b3还未测试，不知效率会不会有提高。

GROMACS测试情况：
AMAX提供的mdrun-openmm是4.0.5的，故自行安装了最新版本的gmx和openmm-2.0，编译openmm的时候用gcc4.4.0出错，gcc4.1.2顺利通过，安装参考我这个帖子http://www.mdbbs.org/thread-23087-1-1.html

3000+原子混合溶液体系
8CPU             0.239 hour/ns
1CPU+1GPU    0.704 hour/ns

==========================================
以上数据仅供参考，可能有操作错误之处，欢迎回帖上传测试数据。

PS：C2050的价格在2w左右，足够一台8核工作站的价格，系统小的话CPU不见得比GPU慢，系统大的话GPU因为显存不足可能不能run，更重要的是GPU的支持有功能上的限制，特别是gmx，即使是支持的功能都还存在非常多的问题。
特大好消息，狂甩了！！
tesla运算卡C2050
全新盒装正品、假一罚百！
特价火热促销中！！
可装整机！有需求者请与我单聊！！！
QQ 1511271443/13681193080 赵文

文库|博客

返回列表

Chinaunix › 论坛 › IT运维 › 服务器及硬件技术 › NVIDIA C2050运算GPU

NVIDIA C2050运算GPU [复制链接]

浏览过的版块