免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3448 | 回复: 0
打印 上一主题 下一主题

NVIDIA C2050运算GPU [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-03-09 12:08 |只看该作者 |倒序浏览
[原创]AMBER,NAMD,GROMACS的CUDA计算性能测试(nVidia Tesla C2050 GPU)
相关搜索: Tesla, GPU, AMBER, 性能测试, CUDA
今天在AMAX提供的免费试用Tesla C2050环境下做了一些测试,把结果发上来。测试地址见 http://www.mdbbs.org/thread-28037-1-1.html

测试环境:Intel(R) Xeon(R) CPU E5520  @ 2.27GHz,双C2050显卡,16GB内存,CentOS 5.5,AMBER 11,NAMD 2.7b2,GROMACS-4.5,网络传输速度比较慢,40kb左右

Tesla C2050 GPU参数:
尺寸规格
9.75英寸PCIe x16规格

Tesla GPU的数量
1

CUDA核心数量
448

CUDA核心频率
1.15 GHz

双精度浮点性能(峰值)
515 Gflops

单精度浮点性能(峰值)
1.03 Tflops

专用存储器总容量*

Tesla C2050
Tesla C2070


3GB GDDR5
6GB GDDR5

存储器频率
1.5 GHz

存储器接口
384位

存储器带宽
144 GB/秒

功耗
238W热设计功耗

系统接口
PCIe x16 Gen2

散热解决方案
主动式风扇散热器

显示器支持

双DVI-I
显示器最大分辨率@ 60Hz

1
2560x1600
软件开发工具
CUDA C/C++/Fortran、OpenCL以及DirectCompute工具包。
针对Visual Studio的NVIDIA®(英伟达™)Parallel Nsight™


详细见:http://www.nvidia.cn/object/product_tesla_C2050_C2070_cn.html

AMBER测试情况:
显示水系统 DHFR NVE = 23,558 atoms (http://ambermd.org/gpus/benchmarks.htm#Benchmarks

官方结果如图:


我做506ps的时间为:
|  Setup CPU time:            2.40 seconds
|  NonSetup CPU time:      2606.05 seconds
|  Total CPU time:         2608.45 seconds     0.72 hours
|  Setup wall time:           2    seconds
|  NonSetup wall time:     2610    seconds
|  Total wall time:        2612    seconds     0.73 hours

大概是16.75ns/day,比官方数据小一些,应该是ECC的原因,开ECC会有10%左右的速度损失。
注意到这个测试的cufoff只有8 A,设成1 nm肯定会更慢。另外AMBER只支持单GPU计算。

NAMD测试情况:
我自己的系统,比较多的真空,PME:
CPU+GPU
1)Info: Benchmark time: 2 CPUs 0.0380887 s/step 0.220421 days/ns 39.6772 MB memory
2)Info: Benchmark time: 1 CPUs 0.0623408 s/step 0.360768 days/ns 60.407 MB memory
only CPU
3)Info: Benchmark time: 8 CPUs 0.0262403 s/step 0.151854 days/ns 18.4082 MB memory

Tutor中的nanotube系统:
CPU+GPU
1)Info: Benchmark time: 2 CPUs 0.0071139 s/step 0.0823368 days/ns 5.05727 MB memory
2)Info: Benchmark time: 1 CPUs 0.0176748 s/step 0.204569 days/ns 5.17448 MB memory
only CPU
3)Info: Benchmark time: 8 CPUs 0.00473547 s/step 0.0548087 days/ns 3.77318 MB memory

自带的测试
CPU+GPU
1)Benchmark time: 2 CPUs 0.0346608 s/step 0.401167 days/ns 31.7219 MB memory
only CPU
2)Benchmark time: 8 CPUs 0.049509 s/step 0.57302 days/ns 20.4398 MB memory

对于特定的系统,GPU不见得一定比CPU快。NAMD 2.7b3还未测试,不知效率会不会有提高。

GROMACS测试情况:
AMAX提供的mdrun-openmm是4.0.5的,故自行安装了最新版本的gmx和openmm-2.0,编译openmm的时候用gcc4.4.0出错,gcc4.1.2顺利通过,安装参考我这个帖子http://www.mdbbs.org/thread-23087-1-1.html

3000+原子混合溶液体系
8CPU                0.239 hour/ns
1CPU+1GPU     0.704 hour/ns

==========================================
以上数据仅供参考,可能有操作错误之处,欢迎回帖上传测试数据。

PS:C2050的价格在2w左右,足够一台8核工作站的价格,系统小的话CPU不见得比GPU慢,系统大的话GPU因为显存不足可能不能run,更重要的是GPU的支持有功能上的限制,特别是gmx,即使是支持的功能都还存在非常多的问题。  
特大好消息,狂甩了!!
tesla运算卡C2050
全新盒装正品、假一罚百!
特价火热促销中!!
可装整机!有需求者请与我单聊!!!
QQ 1511271443/13681193080 赵文
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP