- 论坛徽章:
- 0
|
本帖最后由 图腾部落 于 2010-04-15 14:16 编辑
本次活动已经截止,获奖名单如下:
第一名:
李修宇
点评:算法经过了精心优化,可以适应不同版本的硬件。对程序进行了良好的封装,文档详细
第二名:
马兆锋
点评:在实现方面进行了不少尝试
李晨
点评:比较优化的方法实现了算法
罗家华
点评:学习时间不长就成功实现了算法
吴圣召
点评:文档较为详细
徐辰
点评:尝试了多种算法,并选出了精度较优的算法
第三名:
许文浩
邓子岚
姜惟
Posix_man
starfuck
本次奖品发放走的是快递,因此请获奖者尽快将联系方式提交到qinli@it168.com,联系方式必须具备以下几项:
联系地址:
邮编:
联系电话:
接收人:
联系方式:
MSN:qinli815@hotmail.com[/email]
邮箱:qinli@it168.com(提交作品唯一指定邮箱)
电话:(086)10-59857748
CUDA是用于GPU计算的开发环境,它是一个全新的软硬件架构,可以将GPU视为一个并行数据计算的设备,对所进行的计算进行分配和管理。在CUDA的架构中,这些计算不再像过去所谓的GPGPU架构那样必须将计算映射到图形API(OpenGL和Direct 3D)中,因此对于开发者来说,CUDA的开发门槛大大降低了。CUDA的GPU编程语言基于标准的C语言,因此任何有C语言基础的用户都很容易地开发CUDA的应用程序。
由于GPU的特点是处理密集型数据和并行数据计算,因此CUDA非常适合需要大规模并行计算的领域。
小竞赛日程:
参赛时间:2010年1月25日-2010年3月25日
奖项公布:2010年3月30日
小竞赛对象:
所有CUDA编程爱好者皆可参加。
小竞赛奖品:
特等奖(1名):奖品为神秘高端GeForce Fermi显卡一块(备注:此显卡面对高端市场,具体型号未定,预计3月上市,该奖品发放的时间以产品实际上市时间为准)
优秀奖(5名):奖品为纽曼C100手机1部。
入围奖(20名):奖品为《GPU高性能运算之CUDA》图书一本。
所有提交有效解题代码的网友,将获得200CU积分奖励。优秀评论者将得到100CU积分奖励
小竞赛说明:
本次趣味小竞赛为命题赛,有2道题目供网友选择,网友可以任选其一进行解题。参赛者的解题代码及说明文档请发送至参赛邮箱qinli@staff.chinaunix.net 或直接在本贴回帖里贴出代码跟说明文档。所有参赛者须在邮件中附带自己的个人信息及联系方式,便于奖品发放。
注:严禁抄袭,包括代码和说明文档,一经发现,取消评选资格;代码类似,以发表时间为准,取最早发布或者修改时间者为优秀
CUDA编程小竞赛须采用NVIDIA C for CUDA进行编程。所需要的软件和文档可以到NVIDIA CUDA Zone上下载。网址是:http://www.nvidia.cn/object/cuda_home_cn.html
心动不如行动,还等什么呢?赶快来解题吧。
题目1.并行编程求解线性方程
定义:
条件:
假定A,B为输入,X为输出;其中需满足,A为一个尺寸为1024x1024的上三角的矩阵,B为非0目标矩阵,矩阵中的元素均为single float型;
请用并行算法编程求解上述线性方程。程序封装为可以由C++调用的lib库,并需要提供源代码和接口。
评分方法:
精度较高的解法可以获得额外加分
可以兼容不同尺寸的矩阵可以获得额外加分
题目2:
1.编写程序,测试GPU的:host到device的带宽,device到device的带宽,利用global memory传输的时候带宽,shared memory的带宽,以及local memory的性能
2.程序封装为可以由C++调用的lib库,并需要提供源代码和接口。
3.撰写实验报告,并作出结论
评分方法:
分析数据类型对性能的影响可以获得额外加分
对global memory的性能进行全面分析(尺寸,合并访问条件,数据类型)可以获得额外加分
对host-device和device-host进行多种传输模式和多种尺寸的测试与分析可以获得额外加分
对local meory和shared memory进行详尽分析可以获得额外加分
[ 本帖最后由 图腾部落 于 2010-1-29 15:50 编辑 ] |
|