免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123
最近访问板块 发新帖
楼主: 图腾部落
打印 上一主题 下一主题

[C] CUDA编程-趣味小竞赛(获奖名单公布4月2日) [复制链接]

论坛徽章:
0
21 [报告]
发表于 2010-03-02 15:14 |只看该作者
呵呵,很少人参与啊!

我来玩玩。希望能抛砖引玉。

可惜没n家的卡,也懒得装驱动和环境, ...
Posix_man 发表于 2010-02-22 15:27



论坛徽章:
0
22 [报告]
发表于 2010-03-02 15:17 |只看该作者
有没有cuda入门帖啊?
chianshin 发表于 2010-02-22 11:13



有,入门级资料可以在http://cuda.it168.com/查找,近期,IT168会举办一次关于CUDA开发疑难有问必答的活动,稍后我会放出活动页面,大家有什么关于CUDA开发的问题,无论是初级还高级问题,都可以提出,有专家会为您解答。

论坛徽章:
0
23 [报告]
发表于 2010-03-02 15:21 |只看该作者
呵呵,很少人参与啊!

我来玩玩。希望能抛砖引玉。

可惜没n家的卡,也懒得装驱动和环境, ...
Posix_man 发表于 2010-02-22 15:27



如果附带个简介说明就好了。

论坛徽章:
0
24 [报告]
发表于 2010-03-04 11:58 |只看该作者
我刚才的那个程序是比较简单的,只是想测试一下cuda的运行环境。

首先在驱动程序main()中初始化设备,取的GPU设备的总数,然后枚举这些设备,本程序是针对一个GPU设备的,所以需要找到一个有最大并行数并可用的设备。

然后再等客户手工输入矩阵A,B,先是大小,再是具体数值。

完成矩阵后,调用 MatrixMul4OneDev()函数分配gpu的运算内存,并复制矩阵的对应数值。

当矩阵数值复制到GPU的内容后,根据GPU并行的大小建立并行线程的网格,和块。

然后调用 MatMulKernel()并行计算。

基本内容就是上述这些了。不过我没有cuda的环境,还在等哪位朋友帮忙编译运算一下,指出我代码中的错误呢!

论坛徽章:
0
25 [报告]
发表于 2010-03-10 17:35 |只看该作者
看看  拉
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP