免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: prolj

CUDA很不错啊 [复制链接]

论坛徽章:
0
发表于 2009-01-04 17:08 |显示全部楼层
原帖由 fineamy 于 2009-1-3 00:21 发表
CUDA如果能发展到不访问主内存就好了!不过对PC来讲这可能是奢望了



多了个"不"字吧?

论坛徽章:
0
发表于 2009-01-04 17:10 |显示全部楼层
原帖由 cjaizss 于 2009-1-3 00:52 发表

多核么,恩,架构还是有区别的。你认为这种分布式的结构一定好吗?我看也不见得,各有特点吧。
再者,分布式也不年轻了,研究了那么多年,以前一般是计算机之间,现在可以在嵌入式内部玩。
分布式的概念花样炒 ...

......我蒙一下,估计最后也破产。

论坛徽章:
0
发表于 2009-01-05 16:04 |显示全部楼层
openCL 现在是主推嵌入的。。

论坛徽章:
0
发表于 2009-01-08 15:19 |显示全部楼层
OpenCL在iPhone上?不知道干嘛,不过iPhone的确不错。Mac的东西都不错,看得见摸得着,价钱也可以接受,用起来也比较舒服。

论坛徽章:
0
发表于 2009-01-08 15:54 |显示全部楼层
如果是传统同构多核的HPC上的应用丰富或者好写的话,NV这种异构多核HPC上应该是一样的,因为GPU和CPU的地址空间分开,而GPU那块仍然是同构多核的。而且在编译上没什么新东西,仍然是粗细粒度并行,在循环上上使劲,对于故意写的不能优化的循环仍然跳过,至于向量,不知道有没有那个向量计算的部件,更多的在IPO那里做一些。cache分块或者什么就免了,直接算法DDR3的显存去了。寄存器不清楚,向量还是什么?图染色应该不行了。
有人不是把浮点改成整数提高性能么?CUDA上最不济也可以把整数改成浮点进行并行计算啊。
在Win上科研人员可以用Matlab跑CUDA,让他们去C?人家愿意么?这就是CUDA的优势。
而且更大的优势在于,台湾的工艺生产显卡没问题,简单的工艺就可以带来巨大的并行。为什么不用呢?非得IBM的最好的工艺才能并行出来的U才是好的?
优势还在于可以不改变现有的软硬件基础,直接在Win上跑,传统HPC自己改的那非主流的Linux可以?(不是说Linux非主流,是说HPC自己把Linux改的非主流了)CUDA仅作用于需要被并行的计算,并行OS中的for循环去?很有创意!不知道传统HPC有这么做的没。
NV这个HPC这么便宜为什么不买非要买贵的?不是败家子就是有XXX
NV那个GPU的Core真多,不知道别的传统HPC多核之间都用什么主流或者非主流的XX Bus,也不知道是很好的性能还是啥鸟性能。
NV那个HPC的带宽很不错,不知道别的传统HPC呢...牛还是鸟?
买一个NV的HPC放在机房里,不用专门的水冷,SGI那个1000核的水冷Atom用不上了,空调是必须的,就算没有机器你夏天不开空调?
综合下来,这东西不错。期待大牛来讲讲其他有竞争的机器的Arch,从技术方面比较,毕竟这里是技术论坛。

GPU和CPU的地址空间分开,就像RISC的U那样LOAD/STORE那样,MS的DX应该在隐藏LOAD/STROE上做了文章,这点纯属猜测,知道的多来讲讲吧。

如果说出海的时候在大海里感到自己渺小的话,在优雅的算法面前就会感到自己的白痴,代码的海洋不是迷失就是征服。NV的老大是华人啊,华人科学家和工程师不知道有多少在引领潮流。计算机科学日新月异,创新永远都是自主思考的人做的,我这样的白痴只能在人家后面学习,当然不自主思考的可以做他主子的喉舌,所以我真的不应该总这么瞎胡扯了,弄得自己跟NV的五毛似的。
各位多多讨论先进技术吧。大家一起来交流一下自己对Arch的看法和自己的思路,都自主思考思考。

论坛徽章:
0
发表于 2009-01-09 12:50 |显示全部楼层
原帖由 prolj 于 2009-1-8 15:54 发表
如果是传统同构多核的HPC上的应用丰富或者好写的话,NV这种异构多核HPC上应该是一样的,因为GPU和CPU的地址空间分开,而GPU那块仍然是同构多核的。而且在编译上没什么新东西,仍然是粗细粒度并行,在循环上上使 ...



AGREE!
廉价,节能,高性能!!
才能普及

论坛徽章:
3
2015年迎新春徽章
日期:2015-03-04 09:56:11数据库技术版块每日发帖之星
日期:2016-08-03 06:20:00数据库技术版块每日发帖之星
日期:2016-08-04 06:20:00
发表于 2009-01-10 00:46 |显示全部楼层
就算是再好的东西,被接受都是需要时间的。
非对称多核其实很早就被提出来了,但是因为以前它的应用软件一般需要复杂的设计,而一直没有很明显的突破。gpu也听说人们一直在打它的主意。但愿非对称能够有很好的发展吧。我一直觉得非对称未来会是多处理的主流。

论坛徽章:
0
发表于 2009-01-10 08:52 |显示全部楼层
CUDA就是Compute Unified Device Architecture吧?
是某家显卡厂推出的一个架构,原先是为了利用显卡多余的计算能力。

论坛徽章:
0
发表于 2009-01-10 12:09 |显示全部楼层
x86这种U,一个乘法操作要N多cycle,流水线停顿了又要N多cycle...还是x86跑OS,GPU并行计算这样的配合不错。
NV给Open64做了不少工作,Open64编译出来代码的效率也的确不错。GCC在优化和并行方面的确比较落后。

论坛徽章:
3
2015年迎新春徽章
日期:2015-03-04 09:56:11数据库技术版块每日发帖之星
日期:2016-08-03 06:20:00数据库技术版块每日发帖之星
日期:2016-08-04 06:20:00
发表于 2009-01-10 12:37 |显示全部楼层
原帖由 prolj 于 2009-1-10 12:09 发表
x86这种U,一个乘法操作要N多cycle,流水线停顿了又要N多cycle...还是x86跑OS,GPU并行计算这样的配合不错。
NV给Open64做了不少工作,Open64编译出来代码的效率也的确不错。GCC在优化和并行方面的确比较落后。

GCC的优化倒不是比较落后,而是初衷就不同。
GCC从一开始就要把它变成一个通用编译器,通用编译器的原则就是不偏袒哪个处理器。如果要在哪个处理器上实现特殊的处理,那几乎是哪个CPU公司要用,那么公司自己可以把通用编译器里面加上自己处理器的特性。比如intel就根据CPU的特性来改造gcc。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP