1 2 3 4 567 8 9 10 ... 11 / 11 页下一页

CUDA很不错啊 [复制链接]

system888net

腰缠万贯

论坛徽章:: 0

51楼 [报告]

发表于 2009-01-04 17:08 |只看该作者

原帖由 fineamy 于 2009-1-3 00:21 发表
CUDA如果能发展到不访问主内存就好了！不过对PC来讲这可能是奢望了

多了个"不"字吧?

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

system888net

腰缠万贯

论坛徽章:: 0

52楼 [报告]

发表于 2009-01-04 17:10 |只看该作者

原帖由 cjaizss 于 2009-1-3 00:52 发表

多核么,恩,架构还是有区别的。你认为这种分布式的结构一定好吗？我看也不见得，各有特点吧。
再者，分布式也不年轻了，研究了那么多年，以前一般是计算机之间，现在可以在嵌入式内部玩。
分布式的概念花样炒 ...

......我蒙一下，估计最后也破产。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

wheel

大富大贵

论坛徽章:: 0

53楼 [报告]

发表于 2009-01-05 16:04 |只看该作者

openCL 现在是主推嵌入的。。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

prolj

荣誉版主

论坛徽章:: 0

54楼 [报告]

发表于 2009-01-08 15:19 |只看该作者

OpenCL在iPhone上？不知道干嘛，不过iPhone的确不错。Mac的东西都不错，看得见摸得着，价钱也可以接受，用起来也比较舒服。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

prolj

荣誉版主

论坛徽章:: 0

55楼 [报告]

发表于 2009-01-08 15:54 |只看该作者

如果是传统同构多核的HPC上的应用丰富或者好写的话，NV这种异构多核HPC上应该是一样的，因为GPU和CPU的地址空间分开，而GPU那块仍然是同构多核的。而且在编译上没什么新东西，仍然是粗细粒度并行，在循环上上使劲，对于故意写的不能优化的循环仍然跳过，至于向量，不知道有没有那个向量计算的部件，更多的在IPO那里做一些。cache分块或者什么就免了，直接算法DDR3的显存去了。寄存器不清楚，向量还是什么？图染色应该不行了。
有人不是把浮点改成整数提高性能么？CUDA上最不济也可以把整数改成浮点进行并行计算啊。
在Win上科研人员可以用Matlab跑CUDA，让他们去C？人家愿意么？这就是CUDA的优势。
而且更大的优势在于，台湾的工艺生产显卡没问题，简单的工艺就可以带来巨大的并行。为什么不用呢？非得IBM的最好的工艺才能并行出来的U才是好的？
优势还在于可以不改变现有的软硬件基础，直接在Win上跑，传统HPC自己改的那非主流的Linux可以？(不是说Linux非主流，是说HPC自己把Linux改的非主流了)CUDA仅作用于需要被并行的计算，并行OS中的for循环去？很有创意！不知道传统HPC有这么做的没。
NV这个HPC这么便宜为什么不买非要买贵的？不是败家子就是有XXX
NV那个GPU的Core真多，不知道别的传统HPC多核之间都用什么主流或者非主流的XX Bus，也不知道是很好的性能还是啥鸟性能。
NV那个HPC的带宽很不错，不知道别的传统HPC呢...牛还是鸟？
买一个NV的HPC放在机房里，不用专门的水冷，SGI那个1000核的水冷Atom用不上了，空调是必须的，就算没有机器你夏天不开空调？
综合下来，这东西不错。期待大牛来讲讲其他有竞争的机器的Arch，从技术方面比较，毕竟这里是技术论坛。

GPU和CPU的地址空间分开，就像RISC的U那样LOAD/STORE那样，MS的DX应该在隐藏LOAD/STROE上做了文章，这点纯属猜测，知道的多来讲讲吧。

如果说出海的时候在大海里感到自己渺小的话，在优雅的算法面前就会感到自己的白痴，代码的海洋不是迷失就是征服。NV的老大是华人啊，华人科学家和工程师不知道有多少在引领潮流。计算机科学日新月异，创新永远都是自主思考的人做的，我这样的白痴只能在人家后面学习，当然不自主思考的可以做他主子的喉舌，所以我真的不应该总这么瞎胡扯了，弄得自己跟NV的五毛似的。
各位多多讨论先进技术吧。大家一起来交流一下自己对Arch的看法和自己的思路，都自主思考思考。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

joint

富足长乐

论坛徽章:: 0

56楼 [报告]

发表于 2009-01-09 12:50 |只看该作者

原帖由 prolj 于 2009-1-8 15:54 发表
如果是传统同构多核的HPC上的应用丰富或者好写的话，NV这种异构多核HPC上应该是一样的，因为GPU和CPU的地址空间分开，而GPU那块仍然是同构多核的。而且在编译上没什么新东西，仍然是粗细粒度并行，在循环上上使 ...

AGREE!
廉价，节能，高性能！！
才能普及

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

cjaizss

版主

论坛徽章:: 3

57楼 [报告]

发表于 2009-01-10 00:46 |只看该作者

就算是再好的东西，被接受都是需要时间的。
非对称多核其实很早就被提出来了，但是因为以前它的应用软件一般需要复杂的设计，而一直没有很明显的突破。gpu也听说人们一直在打它的主意。但愿非对称能够有很好的发展吧。我一直觉得非对称未来会是多处理的主流。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

beepbug

小富即安

论坛徽章:: 0

58楼 [报告]

发表于 2009-01-10 08:52 |只看该作者

CUDA就是Compute Unified Device Architecture吧？
是某家显卡厂推出的一个架构，原先是为了利用显卡多余的计算能力。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

prolj

荣誉版主

论坛徽章:: 0

59楼 [报告]

发表于 2009-01-10 12:09 |只看该作者

x86这种U，一个乘法操作要N多cycle，流水线停顿了又要N多cycle...还是x86跑OS，GPU并行计算这样的配合不错。
NV给Open64做了不少工作，Open64编译出来代码的效率也的确不错。GCC在优化和并行方面的确比较落后。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

cjaizss

版主

论坛徽章:: 3

60楼 [报告]

发表于 2009-01-10 12:37 |只看该作者

原帖由 prolj 于 2009-1-10 12:09 发表
x86这种U，一个乘法操作要N多cycle，流水线停顿了又要N多cycle...还是x86跑OS，GPU并行计算这样的配合不错。
NV给Open64做了不少工作，Open64编译出来代码的效率也的确不错。GCC在优化和并行方面的确比较落后。

GCC的优化倒不是比较落后，而是初衷就不同。
GCC从一开始就要把它变成一个通用编译器，通用编译器的原则就是不偏袒哪个处理器。如果要在哪个处理器上实现特殊的处理，那几乎是哪个CPU公司要用，那么公司自己可以把通用编译器里面加上自己处理器的特性。比如intel就根据CPU的特性来改造gcc。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

1 2 3 4 567 8 9 10 ... 11 / 11 页下一页

返回列表

Chinaunix › 论坛 › 程序设计 › CPU与编译器 › CUDA很不错啊

CUDA很不错啊 [复制链接]

浏览过的版块