免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: prolj
打印 上一主题 下一主题

CUDA很不错啊 [复制链接]

论坛徽章:
0
81 [报告]
发表于 2009-01-13 20:02 |只看该作者
CUDA如果跟CPU拥有完全一样的指令集(注意是完全相同,你不能说都有mov指令就说处理器指令相同)也可以作为协处理器器出现,但是那样有必要吗,相当于增加了一个核心?处理器指令不同才会以协处理的方式出现!
理论是理论实际是实际,现在没有相同指令集的协处理也没有不同指令集的并行处理,所以才那样说!

[ 本帖最后由 rawa9999 于 2009-1-13 20:50 编辑 ]

论坛徽章:
3
2015年迎新春徽章
日期:2015-03-04 09:56:11数据库技术版块每日发帖之星
日期:2016-08-03 06:20:00数据库技术版块每日发帖之星
日期:2016-08-04 06:20:00
82 [报告]
发表于 2009-01-13 22:52 |只看该作者
原帖由 rawa9999 于 2009-1-13 19:48 发表
理论上的东西不想多说,现在说道多处理就是具备相同指令集的多处理器,不知道那些不同指令集的多处理有什么应用?比如哪一款处理器是采用不同指令集的并行多处理?

SMP和AMP。AMP的发展确实不像SMP发展的这么好倒是真。
SMP是对称多处理,这是你所熟悉的方式。AMP是指非对称多处理,非对称多处理是指各核的结构并非对称,用处自然有区别,一般来说,指令集可能不一样,但不排除也可以指令集一样。
AMP如果采取指令集异构的方式,可以最大程度发挥各核的优势所在,然而如果想真的最大程度发挥各核心的优势的话,难点却很多,所以一直以来发展的不像SMP这么好。

[ 本帖最后由 cjaizss 于 2009-1-13 23:20 编辑 ]

论坛徽章:
3
2015年迎新春徽章
日期:2015-03-04 09:56:11数据库技术版块每日发帖之星
日期:2016-08-03 06:20:00数据库技术版块每日发帖之星
日期:2016-08-04 06:20:00
83 [报告]
发表于 2009-01-13 23:04 |只看该作者
协处理和并行不是同一回事,协处理的双方是处于绝对的主从关系,协处理对于CPU来说就是一个计算工具,一个手下,虽然计算能力很强但是却只有有限的作用。但AMP并行则不同,任何一个核,虽然不对称,但是都是CPU的一分子,他们是一种完全的对等协作关系。AMP可以同构也可以异构。

论坛徽章:
3
2015年迎新春徽章
日期:2015-03-04 09:56:11数据库技术版块每日发帖之星
日期:2016-08-03 06:20:00数据库技术版块每日发帖之星
日期:2016-08-04 06:20:00
84 [报告]
发表于 2009-01-13 23:09 |只看该作者
SMP里每一个核被平等对待。但AMP不是。打个比方吧,一个AMP里有3个不同的核,一个核专门管中断处理,一个核专门管平常任务的处理,另外一个核专门管调度等操作系统层面相关处理。

论坛徽章:
0
85 [报告]
发表于 2009-01-14 07:04 |只看该作者
呵呵,颇多理论家,你说的非对称多处理现在等同于CPU内部的不同的计算单元,早期的CPU比较落后可能采用非对称的方式,现在这种非对称方式等同于CPU内部的计算单元,现在说道并行多处理就是对称并行多处理,对称处理器利于程序的大规模部署,也有利于错误处理,所谓的AMP已经被淘汰,或者说已经集成进一个CPU核心中了。协处理概念上是一个入口指令,相当于一个子程序,但是否把它当作主要运算工具完全取决于程序编写者,一个子程序跟主程序指令集完全相同(功能相同)就没有必要要这个子程序,故协处理器肯定与主处理器指令集不同。

论坛徽章:
0
86 [报告]
发表于 2009-01-14 07:22 |只看该作者
显卡里的处理器,所计算的一大块任务是标量计算。CPU如果要做标量,而GPU正好有空,就可以把这些计算转移到GPU去。如果CPU的标量计算指令和GPU的标量计算指令正好一模一样,那额外的开销就只是“转移”,不需要“转换”。
我不懂理论,只是傻想想,应该效率会高一点。

论坛徽章:
0
87 [报告]
发表于 2009-01-14 07:26 |只看该作者
已经说过了,两个处理器都有mov指令就叫指令集相同吗?都有矢量计算即使矢量计算指令一样,也不能说两个CPU的指令集相同!

论坛徽章:
0
88 [报告]
发表于 2009-01-14 07:37 |只看该作者
__global__ static void sumOfSquares(int *num, int* result)
{
    int sum = 0;
    int i;
    for(i = 0; i < DATA_SIZE; i++) {
        sum += num * num;
    }
    *result = sum;
}


为什么说是否当作主要计算单元完全取决于程序的编写,如果你喜欢你完全可以在所有的函数前加上__global__让显卡一直运算,当然这就如同嵌入式语言宿主虽然是调用嵌入程序的,但不能就说宿主语言就是主要语言,哪个是主要语言还要看代码量。

说个题外话,显卡计算机也不是不可能:
TESLA处理器以GPU为核心,外观来看跟显卡非常相似,只是没有显示输出接口,我们可以理解为没有视频输出接口的显卡。而这种“显卡”的主要作用就是,多块并联,通过CUDA来进行行业科学运算。和传统服务器/工作站相比,塔式TESLA主机也有CPU等常规硬件,只是内部有多块“显卡”组多路SLI,如图所示。
    了解了基本的硬件构成,对于熟悉CUDA的玩家来说,TESLA产品就非常好理解了,简单来说就是“显卡服务器”。通过多路显卡的强大并行处理能力去使一些以往主要依靠CPU计算的领域大大提速,甚至使部分传统依靠CPU无法完成的计算成为可能。
之前我们都曾经了解过,由于显卡的多个流处理器(例如GT200核心的240个SP)并行计算的机构,通过CUDA进行某些领域应用加速运算的时候可以比单纯依靠CPU提升很多倍。例如PC玩家比较感兴趣的视频编码加速、Photoshop运算提速等。不过TESLA针对的是行业计算领域,应用重点领域自然会有所区隔。
    生命科学: 用于癌症研究的Autodock软件提速,据美国国家癌症研究所报告,模拟速度提升高达12倍,将等待结果的时间从2个小时缩短至10分钟。AutoDock的作者、美国斯克利普斯研究所Garrett Morris博士表示:“从长远角度来讲,我们只希望能够通过Silicon InformATIcs公司的产品来加速找到各种疾病的治疗新药。其中包括从癌症到阿耳茨海默氏症、从艾滋病到疟疾等各种疾病。”
    科学: 美国国家大气研究中心气象研究和预报(WRF) 模型计算,WRF的1%已通过CUDA实现,整体速度提升了20%,节省了一个星期的分析时间。

[ 本帖最后由 rawa9999 于 2009-1-14 08:50 编辑 ]

论坛徽章:
3
2015年迎新春徽章
日期:2015-03-04 09:56:11数据库技术版块每日发帖之星
日期:2016-08-03 06:20:00数据库技术版块每日发帖之星
日期:2016-08-04 06:20:00
89 [报告]
发表于 2009-01-14 09:05 |只看该作者
原帖由 rawa9999 于 2009-1-14 07:04 发表
呵呵,颇多理论家,你说的非对称多处理现在等同于CPU内部的不同的计算单元,早期的CPU比较落后可能采用非对称的方式,现在这种非对称方式等同于CPU内部的计算单元,现在说道并行多处理就是对称并行多处理,对称 ...

先别说被淘汰还是没有被淘汰.其实是没有被淘汰的,现在研究AMP的依然很多,我也认为未来会是AMP的市场.AMP虽然提出很早,但是因为其一些难度,一直没有得到很好的发展,但不是说就不去发展它了,这是一个重要的架构.虽然是商业决定一切,但是在大家几乎都在SMP上大量努力的时候,解决了AMP的很多问题自然也会带来很大的商业利益.呵呵,说AMP比较落后,那么我只能说你还没明白什么叫AMP,可能还没怎么听说过吧,呵呵.在此之前,先多学学,多想想

论坛徽章:
3
2015年迎新春徽章
日期:2015-03-04 09:56:11数据库技术版块每日发帖之星
日期:2016-08-03 06:20:00数据库技术版块每日发帖之星
日期:2016-08-04 06:20:00
90 [报告]
发表于 2009-01-14 09:11 |只看该作者
原帖由 rawa9999 于 2009-1-14 07:26 发表
已经说过了,两个处理器都有mov指令就叫指令集相同吗?都有矢量计算即使矢量计算指令一样,也不能说两个CPU的指令集相同!

谁也没这么说过.只是你认为我们是这么想的.另外,指令集架构(ISA)相同是什么意思?谁跟你说两个处理器都有mov指令就叫ISA相同的?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP