论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2008-04-27 20:03 |只看该作者 |倒序浏览

若有一批float要进行y= sqrt(x1*x1+x2*x2)+0.5 的计算
在32bit的CPU上用常规模式进行计算则明显耗时.
而用INTEL CPU自己专用的SSE指令进行运算,则有明显的优势:
windows2000+ VC

int i;
float x1_float_data_block[]={...}; // x1数据块
float x2_float_data_block[]={...}; // x2数据块
float y_float_data_block[sizeof(x1_float_data_block)/sizeof(float)]; // y数据块,结果
int num_float=sizeof(x1_float_data_block)/sizeof(float); // 数据块中float的数量
int count = num_float/4;
float f = 0.5f;
_asm {
movss xmm2, f
shufps xmm2, xmm2, 0
mov esi, x1_float_data_block
mov edx, x2_float_data_block
mov edi, y_float_data_block
mov ecx, count
sse_loop:
movaps xmm0, [esi]
mulps xmm0, xmm0
movaps xmm1, [edx]
mulps xmm1, xmm1
addps xmm0, xmm1
sqrtps xmm0, xmm0
addps xmm0, xmm2
movaps [edi],xmm0
add esi, 16
add edx, 16
add edi, 16
dec ecx
jnz sse_loop
}
for(i=0;i<num_float;i++)
printf("...",y_float_data_block[i],...
.....

复制代码

[ 本帖最后由 system888net 于 2008-5-18 10:51 编辑 ]

评分

参与人数 1	可用积分 +3	收起理由
prolj	+ 3	好例子

查看全部评分

文库|博客

system888net

腰缠万贯

论坛徽章:: 0

2楼 [报告]

发表于 2008-04-27 20:22 |只看该作者

这条printf("...",y_float_data_block,...
在上面edit了几次总是显示不出来[ i ],不知为何

[ 本帖最后由 system888net 于 2008-4-27 20:23 编辑 ]

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

chzCPU

白手起家

论坛徽章:: 0

3楼 [报告]

发表于 2008-04-27 21:02 |只看该作者

运算速度能提高一点还是许多?

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

jamesr jamesr 当前离线禁止发言好友博客消息论坛徽章: 0	4楼 [报告] 发表于 2008-04-28 19:16 \|只看该作者提示: 作者被禁止或删除内容自动屏蔽
jamesr jamesr 当前离线禁止发言好友博客消息论坛徽章: 0	实战分享：从技术角度谈机器学习入门\| 【大话IT】RadonDB低门槛向MySQL集群下战书 \| ChinaUnix打赏功能已上线！ \| 新一代分布式关系型数据库RadonDB知多少？

system888net

腰缠万贯

论坛徽章:: 0

5楼 [报告]

发表于 2008-05-18 10:48 |只看该作者

原帖由 jamesr 于 2008-4-28 19:16 发表
使用代把码括起来。
另外，应该说明这段代码的运行环境。这种内联汇编不是gcc格式的。

谢谢提醒,已加了code 和/code,平台 windows2000+vc

[ 本帖最后由 system888net 于 2008-5-18 10:51 编辑 ]

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

chuhongze

稍有积蓄

论坛徽章:: 0

6楼 [报告]

发表于 2008-05-18 16:49 |只看该作者

回复 #1 system888net 的帖子

速度是明显快了,顶...

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

chuhongze

稍有积蓄

论坛徽章:: 0

7楼 [报告]

发表于 2008-05-18 16:53 |只看该作者

此程序调用的是FPU内部的指令

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

返回列表

Chinaunix › 论坛 › 程序设计 › CPU与编译器 › 使用CPU 专用指令提高float运算速度的一个小例子

jamesr jamesr 当前离线禁止发言好友博客消息论坛徽章: 0	4楼 [报告] 发表于 2008-04-28 19:16 \|只看该作者提示: 作者被禁止或删除内容自动屏蔽
jamesr jamesr 当前离线禁止发言好友博客消息论坛徽章: 0	实战分享：从技术角度谈机器学习入门\| 【大话IT】RadonDB低门槛向MySQL集群下战书 \| ChinaUnix打赏功能已上线！ \| 新一代分布式关系型数据库RadonDB知多少？

使用CPU 专用指令提高float运算速度的一个小例子 [复制链接]

评分

回复 #1 system888net 的帖子

浏览过的版块