论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2007-03-08 01:03 |只看该作者 |倒序浏览

要优化一段在linux下的代码，有类似的嵌入Intel汇编的vector.cpp文件一个，如果我装了NASM的话，可以直接使用这个vector.cpp吗?如果可以，该如何修改gcc，让它自动调用NASM来汇编，而不是调用AS，请大牛指点一下！具体些或者给出个链接！
谢谢了！

下面是vector.cpp代码：

class vector
{
    public:
        float x,y,z,w;

    inline vector()
{ ; };
    inline vector(float x0,float y0,float z0)
{ x=x0; y=y0; z=z0; };
    inline vector(float x0,float y0,float z0,float w0)
{ x=x0; y=y0; z=z0; w=w0; };
    inline vector(vector &v)
{ *this=v; };
    inline void null(void)
{ x=y=z=0; };
    inline float length(void)
{ return (float)sqrt(x*x+y*y+z*z); };
    inline void  vec(float x0,float y0,float z0)
{ x=x0; y=y0; z=z0; };
    inline void  vec(float x0,float y0,float z0,float w0)
{ x=x0; y=y0; z=z0; w=w0; };
    inline void  negate(void)
{ x=-x; y=-y; z=-z; };
    inline void cross(vector& v1,vector& v2)
{

#ifdef P3SIMD
        __asm
{
        mov esi, v1
        mov edi, v2

        movups xmm0, [esi]
        movups xmm1, [edi]
        movups xmm2, xmm0
        movups xmm3, xmm1

        shufps xmm0, xmm0, 0xc9
        shufps xmm1, xmm1, 0xd2
        mulps xmm0, xmm1

        shufps xmm2, xmm2, 0xd2
        shufps xmm3, xmm3, 0xc9
        mulps xmm2, xmm3

        subps xmm0, xmm2

        mov esi, this
        movups [esi],xmm0
}
#else
        x=v1.y*v2.z-v1.z*v2.y;
        y=v1.z*v2.x-v1.x*v2.z;
        z=v1.x*v2.y-v1.y*v2.x;
#endif
}
    inline void normalize(void)
{
     float len=(float)sqrt(x*x+y*y+z*z);
     if (FP_BITS(len)==0) return;
     len=1.0f/len;
     x*=len; y*=len; z*=len;
}
    inline float& operator[](int i) { return (&x)[i]; };
};

文库|博客

mingyanguo

小富即安

论坛徽章:: 0

2楼 [报告]

发表于 2007-03-08 08:41 |只看该作者

这个恐怕不只是调用nasm的问题，gcc本省生成的asm就是AT&T风格的，所以你需要让gcc本身生成的代码也是intel风格的。

不过，为了一点代码就去修改gcc岂不是很不值得，把这些代码转成AT&T风格就是了。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

albcamus

大富大贵

论坛徽章:: 0

3楼 [报告]

发表于 2007-03-08 09:39 |只看该作者

回复 #2 mingyanguo 的帖子

可以用-masm=intel指定输出汇编为intel格式^_^

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

mingyanguo

小富即安

论坛徽章:: 0

4楼 [报告]

发表于 2007-03-08 11:34 |只看该作者

原帖由 albcamus 于 2007-3-8 09:39 发表于 3楼
可以用-masm=intel指定输出汇编为intel格式^_^

选项太多了，还从来没有注意过有这个。
这样是很方便了。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

wudt

白手起家

论坛徽章:: 0

5楼 [报告]

发表于 2007-03-08 17:03 |只看该作者

嗯，就是说是可以的咯，但好像没人说具体步骤啊！有那位牛牛能说具体一点嘛！
还有好多事情要做，打算把精力投入的GPU那边的优化上，这CPU上的优化实在来不急，只能用C++了！没时间自己查资料找办法了！告诉我如何编译链接这个程序即可!先谢谢了！
#include <iostream>
int main()
{
   vector  v1(1.0,2.0,3.0),v2(3.0,2.0,1.0),v(0.0,0.0,0.0)；
   v.cross(v1,v2);
   std::cout << v.x << "  " << v.y << "  " << v.z << std::endl;
   return 0;
}