免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1016 | 回复: 1
打印 上一主题 下一主题

循环的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2005-12-07 22:19 |只看该作者 |倒序浏览
写了一个矩阵乘法的函数, 计算 c(i, j) = c(i, j) + sum_{k} a(i, k)*b(k, j)

void gemm1(int n, double *a, double *b, double *c)
{
    int i, j, k;
    for (i = 0; i < n; i++) {
        for (j = 0; j < n; j++) {
            for (k = 0; k < n; k++) {
                 c[i+n*j] += a[i+n*k]*b[k+n*j];
            }
        }
    }
    return;
}

后来改了一下循环的顺序
void gemm2(int n, double *a, double *b, double *c)
{
    int i, j, k;
    for (i = 0; i < n; i++) {
        for (k = 0; k < n; k++) {
            for (j = 0; j < n; j++) {
                 c[i+n*j] += a[i+n*k]*b[k+n*j];
            }
        }
    }
    return;
}

发现快了好多, 不大明白为什么?

还有一个问题也想不明白,就是 gemm1 的运行时间:
n                    t
255               0.15~0.17 s
256               0.65~0.80 s
511               1.9 ~ 2.0 s
512               13 s
十分的诡异。
请各位大侠拍砖!

论坛徽章:
0
2 [报告]
发表于 2005-12-07 22:38 |只看该作者
还可以更快的:

  1. void gemm2(int n, double *a, double *b, double *c)
  2. {
  3.     int i, j, k;
  4.     int  t;
  5.     double temp, *p2,*p3;

  6.     for (i = 0; i < n; i++) {
  7.         p2 = c[i];
  8.         for (k = 0; k < n; k++) {
  9.             temp =  a[i+n*k];
  10.             p3 = b[k];
  11.             for (j = 0; j < n; j++) {
  12.                  //c[i+n*j] += a[i+n*k]*b[k+n*j];
  13.                  t=n*j;
  14.                  *(p2 + t) +=   temp *(*(p3 + t));         
  15.         }
  16.         }
  17.     }
  18.     return;
  19. }
复制代码

[ 本帖最后由 converse 于 2005-12-7 22:41 编辑 ]
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP