论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2012-10-08 17:01 |显示全部楼层 |倒序浏览

我在LINUX下使用g++编译器，做一个OPENMP的优化处理实验，代码如下：

#include <stdio.h>
#include <string.h>
#include <strings.h>
#include <time.h>
#include <omp.h>
int main()
{
long long k = 20;
int i;
int j[10] = {101,102,103,104,105,106,107,108,109,110};
printf("begin k=%d\tj[0]=%d\n", k,j[0]);
time_t t, t1;
t = time(NULL);
omp_set_num_threads(7);
#pragma omp parallel for
for(i = 0; i < 7; i++)
{
int rank = omp_get_thread_num();
int count = omp_get_num_threads();
printf("Hello from thread %d of %d\n", rank, count);
for( k=0; k < 1000000000; k++)
{
j[k%10] = k*k;
}
}
t1 = time(NULL);
printf("time = [%d]\n", t1 - t);
printf("end k=%d\tj[0]=%d\n", k,j[0]);
}

复制代码

分别采用OPENMP编译与不采用OPENMP编译的方式结果如下：

采用OPENMP的情况
begin k=20 j[0]=101
Hello from thread 0 of 7
Hello from thread 3 of 7
Hello from thread 4 of 7
Hello from thread 5 of 7
Hello from thread 6 of 7
Hello from thread 1 of 7
Hello from thread 2 of 7
time = [72]
end k=1000000000 j[0]=-11782044

不采用OPENMP的情况
begin k=20 j[0]=101
Hello from thread 0 of 1
Hello from thread 0 of 1
Hello from thread 0 of 1
Hello from thread 0 of 1
Hello from thread 0 of 1
Hello from thread 0 of 1
Hello from thread 0 of 1
time = [27]
end k=1000000000 j[0]=-11782044

采用OPENMP的的情况反而效率变低了，我的LINUX环境是
Linux FC14-1 2.6.35.14-106.fc14.x86_64 #1 SMP Wed Nov 23 13:07:52 UTC 2011 x86_64 x86_64 x86_64 GNU/Linux， 2CPU， 8核（所以才用7个线程）

请那位使用过openmp的高手指点一下，我才vs2008上实验一个类似的程序，效果也是使用openmp时效率大幅下降了，很奇怪。

文库|博客

snakedy

白手起家

论坛徽章:: 0

2楼 [报告]

发表于 2012-10-08 17:20 |显示全部楼层

看来用OPENMP提高软件性能的人比较少呀，大家谁知道给点思路也成呀。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

snakedy

白手起家

论坛徽章:: 0

3楼 [报告]

发表于 2012-10-08 17:30 |显示全部楼层

其实，j这个数组我就是想做一个公式，或者一个处理随便编的，楼上说的我去试试，看是否是多个线程同时访问同一缓冲区造成的，其实这个循环不是一开始就效率下降的，内部循环次数减少一些时效率是提高状态，很奇怪

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

snakedy

白手起家

论坛徽章:: 0

4楼 [报告]

发表于 2012-10-08 17:34 |显示全部楼层

定义了一个变量zz,将原有公式转换成zz += k * k;结果发现效率还是不比串行的效率

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

snakedy

白手起家

论坛徽章:: 0

5楼 [报告]

发表于 2012-10-08 17:47 |显示全部楼层

楼上说的很有道理，我将程序的循环修改为#pragma omp parallel for private(zz)，即将zz变量私有化后，运算从14秒瞬间变为0，不过结果好像就不对了，不过可以肯定的是openmp内部线程管理对共享资源访问是有一定的特殊处理的

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

snakedy

白手起家

论坛徽章:: 0

6楼 [报告]

发表于 2012-10-09 11:04 |显示全部楼层

我的问题已经解决了，在此做一个总结，以便遇到相同问题的兄弟参考，除了上述问题会影响运算效率外，在OPENMP环境下，每个调用的函数层数也会影响运算效率，即如果一个算法中调用多个嵌套函数的话，用OPENMP并行它，运算结果可能还不如串行效率高，个人猜测是分配同一函数的堆栈太多，就像递归调用一样对系统资源以及访问效率都会有一定影响。尽量让自己并行部分“干净”一点是提高效率的最好的方法。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

snakedy

白手起家

论坛徽章:: 0

7楼 [报告]

发表于 2012-10-09 13:42 |显示全部楼层

其实这次的心得就是，使用OPENMP比较简单，但是需要对原有代码进行并行优化。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

返回列表

Chinaunix › 论坛 › 程序设计 › C/C++ › OPENMP的一个恶心问题

[技术动态] OPENMP的一个恶心问题 [复制链接]