免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2107 | 回复: 2
打印 上一主题 下一主题

[Linux] linux下面多线程程序优化的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-10-10 19:41 |只看该作者 |倒序浏览
本帖最后由 asdmonster 于 2012-10-10 19:42 编辑

有一个程序,多线程,其中可以多线程并行的部分,是多个线程访问一个全局的大结构体(的不同或者相同部分,只读,不做修改)做分别计算,
理论上,如果并行部分总的计算量是M,线程数是N,那么这一部分的计算量应该是M/N,或者近似.
现在的情况是不是这样,比如2线程和6线程比较, Cost(2)*2 < Cost(6)*6,  后者大约比前者高了25%的样子.
不知道这个出问题的原因在哪里.(这里只考量并行部分时间,串行的因素不存在)

下面是perf stat的结果:
  1.     444.705669  task-clock-msecs         #      1.016 CPUs
  2.            2481  context-switches         #      0.006 M/sec
  3.              10  CPU-migrations           #      0.000 M/sec
  4.           22766  page-faults              #      0.051 M/sec
  5.      1385672874  cycles                   #   3115.933 M/sec
  6.      1223208823  instructions             #      0.883 IPC  
  7.       240270596  branches                 #    540.291 M/sec
  8.        26247124  branch-misses            #     10.924 %   
  9.        11659542  cache-references         #     26.219 M/sec
  10.         4131662  cache-misses             #      9.291 M/sec
复制代码
branch-misses我看了,是整个程序的其它部分造成,无关.
别的地方还有哪里不对的,我看不出来.

论坛徽章:
4
水瓶座
日期:2013-09-06 12:27:30摩羯座
日期:2013-09-28 14:07:46处女座
日期:2013-10-24 14:25:01酉鸡
日期:2014-04-07 11:54:15
2 [报告]
发表于 2012-10-11 23:18 |只看该作者
读写锁 or 互斥锁 ?

论坛徽章:
0
3 [报告]
发表于 2012-10-12 09:23 |只看该作者
互斥锁,但是锁的部分也就是并行部分的运行时间我测试过时间,占整个运行时间的1%都不到.
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP