免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 51609 | 回复: 14

[C] 我想试做一个多核编译器,哪位同行愿意贴些循环体代码来评估? [复制链接]

论坛徽章:
0
发表于 2016-08-05 16:01 |显示全部楼层
目标希望能实现多核自动绑定。

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:53:172015亚冠之水原三星
日期:2015-06-02 16:34:202015年亚冠纪念徽章
日期:2015-10-19 18:13:37程序设计版块每日发帖之星
日期:2015-11-08 06:20:00
发表于 2016-08-05 18:31 |显示全部楼层
make -j就行了

论坛徽章:
0
发表于 2016-08-05 20:10 |显示全部楼层
不是GCC的并行编译,是多条线程并行执行循环体。

for ( i=0; i<4000; i+=1)
     a[i] = 123;

如果是4核芯片,转为

for ( i=0; i<1000; i+=1)          a[i] = 123;
for ( i=1000; i<2000; i+=1)     a[i] = 123;
for ( i=2000; i<3000; i+=1)     a[i] = 123;
for ( i=3000; i<4000; i+=1)     a[i] = 123;

创建4条线程,各自绑定4个物理核

论坛徽章:
95
程序设计版块每日发帖之星
日期:2015-09-05 06:20:00程序设计版块每日发帖之星
日期:2015-09-17 06:20:00程序设计版块每日发帖之星
日期:2015-09-18 06:20:002015亚冠之阿尔艾因
日期:2015-09-18 10:35:08月度论坛发贴之星
日期:2015-09-30 22:25:002015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39程序设计版块每日发帖之星
日期:2015-10-05 06:20:00每日论坛发贴之星
日期:2015-10-05 06:20:002015年亚冠纪念徽章
日期:2015-10-06 10:06:482015亚冠之塔什干棉农
日期:2015-10-19 19:43:35程序设计版块每日发帖之星
日期:2015-10-21 06:20:00每日论坛发贴之星
日期:2015-09-14 06:20:00
发表于 2016-08-05 21:00 |显示全部楼层
回复 3# blackoil


    真实的循序往往有太多数据/控制依赖,根本没办法建立多个线程同时执行。

论坛徽章:
323
射手座
日期:2013-08-23 12:04:38射手座
日期:2013-08-23 16:18:12未羊
日期:2013-08-30 14:33:15水瓶座
日期:2013-09-02 16:44:31摩羯座
日期:2013-09-25 09:33:52双子座
日期:2013-09-26 12:21:10金牛座
日期:2013-10-14 09:08:49申猴
日期:2013-10-16 13:09:43子鼠
日期:2013-10-17 23:23:19射手座
日期:2013-10-18 13:00:27金牛座
日期:2013-10-18 15:47:57午马
日期:2013-10-18 21:43:38
发表于 2016-08-05 21:26 |显示全部楼层
类似OpenMP的功能?

论坛徽章:
89
水瓶座
日期:2014-04-01 08:53:31天蝎座
日期:2014-04-01 08:53:53天秤座
日期:2014-04-01 08:54:02射手座
日期:2014-04-01 08:54:15子鼠
日期:2014-04-01 08:55:35辰龙
日期:2014-04-01 08:56:36未羊
日期:2014-04-01 08:56:27戌狗
日期:2014-04-01 08:56:13亥猪
日期:2014-04-01 08:56:02亥猪
日期:2014-04-08 08:38:58程序设计版块每日发帖之星
日期:2016-01-05 06:20:00程序设计版块每日发帖之星
日期:2016-01-07 06:20:00
发表于 2016-08-05 22:37 |显示全部楼层
这不就是OpenMP吗?

相比较之下,我更喜欢自己用thread来实现并行。

论坛徽章:
44
15-16赛季CBA联赛之浙江
日期:2021-10-11 02:03:59程序设计版块每日发帖之星
日期:2016-07-02 06:20:0015-16赛季CBA联赛之新疆
日期:2016-04-25 10:55:452016科比退役纪念章
日期:2016-04-23 00:51:2315-16赛季CBA联赛之山东
日期:2016-04-17 12:00:2815-16赛季CBA联赛之福建
日期:2016-04-12 15:21:2915-16赛季CBA联赛之辽宁
日期:2016-03-24 21:38:2715-16赛季CBA联赛之福建
日期:2016-03-18 12:13:4015-16赛季CBA联赛之佛山
日期:2016-02-05 00:55:2015-16赛季CBA联赛之佛山
日期:2016-02-04 21:11:3615-16赛季CBA联赛之天津
日期:2016-11-02 00:33:1215-16赛季CBA联赛之浙江
日期:2017-01-13 01:31:49
发表于 2016-08-05 22:43 |显示全部楼层
就是这种东西?
https://en.wikipedia.org/wiki/Cilk

论坛徽章:
0
发表于 2016-08-05 23:46 |显示全部楼层
本帖最后由 blackoil 于 2016-08-05 23:52 编辑

类似CILK,其实原理都一样,大家都知道。
OPENMP需要手写,我希望语义分析做到并行自动化,带上SIMD。
  1. for ( i=3000; i<4000; i+=1)     a[i] = 123;

  2. for ( i=3000; i<4000; i+=4)     vector.a[i] = {123,123,123,123};
复制代码

论坛徽章:
0
发表于 2016-08-07 00:22 |显示全部楼层
生成的伪汇编大致这样
  1. for (i=0;i<4000;i+=1)
  2.                 z[i]+=456;
复制代码
  1. section .code align=4
  2. bits 32
  3. global        _main
  4. _main:
  5. push        ebp
  6. mov        ebp, esp
  7. and        esp, 0xFFFFFFF0
  8. jmp        .L0:
  9. thread_1:
  10. push        ebp
  11. mov        ebp, esp
  12. mov        esi, 0
  13. jmp        .L7
  14. .L5:
  15. add        [ _z + esi * 4 ], dword 456
  16. .L6:
  17. add        esi, 1
  18. .L7:
  19. cmp        esi, 1000
  20. jb        .L5
  21. .L8:
  22. mov        esp, ebp
  23. pop        ebp
  24. thread_2:
  25. push        ebp
  26. mov        ebp, esp
  27. mov        esi, 1000
  28. jmp        .L11
  29. .L9:
  30. add        [ _z + esi * 4 ], dword 456
  31. .L10:
  32. add        esi, 1
  33. .L11:
  34. cmp        esi, 2000
  35. jb        .L9
  36. .L12:
  37. mov        esp, ebp
  38. pop        ebp
  39. thread_3:
  40. push        ebp
  41. mov        ebp, esp
  42. mov        esi, 2000
  43. jmp        .L15
  44. .L13:
  45. add        [ _z + esi * 4 ], dword 456
  46. .L14:
  47. add        esi, 1
  48. .L15:
  49. cmp        esi, 3000
  50. jb        .L13
  51. .L16:
  52. mov        esp, ebp
  53. pop        ebp
  54. thread_4:
  55. push        ebp
  56. mov        ebp, esp
  57. mov        esi, 3000
  58. jmp        .L19
  59. .L17:
  60. add        [ _z + esi * 4 ], dword 456
  61. .L18:
  62. add        esi, 1
  63. .L19:
  64. cmp        esi, 4000
  65. jb        .L17
  66. .L20:
  67. mov        esp, ebp
  68. pop        ebp
  69. .L0:
  70. call        __beginthreadex(thread_1)
  71. call        __beginthreadex(thread_2)
  72. call        __beginthreadex(thread_3)
  73. call        __beginthreadex(thread_4)
  74. call        _WaitForMultipleObjects(thread_1,thread_2,thread_3,thread_4)
  75. mov        esp, ebp
  76. pop        ebp
  77. ret
复制代码

论坛徽章:
13
程序设计版块每日发帖之星
日期:2016-06-29 06:20:00每日论坛发贴之星
日期:2016-08-14 06:20:00操作系统版块每日发帖之星
日期:2016-08-14 06:20:00每日论坛发贴之星
日期:2016-08-13 06:20:00数据库技术版块每日发帖之星
日期:2016-08-13 06:20:00程序设计版块每日发帖之星
日期:2016-08-13 06:20:00IT运维版块每日发帖之星
日期:2016-08-13 06:20:00每日论坛发贴之星
日期:2016-08-12 06:20:00数据库技术版块每日发帖之星
日期:2016-08-12 06:20:00程序设计版块每日发帖之星
日期:2016-08-12 06:20:00操作系统版块每日发帖之星
日期:2016-08-12 06:20:00综合交流区版块每日发帖之星
日期:2016-08-09 06:20:00
发表于 2016-08-09 10:45 |显示全部楼层
赞,楼主加油~~
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP