免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 984 | 回复: 1
打印 上一主题 下一主题

[C++] 64位调用约定寄存器传this,但用的指令更多,比32位效率似乎更低了. [复制链接]

论坛徽章:
1
2015年迎新春徽章
日期:2015-03-04 09:58:11
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2016-09-28 17:29 |只看该作者 |倒序浏览
64位调用约定,既然是用了寄存器,想来应该是效率更高才对。
但是我发现: 64位程序调用类的成员函数(例如构造函数的时候),编译器生成的代码,又把这个寄存器的this内容放回内存,再调用函数。
这岂不是多出了用寄存器做中转这一步? 为什么不在调用时直接用到寄存器内容呢?

实验: 下面的程序,观察比较构造函数的代码生成。首先编译成32位版本:
  1. struct Test
  2. {
  3.   int i;
  4.   Test(){
  5.     i=23;
  6.   }
  7. };
  8. int main()
  9. {
  10.   Test obj1;
  11.   return 0;
  12. }
复制代码
$ gcc Test.cpp -g -o Test -m32
然后用gdb来调试,断点放在i=23这里,看反汇编代码:
  1. (gdb) disassemble
  2. Dump of assembler code for function Test::Test():
  3.    0x08048484 <+0>:        push   %ebp
  4.    0x08048485 <+1>:        mov    %esp,%ebp
  5. => 0x08048487 <+3>:        mov    0x8(%ebp),%eax # 对象地址在%ebp+8的位置,看起来this指针是传入的参数
  6.    0x0804848a <+6>:        movl   $0x17,(%eax)   # 把23放入对象头部
  7.    0x08048490 <+12>:        nop
  8.    0x08048491 <+13>:        pop    %ebp
  9.    0x08048492 <+14>:        ret   
  10. End of assembler dump.
复制代码
问题(1): 这个32位程序看起来效率还可以,不过,this参数似乎不是从ecx来直接访问的。我知道vc使用ecx传this参数,gcc是吗?

然后我编译64位的版本,不加-m32选项。用gdb来看反汇编
  1. (gdb) disassemble
  2. Dump of assembler code for function Test::Test():
  3.    0x0000000000400584 <+0>:        push   %rbp
  4.    0x0000000000400585 <+1>:        mov    %rsp,%rbp
  5.    0x0000000000400588 <+4>:        mov    %rdi,-0x8(%rbp) #中转一次,岂不是效率更低?
  6. => 0x000000000040058c <+8>:        mov    -0x8(%rbp),%rax #同32位版本
  7.    0x0000000000400590 <+12>:        movl   $0x17,(%rax)
  8.    0x0000000000400596 <+18>:        nop
  9.    0x0000000000400597 <+19>:        pop    %rbp
  10.    0x0000000000400598 <+20>:        retq   
  11. End of assembler dump.
复制代码
问题(2): 显然,这次的指令更多了,岂不是说明64位版本效率反而不如32位版本?
(2.1)我知道64位函数调用前2个参数使用rdi,rsi,但是这里看起来rdi的,先放在某个内存地址,然后再调用构造函数。比32位的多了一条指令。
(2.2)而且,还多使用了一个内存位置(%rbp-来从寄存器里面取得this指针。

那看起来64位的时空效率比32位都要低啊。这是64位调用约定导致的,还是在别的场景下64位效率会更高,只是我这里的场景32位效率更高呢?
谢谢。

论坛徽章:
95
程序设计版块每日发帖之星
日期:2015-09-05 06:20:00程序设计版块每日发帖之星
日期:2015-09-17 06:20:00程序设计版块每日发帖之星
日期:2015-09-18 06:20:002015亚冠之阿尔艾因
日期:2015-09-18 10:35:08月度论坛发贴之星
日期:2015-09-30 22:25:002015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39程序设计版块每日发帖之星
日期:2015-10-05 06:20:00每日论坛发贴之星
日期:2015-10-05 06:20:002015年亚冠纪念徽章
日期:2015-10-06 10:06:482015亚冠之塔什干棉农
日期:2015-10-19 19:43:35程序设计版块每日发帖之星
日期:2015-10-21 06:20:00每日论坛发贴之星
日期:2015-09-14 06:20:00
2 [报告]
发表于 2016-09-28 17:49 |只看该作者
回复 1# asker160

g++ 默认是 -O0,把优化打开(-O2)再看看。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP