免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
1234下一页
最近访问板块 发新帖
查看: 27466 | 回复: 36
打印 上一主题 下一主题

[BootLoader] 为何C语言(的函数调用)需要堆栈,而汇编语言却不需要堆栈 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-04-18 00:04 |只看该作者 |倒序浏览
本帖最后由 crifan 于 2011-04-18 00:10 编辑

为何C语言(的函数调用)需要堆栈,而汇编语言却不需要堆栈

之前看了很多关于uboot的分析,其中就有说要为C语言的运行,准备好堆栈。

而自己在Ubootstart.S汇编代码中,关于系统初始化,也看到有堆栈指针初始化这个动作。但是,从来只是看到有人说系统初始化要初始化堆栈,即正确给堆栈指针sp赋值,但是却从来没有看到有人解释,为何要初始化堆栈。所以,接下来的内容,就是经过一定的探究,试图来解释一下,为何要初始化堆栈,即:

为何C语言的函数调用要用到堆栈,而汇编却不需要初始化堆栈


要明白这个问题,首先要了解堆栈的作用。

关于堆栈的作用,要详细讲解的话,要很长的篇幅,所以此处只是做简略介绍。

总的来说,堆栈的作用就是:保存现场/上下文,传递参数。

1.保存现场/上下文

现场,意思就相当于案发现场,总有一些现场的情况,要记录下来的,否则被别人破坏掉之后,你就无法恢复现场了。而此处说的现场,就是指CPU运行的时候,用到了一些寄存器,比如r0,r1等等,对于这些寄存器的值,如果你不保存而直接跳转到子函数中去执行,那么很可能就被其破坏了,因为其函数执行也要用到这些寄存器。

因此,在函数调用之前,应该将这些寄存器等现场,暂时保持起来,等调用函数执行完毕返回后,再恢复现场。这样CPU就可以正确的继续执行了。


在计算机中,你常可以看到上下文这个词,对应的英文是context。那么:

1.1.什么叫做上下文context

保存现场,也叫保存上下文。

上下文,英文叫做context,就是上面的文章,和下面的文章,即与你此刻,当前CPU运行有关系的内容,即那些你用到寄存器。所以,和上面的现场,是一个意思。


保存寄存器的值,一般用的是push指令,将对应的某些寄存器的值,一个个放到堆栈中,把对应的值压入到堆栈里面,即所谓的压栈

然后待被调用的子函数执行完毕的时候,再调用pop,把堆栈中的一个个的值,赋值给对应的那些你刚开始压栈时用到的寄存器,把对应的值从堆栈中弹出去,即所谓的出栈


其中保存的寄存器中,也包括lr的值(因为用bl指令进行跳转的话,那么之前的pc的值是存在lr中的),然后在子程序执行完毕的时候,再把堆栈中的lr的值pop出来,赋值给pc,这样就实现了子函数的正确的返回。


2.传递参数

C语言进行函数调用的时候,常常会传递给被调用的函数一些参数,对于这些C语言级别的参数,被编译器翻译成汇编语言的时候,就要找个地方存放一下,并且让被调用的函数能够访问,否则就没发实现传递参数了。对于找个地方放一下,分两种情况。

一种情况是,本身传递的参数就很少,就可以通过寄存器传送参数。

因为在前面的保存现场的动作中,已经保存好了对应的寄存器的值,那么此时,这些寄存器就是空闲的,可以供我们使用的了,那就可以放参数,而参数少的情况下,就足够存放参数了,比如参数有2个,那么就用r0r1存放即可。(关于参数1和参数2,具体哪个放在r0,哪个放在r1,就是和APCS中的“在函数调用之间传递/返回参数”相关了,APCS中会有详细的约定。感兴趣的自己去研究。)

但是如果参数太多,寄存器不够用,那么就得把多余的参数堆栈中了。

即,可以用堆栈来传递所有的或寄存器放不下的那些多余的参数。


3.举例分析C语言函数调用是如何使用堆栈的

对于上面的解释的堆栈的作用显得有些抽象,此处再用例子来简单说明一下,就容易明白了:

:

  1. arm-inux-objdump –d u-boot > dump_u-boot.txt
复制代码

可以得到dump_u-boot.txt文件。该文件就是中,包含了u-boot中的程序的可执行的汇编代码,

其中我们可以看到C语言的函数的源代码,到底对应着那些汇编代码。


下面贴出两个函数的汇编代码,

一个是clock_init

另一个是与clock_init在同一C源文件中的,另外一个函数CopyCode2Ram



  1. 33d0091c <CopyCode2Ram>:
  2. 33d0091c:  e92d4070   push   {r4, r5, r6, lr}
  3. 33d00920:  e1a06000   mov r6, r0
  4. 33d00924:  e1a05001   mov r5, r1
  5. 33d00928:  e1a04002   mov r4, r2
  6. 33d0092c:  ebffffef   bl  33d008f0 <bBootFrmNORFlash>
  7. ... ...
  8. 33d00984:  ebffff14   bl  33d005dc <nand_read_ll>
  9. ... ...
  10. 33d009a8:  e3a00000   mov r0, #0 ; 0x0
  11. 33d009ac:  e8bd8070   pop {r4, r5, r6, pc}

  12. 33d009b0 <clock_init>:
  13. 33d009b0:  e3a02313   mov r2, #1275068416   ; 0x4c000000
  14. 33d009b4:  e3a03005   mov r3, #5 ; 0x5
  15. 33d009b8:  e5823014   str r3, [r2, #20]
  16. ... ...
  17. 33d009f8:  e1a0f00e   mov pc, lr
复制代码


1clock_init部分的代码

可以看到该函数第一行:

  1. 33d009b0:  e3a02313   mov r2, #1275068416   ; 0x4c000000
复制代码

就没有我们所期望的push指令,没有去将一些寄存器的值放到堆栈中。这是因为,我们clock_init这部分的内容,所用到的r2,r3等等寄存器,和前面调用clock_init之前所用到的寄存器r0,没有冲突,所以此处可以不用push去保存这类寄存器的值,不过有个寄存器要注意,那就是r14,即lr,其是在前面调用clock_init的时候,用的是bl指令,所以会自动把跳转时候的pc的值赋值给lr,所以也不需要push指令去将PC的值保存到堆栈中。

clock_init的代码的最后一行:

  1. 33d009f8: e1a0f00e mov pc, lr
复制代码

就是我们常见的mov pc, lr,把lr的值,即之前保存的函数调用时候的PC值,赋值给现在的PC

这样就实现了函数的正确的返回,即返回到了函数调用时候下一个指令的位置。

这样CPU就可以继续执行原先函数内剩下那部分的代码了。


2CopyCode2Ram部分的代码

其第一行:

  1. 33d0091c: e92d4070 push {r4, r5, r6, lr}
复制代码

就是我们所期望的,用push指令,保存了r4,r5,r以及lr

push去保存r4,r5,r6,那是因为所谓的保存现场,以后后续函数返回时候再恢复现场,

而用push去保存lr,那是因为此函数里面,还有其他函数调用:

  1. 33d0092c:  ebffffef   bl  33d008f0 <bBootFrmNORFlash>
  2. ... ...
  3. 33d00984:  ebffff14   bl  33d005dc <nand_read_ll>
  4. ... ...
复制代码

也用到了bl指令,会改变我们最开始进入clock_init时候的lr的值,所以我们要用push也暂时保存起来。

而对应地,CopyCode2Ram的最后一行:

  1. 33d009ac: e8bd8070 pop {r4, r5, r6, pc}
复制代码

就是把之前push的值,给pop出来,还给对应的寄存器,其中最后一个是将开始pushlr的值,pop出来给赋给PC,因为实现了函数的返回。

另外,我们注意到,在CopyCode2Ram的倒数第二行是:

  1. 33d009a8: e3a00000 mov r0, #0 ; 0x0
复制代码

是把0赋值给r0寄存器,这个就是我们所谓返回值的传递,是通过r0寄存器的。

此处的返回值是0,也对应着C语言的源码中的“return 0.


对于使用哪个寄存器来传递返回值:

当然你也可以用其他暂时空闲没有用到的寄存器来传递返回值,但是这些处理方式,本身是根据ARMAPCS的寄存器的使用的约定而设计的,你最好不要随便改变使用方式,最好还是按照其约定的来处理,这样程序更加符合规范。

评分

参与人数 1可用积分 +10 收起 理由
bitmilong + 10 感谢分享

查看全部评分

论坛徽章:
31
CU大牛徽章
日期:2013-03-13 15:15:08CU大牛徽章
日期:2013-05-20 10:46:18CU大牛徽章
日期:2013-05-20 10:46:25CU大牛徽章
日期:2013-05-20 10:46:31CU大牛徽章
日期:2013-05-20 10:46:38CU大牛徽章
日期:2013-05-20 10:46:44CU大牛徽章
日期:2013-09-18 15:16:55CU大牛徽章
日期:2013-09-18 15:18:22CU大牛徽章
日期:2013-09-18 15:18:43CU十二周年纪念徽章
日期:2013-10-24 15:41:34丑牛
日期:2013-12-01 10:11:07水瓶座
日期:2014-01-15 08:47:25
2 [报告]
发表于 2011-04-19 11:44 |只看该作者
感谢crifan,让人豁然清晰。。。

论坛徽章:
0
3 [报告]
发表于 2011-04-19 13:54 |只看该作者
crifan兄 发的都是经典呀

论坛徽章:
0
4 [报告]
发表于 2011-04-19 19:29 |只看该作者
关于这个问题,我之前一直很困惑,无奈,没有见到有人有任何这方面的解释。
最近在弄uboot,经过一番折腾,最后终于搞懂了。所以贴出来,算是给还不清楚的人,一点指示吧。

论坛徽章:
0
5 [报告]
发表于 2011-04-19 23:07 |只看该作者
耳闻不如目见

论坛徽章:
0
6 [报告]
发表于 2011-04-20 08:18 |只看该作者
汇编也是要堆栈的,ARM没有直接涉及堆栈的指令,也就说硬件上不对堆栈做假设。但是像x86之类的指令集,本身就有push,pop这种直接操纵堆栈的指令,call指令甚至会自动往堆栈里放东西。堆栈最初是为了解决函数递归出现的,对现代的处理器来说应该是理所当然的东西了。

论坛徽章:
0
7 [报告]
发表于 2011-04-20 23:07 |只看该作者
汇编也是要堆栈的,ARM没有直接涉及堆栈的指令,也就说硬件上不对堆栈做假设。但是像x86之类的指令集,本身 ...
tempname3 发表于 2011-04-20 08:18



    那请问arm中的push和pop等指令,不属于"直接涉及堆栈的指令"吗?

论坛徽章:
0
8 [报告]
发表于 2011-04-21 09:06 |只看该作者
ARM也有push指令?不好意思,太久没用了。。。。。

论坛徽章:
0
9 [报告]
发表于 2011-04-21 16:22 |只看该作者
回复 8# tempname3

我上面发的内容中,就有push指令啊........
“33d0091c:  e92d4070   push   {r4, r5, r6, lr}

论坛徽章:
0
10 [报告]
发表于 2011-04-21 16:27 |只看该作者
我查了一下,好像只有Thumb指令集才有pop和push。反正我是记得,以前看反汇编代码时,保护现场用的是str和ldr。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP