本文由Jacky原创,来自http://blog.chinaunix.net/u1/58780/showart.php?id=462971
对于.lds文件,它定义了整个程序编译之后的连接过程,决定了一个可执行程序的各个段的存储位置。虽然现在我还没怎么用它,但感觉还是挺重要的,有必要了解一下。
先看一下GNU官方网站上对.lds文件形式的完整描述:
SECTIONS { ... secname start BLOCK(align) (NOLOAD) : AT ( ldadr ) { contents } >region :phdr =fill ... } | secname和contents是必须的,其他的都是可选的。下面挑几个常用的看看:
1、secname:段名
2、contents:决定哪些内容放在本段,可以是整个目标文件,也可以是目标文件中的某段(代码段、数据段等)
3、start:本段连接(运行)的地址,如果没有使用AT(ldadr),本段存储的地址也是start。GNU网站上说start可以用任意一种描述地址的符号来描述。
4、AT(ldadr):定义本段存储(加载)的地址。
看一个简单的例子:(摘自《2410完全开发》)
/* nand.lds */ SECTIONS { firtst 0x00000000 : { head.o init.o } second 0x30000000 : AT(4096) { main.o } } |
以上,head.o放在0x00000000地址开始处,init.o放在head.o后面,他们的运行地址也是0x00000000,即连接和存储地址相同(没有AT指定);main.o放在4096(0x1000,是AT指定的,存储地址)开始处,但是它的运行地址在0x30000000,运行之前需要从0x1000(加载处)复制到0x30000000(运行处),此过程也就用到了读取Nand flash。
这就是存储地址和连接(运行)地址的不同,称为加载时域和运行时域,可以在.lds连接脚本文件中分别指定。
编写好的.lds文件,在用arm-linux-ld连接命令时带-Tfilename来调用执行,如 arm-linux-ld –Tnand.lds x.o y.o –o xy.o。也用-Ttext参数直接指定连接地址,如 arm-linux-ld –Ttext 0x30000000 x.o y.o –o xy.o。
既然程序有了两种地址,就涉及到一些跳转指令的区别,这里正好写下来,以后万一忘记了也可查看,以前不少东西没记下来现在忘得差不多了。。。
ARM汇编中,常有两种跳转方法:b跳转指令、ldr指令向PC赋值。
我自己经过归纳如下:
(1) b step1 :b跳转指令是相对跳转,依赖当前PC的值,偏移量是通过该指令本身的bit[23:0]算出来的,这使得使用b指令的程序不依赖于要跳到的代码的位置,只看指令本身。
(2) ldr pc, =step1 :该指令是从内存中的某个位置(step1)读出数据并赋给PC,同样依赖当前PC的值,但是偏移量是那个位置(step1)的连接地址(运行时的地址),所以可以用它实现从Flash到RAM的程序跳转。
(3) 此外,有必要回味一下adr伪指令,U-boot中那段relocate代码就是通过adr实现当前程序是在RAM中还是flash中。仍然用我当时的注释:
relocate: /* 把U-Boot重新定位到RAM */ adr r0, _start /* r0是代码的当前位置 */ /* adr伪指令,汇编器自动通过当前PC的值算出 如果执行到_start时PC的值,放到r0中: 当此段在flash中执行时r0 = _start = 0;当此段在RAM中执行时_start = _TEXT_BASE(在board/smdk2410/config.mk中指定的值为0x33F80000,即u-boot在把代码拷贝到RAM中去执行的代码段的开始) */ ldr r1, _TEXT_BASE /* 测试判断是从Flash启动,还是RAM */ /* 此句执行的结果r1始终是0x33FF80000,因为此值是又编译器指定的(ads中设置,或-D设置编译器参数) */ cmp r0, r1 /* 比较r0和r1,调试的时候不要执行重定位 */ |
下面,结合u-boot.lds看看一个正式的连接脚本文件。这个文件的基本功能还能看明白,虽然上面分析了好多,但其中那些GNU风格的符号还是着实让我感到迷惑。。。
OUTPUT_FORMAT("elf32­littlearm", "elf32­littlearm", "elf32­littlearm") ;指定输出可执行文件是elf格式,32位ARM指令,小端 OUTPUT_ARCH(arm) ;指定输出可执行文件的平台为ARM ENTRY(_start) ;指定输出可执行文件的起始代码段为_start. SECTIONS { . = 0x00000000 ; 从0x0位置开始 . = ALIGN(4) ; 代码以4字节对齐 .text : ;指定代码段 { cpu/arm920t/start.o (.text) ; 代码的第一个代码部分 *(.text) ;其它代码部分 } . = ALIGN(4) .rodata : { *(.rodata) } ;指定只读数据段 . = ALIGN(4); .data : { *(.data) } ;指定读/写数据段 . = ALIGN(4); .got : { *(.got) } ;指定got段, got段式是uboot自定义的一个段, 非标准段 __u_boot_cmd_start = . ;把__u_boot_cmd_start赋值为当前位置, 即起始位置 .u_boot_cmd : { *(.u_boot_cmd) } ;指定u_boot_cmd段, uboot把所有的uboot命令放在该段. __u_boot_cmd_end = .;把__u_boot_cmd_end赋值为当前位置,即结束位置 . = ALIGN(4); __bss_start = .; 把__bss_start赋值为当前位置,即bss段的开始位置 .bss : { *(.bss) }; 指定bss段 _end = .; 把_end赋值为当前位置,即bss段的结束位置 } |
说一下最后碰到的关于lds文件中连接(运行)的地址和存储(加载)的地址的一理解。
出处:http://hi.baidu.com/%D1%D6%B3%AC/blog/item/e2b50bf96afe7756242df2fb.html 先看一个例子:
/* nand.lds */ SECTIONS { firtst 0x00000000 : { head.o init.o } second 0x30000000 : AT(4096) { main.o } }
这个AT括号里的就是存储(加载)地址。什么意思呢?就是链接的时候并不把main.o放在紧临init.o之后,而中间留个空洞,在偏移4096字节的地方开始放置main.o。
_______________________________________________________________
| | | | |
|head.o | init.o |空着 |main.o |
| | | | |
_______________________________________________________________
4096处
因为加载程序也没有什么智能可言,所以就在中间弄个空洞,好像有东西一样。这样CPU启动的时候就把这个二进制文件拷贝到内部的ram中,内部的ram只有4K大小,所以这个文件不能完全拷贝进去,main部分留在了flash中,然后前面的head.o调用nand的操作函数把main.o拷贝到真正的内存0x30000000(连接,运行地址)中,再跳到真正的内存去执行。
所以所谓的“连接,运行地址”就是两个时候的不同叫法,编译的时候,要调用函数,函数要有地址,这个就是连接地址,运行的时候要执行某个函数,也需要地址如倒子中指的是0x30000000就是连接运行地址。
而“存储,加载地址”就是编译之后某一个文件的某一部分被存储在哪里,当然加载的时候只是简单的把二进制文件拷贝到内存,所以存储地址也就是加载地址了。
上面的那个lds文件如果不加AT(4096)编译出的二进制文件有七百多兆,因为如果不指定连接地址,连接地址和存储地址是相同的,于是main.o就被存储在偏移0x3000000字节的地方,中间留下了一个巨大的空洞。
虽然写了很多,可能还是没有讲明白,用的就是这个例子http://tq2440.googlecode.com/svn%E2%80%BAtrunk/trunk/examples/ 可以修改nand.lds编译一下,看看加不加AT(4096)程序的nand.bin大小。估计就能理解了。 |