rocky1972 发表于 2010-02-05 16:53

Mips的代码密度没有ARM大

本帖最后由 rocky1972 于 2010-02-05 16:55 编辑

# ls
main.c    Makefile
# cat main.c
#include <stdio.h>
#include <stdlib.h>

int foo(int a, int b)
{

return (a + b);
}
int dumm(int a, int b ,int c , int d,int e)
{

return (a + b + c +d);

}


int main(int argc ,char ** argv)
{


int c;

c = foo(1,2);
c = dumm(1,2,3,4,5);
return c;

}

# cat Makefile
all: build_arm build_mips show



TARGET_NAME = helloworld
SOUCRE_FILE = main.c
build_arm:
arm-linux-gcc $(SOUCRE_FILE) -o $(TARGET_NAME).arm.elf
arm-linux-objdump -D $(TARGET_NAME).arm.elf > $(TARGET_NAME).arm.objdump
arm-linux-objcopy -O binary -R .note -R .note.gnu.build-id -R .comment -S $(TARGET_NAME).arm.elf $(TARGET_NAME).arm.bin



build_mips:
mips-linux-gcc $(SOUCRE_FILE) -o $(TARGET_NAME).mips.elf
mips-linux-objdump -D $(TARGET_NAME).mips.elf > $(TARGET_NAME).mips.objdump
mips-linux-objcopy -O binary -R .note -R .note.gnu.build-id -R .comment -S $(TARGET_NAME).mips.elf $(TARGET_NAME).mips.bin

show:
ls -al *bin
ls -al *objdump
ls -al *elf

clean:
rm -rf *.elf *.bin *.objdump

# make
arm-linux-gcc main.c -o helloworld.arm.elf
arm-linux-objdump -D helloworld.arm.elf > helloworld.arm.objdump
arm-linux-objcopy -O binary -R .note -R .note.gnu.build-id -R .comment -S helloworld.arm.elf helloworld.arm.bin
mips-linux-gcc main.c -o helloworld.mips.elf
mips-linux-objdump -D helloworld.mips.elf > helloworld.mips.objdump
mips-linux-objcopy -O binary -R .note -R .note.gnu.build-id -R .comment -S helloworld.mips.elf helloworld.mips.bin
ls -al *bin
-rwxr-xr-x 1 root root 34160 02-05 16:43 helloworld.arm.bin
-rwxr-xr-x 1 root root 67696 02-05 16:43 helloworld.mips.bin
ls -al *objdump
-rw-r--r-- 1 root root 25486 02-05 16:43 helloworld.arm.objdump
-rw-r--r-- 1 root root 19243 02-05 16:43 helloworld.mips.objdump
ls -al *elf
-rwxr-xr-x 1 root root 7516 02-05 16:43 helloworld.arm.elf
-rwxr-xr-x 1 root root 5878 02-05 16:43 helloworld.mips.elf
#

比较两个binary的大小发现ARM的代码密度要比MIPS高一倍。




对单个函数 foo函数进行反汇编:

=================================       ARM    ==================================

000083a0 <foo>:
    83a0:    e1a0c00d   mov    ip, sp
    83a4:    e92dd800   stmdb    sp!, {fp, ip, lr, pc}
    83a8:    e24cb004   sub    fp, ip, #4    ; 0x4
    83ac:    e24dd008   sub    sp, sp, #8    ; 0x8
    83b0:    e50b0010   str    r0,
    83b4:    e50b1014   str    r1,
    83b8:    e51b2010   ldr    r2,
    83bc:    e51b3014   ldr    r3,
    83c0:    e0823003   add    r3, r2, r3
    83c4:    e1a00003   mov    r0, r3
    83c8:    e24bd00c   sub    sp, fp, #12    ; 0xc
    83cc:    e89da800   ldmia    sp, {fp, sp, pc}

ARM 用 12 条指令完成

================================= MIPS ==================================

00400750 <foo>:
400750:    27bdfff8   addiu    sp,sp,-8
400754:    afbe0004   sw    s8,4(sp)
400758:    03a0f021   move    s8,sp
40075c:    afc40008   sw    a0,8(s8)
400760:    afc5000c   sw    a1,12(s8)
400764:    8fc30008   lw    v1,8(s8)
400768:    8fc2000c   lw    v0,12(s8)
40076c:    00000000   nop
400770:    00621021   addu    v0,v1,v0
400774:    03c0e821   move    sp,s8
400778:    8fbe0004   lw    s8,4(sp)
40077c:    27bd0008   addiu    sp,sp,8
400780:    03e00008   jr    ra
400784:    00000000   nop

MIPS 用14条指令, 多出来的两条指令为nop来充当delay slot

但是MIPS 的FAE 培训的时候讲到 , MIPS寄存器数量比ARM 要多, 所以代码密度和执行效率较ARM 要高一些。。。。。。。

prolj 发表于 2010-02-05 23:03

虽然lz的例子没有用到,但是ARM的指令密度主要是靠thumb指令集出来的,还有另外一个非主流CPU更BT,提出了双分支并行的概念,虽然不怎么实用。
MIPS的nop是必须的,设计决定的,好像不加nop就会错误,反正gcc的mips port也不咋地,具体做起来又麻烦。可是我觉得更糟糕的在与jmp的长度,还有非对齐访问。而ARM在非对齐访问方面提供了一些指令,据说有某种机制的优化,jmp,我记不清了,其实我就刚毕业接触过ARM。
我是x64的用户,而且对x64的认识还一直停留在ISA的层面,mik是学习的目标和榜样,各位熟悉ARM和MIPS的大牛看我说错了还请轻拍哈,我幼小的心灵承受能力不强。

beyond2004 发表于 2010-02-06 09:22

ARM好像有16位的指令,不知道是不是这个原因

rocky1972 发表于 2010-02-06 10:47

ARM好像有16位的指令,不知道是不是这个原因
beyond2004 发表于 2010-02-06 09:22 http://linux.chinaunix.net/bbs/images/common/back.gif


    MIPS和ARM都是编译成32位指令的

lllaaa 发表于 2010-02-06 11:10

可能这个例子比较简单无法说明情况。但是根据我的实验。thumb<mips<arm<ppc

华为的以太网交换机三种cpu都用到了。有一次我比较了用ppc、arm、mips三款设备的obj文件,编译完后使用size命令来统计代码段大小。得出的结论是mips<arm<ppc。之后重新用thumb指令集编译全套代码(1G左右),得出thumb<mips<arm<ppc的结论。现在回想起来可能不同设备使用特性不一样有一定的影响。可以回头再验证一下。但实际这个大小跟编译器的质量有关。即使是vxworks 5.5里面gcc 2.95+风河的一堆修补,对三种平台的支持程度也是不一样的。

另外,mips编译填充的nop我认为还是没有打开编译器优化选项。delay slot的话可以不用填充nop,lz编译的时候用的默认优化,那就直接填充nop了事了。

另外看二进制大小可以不用这么麻烦。objdump ,readelf,size都可以看。

lz试一试编译http://www.sqlite.org/sqlite-amalgamation-3_6_22.zip比较一下。我周一回头也再比较一下。

cjaizss 发表于 2010-02-06 13:40

ARM好像有16位的指令,不知道是不是这个原因
beyond2004 发表于 2010-02-06 09:22 http://linux.chinaunix.net/bbs/images/common/back.gif
这是thumb指令集

cjaizss 发表于 2010-02-06 18:21

虽然lz的例子没有用到,但是ARM的指令密度主要是靠thumb指令集出来的,还有另外一个非主流CPU更BT,提出了双 ...
prolj 发表于 2010-02-05 23:03 http://linux.chinaunix.net/bbs/images/common/back.gif
MIPS= Microprocessor without Interlocked Pipeline Stages
RISC的代表
delay slot是不可省略的
MIPS的设计思路使得大家一向觉得这才应该是纯粹的RISC

rocky1972 发表于 2010-02-06 21:00

MIPS= Microprocessor without Interlocked Pipeline Stages
RISC的代表
delay slot是不可省略的
MIPS ...
cjaizss 发表于 2010-02-06 18:21 http://linux.chinaunix.net/bbs/images/common/back.gif


    牛人终于出来了

rocky1972 发表于 2010-02-06 21:01

可能这个例子比较简单无法说明情况。但是根据我的实验。thumb
lllaaa 发表于 2010-02-06 11:10 http://linux.chinaunix.net/bbs/images/common/back.gif


    底层驱动,特别是固件的代码,应该是看binary的大小吧

lllaaa 发表于 2010-02-06 22:44

底层驱动,特别是固件的代码,应该是看binary的大小吧
rocky1972 发表于 2010-02-06 21:01 http://linux.chinaunix.net/bbs/images/common/back.gif


你的那个例子是看的最终链接后的binary,我认为不能反映纯粹的代码编译结果,因为已经和crt链接到一起了。其实你的目的只想比较函数而已。从反汇编的结果来看,arm在函数头用1条指令就可以把一堆寄存器压栈,而mips要调整栈后慢慢赋值。由于你的函数非常简单仅仅是加法运算,这部分入栈代码的差异相对来说就占了更大的比例。因此后面我建议你用sqlite的代码编译后用binutils里面的size命令来看看text段大小的差异。
页: [1] 2
查看完整版本: Mips的代码密度没有ARM大