论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2011-06-08 14:12 |只看该作者 |倒序浏览

在看补码的时候遇到一个古怪的问题，似乎编译器对十进制常量汇编的时候，会做一个转换，但是其它进制不会：

test.c
#include <stdio.h>
int main()
{
char a = 0b00000000;
char b = 0b10000001;
printf("a: %d, b:%d\n", a, b);
return 0;
}

复制代码

#make  test
#./test
a: 0, b:-127

为什么b不是-1而是-127呢，看来是用二进制表示的时候，汇编器将0b10000001直接读入了，而printf读出的时候，
CPU内部做了转换，也即10000001 取反11111110再加1求得11111111，也即-127

查看生成的反汇编代码为：
80483cd:    c6 44 24 1f 00       movb $0x0,0x1f(%esp)
80483d2:    c6 44 24 1e 81       movb $0x81,0x1e(%esp)

第一句将0x0放入堆栈esp+0x1f处，第二句将0x81放入堆栈esp+0x1e处，0x81就是0b10000001。
看来当使用二进制给出初始值的时候，汇编器忠实于原数值。

再看下面程序：
#include <stdio.h>

int main()
{
      char a = 0b00000000;
      char b = -1;

      printf("a: %d, b:%d\n", a, b);

      return 0;
}

#./test
a: 0, b:-1

查看生成的汇编代码为：
80483cd:    c6 44 24 1f 00       movb $0x0,0x1f(%esp)
80483d2:    c6 44 24 1e ff       movb $0xff,0x1e(%esp)
第一句将0x0放入堆栈esp+0x1f处，第二句将0xff放入堆栈esp+0x1e处，0xff就是-1的补码。
看来当使用十进制给出初始值的时候，汇编器将翻译原数值为补码到机器指令。

假如我们使用十六进制呢，char b = 0x81; 打印结果与二进制给出的结果是一致的，另外测试8进制是结果也为-127。
难道只有十进制的时候，编译器会忠实于赋予的值？为什么要这样处理？请不吝指点！

编译器, 进制, 编译器, 进制

文库|博客

hellioncu

巨富豪门

论坛徽章:: 324

2楼 [报告]

发表于 2011-06-08 14:24 |只看该作者

哪个编译器支持 0b表示二进制？
-1的二进制应该是11111111，而不是10000001

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

tempname2

富足长乐

论坛徽章:: 2

3楼 [报告]

发表于 2011-06-08 14:31 |只看该作者

补码10000001本来就是－127。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

lli_njupt

白手起家

论坛徽章:: 0

4楼 [报告]

发表于 2011-06-08 14:33 |只看该作者

本帖最后由 lli_njupt 于 2011-06-08 14:38 编辑

#gcc -v
gcc version 4.4.5 (Ubuntu/Linaro 4.4.4-14ubuntu5)

看来二进制大家用的都很少啊，
-1的二进制应该是11111111，而不是10000001，这点楼上应该是指计算机内部表示了？
因为它用补码表示负数，看来是-1的十进制编译机器指令的时候直接由汇编器转化为二进制的
内部表示11111111了，恩，其它进制也是如此罢了，没甚奇怪的了！