feiyang10086 发表于 2011-12-26 16:05

小议大小端模式对C语言的共用体结构的影响


小议大小端模式对C语言的共用体结构的影响










1、一些问题

问题1




view plaincopy to clipboard01.#include "stdio.h"
02.union   
03.{
04.    int i;
05.    char ch;
06.}key;
07.main()
08.{
09.    key.i=65*256+66;
10.    printf("%c\t%c\n",key.ch,key.ch);
11.}答案是B      A;为什么不是A      B呢?

      在前面的文章中我们已经测试过,X86体系结构的CPU是小端模式的。比如一个数0x1234,放在内存里按照内存地址从低往高实际上是低地址字节里放的是0x34,高字节里放的是0x12。小端模式和我们平时感觉上的一致,把数位数越高的部分放在地址越高的部分。union类型是共享内存的,union中是按照从低到高放的,i=0x4142,也就是低地址中放的是42,高地址中放的是41,按照ch,ch的顺序输出就是B      A。如果是大端模式的话就是打印两个空了,故不会出现A      B的情况。





问题2




view plaincopy to clipboard01.union myun   
02.{
03.   struct { int x; int y; int z; }u;   
04.   int k;   
05.}a;   
06.int main()   
07.{   
08.   a.u.x =4;
09.   a.u.y =5;   
10.   a.u.z =6;   
11.   a.k = 0;   
12.   printf("%d %d %d\n",a.u.x,a.u.y,a.u.z);
13.   return 0;
14.}union类型是共享内存的,以size最大的结构作为自己的大小,这样的话,myun这个结构就包含u这个结构体,而大小也等于u这个结构体的大小,在内存中的排列为声明的顺序x,y,z从低到高,然后赋值的时候,在内存中,就是x的位置放置4,y的位置放置5,z的位置放置6,现在对k赋值,对k的赋值因为是union,要共享内存,所以从union的首地址开始放置,首地址开始的位置其实是x的位置,这样原来内存中x的位置就被k所赋的值代替了,就变为0了,这个时候要进行打印,就直接看内存里就行了,x的位置也就是k的位置是0,而y,z的位置的值没有改变,所以应该是0,5,6。




问题3




view plaincopy to clipboard01.int checkCPU()
02.{
03.  union   
04.  {
05.    int a;
06.    char b;
07.  }c;
08.  c.a = 1;
09.  return (c.b == 1);// 小端返回TRUE,大端返回FALSE
10.}这个就不详细解释了,用来判定CPU大小端模式的一个经典例子。




问题4




view plaincopy to clipboard01.union {
02.    int a;
03.    long b;
04.    char c;
05.}s;
06.main()
07.{
08.    s.a=0x12345678;
09.    s.a=0x23456789;
10.    printf("%lx\n",s.b);
11.    printf("%x,%x,%x,%x\n",s.c,s.c,s.c,s.c);
12.}答案是: 12345678
78,56,34,12问题5



view plaincopy to clipboard01.# include <stdio.h>
02.main()
03.{
04.    union {
05.      long i;
06.      int k;
07.      char ii;
08.      char s;
09.    } mix ;
10.    mix.k=0x23456789;
11.    printf("mix.i=%lx\n",mix.i);
12.    printf("mix.k=%x\n",mix.k);
13.    printf("mix.ii=%x\n",mix.ii);
14.    printf("mix.s=%x\tmix.s=%x\n",mix.s,mix.s);
15.    printf("mix.s=%x\tmix.s=%x\n",mix.s,mix.s);
16.    return 0;
17.} 答案是: mix.i=23456789
mix.k=23456789
mix.ii=ffffff89
mix.s=ffffff89 mix.s=67
mix.s=45 mix.s=23出现f是因为把char型强制转换成int型输出,0x89最高位1000 1001最高位为1,转换为int类型的时候认为是负数,而且数在计算机中是按补码存储的,所以自然高位补1了。
2、这是一个什么问题

2.1、共用体结构的意义

问题:
假设网络节点A 和网络节点B 中的通信协议涉及四类报文,报文格式为“报文类型字段+报文内容的结构体”,四个报文内容的结构体类型分别为STRUCTTYPE1~ STRUCTTYPE4,如何编写程序以最简单的方式组
织一个统一的报文数据结构。
分析:
报文的格式为“报文类型+报文内容的结构体”,在真实的通信中,每次只能发四类报文中的一种,我们可以将四类报文的结构体组织为一个union(共享一段内存,但每次有效的只是一种),然后和报文类型字段统一组织成一个报文数据结构。

解答:




view plaincopy to clipboard01.typedef unsigned char BYTE;
02.//报文内容联合体
03.typedef union tagPacketContent
04.{
05.  STRUCTTYPE1 pkt1;
06.  STRUCTTYPE2 pkt2;
07.  STRUCTTYPE3 pkt1;
08.  STRUCTTYPE4 pkt2;
09.}PacketContent;
10.//统一的报文数据结构
11.typedef struct tagPacket
12.{
13.  BYTE pktType;
14.  PacketContent pktContent;
15.}Packet;当多个基本数据类型或复合数据结构要占用同一片内存时,我们要使用共用体;当多种类型,多个对象,多个事物只取其一时(我们姑且通俗地称其为“n 选1”),我们也可以使用共用体来发挥其长处。把几种不同类型的变量放到同一段内存单元中,这些变量在内存中占用的字节数可能不同,但都从同一个地址开始存放。也就是使用覆盖技术,几个变量互相覆盖。同一个内存段可以用来存放几种不同类型的成员,但在每一瞬间只能存放其中一种,而不能同时存放几种。即,每一瞬间只有一个成员起作用,其他的成员不起作用,不能同时存在和起作用。共用体变量中起作用的成员是最后一次存放的成员,在存入一个新的成员后原有的成员就失去了作用。



2.2、大小端模式对共用体的影响

      当共用体中有不同类型的变量,用一种变量类型给共用体赋值,但用另一种变量类型读取共用体的时候就涉及到大小端的问题。比如在问题1中,给int类型的变量i赋值,但通过char类型的数组来读取时,就要注意字节序的问题,也就是大小端的问题。

如果有一天21 发表于 2011-12-26 18:09

学习鸟谢谢分享
页: [1]
查看完整版本: 小议大小端模式对C语言的共用体结构的影响