小议大小端模式对C语言的共用体结构的影响

feiyang10086 发表于 2011-12-26 16:05

小议大小端模式对C语言的共用体结构的影响

1、一些问题

问题1

view plaincopy to clipboard01.#include "stdio.h"
02.union
03.{
04. int i;
05. char ch;
06.}key;
07.main()
08.{
09. key.i=65*256+66;
10. printf("%c\t%c\n",key.ch,key.ch);
11.}答案是B    A；为什么不是A    B呢？

   在前面的文章中我们已经测试过，X86体系结构的CPU是小端模式的。比如一个数0x1234,放在内存里按照内存地址从低往高实际上是低地址字节里放的是0x34，高字节里放的是0x12。小端模式和我们平时感觉上的一致，把数位数越高的部分放在地址越高的部分。union类型是共享内存的，union中是按照从低到高放的，i=0x4142，也就是低地址中放的是42，高地址中放的是41，按照ch,ch的顺序输出就是B    A。如果是大端模式的话就是打印两个空了，故不会出现A    B的情况。

问题2

view plaincopy to clipboard01.union myun
02.{
03. 　　struct { int x; int y; int z; }u;
04.　　 int k;
05.}a;
06.int main()
07.{
08.　　 a.u.x =4;
09. 　　a.u.y =5;
10.　　 a.u.z =6;
11.　　 a.k = 0;
12.　　 printf("%d %d %d\n",a.u.x,a.u.y,a.u.z);
13.　　 return 0;
14.}union类型是共享内存的，以size最大的结构作为自己的大小，这样的话，myun这个结构就包含u这个结构体，而大小也等于u这个结构体的大小，在内存中的排列为声明的顺序x,y,z从低到高，然后赋值的时候，在内存中，就是x的位置放置4，y的位置放置5，z的位置放置6，现在对k赋值，对k的赋值因为是union，要共享内存，所以从union的首地址开始放置，首地址开始的位置其实是x的位置，这样原来内存中x的位置就被k所赋的值代替了，就变为0了，这个时候要进行打印，就直接看内存里就行了，x的位置也就是k的位置是0，而y，z的位置的值没有改变，所以应该是0,5,6。

问题3

view plaincopy to clipboard01.int checkCPU()
02.{
03.　　union
04.　　{
05. 　　　int a;
06. 　　　char b;
07.　　}c;
08.　　c.a = 1;
09.　　return (c.b == 1);// 小端返回TRUE,大端返回FALSE
10.}这个就不详细解释了，用来判定CPU大小端模式的一个经典例子。

问题4

view plaincopy to clipboard01.union {
02. int a;
03. long b;
04. char c;
05.}s;
06.main()
07.{
08. s.a=0x12345678;
09. s.a=0x23456789;
10. printf("%lx\n",s.b);
11. printf("%x,%x,%x,%x\n",s.c,s.c,s.c,s.c);
12.}答案是： 12345678
78,56,34,12问题5

view plaincopy to clipboard01.# include <stdio.h>
02.main()
03.{
04. union {
05.    long i;
06.    int k;
07.    char ii;
08.    char s;
09. } mix ;
10. mix.k=0x23456789;
11. printf("mix.i=%lx\n",mix.i);
12. printf("mix.k=%x\n",mix.k);
13. printf("mix.ii=%x\n",mix.ii);
14. printf("mix.s=%x\tmix.s=%x\n",mix.s,mix.s);
15. printf("mix.s=%x\tmix.s=%x\n",mix.s,mix.s);
16. return 0;
17.} 答案是： mix.i=23456789
mix.k=23456789
mix.ii=ffffff89
mix.s=ffffff89 mix.s=67
mix.s=45 mix.s=23出现f是因为把char型强制转换成int型输出，0x89最高位1000 1001最高位为1，转换为int类型的时候认为是负数，而且数在计算机中是按补码存储的，所以自然高位补1了。
2、这是一个什么问题

2.1、共用体结构的意义

问题：
假设网络节点A 和网络节点B 中的通信协议涉及四类报文，报文格式为“报文类型字段+报文内容的结构体”，四个报文内容的结构体类型分别为STRUCTTYPE1~ STRUCTTYPE4，如何编写程序以最简单的方式组
织一个统一的报文数据结构。
分析：
报文的格式为“报文类型+报文内容的结构体”，在真实的通信中，每次只能发四类报文中的一种，我们可以将四类报文的结构体组织为一个union（共享一段内存，但每次有效的只是一种），然后和报文类型字段统一组织成一个报文数据结构。

解答：

view plaincopy to clipboard01.typedef unsigned char BYTE;
02.//报文内容联合体
03.typedef union tagPacketContent
04.{
05.　　STRUCTTYPE1 pkt1;
06.　　STRUCTTYPE2 pkt2;
07.　　STRUCTTYPE3 pkt1;
08.　　STRUCTTYPE4 pkt2;
09.}PacketContent;
10.//统一的报文数据结构
11.typedef struct tagPacket
12.{
13.　　BYTE pktType;
14.　　PacketContent pktContent;
15.}Packet;当多个基本数据类型或复合数据结构要占用同一片内存时，我们要使用共用体；当多种类型，多个对象，多个事物只取其一时（我们姑且通俗地称其为“n 选1”），我们也可以使用共用体来发挥其长处。把几种不同类型的变量放到同一段内存单元中，这些变量在内存中占用的字节数可能不同，但都从同一个地址开始存放。也就是使用覆盖技术，几个变量互相覆盖。同一个内存段可以用来存放几种不同类型的成员，但在每一瞬间只能存放其中一种，而不能同时存放几种。即，每一瞬间只有一个成员起作用，其他的成员不起作用，不能同时存在和起作用。共用体变量中起作用的成员是最后一次存放的成员，在存入一个新的成员后原有的成员就失去了作用。

2.2、大小端模式对共用体的影响

   当共用体中有不同类型的变量，用一种变量类型给共用体赋值，但用另一种变量类型读取共用体的时候就涉及到大小端的问题。比如在问题1中，给int类型的变量i赋值，但通过char类型的数组来读取时，就要注意字节序的问题，也就是大小端的问题。

如果有一天21 发表于 2011-12-26 18:09

学习鸟谢谢分享

页: [1]

Chinaunix's Archiver

小议大小端模式对C语言的共用体结构的影响