小议大小端模式对C语言的共用体结构的影响

小议大小端模式对C语言的共用体结构的影响

1、一些问题

问题1

#include "stdio.h"
union 
{
	int i;
	char ch[2];
}key;
main()
{
	key.i=65*256+66;
	printf("%c\t%c\n",key.ch[0],key.ch[1]);
}
答案是B A;为什么不是A B呢?
在前面的文章中我们已经测试过,X86体系结构的CPU是小端模式的。比如一个数0x1234,放在内存里按照内存地址从低往高实际上是低地址字节里放的是0x34,高字节里放的是0x12。小端模式和我们平时感觉上的一致,把数位数越高的部分放在地址越高的部分。union类型是共享内存的,union中是按照从低到高放的,i=0x4142,也就是低地址中放的是42,高地址中放的是41,按照ch[0],ch[1]的顺序输出就是B A。如果是大端模式的话就是打印两个空了,故不会出现A B的情况。

问题2

union myun 
{
   struct { int x; int y; int z; }u; 
   int k; 
}a; 
int main() 
{ 
   a.u.x =4;
   a.u.y =5; 
   a.u.z =6; 
   a.k = 0; 
   printf("%d %d %d\n",a.u.x,a.u.y,a.u.z);
   return 0;
}
union类型是共享内存的,以size最大的结构作为自己的大小,这样的话,myun这个结构就包含u这个结构体,而大小也等于u这个结构体的大小,在内存中的排列为声明的顺序x,y,z从低到高,然后赋值的时候,在内存中,就是x的位置放置4,y的位置放置5,z的位置放置6,现在对k赋值,对k的赋值因为是union,要共享内存,所以从union的首地址开始放置,首地址开始的位置其实是x的位置,这样原来内存中x的位置就被k所赋的值代替了,就变为0了,这个时候要进行打印,就直接看内存里就行了,x的位置也就是k的位置是0,而y,z的位置的值没有改变,所以应该是0,5,6。

问题3

int checkCPU()
{
  union 
  {
    int a;
    char b;
  }c;
  c.a = 1;
  return (c.b == 1);  // 小端返回TRUE,大端返回FALSE
}

这个就不详细解释了,用来判定CPU大小端模式的一个经典例子。


问题4

union {
	int a[2];
	long b;
	char c[4];
}s;
main()
{
	s.a[0]=0x12345678;
	s.a[1]=0x23456789;
	printf("%lx\n",s.b);
	printf("%x,%x,%x,%x\n",s.c[0],s.c[1],s.c[2],s.c[3]);
}
答案是:
12345678
78,56,34,12

问题5

# include <stdio.h>
main()
{
	union {
		long i;
		int k;
		char ii;
		char s[4];
	} mix ;
	mix.k=0x23456789;
	printf("mix.i=%lx\n",mix.i);
	printf("mix.k=%x\n",mix.k);
	printf("mix.ii=%x\n",mix.ii);
	printf("mix.s[0]=%x\tmix.s[1]=%x\n",mix.s[0],mix.s[1]);
	printf("mix.s[2]=%x\tmix.s[3]=%x\n",mix.s[2],mix.s[3]);
	return 0;
}
答案是:
mix.i=23456789
mix.k=23456789
mix.ii=ffffff89
mix.s[0]=ffffff89 mix.s[1]=67
mix.s[2]=45 mix.s[3]=23
出现f是因为把char型强制转换成int型输出,0x89最高位1000 1001最高位为1,转换为int类型的时候认为是负数,而且数在计算机中是按补码存储的,所以自然高位补1了。

2、这是一个什么问题

2.1、共用体结构的意义

问题
假设网络节点A 和网络节点B 中的通信协议涉及四类报文,报文格式为“报文类型字段+报文内容的结构体”,四个报文内容的结构体类型分别为STRUCTTYPE1~ STRUCTTYPE4,如何编写程序以最简单的方式组
织一个统一的报文数据结构。
分析:
报文的格式为“报文类型+报文内容的结构体”,在真实的通信中,每次只能发四类报文中的一种,我们可以将四类报文的结构体组织为一个union(共享一段内存,但每次有效的只是一种),然后和报文类型字段统一组织成一个报文数据结构。
解答:
typedef unsigned char BYTE;
//报文内容联合体
typedef union tagPacketContent
{
  STRUCTTYPE1 pkt1;
  STRUCTTYPE2 pkt2;
  STRUCTTYPE3 pkt1;
  STRUCTTYPE4 pkt2;
}PacketContent;
//统一的报文数据结构
typedef struct tagPacket
{
  BYTE pktType;
  PacketContent pktContent;
}Packet;
当多个基本数据类型或复合数据结构要占用同一片内存时,我们要使用共用体;当多种类型,多个对象,多个事物只取其一时(我们姑且通俗地称其为“n 选1”),我们也可以使用共用体来发挥其长处。 把几种不同类型的变量放到同一段内存单元中,这些变量在内存中占用的字节数可能不同,但都从同一个地址开始存放。也就是使用覆盖技术,几个变量互相覆盖。同一个内存段可以用来存放几种不同类型的成员,但在每一瞬间只能存放其中一种,而不能同时存放几种。即,每一瞬间只有一个成员起作用,其他的成员不起作用,不能同时存在和起作用。共用体变量中起作用的成员是最后一次存放的成员,在存入一个新的成员后原有的成员就失去了作用。

2.2、大小端模式对共用体的影响
当共用体中有不同类型的变量,用一种变量类型给共用体赋值,但用另一种变量类型读取共用体的时候就涉及到大小端的问题。比如在问题1中,给int类型的变量i赋值,但通过char类型的数组来读取时,就要注意字节序的问题,也就是大小端的问题。

你可能感兴趣的:(C语言)