C语言 Union的用法 和 大小端的判断

摘自:点击打开链接

Union(联合体)的定义:

union 维护足够的空间来置放多个数据成员中的“一种”,而不是为每一个数据成员配置空间,在union 中所有的数据成员共用一个空间,同一时间只能储存其中一个数据成员,所有的数据成员具有相同的起始地址。例子如下:
union StateMachine
{
   char character;
   int number;
   char *str;
   double exp;
};

一个union 只配置一个足够大的空间以来容纳最大长度的数据成员,以上例而言,最大长度是double 型态,所以StateMachine 的空间大小就是double 数据类型的大小。

在C++里,union 的成员默认属性页为public。union 主要用来压缩空间。如果一些数据不可能在同一时间同时被用到,则可以使用union。


以前在学校学习C语言的时候一直搞不懂那个共用体union有什么用的。工作之后才发现它的一些妙用,现举例如下:

1. 为了方便看懂代码。

比如说想写一个3 * 3的矩阵,可以这样写:
[
 注:下面用红色部分标记的地方是后来添加上去的,谢谢yrqing718的提醒!]

  1. struct  Matrix
  2. {
  3.     union
  4.     {
  5.         struct
  6.         {
  7.             float  _f11, _f12, _f13, _f21, _f22, _f23, _f31, _f32, _f33;
  8.         };
  9.         float  f[3][3];
  10.     }_matrix;
  11. };
  12. struct  Matrix m;

这两个东西共同使用相同的空间,所以没有空间浪费,在需要整体用矩阵的时候可以用
m._matrix.f (比如说传参,或者是整体赋值等);需要用其中的几个元素的时候可以用m._matrix._f11那样可以避免用m.f[0][0](这样不大直观,而且容易出错)。

2. 用在强制类型转换上(比强制类型转换更加容易看懂)
下面举几个例子:

(1). 判断系统用的是big endian 还是 little endian(其定义大家可以到网上查相关资料,此略)

  1. #define TRUE 1
  2. #define FALSE 0
  3. #define BOOL int

  4. BOOL  isBigEndian()
  5. {
  6.     int  i = 1;   /* i = 0x00000001*/
  7.     char  c = *(char  *)&i; /* 注意不能写成 char c = (char)i; */
  8.     return  (int )c != i;
  9. }
如果是little endian字节序的话,那个i = 1;的内存从小到大依次放的是:0x01 0x00 0x00 0x00,如是,按照i的起始地址变成按照char *方式(1字节)存取,即得c = 0x01;
反之亦然

也许看起来不是很清晰,下面来看一下这个:
  1. BOOL  isBigEndian()
  2. {
  3.     union
  4.     {
  5.         int  i;
  6.         char  c;
  7.     }test;
  8.     
  9.     test.c = 2;
  10.  
  11.     return  test.i != 2;
  12. }

这里用的是union来控制这个共享布局,有个知识点就是union里面的成员c和i都是从低地址开始对齐的。同样可以得到如此结果,而且不用转换,清晰一些。

什么,不觉得清晰??那再看下面的例子:

(2). 将little endian下的long long类型的值换成 big endian类型的值。已经知道系统提供了下面的api:long htonl(long lg);作用是把所有的字节序换成大端字节序。因此得出下面做法:

  1. long  long  htonLL(long  long  lg)
  2. {
  3.     union  
  4.     {
  5.         struct  
  6.         { 
  7.             long  low;
  8.             long  high;
  9.         }val_1;
  10.         long  long  val_2;
  11.     }val_arg, val_ret;
  12.     if ( isBigEndian() )
  13.         return  lg;
  14.     val_arg.val_2 = lg;
  15.     val_ret.val_1.low = htonl( val_arg.val_1.high );
  16.     val_ret.val_1.high = htonl( val_arg.val_1.low );    
  17.     return  val_ret.val_2;
  18. }

只要把内存结构的草图画出来就比较容易明白了。

(3).为了理解c++类的布局,再看下面一个例子。有如下类:

  1. class  Test
  2. {
  3. public :
  4.     float  getFVal(){ return  f;}
  5. private :
  6.     int  i;
  7.     char  c;
  8.     float  f;
  9. };
  10. Test t;

不能在类Test中增加代码,给对象中的f赋值7.0f.

  1. class  Test_Cpy
  2. {
  3.  public :
  4.     float  getVal(){ return  f;}
  5.     float  setVal(float  f){ this ->f = f;}
  6. private :
  7.     int  i;
  8.     char  c;
  9.     float  f;
  10. };
  11. ....
  12. int  main()
  13. {
  14.     Test t;
  15.     union
  16.     {
  17.          Test t1, 
  18.          Test_Cpy t2;
  19.     }test;
  20.     test.t2.setVal(7.0f);
  21.     t = test.t1;
  22.     assert( t.getVal() == 7.0f );   
  23.     return  0;
  24. }

说明:因为在增加类的成员函数时候,那个类的对象的布局基本不变。因此可以写一个与Test类一样结构的类Test_Cpy,而多了一个成员函数setVal,再用uinon结构对齐,就可以给私有变量赋值了。(这种方法在有虚机类和虚函数机制时可能失灵,故不可移植)至于详细的讨论,网上有,这个例子在实际中没有用途,只是用来考察这个内存布局的使用而已.

union在操作系统底层的代码中用的比较多,因为它在内存共赏布局上方便且直观。所以网络编程,协议分析,内核代码上有一些用到union都比较好懂,简化了设计。

你可能感兴趣的:(C++基础知识)