有些信息在存储时,并不需要占用一个完整的字节, 而只需占几个或一个二进制位。例如在存放一个开关量时,只有0和1 两种状态, 用一位二进位即可。为了节省存储空间,并使处理简便,C语言又提供了一种数据结构,称为“位域”或“位段”。所谓“位域”是把一个字节中的二进位划分为几个不同的区域, 并说明每个区域的位数。每个域有一个域名,允许在程序中按域名进行操作。 这样就可以把几个不同的对象用一个字节的二进制位域来表示。
位域定义与结构定义相仿,其形式为:
struct 位域结构名
{
位域列表
};
其中位域列表的形式为:
类型说明符 位域名:位域长度
位域变量的说明与结构变量说明的方式相同。 可采用先定义后说明,同时定义说明或者直接说明这三种方式。例如:
struct bs
{
int a:8;
int b:2;
int c:6;
}data;
说明data为bs变量,共占两个字节。其中位域a占8位,位域b占2位,位域c占6位。对于位域的定义尚有以下几点说明:
1. 一个位域必须存储在同一个字节中,不能跨两个字节。
如一个字节所剩空间不够存放另一位域时,应从下一单元起存放该位域。也可以有意使某位域从下一单元开始。例如:
struct bs
{
unsigned a:4
unsigned b:5 /*从下一单元开始存放*/
unsigned c:4
}
2. 由于位域不允许跨两个字节,因此位域的长度不能大于一个字节的长度。
3. 位域可以无位域名,这时它只用来作填充或调整位置。无名的位域是不能使用的。例如:
struct k
{
int a:1
int :2 /*无位域名,该2位不能使用*/
int b:3
int c:2
};
举个例子:
普通结构体内存示例:
struct
{
double a;//8 8 8 0-7
char b;//1 8 1 8 8-11浪费
int c;//4 8 4 12-15
int d;//4 8 4 16-19 20-24浪费
}S;
解析:(vs下默认对齐数为8,linux下为4,以下环境为vs)
1.结构体中第一个成员a放在0偏移处,a是double类型,占8个字节,对齐数为8,从0偏移处开始往后放,0-7.
2.b占1个字节,对齐数为1(b自身大小为1,默认为8,较小值为1,即对齐数为1),8是1的倍数,所以从8偏移处开始放,8.
3.c占4个字节,对齐数为4,9-11浪费,从12开始放c,12-15.
4.d占4个字节,对齐数为4,16是4的倍数,从16开始放,16-19.
5.0-19是20个字节,最大对齐数为8,8的倍数最小的为24,20-24浪费.
6.因此,该结构体的大小为24.
位段大小的计算,及计算机的存储方式:
struct
{
int a : 2;
int b : 10;
int c : 5;
int d : 20;
}S;
注意:
(1)位段成员的类型必须指定为unsigned或int类型。
(2)一个位段必须存储在同一存储单元中,不能跨两个单元。如果第一个单元空间不能容纳下一个位段,则该空间不用,而从下一个单元起存放该位段。
(3)可以定义无名位段。
(4)从图中可以看出位段是如何存储的,a、b、c放在一个存储单元,为4个字节,剩下的空间放不下d,放在下一个存储单元中,占4个字节,共占8个字节。
#include
#include
using namespace std;
struct A
{
int a:5;
int b:3;
};
int main(void)
{
char str[100] = "0134324324afsadfsdlfjlsdjfl";
struct A d;
memcpy(&d, str, sizeof(A));
cout << d.a << endl;
cout << d.b << endl;
return 0;
}
在32位x86机器上输出:
$ ./langxun.exe
-16
1
解析:在默认情况下,为了方便对结构体内元素的访问和管理,当结构体内的元素长度都小于处理器的位数的时候,便以结构体里面最长的元素为对其单位,即结构体的长度一定是最长的数据元素的整数倍;如果有结构体内存长度大于处理器位数的元素,那么就以处理器的位数为对齐单元。由于是32位处理器,而且结构体中a和b元素类型均为int(也是4个字节),所以结构体的A占用内存为4个字节。
上例程序中定义了位域结构A,两个个位域为a(占用5位),b(占用3位),所以a和b总共占用了结构A一个字节(低位的一个字节)。
当程序运行到14行时,d内存分配情况:
高位 00110100 00110011 00110001 00110000 低位 '4' '3' '1' '0' 其中d.a和d.b占用d低位一个字节(00110000),d.a : 10000, d.b : 001
d.a内存中二进制表示为10000,由于d.a为有符号的整型变量,输出时要对符号位进行扩展,所以结果为-16(二进制为11111111111111111111111111110000)
d.b内存中二进制表示为001,由于d.b为有符号的整型变量,输出时要对符号位进行扩展,所以结果为1(二进制为00000000000000000000000000000001)
如果结构体中含有位域(bit-field),那么VC中准则是:
1) 如果相邻位域字段的类型相同,且其位宽之和小于类型的sizeof大小,则后面的字段将紧邻前一个字段存储,直到不能容纳为止;
2) 如果相邻位域字段的类型相同,但其位宽之和大于类型的sizeof大小,则后面的字段将从新的存储单元开始,其偏移量为其类型大小的整数倍;
3) 如果相邻的位域字段的类型不同,则各编译器的具体实现有差异,VC6采取不压缩方式(不同位域字段存放在不同的位域类型字节中),Dev-C++和GCC都采取压缩方式;
系统会先为结构体成员按照对齐方式分配空间和填塞(padding),然后对变量进行位域操作。
参考:https://blog.csdn.net/lzx_bupt/article/details/7066577
C语言中好像没有这种数据类型,但是在实际应用的过程中,发现许多人的代码中都存在这种表示方式。其实uintX-t就是通过typedef定义的,利用预编译和typedef可提高效率也方便代码移植。总结如下:
typedef unsigned char uint8_t; //无符号8位数
typedef signed char int8_t; //有符号8位数
typedef unsigned int uint16_t; //无符号16位数
typedef signed int int16_t; //有符号16位数
typedef unsigned long uint32_t; //无符号32位数
typedef signed long int32_t; //有符号32位数
typedef float float32; //单精度浮点数
typedef double float64; //双精度浮点数
一般来说整形对应的*_t类型为:
uint8_t为1字节
uint16_t为2字节
uint32_t为4字节
uint64_t为8字节
uint8_t / uint16_t / uint32_t /uint64_t 是什么数据类型
这些数据类型是 C99 中定义的,具体定义在:/usr/include/stdint.h ISO C99: 7.18 Integer types
#ifndef __int8_t_defined
# define __int8_t_defined
typedef signed char int8_t;
typedef short int int16_t;
typedef int int32_t;
# if __WORDSIZE == 64
typedef long int int64_t;
# else
__extension__
typedef long long int int64_t;
# endif
#endif
/* Unsigned. */
typedef unsigned char uint8_t;
typedef unsigned short int uint16_t;
#ifndef __uint32_t_defined
typedef unsigned int uint32_t;
# define __uint32_t_defined
#endif
#if __WORDSIZE == 64
typedef unsigned long int uint64_t;
#else
__extension__
typedef unsigned long long int uint64_t;
#endif
格式化输出:
unit64_t %llu
unit32_t %u
unit16_t %hu
unit8_t %d
举例:
#include
#include
struct A
{
uint8_t a:1;
uint8_t b:4;
};
int main()
{
struct A myA;
printf("A size is %d\n",sizeof(myA));
myA.a=1;
myA.b=13;
printf("myA.a is %c\n",myA.a);
printf("myA.a is %d\n",myA.a);
printf("myA.b is %c\n",myA.b);
printf("myA.b is %d\n",myA.b);
printf("end\n");
return 0;
}
32位系统输出结果:
[root@localhost tmp]# ./a.out
A size is 1
myA.a is
myA.a is 1
myA.b is
myA.b is 13
end