嵌入式系统开发者应该对Little-endian和Big-endian模式非常了解。采用Little-endian模式的CPU对操作数的存放方式是从低字节到高字节,而Big-endian模式对操作数的存放方式是从高字节到低字节。也就是说Big-endian模式符合人的习惯,而Little-endian更加方便计算机操作。
例如,16bit宽的数0x1234在Little-endian模式CPU内存中的存放方式(假设从地址0x4000开始存放)为:
内存地址 0x4000 0x4001
存放内容 0x34 0x12
而在Big-endian模式CPU内存中的存放方式则为:
内存地址 0x4000 0x4001
存放内容 0x12 0x34
32bit宽的数0x12345678在Little-endian模式CPU内存中的存放方式(假设从地址0x4000开始存放)为:
内存地址 0x4000 0x4001 0x4002 0x4003
存放内容 0x78 0x56 0x34 0x12
而在Big-endian模式CPU内存中的存放方式则为:
内存地址 0x4000 0x4001 0x4002 0x4003
存放内容 0x12 0x34 0x56 0x78
若判断处理器是Big还是Little模式,有两种方法。
1、
int i=1;
char *p=(char *)&i;
if(*p==1)
printf("1");
else
printf("2");
大小端存储问题,如果小端方式(i占至少两个字节的长度)则i所分配的内存最小地址那个字节中就存着1,其他字节是0.大端的话则1在i的最高地址字节处存放,char是一个字节,所以强制将char型量p指向i则p指向的一定是i的最低地址,那么就可以判断p中的值是不是1来确定是不是小端
2、
int checkCPU( )
{
{
union w
{
int a;
char b;
} c;
c.a = 1;
return(c.b ==1);
}
}
这个解法涉及到Union的内存分配模式。
Union的大小为其内部所有变量的最大值,并且按照类型最大值的整数倍进行内存对齐。
例如:
typedef Union
{
char c[10];
char cc1;
}u11;首先按照char c[10]分配10个字节,然后按照char的1个字节对齐,最终sizeof(u11)=10;
typedef union
{
char c[10];
int i;
}u22;首先按照char c[10]分配10个字节,然后按照int的4个字节对齐,最终sizeof(u22)=12;
typedef union
{
char c[10];
double d;
}u33;首先按照char c[10]分配10个字节,然后按照double的4个自己对齐,最终sizeof=16;
union U1 {
5 char c;
6 int i;
7 double d;
8 } ;按照double的8个字节分配,最终为8;
9 union U2 {
10 char c;
13 } ;按照char c的一个字节分配,最终sizeof为1;
14
15 union U3 {
16 char c;
17 int i;
18 // double d;
19 } ;按照int的4个字节分配,最终sizeof为4;
因此,举例中union分配的内存按照int分配4个字节,如果是小端模式则存放的方式为
地址A
------------------------------------
|A |A+1 |A+2 |A+3 | int a;
|0x01 |0x00 |0x00 |0x00 |
-------------------------------------
|A |char b;
| |
---------
如果是大端如何存储c.a的呢?
地址A
------------------------------------------
|A |A+1 |A+2 |A+3 |int a;
|0x00 |0x00 |0x00 |0x01 |
------------------------------------------
|A |char b;
| |
---------
因此我们就可以通过查看char b==1?来判断大小端了。
顺便说明一下struct的内存分配方式。
struct的内存大小为每个数据内存的加和,首先按照最大的数据类型进行单个分配,如果前一个数据占用不了所有的内存,而剩下的内存可以放下下一个数据,则第二个数据不另外分配内存,否则重新分配一个最大类型的内存单元。
如果是:
struct data1
{
double d;
int i;
char c1;
char c2[9];
};
sizeof(struct data1)的值为24,首先按照存储大小,该结构体所占存储空间为:8+4+1+9=22字节,这个结构体也是以8对齐,因此实际分配的是24字节。
示例2:
Union data2
{
int i;
char c1;
char c2[9];
};
sizeof(union data2)的值为12,该共用体占内存空间最大的基本数据类型为int,其长度为4,所以该共用体以4来对齐。该共用体的长度取决于字符c2,其长度为9,9不是4的倍数,要进行对齐,因此实际分配的存储空间为12.
struct data2
{
int i;
char c1;
char c2[9];
};
sizeof(struct data2)的值为16,与上面共用体一样,该结构体以4对齐。按照存储大小,该结构体所占存储空间为:4+1+9=14,14不是4的倍数,进行对齐,对齐后的值为16.
示例3:
Union data3
{
char c1;
char c2[3];
};
sizeof(union data3)的值为3,该共用体占内存空间最大的基本数据类型为chart,其长度为1,所以该共用体以1来对齐。该共用体的长度取决于字符c2,其长度为3,因此分配的存储空间为3.
struct data3
{
char c1;
char c2[2];
};
sizeof(struct data3)的值为3,与上面共用体一样,该结构体以1对齐。按照存储大小,该结构体所占存储空间为:1+2=3字节。
示例4:
struct inner
{
char c1;
double d;
char c2;
};
这个结构体显然是8字节对齐的,在给c1分配存储空间时,考虑到对齐,分配给c1的字节数就是8,然后给d分配8字节,最后给c2分配时,因为也要以8对齐,所以也分配了8个字节的存储空间。所以sizeof(struct inner)值为24.
如果是:
struct inner
{
char c1;
char c2;
double d;
};
当然这个结构体也是以8字节对齐的,编译器编译程序时,给c1、c2分配存储空间没有必要各自给它们分配8字节,只要8字节就可以了。给d分配8字节,所以sizeof(struct inner)值为16.
struct inner
{
char c1;
double d;
char c2;
};
union data4
{
struct inner t1;
int i;
char c;
};
由于data4共用体中有一个inner结构体,所以最大的基本数据类型为double,因此以8字节对齐。共用体的存储长度取决于t1,而t1长度为24,因此sizeof(union data4)的值为24.
struct inner
{
char c1;
double d;
char c2;
};
struct data4
{
struct inner t1;
int i;
char c;
};
data4结构体中有一个inner结构体,所以以8对齐,变量i和c共分配8字节就可以了,因此sizeof(struct data4)的值为32.
示例5:
struct data
{
int a;
long b;
double c;
float d;
char e;
short f;
}d;
这个结构体所占的字节数是多少呢?这里假设long所占字节数为4字节,short占2字节。这个结构体与示例4中第二个struct inner类似。首先这个结构体是以8字节对齐的,因为最长基本数据类型为double,它占8字节,d、e、f、总和为7个字节。分配存储空间时,成员a和b各分配4字节,d分配4字节,f分配2字节,e也分配2字节。d、e、f总和刚好占8个字节,所以sizeof(struct data)值为24.
struct data
{
int a;
long b;
double c;
float d;
char e[3];
short f;
}d;
sizeof(struct data)值为32.
例1:对于一个频繁使用的短小函数,在C语言中最好用什么实现?
答:最好用宏定义,这样可以节省调用函数的开销,效率最高。
例2:已知一个数组table,写一个宏定义,求出数组的元素个数
答:#define NTBL (sizeof(table)/sizeof(table[0]))
对于数组,sizeof(table)获取数组的总长度,而sizeof(table[0])是数组第一个元素所占的长度。当然若是可以用strlen()函数也行。
例3:给定结构
struct A
{
unsigned short t:4;
unsigned short k:4;
unsigned short i:8;
unsigned long m;
};
问sizeof(A)的值。
程序分析:unsigned short 一般占2个字节,unsigned long一般占4个字节,结构体A以4字节对齐,A中成员t、k、i共占4+4+8=16位,由于要内存对齐,实际那三个成员共占32位即4字节,成员m占4字节,因此sizeof(A)=8.
例4:求函数返回值,输入x=9999
int func(int x)
{
int count=0;
while(x)
{
count ++;
x=x&(x-1);
}
return count;
}
程序分析:这是统计9999的二进制形式中有多少个1的函数。9999=9*1024+512+256+15,2*1024的二进制表示中含有1的个数为2;512的二进制表示中含有1的个数为1;256的二进制表示中含有1的个数为1;15的二进制表示中含有1的个数为4;故共有1的个数为8,结果为8 。1000(2)-1(2)=0111(2),正好是原数取反,用这种方法来求1的个数是高效率的。
例5:已知运行这个程序的主机中数据类型long占8字节,请分析程序的运行结果。
#include
int main()
{
struct data
{
long l;
char *s;
short int i;
char c;
short int a[5];
}d;
struct data *p=&d;
printf("%d/n",sizeof(d));
printf("%x/t%x/n",p,p+1);
printf("%x/t%x/n",p,(char *)p+1);
printf("%x/t%x/n",p,(long *)p+1);
return 0;
}
运行结果:
32
bffff60 bffff80
bffff60 bffff61
bffff60 bffff64
程序分析:struct data以8个字节对齐,long类型的成员1分配8个字节。s、i、c、a原本分别占4、2、1、10个字节。由于考虑到对齐,s分配4个字节,i分配2个字节,c分配2个字节,此时刚好用完8个字节。a原本分配10个字节,由于考虑到对齐,要使整个结构体所占的存储空间是8的倍数,所以分配给它16个字节。因此结构体data占8+4+4+2+16=32个字节。
第二条printf语句,p+1中的加1并不是加1个字节,而是1个struct data的长度,16进制下,bffff60+20(十进制数32以十六进制数表示是20)=bffff80.
第三条printf语句,p+1中的加1,由于对指针p进行了强制类型转换,使p指向char类型的数据,此时的加1就是加上1个char类型的长度,因此p+1的输出是bffff61.
第四条语句分析与第三条类似。