1. struct
的巨大作用
面对一个人的大型
C/C++
程序时,只看其对
struct
的使用情况我们就可以对其编写者的编程经验进行评估。因为一个大型的
C/C++
程序,势必要涉及一些
(
甚至大量
)
进行数据组合的结构体,这些结构体可以将原本意义属于一个整体的数据组合在一起。从某种程度上来说,会不会用
struct
,怎样用
struct
是区别一个开发人员是否具备丰富开发经历的标志。
在网络协议、通信控制、嵌入式系统的
C/C++
编程中,我们经常要传送的不是简单的字节流(
char
型数组),而是多种数据组合起来的一个整体,其表现形式是一个结构体。
经验不足的开发人员往往将所有需要传送的内容依顺序保存在
char
型数组中,通过指针偏移的方法传送网络报文等信息。这样做编程复杂,易出错,而且一旦控制方式及通信协议有所变化,程序就要进行非常细致的修改。
一个有经验的开发者则灵活运用结构体,举一个例子,假设网络或控制协议中需要传送三种报文,其格式分别为
packetA
、
packetB
、
packetC
:
struct structA
{
int a;
char b;
};
struct structB
{
char a;
short b;
};
struct structC
{
int a;
char b;
float c;
}
优秀的程序设计者这样设计传送的报文:
struct CommuPacket
{
int iPacketType;
//
报文类型标志
union
//
每次传送的是三种报文中的一种,使用
union
{
struct structA packetA;
struct structB packetB;
struct structC packetC;
}
};
在进行报文传送时,直接传送
struct CommuPacket
一个整体。
假设发送函数的原形如下:
// pSendData
:发送字节流的首地址,
iLen
:要发送的长度
Send(char * pSendData, unsigned int iLen);
发送方可以直接进行如下调用发送
struct CommuPacket
的一个实例
sendCommuPacket
:
Send( (char *)&sendCommuPacket , sizeof(CommuPacket) );
假设接收函数的原形如下:
// pRecvData
:发送字节流的首地址,
iLen
:要接收的长度
//
返回值:实际接收到的字节数
unsigned int Recv(char * pRecvData, unsigned int iLen)
;
接收方可以直接进行如下调用将接收到的数据保存在
struct CommuPacket
的一个实例
recvCommuPacket
中:
Recv( (char *)&recvCommuPacket , sizeof(CommuPacket) );
接着判断报文类型进行相应处理:
switch(recvCommuPacket. iPacketType)
{
case PACKET_A:
… //A
类报文处理
break;
case PACKET_B:
…
//B
类报文处理
break;
case PACKET_C:
… //C
类报文处理
break;
}
以上程序中最值得注意的是
Send( (char *)&sendCommuPacket , sizeof(CommuPacket) );
Recv( (char *)&recvCommuPacket , sizeof(CommuPacket) );
中的强制类型转换:
(char *)&sendCommuPacket
、
(char *)&recvCommuPacket
,先取地址,再转化为
char
型指针,这样就可以直接利用处理字节流的函数。
利用这种强制类型转化,我们还可以方便程序的编写,例如要对
sendCommuPacket
所处内存初始化为
0
,可以这样调用标准库函数
memset()
:
memset((char *)&sendCommuPacket,0, sizeof(CommuPacket));
2. struct
的成员对齐
Intel
、微软等公司曾经出过一道类似的面试题:
1. #include
2. #pragma pack(8)
3. struct example1
4. {
5. short a;
6. long b;
7. };
8. struct example2
9. {
10. char c;
11. example1 struct1;
12. short e;
13. };
14. #pragma pack()
15. int main(int argc, char* argv[])
16. {
17. example2 struct2;
18. cout << sizeof(example1) << endl;
19. cout << sizeof(example2) << endl;
20. cout << (unsigned int)(&struct2.struct1) - (unsigned int)(&struct2)
<< endl;
21. return 0;
22. }
问程序的输入结果是什么?
答案是:
8
16
4
不明白?还是不明白?下面一一道来:
2.1
自然对界
struct
是一种复合数据类型,其构成元素既可以是基本数据类型(如
int
、
long
、
float
等)的变量,也可以是一些复合数据类型(如
array
、
struct
、
union
等)的数据单元。对于结构体,编译器会自动进行成员变量的对齐,以提高运算效率。缺省情况下,编译器为结构体的每个成员按其自然对界(
natural alignment
)条件分配空间。各个成员按照它们被声明的顺序在内存中顺序存储,第一个成员的地址和整个结构的地址相同。
自然对界
(natural alignment)
即默认对齐方式,是指按结构体的成员中
size
最大的成员对齐。
例如:
struct naturalalign
{
char a;
short b;
char c;
};
在上述结构体中,
size
最大的是
short
,其长度为
2
字节,因而结构体中的
char
成员
a
、
c
都以
2
为单位对齐,
sizeof(naturalalign)
的结果等于
6
;
如果改为:
struct naturalalign
{
char a;
int b;
char c;
};
其结果显然为
12
。
2.2
指定对界
一般地,可以通过下面的方法来改变缺省的对界条件:
·
使用伪指令
#pragma pack (n)
,编译器将按照
n
个字节对齐;
·
使用伪指令
#pragma pack ()
,取消自定义字节对齐方式。
注意:如果
#pragma pack (n)
中指定的
n
大于结构体中最大成员的
size
,则其不起作用,结构体仍然按照
size
最大的成员进行对界。
例如:
#pragma pack (n)
struct naturalalign
{
char a;
int b;
char c;
};
#pragma pack ()
当
n
为
4
、
8
、
16
时,其对齐方式均一样,
sizeof(naturalalign)
的结果都等于
12
。而当
n
为
2
时,其发挥了作用,使得
sizeof(naturalalign)
的结果为
8
。
在
VC++ 6.0
编译器中,我们可以指定其对界方式(见图
1
),其操作方式为依次选择
projetct > setting > C/C++
菜单,在
struct member alignment
中指定你要的对界方式。
图1 在VC++ 6.0中指定对界方式
另外,通过
__attribute((aligned (n)))
也可以让所作用的结构体成员对齐在
n
字节边界上,但是它较少被使用,因而不作详细讲解。
2.3
面试题的解答
至此,我们可以对
Intel
、微软的面试题进行全面的解答。
程序中第
2
行
#pragma pack (8)
虽然指定了对界为
8
,但是由于
struct example1
中的成员最大
size
为
4
(
long
变量
size
为
4
),故
struct example1
仍然按
4
字节对界,
struct example1
的
size
为
8
,即第
18
行的输出结果;
struct example2
中包含了
struct example1
,其本身包含的简单数据成员的最大
size
为
2
(
short
变量
e
),但是因为其包含了
struct example1
,而
struct example1
中的最大成员
size
为
4
,
struct example2
也应以
4
对界,
#pragma pack (8)
中指定的对界对
struct example2
也不起作用,故
19
行的输出结果为
16
;
由于
struct example2
中的成员以
4
为单位对界,故其
char
变量
c
后应补充
3
个空,其后才是成员
struct1
的内存空间,
20
行的输出结果为
4
。
3. C
和
C++
间
struct
的深层区别
在
C++
语言中
struct
具有了“类” 的功能,其与关键字
class
的区别在于
struct
中成员变量和函数的默认访问权限为
public
,而
class
的为
private
。
例如,定义
struct
类和
class
类:
struct structA
{
char a;
…
}
class classB
{
char a;
…
}
则:
struct A a;
a.a = 'a'; //
访问
public
成员,合法
classB b;
b.a = 'a'; //
访问
private
成员,不合法
许多文献写到这里就认为已经给出了
C++
中
struct
和
class
的全部区别,实则不然,另外一点需要注意的是:
C++
中的
struct
保持了对
C
中
struct
的全面兼容(这符合
C++
的初
衷——“a better c”
),因而,下面的操作是合法的:
//
定义
struct
struct structA
{
char a;
char b;
int c;
};
structA a = {'a' , 'a' ,1}; //
定义时直接赋初值
即
struct
可以在定义的时候直接以
{ }
对其成员变量赋初值,而
class
则不能,在经典书目《
thinking C++ 2nd edition
》中作者对此点进行了强调。
4. struct
编程注意事项
看看下面的程序:
1. #include
2. struct structA
3. {
4. int iMember;
5. char *cMember;
6. };
7. int main(int argc, char* argv[])
8. {
9. structA instant1,instant2;
10.char c = 'a';
11. instant1.iMember = 1;
12. instant1.cMember = &c;
13.instant2 = instant1;
14.cout << *(instant1.cMember) << endl;
15.*(instant2.cMember) = 'b';
16. cout << *(instant1.cMember) << endl;
17. return 0;
}
14
行的输出结果是:
a
16
行的输出结果是:
b
Why?
我们在
15
行对
instant2
的修改改变了
instant1
中成员的值!
原因在于
13
行的
instant2 = instant1
赋值语句采用的是变量逐个拷贝,这使得
instant1
和
instant2
中的
cMember
指向了同一片内存,因而对
instant2
的修改也是对
instant1
的修改。
在
C
语言中,当结构体中存在指针型成员时,一定要注意在采用赋值语句时是否将
2
个实例中的指针型成员指向了同一片内存。
在
C++
语言中,当结构体中存在指针型成员时,我们需要重写
struct
的拷贝构造函数并进行“
=
”操作符重载。