此文转自http://blog.csdn.net/supermegaboy/article/details/4854939
在讲述柔性数组成员之前,首先要介绍一下不完整类型(incomplete type)。不完整类型是这样一种类型,它缺乏足够的信息例如长度去描述一个完整的对象。
6.2.5 Types
incomplete types (types that describe objects but lack information needed to determine their sizes).
C与C++关于不完整类型的语义是一样的。
基本上没有什么书介绍过不完整类型,很多人初次遇到这个概念时脑袋会一片空白。事实上我们在实际的工程设计中经常使用不完整类型,只不过不知道有这么个概念而已。前向声明就是一种常用的不完整类型:
class base;
struct test;
base和test只给出了声明,没有给出定义。不完整类型必须通过某种方式补充完整,才能使用它们进行实例化,否则只能用于定义指针或引用,因为此时实例化的是指针或引用本身,不是base或test对象。
一个未知长度的数组也属于不完整类型:
extern int a[];
extern不能去掉,因为数组的长度未知,不能作为定义出现。不完整类型的数组可以通过几种方式补充完整才能使用,大括号形式的初始化就是其中一种方式:
int a[] = { 10, 20 };
柔性数组成员(flexible array member)也叫伸缩性数组成员,它的出现反映了C程序员对精炼代码的极致追求。这种代码结构产生于对动态结构体的需求。在日常的编程中,有时候需要在结构体中存放一个长度动态的字符串,一般的做法,是在结构体中定义一个指针成员,这个指针成员指向该字符串所在的动态内存空间,例如:
struct test
{
int a;
double b;
char *p;
};
p指向字符串。这种方法造成字符串与结构体是分离的,不利于操作,如果把字符串跟结构体直接连在一起,不是更好吗?于是,可以把代码修改为这样:
char a[] = “hello world”;
struct test *PntTest = ( struct test* )malloc( sizeof( struct test ) + strlen( a ) + 1 );
strcpy( PntTest + 1, a );
——————————————————————————————
看到这个上面代码的时候很困惑,为什么是
struct test *PntTest = ( struct test* )malloc( sizeof( struct test ) + strlen( a ) + 1 );
而不是
struct test *PntTest = ( struct test* )malloc( sizeof( struct test ) );
为何要加上 strlen(a)+1字节的大小呢?这得联系下面的strcpy( PntTest + 1, a );
( struct test* )malloc( sizeof( struct test ) + strlen( a ) + 1 );为PntTest申请了24+10+1字节大小的内存空间
PntTest +1 的含义是从起始位置向后移动sizeof(test)个字节,此时, PntTest +1 指向的是malloc出来的第25个字节的内存地址
strcpy( PntTest + 1, a );就是将a的内容复制到,malloc出的内存的第25个 到第36个
——————————————————————————————
这样一来,( char* )( PntTest + 1 )就是字符串“hello world”的地址了。这时候p成了多余的东西,可以去掉。但是,又产生了另外一个问题:老是使用( char* )( PntTest + 1 )不方便。如果能够找出一种方法,既能直接引用该字符串,又不占用结构体的空间,就完美了,符合这种条件的代码结构应该是一个非对象的符号地址,在结构体的尾部放置一个0长度的数组是一个绝妙的解决方案。不过,C/C++标准规定不能定义长度为0的数组,因此,有些编译器就把0长度的数组成员作为自己的非标准扩展,例如:
struct test
{
int a;
double b;
char c[0];
};
c就叫柔性数组成员,如果把PntTest指向的动态分配内存看作一个整体,c就是一个长度可以动态变化的结构体成员,柔性一词来源于此。c的长度为0,因此它不占用test的空间,同时PntTest->c就是“hello world”的首地址,不需要再使用( char* )( PntTest + 1 )这么丑陋的语法了。
鉴于这种代码结构所产生的重要作用,C99甚至把它收入了标准中:
6.7.2.1 Structure and union specifiers
As a special case, the last element of a structure with more than one named member may have an incomplete array type; this is called aflexible array member.
C99使用不完整类型实现柔性数组成员,标准形式是这样的:
struct test
{
int a;
double b;
char c[];
};
c同样不占用test的空间,只作为一个符号地址存在,而且必须是结构体的最后一个成员。柔性数组成员不仅可以用于字符数组,还可以是元素为其它类型的数组,例如:
struct test
{
int a;
double b;
float c[];
};
应当尽量使用标准形式,在非C99的场合,可以使用指针方法。有些人使用char a[1],这是非常不可取的,把这样的a用作柔性数组成员会发生越界行为,虽然C/C++标准并没有规定编译器应当检查越界,但也没有规定不能检查越界,为了一个小小的指针空间而牺牲移植性,是不值得的。
——————————————————————
不明白为什么supermegaboy说 “。有些人使用char a[1],这是非常不可取的,把这样的a用作柔性数组成员会发生越界行为”,个人认为 使用char a[1] 与char a[0] 只是在malloc 长度时 有些区别。 不明白为什么会越界,求大牛解释
——————————————————————
经过论坛上大牛们的解释 小弟终于弄明白了。
大牛supermegaboy如是说“实现语义与抽象语义之间并不能互相保证,特别是在undefined的情况下。虽然在主观上你为代码分配了足够的空间,但作为undefined行为,无法保证编译器会按照你的预想去实现,如果编译器设计者认为有必要对越界行为进行监控,那么越界时发生陷阱异常或者地址回绕等等都是有可能的,虽然这种行为极其罕见。但作为代码设计的一个基本准则,你不应该做出这种赌博,特别是在并非唯一解决方案的情况下。即使按照初期软件工程需求不考虑移植性,但需求是经常变化的,超出需求的行为是非常普遍的”
由于使用 char a[1]这种行为 标准并没有规定 所以每个编译器的实现不一定一样,故而会产生移植问题!