第一章。头文件
【规则1-2-1】为了防止头文件被重复引用,应当用 ifndef/define/endif 结构产生预
处理块。
【规则1-2-2】用 #include <filename.h> 格式来引用标准库的头文件(编译器将从
标准库目录开始搜索)。
【规则1-2-3】用 #include “filename.h” 格式来引用非标准库的头文件(编译器
将从用户的工作目录开始搜索)。
// 版权和版本声明见示例1-1,此处省略。 #ifndef GRAPHICS_H // 防止graphics.h被重复引用 #define GRAPHICS_H #include <math.h> // 引用标准库的头文件 … #include “myheader.h” // 引用非标准库的头文件 … void Function1(…); // 全局函数声明 … class Box // 类结构声明 { … }; #endif
这里ifndef和endif两个关键字似乎没怎么用过,看来是在自己定义头文件里所需要的关键字。
第二章。程序的板式
1。空行
【规则2-1-1】在每个类声明之后、每个函数定义结束之后都要加空行。参见示例2-1
(a)
【规则2-1-2】在一个函数体内,逻揖上密切相关的语句之间不加空行,其它地方应加
空行分隔。参见示例2-1(b )
2。代码行
【规则2-2-1】一行代码只做一件事情,如只定义一个变量,或只写一条语句。这样的
代码容易阅读,并且方便于写注释。
【规则2-2-2】if、for、while、do 等语句自占一行,执行语句不得紧跟其后。不论执
行语句有多少都要加{}。这样可以防止书写失误。
【建议2-2-1】尽可能在定义变量的同时初始化该变量(就近原则)
如果变量的引用处和其定义处相隔比较远,变量的初始化很容易被忘记。如果引用了未
被初始化的变量,可能会导致程序错误。本建议可以减少隐患。例如
int width = 10; // 定义并初绐化width
int height = 10; // 定义并初绐化height
int depth = 10; // 定义并初绐化depth
3。代码行内的空格
【规则2-3-1】关键字之后要留空格。象const、virtual、inline、case 等关键字之
后至少要留一个空格,否则无法辨析关键字。象if、for、while 等关键字之后应留一
个空格再跟左括号‘(’,以突出关键字。
【规则2-3-2】函数名之后不要留空格,紧跟左括号‘(’,以与关键字区别。
【规则2-3-3】‘(’向后紧跟,‘)’、‘,’、‘;’向前紧跟,紧跟处不留空格。
【规则2-3-4】‘,’之后要留空格,如 Function(x, y, z)。如果‘;’不是一行的结
束符号,其后要留空格,如for (initialization; condition; update)。
【规则2-3-5】赋值操作符、比较操作符、算术操作符、逻辑操作符、位域操作符,如
“=”、“+=” “>=”、“<=”、“+”、“*”、“%”、“&&”、“||”、“<<”,“^”
等二元操作符的前后应当加空格。
【规则2-3-6】一元操作符如“!”、“~”、“++”、“--”、“&”(地址运算符)
等前后不加空格。
【规则2-3-7】象“〔〕”、“.”、“->”这类操作符前后不加空格。
【建议2-3-8】对于表达式比较长的for 语句和if语句,为了紧凑起见可以适当地去
掉一些空格,如for (i=0; i<10; i++)和if ((a<=b) && (c<=d))
void Func1(int x, int y, int z); // 良好的风格 void func( int x, int y, int z ); //良好的风格 void Func1 (int x,int y,int z); // 不良的风格 if (year >= 2000) // 良好的风格 if(year>=2000) // 不良的风格 if ((a>=b) && (c<=d)) // 良好的风格 if(a>=b&&c<=d) // 不良的风格 for (i=0; i<10; i++) // 良好的风格 for( I=0; I<10; I++ ) //良好的风格 for(i=0;i<10;i++) // 不良的风格 for (i = 0; i < 10; i ++) // 过多的空格 x = a < b ? a : b; // 良好的风格 x=a<b?a:b; // 不好的风格 int *x = &y; // 良好的风格 int * x = & y; // 不良的风格 array[5] = 0; // 不要写成 array [ 5 ] = 0; a.Function(); // 不要写成 a . Function(); b->Function(); // 不要写成 b -> Function();
这里有分Java风格和C++风格的,两种都可以。
5。长行拆分
6。修饰符的位置
若将修饰符 * 靠近数据类型,例如:int* x; 从语义上讲此写法比较直观,即x 是int
类型的指针。
上述写法的弊端是容易引起误解,例如:int* x, y; 此处y 容易被误解为指针变量。
虽然将x 和y 分行定义可以避免误解,但并不是人人都愿意这样做。
【规则2-6-1】应当将修饰符 * 和 & 紧靠变量名
例如:
char *name;
int *x, y; // 此处y 不会被误解为指针
7。注释
【规则2-7-1】注释是对代码的“提示”,而不是文档。程序中的注释不可喧宾夺主,
注释太多了会让人眼花缭乱。注释的花样要少。
【规则2-7-2】如果代码本来就是清楚的,则不必加注释。否则多此一举,令人厌烦。
例如
i++; // i 加 1,多余的注释
【规则2-7-3】边写代码边注释,修改代码同时修改相应的注释,以保证注释与代码的
一致性。不再有用的注释要删除。
【规则2-7-4】注释应当准确、易懂,防止注释有二义性。错误的注释不但无益反而有
害。
【规则2-7-5】尽量避免在注释中使用缩写,特别是不常用缩写。
【规则2-7-6】注释的位置应与被描述的代码相邻,可以放在代码的上方或右方,不可
放在下方。
【规则2-7-8】当代码比较长,特别是有多重嵌套时,应当在一些段落的结束处加注释,
便于阅读。
8。类的板式
类的版式主要有两种方式:
(1)将private 类型的数据写在前面,而将public类型的函数写在后面,如示例 8-3
(a)采用这种版式的程序员主张类的设计“以数据为中心”,重点关注类的内部结构。
(2)将public类型的函数写在前面,而将private 类型的数据写在后面,如示例 8.3
(b)采用这种版式的程序员主张类的设计“以行为为中心”,重点关注的是类应该提
供什么样的接口(或服务)。
很多C++教课书受到Biarne Stroustrup 第一本著作的影响,不知不觉地采用了“以数
据为中心”的书写方式,并不见得有多少道理。
我建议读者采用“以行为为中心”的书写方式,即首先考虑类应该提供什么样的函数。
这是很多人的经验——“这样做不仅让自己在设计类时思路清晰,而且方便别人阅读。
因为用户最关心的是接口,谁愿意先看到一堆私有数据成员!”
第三章。命名规则
1.共性规则
【规则3-1-1】标识符应当直观且可以拼读,可望文知意,不必进行“解码”。
标识符最好采用英文单词或其组合,便于记忆和阅读。切忌使用汉语拼音来命名。程序
中的英文单词一般不会太复杂,用词应当准确。例如不要把CurrentValue写成
NowValue。
【规则3-1-3】命名规则尽量与所采用的操作系统或开发工具的风格保持一致。
例如Windows 应用程序的标识符通常采用“大小写”混排的方式,如AddChild 。而 Unix
应用程序的标识符通常采用“小写加下划线”的方式,如add_child 。别把这两类风格
混在一起用。
【规则3-1-5】程序中不要出现标识符完全相同的局部变量和全局变量,尽管两者的作
用域不同而不会发生语法错误,但会使人误解。
【规则3-1-6】变量的名字应当使用“名词”或者“形容词+名词”。
例如:
float value;
float oldValue;
float newValue;
【规则3-1-7】全局函数的名字应当使用“动词”或者“动词+名词”(动宾词组)。
类的成员函数应当只使用“动词”,被省略掉的名词就是对象本身。
例如:
DrawBox(); // 全局函数
box->Draw(); // 类的成员函数
【规则3-1-8】用正确的反义词组命名具有互斥意义的变量或相反动作的函数等。
例如:
int minValue;
int maxValue;
int SetValue(…);
int GetValue(…);
【建议3-1-1】尽量避免名字中出现数字编号,如 Value1,Value2 等,除非逻辑上的确
需要编号。这是为了防止程序员偷懒,不肯为命名动脑筋而导致产生无意义的名字(因
为用数字编号最省事)。
2.简单的程序命名规则
【规则3-2-1】类名和函数名用大写字母开头的单词组合而成。
例如:
class Node; // 类名
class LeafNode; // 类名
void Draw(void); // 函数名
void SetValue(int value); // 函数名
【规则3-2-2】变量和参数用小写字母开头的单词组合而成。
例如:
BOOL flag;
int drawMode;
【规则3-2-3】常量全用大写的字母,用下划线分割单词。
例如:
const int MAX = 100;
const int MAX_LENGTH = 100;
【规则3-2-4】静态变量加前缀s_(表示static)。
例如:
void Init(…)
{
static int s_initValue; // 静态变量
…
}
【规则3-2-5】如果不得已需要全局变量,则使全局变量加前缀g_(表示global)。
例如:
int g_howManyPeople; // 全局变量
int g_howMuchMoney; // 全局变量
【规则3-2-6】类的数据成员加前缀m_(表示member),这样可以避免数据成员与成
员函数的参数同名。
例如:
void Object::SetValue(int width, int height)
{
m_width = width;
m_height = height;
}
【规则3-2-7】为了防止某一软件库中的一些标识符和其它软件库中的冲突,可以为各
种标识符加上能反映软件性质的前缀。例如三维图形标准OpenGL 的所有库函数均以 gl
开头,所有常量(或宏定义)均以GL开头。
第四章。表达式和基本语句
1.if语句
【规则4-3-1】不可将布尔变量直接与TRUE、FALSE 或者1、0 进行比较。
根据布尔类型的语义,零值为“假”(记为FALSE),任何非零值都是“真”(记为 TRUE)。
TRUE的值究竟是什么并没有统一的标准。例如Visual C++ 将TRUE 定义为 1,而 Visual
Basic 则将TRUE定义为-1。
假设布尔变量名字为flag,它与零值比较的标准if语句如下:
if (flag) // 表示flag为真
if (!flag) // 表示flag为假
其它的用法都属于不良风格,例如:
if (flag == TRUE) ??
if (flag == 1 )
if (flag == FALSE) ??
if (flag == 0)
这里我认为应该问题不大才对。。。囧。。。
【规则4-3-2】应当将整型变量用“==”或“!=”直接与0 比较。
假设整型变量的名字为value,它与零值比较的标准if语句如下:
if (value == 0)
if (value != 0)
【规则4-3-3】不可将浮点变量用“==”或“!=”与任何数字比较。
千万要留意,无论是 float 还是double 类型的变量,都有精度限制。所以一定要避免
将浮点变量用“==”或“!=”与数字比较,应该设法转化成“>=”或“<=”形式。
假设浮点变量的名字为x,应当将
if (x == 0.0) // 隐含错误的比较
转化为
if ((x>=-EPSINON) && (x<=EPSINON))
其中EPSINON 是允许的误差(即精度)。
【规则4-3-4】应当将指针变量用“==”或“!=”与NULL比较。
指针变量的零值是“空”(记为NULL )。尽管NULL 的值与0 相同,但是两者意义不同。
假设指针变量的名字为p,它与零值比较的标准if语句如下:
if (p == NULL) // p与NULL显式比较,强调p 是指针变量
if (p != NULL)
有时候我们可能会看到 if (NULL == p) 这样古怪的格式。不是程序写错了,是程序员
为了防止将 if (p == NULL) 误写成 if (p = NULL),而有意把p 和NULL颠倒。编译
器认为 if (p = NULL) 是合法的,但是会指出 if (NULL = p) 是错误的,因为 NULL不
能被赋值。
这个很有用!!!
程序中有时会遇到if/else/return的组合,应该将如下不良风格的程序
if (condition)
return x;
return y;
改写为
if (condition)
{
return x;
}
else
{
}
return y;
}
2.循环语句的效率
C++/C循环语句中,for 语句使用频率最高,while 语句其次,do语句很少用。本节重
点论述循环体的效率。提高循环体效率的基本办法是降低循环体的复杂性。
【建议4-4-1】在多重循环中,如果有可能,应当将最长的循环放在最内层,最短的循
环放在最外层,以减少CPU 跨切循环层的次数。例如示例4-4(b)的效率比示例4-4(a)
的高。
for (row=0; row<100; row++)
{
for ( col=0; col<5; col++ )
{
sum = sum + a[row][col];
}
}
示例4-4(a) 低效率:长循环在最外层
for (col=0; col<5; col++ )
{
for (row=0; row<100; row++)
{
sum = sum + a[row][col];
}
}
示例4-4(b) 高效率:长循环在最内层
看到这里突然想到趋势科技的一道题目果断做错了,悲剧。。。
看来多重循环嵌套的主要效率损失发生在在内外层循环切换时。。。
【建议4-4-2】如果循环体内存在逻辑判断,并且循环次数很大,宜将逻辑判断移到循
环体的外面。示例4-4(c)的程序比示例4-4(d)多执行了N-1 次逻辑判断。并且由于前
者老要进行逻辑判断,打断了循环“流水线”作业,使得编译器不能对循环进行优化处
理,降低了效率。如果 N 非常大,最好采用示例 4-4(d) 的写法,可以提高效率。如果 N
非常小,两者效率差别并不明显,采用示例 4-4(c) 的写法比较好,因为程序更加简洁。
3.for语句
【规则4-5-1】不可在for 循环体内修改循环变量,防止for 循环失去控制。
4.switch语句
switch语句的基本格式是:
switch (variable)
{
case value1 : …
break;
case value2 : …
break;
…
default : …
break;
}
【规则4-6-1】每个 case 语句的结尾不要忘了加 break,否则将导致多个分支重叠(除
非有意使多个分支重叠)。
【规则4-6-2】不要忘记最后那个 default 分支。即使程序真的不需要 default 处理,
也应该保留语句 default : break; 这样做并非多此一举,而是为了防止别人误以
为你忘了default 处理。
第五章。常量
【规则5-1-1】 尽量使用含义直观的常量来表示那些将在程序中多次出现的数字或字
符串。
例如:
#define MAX 100 /* C语言的宏常量 */
const int MAX = 100; // C++ 语言的const 常量
const float PI = 3.14159; // C++ 语言的const 常量
1.const 与 #define的比较
C++ 语言可以用 const 来定义常量,也可以用 #define来定义常量。但是前者比后
者有更多的优点:
(1)const 常量有数据类型,而宏常量没有数据类型。编译器可以对前者进行类型安全
检查。而对后者只进行字符替换,没有类型安全检查,并且在字符替换可能会产生意料
不到的错误(边际效应)。
(2)有些集成化的调试工具可以对 const 常量进行调试,但是不能对宏常量进行调试。
【规则5-2-1】在C++ 程序中只使用 const 常量而不使用宏常量,即 const 常量完全取
代宏常量。
2.常量定义规则
【规则5-3-1】需要对外公开的常量放在头文件中,不需要对外公开的常量放在定义文
件的头部。为便于管理,可以把不同模块的常量集中存放在一个公共的头文件中。
【规则5-3-2】如果某一常量与其它常量密切相关,应在定义中包含这种关系,而不应
给出一些孤立的值。
例如:
const float RADIUS = 100;
const float DIAMETER = RADIUS * 2;
3.类中的常量
有时我们希望某些常量只在类中有效。由于#define 定义的宏常量是全局的,不能达到
目的,于是想当然地觉得应该用const 修饰数据成员来实现。const 数据成员的确是存
在的,但其含义却不是我们所期望的。const 数据成员只在某个对象生存期内是常量,
而对于整个类而言却是可变的,因为类可以创建多个对象,不同的对象其const 数据成
员的值可以不同。
不能在类声明中初始化const 数据成员。以下用法是错误的,因为类的对象未被创
建时,编译器不知道SIZE的值是什么。
class A
{…
const int SIZE = 100; // 错误,企图在类声明中初始化const 数据成员
int array[SIZE]; // 错误,未知的SIZE
};
const 数据成员的初始化只能在类构造函数的初始化表中进行,例如
class A
{…
A(int size); // 构造函数
const int SIZE ;
};
const 数据成员的初始化只能在类构造函数的初始化表中进行,例如
class A
{…
A(int size); // 构造函数
const int SIZE ;
};
A::A(int size) : SIZE(size) // 构造函数的初始化表
{
…
}
这种语法还是第一次见到,应该是C++中为了简化创建对象实例的一种语法才对
应该好好看看。。。
A a(100); // 对象 a 的SIZE值为100
A b(200); // 对象 b 的SIZE值为200
怎样才能建立在整个类中都恒定的常量呢?别指望const 数据成员了,应该用类中
的枚举常量来实现。例如
class A
{…
enum { SIZE1 = 100, SIZE2 = 200}; // 枚举常量
int array1[SIZE1];
int array2[SIZE2];
};
枚举常量不会占用对象的存储空间,它们在编译时被全部求值。枚举常量的缺点是:
它的隐含数据类型是整数,其最大值有限,且不能表示浮点数(如PI=3.14159)。
第六章。函数设计
函数接口的两个要素是参数和返回值。C 语言中,函数的参数和返回值的传递方式有两
种:值传递(pass by value)和指针传递(pass by pointer)。C++ 语言中多了引用
传递(pass by reference)。由于引用传递的性质象指针传递,而使用方式却象值传
递,初学者常常迷惑不解,容易引起混乱。
【规则6-1-2】参数命名要恰当,顺序要合理。
例如编写字符串拷贝函数StringCopy,它有两个参数。如果把参数名字起为str1和
str2,例如
void StringCopy(char *str1, char *str2);
那么我们很难搞清楚究竟是把str1拷贝到str2中,还是刚好倒过来。
可以把参数名字起得更有意义,如叫strSource 和strDestination 。这样从名字上就可
以看出应该把strSource 拷贝到strDestination。
还有一个问题,这两个参数那一个该在前那一个该在后?参数的顺序要遵循程序员的习
惯。一般地,应将目的参数放在前面,源参数放在后面。
【规则6-1-3】如果参数是指针,且仅作输入用,则应在类型前加const,以防止该指
针在函数体内被意外修改。
例如:
void StringCopy(char *strDestination,const char *strSource);
【规则6-1-4】如果输入参数以值传递的方式传递对象,则宜改用“const &”方式来
传递,这样可以省去临时对象的构造和析构过程,从而提高效率。
“const &”为常量引用,不可修改。
【建议6-1-1】避免函数有太多的参数,参数个数尽量控制在 5 个以内。如果参数太多,
在使用时容易将参数类型或顺序搞错。
【规则6-2-3】不要将正常值和错误标志混在一起返回。正常值用输出参数获得,而错
误标志用return语句返回。
回顾上例,C 标准库函数的设计者为什么要将getchar 声明为令人迷糊的 int 类型呢?
他会那么傻吗?
在正常情况下,getchar 的确返回单个字符。但如果getchar 碰到文件结束标志或发生
读错误,它必须返回一个标志EOF。为了区别于正常的字符,只好将EOF 定义为负数(通
常为负1)。因此函数getchar 就成了int 类型。
我们在实际工作中,经常会碰到上述令人为难的问题。为了避免出现误解,我们应该将
正常值和错误标志分开。即:正常值用输出参数获得,而错误标志用return 语句返回。
函数getchar 可以改写成 BOOL GetChar(char *c);
虽然gechar 比GetChar 灵活,例如 putchar(getchar()); 但是如果 getchar 用错了,
它的灵活性又有什么用呢?【建议6-2-1】有时候函数原本不需要返回值,但为了增加灵活性如支持链式表达,可
以附加返回值。
例如字符串拷贝函数strcpy的原型:
char *strcpy(char *strDest,const char *strSrc);
strcpy函数将strSrc拷贝至输出参数strDest 中,同时函数的返回值又是strDest。
这样做并非多此一举,可以获得如下灵活性:
char str[20];
int length = strlen( strcpy(str, “Hello World”) );
【建议6-2-2】如果函数的返回值是一个对象,有些场合用“引用传递”替换“值传递”
可以提高效率。而有些场合只能用“值传递”而不能用“引用传递”,否则会出错。
(这里没怎么看懂,因为对于C++中引用的概念不太熟悉,也基本上没有用过,看来需要进行恶补一下
另外这里似乎还涉及到操作符,运算符重载的概念)
例如:
class String
{…
// 赋值函数
String & operate=(const String &other);
// 相加函数,如果没有friend修饰则只许有一个右侧参数
// 这里似乎是加号运算符的重载???
friend String operate+( const String &s1, const String &s2);
private:
char *m_data;
}
String的赋值函数operate = 的实现如下:
String & String::operate=(const String &other)
{
if (this == &other)
return *this;
delete m_data;
m_data = new char[strlen(other.data)+1];
strcpy(m_data, other.data);
return *this; // 返回的是 *this的引用,无需拷贝过程
}
对于赋值函数,应当用“引用传递”的方式返回String对象。如果用“值传递”的方
式,虽然功能仍然正确,但由于return语句要把 *this 拷贝到保存返回值的外部存储
单元之中,增加了不必要的开销,降低了赋值函数的效率。例如:
String a,b,c;
…
a = b; // 如果用“值传递”,将产生一次 *this 拷贝
a = b = c; // 如果用“值传递”,将产生两次 *this 拷贝
String的相加函数operate + 的实现如下:
String operate+(const String &s1, const String &s2)
{
String temp;
delete temp.data; // temp.data是仅含‘\0’的字符串
temp.data = new char[strlen(s1.data) + strlen(s2.data) +1];
strcpy(temp.data, s1.data);
strcat(temp.data, s2.data);
return temp;
}
对于相加函数,应当用“值传递”的方式返回String对象。如果改用“引用传递”,
那么函数返回值是一个指向局部对象 temp的“引用”。由于temp 在函数结束时被自动
销毁,将导致返回的“引用”无效。例如:
c = a + b;
此时 a + b 并不返回期望值,c 什么也得不到,流下了隐患。
函数内部的实现规则
【规则6-3-2】在函数体的“出口处”,对return语句的正确性和效率进行检查。
如果函数有返回值,那么函数的“出口处”是return语句。我们不要轻视return
语句。如果return语句写得不好,函数要么出错,要么效率低下。
注意事项如下:
(1)return语句不可返回指向“栈内存”的“指针”或者“引用”,因为该内存在函
数体结束时被自动销毁。例如
char * Func(void)
{
char str[] = “hello world”; // str 的内存位于栈上
…
return str; // 将导致错误
}
(2)要搞清楚返回的究竟是“值”、“指针”还是“引用”。
(3)如果函数返回值是一个对象,要考虑return语句的效率。例如
return String(s1 + s2);
这是临时对象的语法,表示“创建一个临时对象并返回它”。不要以为它与“先创建一
个局部对象temp并返回它的结果”是等价的,如
String temp(s1 + s2);
return temp;
实质不然,上述代码将发生三件事。首先,temp 对象被创建,同时完成初始化;然后拷
贝构造函数把temp拷贝到保存返回值的外部存储单元中;最后,temp 在函数结束时被
销毁(调用析构函数)。然而“创建一个临时对象并返回它”的过程是不同的,编译器
直接把临时对象创建并初始化在外部存储单元中,省去了拷贝和析构的化费,提高了效
率。
类似地,我们不要将
return int(x + y); // 创建一个临时变量并返回它
写成
int temp = x + y;
return temp;
由于内部数据类型如 int,float,double 的变量不存在构造函数与析构函数,虽然该“临
时变量的语法”不会提高多少效率,但是程序更加简洁易读。
【建议6-4-3】尽量避免函数带有“记忆”功能。相同的输入应当产生相同的输出。
带有“记忆”功能的函数,其行为可能是不可预测的,因为它的行为可能取决于某种
“记忆状态”。这样的函数既不易理解又不利于测试和维护。在C/C++语言中,函数的
static局部变量是函数的“记忆”存储器。建议尽量少用static局部变量,除非必需。
【建议6-4-4】不仅要检查输入参数的有效性,还要检查通过其它途径进入函数体内的
变量的有效性,例如全局变量、文件句柄等。
使用断言
void *memcpy(void *pvTo, const void *pvFrom, size_t size) { assert((pvTo != NULL) && (pvFrom != NULL)); // 使用断言 byte *pbTo = (byte *) pvTo; // 防止改变pvTo的地址 byte *pbFrom = (byte *) pvFrom; // 防止改变pvFrom的地址 while(size -- > 0 ) *pbTo ++ = *pbFrom ++ ; return pvTo; }
assert不是一个仓促拼凑起来的宏。为了不在程序的Debug 版本和 Release 版本引起差
别,assert不应该产生任何副作用。所以assert 不是函数,而是宏。程序员可以把 assert
看成一个在任何系统状态下都可以安全使用的无害测试手段。 如果程序在assert处终
止了,并不是说含有该 assert 的函数有错误,而是调用者出了差错,assert 可以帮助
我们找到发生错误的原因。
【规则6-5-1】使用断言捕捉不应该发生的非法情况。不要混淆非法情况与错误情况之
间的区别,后者是必然存在的并且是一定要作出处理的。
【规则6-5-2】在函数的入口处,使用断言检查参数的有效性(合法性)。
【建议6-5-1】在编写函数时,要进行反复的考查,并且自问:“我打算做哪些假定?”
一旦确定了的假定,就要使用断言对假定进行检查。
【建议6-5-2】一般教科书都鼓励程序员们进行防错设计,但要记住这种编程风格可能
会隐瞒错误。当进行防错设计时,如果“不可能发生”的事情的确发生了,则要使用断
言进行报警。
引用与指针
引用是C++中的概念,初学者容易把引用和指针混淆一起。一下程序中,n 是m 的一个
引用(reference),m 是被引用物(referent)。
int m;
int &n = m;
引用的一些规则如下:
(1)引用被创建的同时必须被初始化(指针则可以在任何时候被初始化)。
(2)不能有NULL引用,引用必须与合法的存储单元关联(指针则可以是NULL)。
(3)一旦引用被初始化,就不能改变引用的关系(指针则可以随时改变所指的对象)。
以下示例程序中,k 被初始化为i 的引用。语句k = j 并不能将k 修改成为j 的引
用,只是把k 的值改变成为6。由于k 是i 的引用,所以i 的值也变成了6。
int i = 5;
int j = 6;
int &k = i;
k = j; // k和i 的值都变成了6;
以下是“值传递”的示例程序。由于Func1 函数体内的 x 是外部变量 n 的一份拷贝,
改变x 的值不会影响n, 所以n 的值仍然是0。
void Func1(int x)
{
x = x + 10;
}
…
int n = 0;
Func1(n);
cout << “n = ” << n << endl; // n = 0
以下是“指针传递”的示例程序。由于 Func2 函数体内的 x 是指向外部变量 n 的指针,
改变该指针的内容将导致n 的值改变,所以n 的值成为10。
void Func2(int *x)
{
(* x) = (* x) + 10;
}
…
int n = 0;
Func2(&n);
cout << “n = ” << n << endl; // n = 10
以下是“引用传递”的示例程序。由于 Func3 函数体内的 x 是外部变量 n 的引用,
x 和n 是同一个东西,改变x 等于改变n,所以n 的值成为10。
void Func3(int &x)
{
x = x + 10;
}
…
int n = 0;
Func3(n);
cout << “n = ” << n << endl; // n = 10
对比上述三个示例程序,会发现“引用传递”的性质象“指针传递”,而书写方式
象“值传递”。实际上“引用”可以做的任何事情“指针”也都能够做,为什么还要
“引用”这东西?
答案是“用适当的工具做恰如其分的工作”。
指针能够毫无约束地操作内存中的如何东西,尽管指针功能强大,但是非常危险。
就象一把刀,它可以用来砍树、裁纸、修指甲、理发等等,谁敢这样用?
如果的确只需要借用一下某个对象的“别名”,那么就用“引用”,而不要用“指针”,
以免发生意外。比如说,某人需要一份证明,本来在文件上盖上公章的印子就行了,如
果把取公章的钥匙交给他,那么他就获得了不该有的权利
第七章 内存管理
内存分配方式有三种:
(1) 从静态存储区域分配。内存在程序编译的时候就已经分配好,这块内存在
程序的整个运行期间都存在。例如全局变量,static变量。
(2) 在栈上创建。在执行函数时,函数内局部变量的存储单元都可以在栈上创
建,函数执行结束时这些存储单元自动被释放。栈内存分配运算内置于处理器的指令集
中,效率很高,但是分配的内存容量有限。
(3) 从堆上分配,亦称动态内存分配。程序在运行的时候用malloc 或new 申请
任意多少的内存,程序员自己负责在何时用 free或delete释放内存。动态内存的生存
期由我们决定,使用非常灵活,但问题也最多。
常见的内存错误及其对策如下:
内存分配未成功,却使用了它。
编程新手常犯这种错误,因为他们没有意识到内存分配会不成功。常用解决办法是,在
使用内存之前检查指针是否为 NULL。如果指针 p 是函数的参数,那么在函数的入口处用
assert(p!=NULL)进行检查。如果是用malloc 或new 来申请内存,应该用 if(p==NULL) 或
if(p!=NULL)进行防错处理。
内存分配虽然成功,但是尚未初始化就引用它。
犯这种错误主要有两个起因:一是没有初始化的观念;二是误以为内存的缺省初值全为
零,导致引用初值错误(例如数组)。
内存的缺省初值究竟是什么并没有统一的标准,尽管有些时候为零值,我们宁可信其无
不可信其有。所以无论用何种方式创建数组,都别忘了赋初值,即便是赋零值也不可省
略,不要嫌麻烦。
内存分配成功并且已经初始化,但操作越过了内存的边界。
例如在使用数组时经常发生下标“多1”或者“少1”的操作。特别是在for 循环语句
中,循环次数很容易搞错,导致数组操作越界。
忘记了释放内存,造成内存泄露。
含有这种错误的函数每被调用一次就丢失一块内存。刚开始时系统的内存充足,你看不
到错误。终有一次程序突然死掉,系统出现提示:内存耗尽。
动态内存的申请与释放必须配对,程序中 malloc 与free的使用次数一定要相同,否则
肯定有错误(new/delete同理)。
释放了内存却继续使用它。
有三种情况:
(1)程序中的对象调用关系过于复杂,实在难以搞清楚某个对象究竟是否已经释放了
内存,此时应该重新设计数据结构,从根本上解决对象管理的混乱局面。
(2)函数的return语句写错了,注意不要返回指向“栈内存”的“指针”或者“引
用”,因为该内存在函数体结束时被自动销毁。
(3)使用 free 或delete释放了内存后,没有将指针设置为NULL。导致产生“野指针”。
【规则7-2-1】用malloc或new 申请内存之后,应该立即检查指针值是否为NULL。防
止使用指针值为NULL的内存。
【规则7-2-2】不要忘记为数组和动态内存赋初值。防止将未被初始化的内存作为右值
使用。
【规则7-2-3】避免数组或指针的下标越界,特别要当心发生“多1”或者“少1”操
作。
【规则7-2-4】动态内存的申请与释放必须配对,防止内存泄漏。
【规则7-2-5】用free 或delete释放了内存之后,立即将指针设置为 NULL ,防止产生
“野指针”。
指针与数组
数组要么在静态存储区被创建(如全局数组),要么在栈上被创建。数组名对应
着(而不是指向)一块内存,其地址与容量在生命期内保持不变,只有数组的内容可以
改变。
指针可以随时指向任意类型的内存块,它的特征是“可变”,所以我们常用指针来操作
动态内存。指针远比数组灵活,但也更危险。
下面以字符串为例比较指针与数组的特性。
修改内容
示例中,字符数组 a 的容量是 6 个字符,其内容为 hello\0。a 的内容可以改变,
如a[0]= ‘X’。指针p 指向常量字符串“world”(位于静态存储区,内容为 world\0),
常量字符串的内容是不可以被修改的。从语法上看,编译器并不觉得语句p[0]= ‘X’
有什么不妥,但是该语句企图修改常量字符串的内容而导致运行错误。
char a[] = “hello”;
a[0] = ‘X’;
cout << a << endl;
char *p = “world”; // 注意p 指向常量字符串
p[0] = ‘X’; // 编译器不能发现该错误
cout << p << endl;
不能对数组名进行直接复制与比较。示例中,若想把数组a 的内容复制给数组 b,
不能用语句 b = a ,否则将产生编译错误。应该用标准库函数 strcpy 进行复制。同理,
比较b 和a 的内容是否相同,不能用if(b==a) 来判断,应该用标准库函数strcmp进行
比较。
语句p = a 并不能把a 的内容复制指针p,而是把a 的地址赋给了p。要想复制a 的内
容,可以先用库函数malloc为p 申请一块容量为strlen(a)+1 个字符的内存,再用
strcpy进行字符串复制。同理,语句 if(p==a) 比较的不是内容而是地址,应该用库函
数strcmp来比较。
// 数组…
char a[] = "hello";
char b[10];
strcpy(b, a); // 不能用 b = a;
if(strcmp(b, a) == 0) // 不能用 if (b == a)
…
// 指针…
int len = strlen(a);
char *p = (char *)malloc(sizeof(char)*(len+1));
strcpy(p,a); // 不要用 p = a;
if(strcmp(p, a) == 0) // 不要用 if (p == a)
…
用运算符 sizeof 可以计算出数组的容量(字节数)。示例7-3-3(a)中,sizeof(a)
的值是12(一个字符两个字节)(注意别忘了’\0’)。指针p 指向a,但是sizeof(p)的值却是4。这是因
为sizeof(p)得到的是一个指针变量的字节数,相当于sizeof(char*),而不是p 所指
的内存容量。C++/C 语言没有办法知道指针所指的内存容量,除非在申请内存时记住它。
char a[] = "hello world";
char *p = a;
cout<< sizeof(a) << endl; // 12 字节
cout<< sizeof(p) << endl; // 4字节
注意当数组作为函数的参数进行传递时,该数组自动退化为同类型的指针。示例7-3-3
(b)中,不论数组a 的容量是多少,sizeof(a)始终等于sizeof(char *)。
void Func(char a[100])
{
cout<< sizeof(a) << endl; // 4字节而不是100 字节
}
指针参数是如何传递内存的?
如果函数的参数是一个指针,不要指望用该指针去申请动态内存。示例中,
Test函数的语句 GetMemory(str, 200)并没有使 str 获得期望的内存,str 依旧是 NULL。
void GetMemory(char *p, int num)
{
p = (char *)malloc(sizeof(char) * num);
}
void Test(void)
{
char *str = NULL;
GetMemory(str, 100); // str 仍然为 NULL
strcpy(str, "hello"); // 运行错误
}
毛病出在函数 GetMemory 中。编译器总是要为函数的每个参数制作临时副本,指针参数
p 的副本是 _p,编译器使 _p = p。如果函数体内的程序修改了_p 的内容,就导致参数
p 的内容作相应的修改。这就是指针可以用作输出参数的原因。在本例中,_p申请了新
的内存,只是把_p所指的内存地址改变了,但是 p 丝毫未变。所以函数 GetMemory 并不
能输出任何东西。事实上,每执行一次GetMemory 就会泄露一块内存,因为没有用 free
释放内存。
如果非得要用指针参数去申请内存,那么应该改用“指向指针的指针”,见示例
void GetMemory2(char **p, int num) { *p = (char *)malloc(sizeof(char) * num); } void Test2(void) { char *str = NULL; GetMemory2(&str, 100); // 注意参数是 &str,而不是str strcpy(str, "hello"); cout<< str << endl; free(str); }
char *GetMemory3(int num) { char *p = (char *)malloc(sizeof(char) * num); return p; } void Test3(void) { char *str = NULL; str = GetMemory3(100); strcpy(str, "hello"); cout<< str << endl; free(str); }
用函数返回值来传递动态内存这种方法虽然好用,但是常常有人把return语句用错了。
这里强调不要用return语句返回指向“栈内存”的指针,因为该内存在函数结束时自
动消亡,见示例
这里p[]的值是存放在栈内存中的~
char *GetString(void) { char p[] = "hello world"; return p; // 编译器将提出警告 } void Test4(void) { char *str = NULL; str = GetString(); // str 的内容是垃圾 cout<< str << endl; }
char *GetString2(void) { char *p = "hello world"; return p; } void Test5(void) { char *str = NULL; str = GetString2(); cout<< str << endl; }
恒定不变。无论什么时候调用 GetString2 ,它返回的始终是同一个“只读”的内存块。
free和delete把指针怎么啦?
别看free和delete 的名字恶狠狠的(尤其是 delete ),它们只是把指针所指的内存给
释放掉,但并没有把指针本身干掉。
用调试器跟踪示例7-5,发现指针p 被free以后其地址仍然不变(非NULL),只是该
地址对应的内存是垃圾,p 成了“野指针”。如果此时不把 p 设置为 NULL,会让人误以
为p 是个合法的指针。
如果程序比较长,我们有时记不住 p 所指的内存是否已经被释放,在继续使用 p 之前,
通常会用语句if (p != NULL) 进行防错处理。很遗憾,此时if语句起不到防错作用,
因为即便p 不是NULL指针,它也不指向合法的内存块。
char *p = (char *) malloc(100);
strcpy(p, “hello”);
free(p); // p 所指的内存被释放,但是p 所指的地址仍然不变
动态内存会被自动释放吗?
函数体内的局部变量在函数结束时自动消亡。很多人误以为示例是正确的。
理由是p 是局部的指针变量,它消亡的时候会让它所指的动态内存一起完蛋。这是错觉!
void Func(void)
{
char *p = (char *) malloc(100); // 动态内存会自动释放吗?
}
我们发现指针有一些“似是而非”的特征:
(1)指针消亡了,并不表示它所指的内存会被自动释放。
(2 )内存被释放了,并不表示指针会消亡或者成了NULL指针。
这表明释放内存并不是一件可以草率对待的事。也许有人不服气,一定要找出可以草率
行事的理由:
如果程序终止了运行,一切指针都会消亡,动态内存会被操作系统回收。既然如此,
在程序临终前,就可以不必释放内存、不必将指针设置为NULL了。终于可以偷懒而不
会发生错误了吧?
想得美。如果别人把那段程序取出来用到其它地方怎么办?
杜绝“野指针”
“野指针”不是 NULL指针,是指向“垃圾”内存的指针。人们一般不会错用NULL指针,
因为用if语句很容易判断。但是“野指针”是很危险的,if语句对它不起作用。
“野指针”的成因主要有两种:
(1)指针变量没有被初始化。任何指针变量刚被创建时不会自动成为 NULL 指针,它的
缺省值是随机的,它会乱指一气。所以,指针变量在创建的同时应当被初始化,要么将
指针设置为NULL,要么让它指向合法的内存。例如
char *p = NULL;
char *str = (char *) malloc(100);
(2)指针 p 被free或者 delete之后,没有置为 NULL ,让人误以为 p 是个合法的指针。
参见7.5 节。
(3)指针操作超越了变量的作用范围。这种情况让人防不胜防,示例程序如下:
class A
{
public:
void Func(void){ cout << “Func of class A” << endl; }
};
void Test(void)
{
A *p;
{
A a;
p = &a; // 注意 a 的生命期
}
p->Func(); // p是“野指针”
}
函数Test在执行语句 p->Func()时,对象 a 已经消失,而 p 是指向 a 的,所以 p 就成了
“野指针”。但奇怪的是我运行这个程序时居然没有出错,这可能与编译器有关。
有了malloc/free 为什么还要new/delete ?
malloc与free是C++/C 语言的标准库函数,new/delete 是C++的运算符。它们
都可用于申请动态内存和释放内存。
对于非内部数据类型的对象而言,光用maloc/free无法满足动态对象的要求。对象在
创建的同时要自动执行构造函数,对象在消亡之前要自动执行析构函数。由于
malloc/free 是库函数而不是运算符,不在编译器控制权限之内,不能够把执行构造函
数和析构函数的任务强加于malloc/free。
因此C++语言需要一个能完成动态内存分配和初始化工作的运算符new,以及一
个能完成清理与释放内存工作的运算符delete。注意new/delete不是库函数。
我们先看一看 malloc/free 和new/delete 如何实现对象的动态内存管理,见示例
class Obj { public : Obj(void){ cout << “Initialization” << endl; } ~Obj(void){ cout << “Destroy” << endl; } void Initialize(void){ cout << “Initialization” << endl; } void Destroy(void){ cout << “Destroy” << endl; } }; void UseMallocFree(void) { Obj *a = (obj *)malloc(sizeof(obj)); // 申请动态内存 a->Initialize(); // 初始化 //… a->Destroy(); // 清除工作 free(a); // 释放内存 } void UseNewDelete(void) { Obj *a = new Obj; // 申请动态内存并且初始化 //… delete a; // 清除并且释放内存 }
所以我们不要企图用 malloc/free 来完成动态对象的内存管理,应该用new/delete 。由
于内部数据类型的“对象”没有构造与析构的过程,对它们而言malloc/free 和
new/delete是等价的。
既然new/delete的功能完全覆盖了malloc/free,为什么C++不把malloc/free 淘
汰出局呢?这是因为C++程序经常要调用C 函数,而C 程序只能用malloc/free 管理动
态内存。
如果用free 释放“new 创建的动态对象”,那么该对象因无法执行析构函数而可能导致
程序出错。如果用delete释放“malloc申请的动态内存”,理论上讲程序不会出错,
但是该程序的可读性很差。所以new/delete必须配对使用,malloc/free 也一样。
内存耗尽怎么办?
如果在申请动态内存时找不到足够大的内存块,malloc 和new 将返回 NULL指针,
宣告内存申请失败。通常有三种方式处理“内存耗尽”问题。
(1)判断指针是否为NULL,如果是则马上用return语句终止本函数。例如:
void Func(void)
{
A *a = new A;
if(a == NULL)
{
return;
}
…
}
(2)判断指针是否为NULL,如果是则马上用exit(1)终止整个程序的运行。例如:
void Func(void)
{
A *a = new A;
if(a == NULL)
{
cout << “Memory Exhausted” << endl;
exit(1);
}
…
}
(3)为new 和malloc 设置异常处理函数。例如 Visual C++ 可以用_set_new_hander 函
数为new 设置用户自己定义的异常处理函数,也可以让malloc享用与new 相同的异常
处理函数。详细内容请参考C++使用手册。
上述(1)(2)方式使用最普遍。如果一个函数内有多处需要申请动态内存,那
么方式(1)就显得力不从心(释放内存很麻烦),应该用方式(2)来处理。
很多人不忍心用 exit(1),问:“不编写出错处理程序,让操作系统自己解决行不行?”
不行。如果发生“内存耗尽”这样的事情,一般说来应用程序已经无药可救。如
果不用exit(1) 把坏程序杀死,它可能会害死操作系统。道理如同:如果不把歹徒击毙,
歹徒在老死之前会犯下更多的罪。
有一个很重要的现象要告诉大家。对于32位以上的应用程序而言,无论怎样使
用malloc与new,几乎不可能导致“内存耗尽”。我在 Windows 98 下用 Visual C++ 编
写了测试程序,见示例7-9。这个程序会无休止地运行下去,根本不会终止。因为32
位操作系统支持“虚存”,内存用完了,自动用硬盘空间顶替。我只听到硬盘嘎吱嘎吱
地响,Window 98 已经累得对键盘、鼠标毫无反应。
我可以得出这么一个结论:对于32位以上的应用程序,“内存耗尽”错误处理程序毫
无用处。这下可把Unix和Windows 程序员们乐坏了:反正错误处理程序不起作用,我
就不写了,省了很多麻烦。
我不想误导读者,必须强调:不加错误处理将导致程序的质量很差,千万不可因小失大。
void main(void)
{
float *p = NULL;
while(TRUE)
{
p = new float[1000000];
cout << “eat memory” << endl;
if(p==NULL)
exit(1);
}
}
malloc/free 的使用要点
函数malloc的原型如下:
void * malloc(size_t size);
用malloc申请一块长度为length的整数类型的内存,程序如下:
int *p = (int *) malloc(sizeof(int) * length);
我们应当把注意力集中在两个要素上:“类型转换”和“sizeof”。
u malloc 返回值的类型是 void * ,所以在调用 malloc 时要显式地进行类型转换,
将void * 转换成所需要的指针类型。
u malloc函数本身并不识别要申请的内存是什么类型,它只关心内存的总字节
数。我们通常记不住int, float 等数据类型的变量的确切字节数。例如int 变量在16
位系统下是 2 个字节,在32位下是4 个字节;而float 变量在 16位系统下是 4 个字节,
在32位下也是4 个字节。最好用以下程序作一次测试:
cout << sizeof(char) << endl;
cout << sizeof(int) << endl;
cout << sizeof(unsigned int) << endl;
cout << sizeof(long) << endl;
cout << sizeof(unsigned long) << endl;
cout << sizeof(float) << endl;
cout << sizeof(double) << endl;
cout << sizeof(void *) << endl;
在malloc的“()”中使用sizeof运算符是良好的风格,但要当心有时我们会昏了
头,写出 p = malloc(sizeof(p))这样的程序来。
u 函数free的原型如下:
void free( void * memblock );
为什么free函数不象malloc函数那样复杂呢?这是因为指针p 的类型以及它所指
的内存的容量事先都是知道的,语句 free(p)能正确地释放内存。如果 p 是NULL指针,
那么free对p 无论操作多少次都不会出问题。如果p 不是NULL指针,那么free对p
连续操作两次就会导致程序运行错误。
下面是一段UNIX内核的malloc程序,看看就知道了
/* coremap 和 swapmap 的结构。包括一个非零记数器,以及一个基地址,COREMAP 是以 64BYTE 为单位,SWAPMAP 是以512BYTE 或4KBYTE为单位的 地址是增长的,当遇到第一个为零的记数值时链表结束 */ struct map { char *m_size; char *m_addr; } malloc( struct map *mp, int size ) { register int a; register struct map *bp; for( bp = mp; bp->m_size; bp++ ){ if( bp->m_size >= size ) { a = bp->m_addr; bp->m_addr += size; if(( bp->m_size =- size ) == 0 ) do { bp++; (bp – 1)->m_addr = bp->m_addr }while(( bp-1)->m_size = bp->m_size ); return(a); } return( 0 ); }
new/delete 的使用要点
运算符new 使用起来要比函数malloc简单得多,例如:
int *p1 = (int *)malloc(sizeof(int) * length);
int *p2 = new int[length];
这是因为new 内置了 sizeof 、类型转换和类型安全检查功能。对于非内部数据类型的对
象而言,new 在创建动态对象的同时完成了初始化工作。如果对象有多个构造函数,那
么new 的语句也可以有多种形式。例如
class Obj
{
public :
Obj(void); // 无参数的构造函数
Obj(int x); // 带一个参数的构造函数
…
}
void Test(void)
{
Obj *a = new Obj;
Obj *b = new Obj(1); // 初值为1
…
delete a;
delete b;
}
如果用new 创建对象数组,那么只能使用对象的无参数构造函数。例如
Obj *objects = new Obj[100]; // 创建100 个动态对象
不能写成
Obj *objects = new Obj[100](1);// 创建100 个动态对象的同时赋初值1
在用delete释放对象数组时,留意不要丢了符号‘[]’。例如
delete []objects; // 正确的用法
delete objects; // 错误的用法
后者相当于delete objects[0],漏掉了另外99个对象。
我的经验教训是:
(1)越是怕指针,就越要使用指针。不会正确使用指针,肯定算不上是合格的程序员。
(2)必须养成“使用调试器逐步跟踪程序”的习惯,只有这样才能发现问题的本质。
第八章 C++函数的高级特性
重载
在C++程序中,可以将语义、功能相似的几个函数用同一个名字表示,即函数重载。
这样便于记忆,提高了函数的易用性,这是C++语言采用重载机制的一个理由。例如示
例8-1-1 中的函数EatBeef,EatFish,EatChicken可以用同一个函数名Eat 表示,用不
同类型的参数加以区别。
void EatBeef(…); // 可以改为 void Eat(Beef …);
void EatFish(…); // 可以改为 void Eat(Fish …);
void EatChicken(…); // 可以改为 void Eat(Chicken …);
C++语言采用重载机制的另一个理由是:类的构造函数需要重载机制。因为C++规定
构造函数与类同名(请参见第 9 章),构造函数只能有一个名字。如果想用几种不同的
方法创建对象该怎么办?别无选择,只能用重载机制来实现。所以类可以有多个同名的
构造函数。
注意并不是两个函数的名字相同就能构成重载。全局函数和类的成员函数同名不算
重载,因为函数的作用域不同。例如:
void Print(…); // 全局函数
class A
{…
void Print(…); // 成员函数
}
不论两个Print 函数的参数是否不同,如果类的某个成员函数要调用全局函数
Print,为了与成员函数Print 区别,全局函数被调用时应加‘::’标志。如
::Print(…); // 表示Print 是全局函数而非成员函数
成员函数的重载、覆盖(override )与隐藏很容易混淆,C++程序员必须要搞清楚概
念,否则错误将防不胜防。
成员函数被重载的特征:
(1)相同的范围(在同一个类中);
(2)函数名字相同;
(3)参数不同;
(4)virtual 关键字可有可无。
覆盖是指派生类函数覆盖基类函数,特征是:
(1)不同的范围(分别位于派生类与基类);
(2)函数名字相同;
(3)参数相同;
(4)基类函数必须有virtual 关键字。
示例8-2-1 中,函数Base::f(int)与Base::f(float)相互重载,而Base::g(void)
被Derived::g(void)覆盖。
本来仅仅区别重载与覆盖并不算困难,但是 C++的隐藏规则使问题复杂性陡然增加。
这里“隐藏”是指派生类的函数屏蔽了与其同名的基类函数,规则如下:
(1)如果派生类的函数与基类的函数同名,但是参数不同。此时,不论有无virtual
关键字,基类的函数将被隐藏(注意别与重载混淆)。
(2)如果派生类的函数与基类的函数同名,并且参数也相同,但是基类函数没有 virtual
关键字。此时,基类的函数被隐藏(注意别与覆盖混淆)。
示例程序8-2-2(a)中:
(1)函数Derived::f(float)覆盖了Base::f(float)。
(2)函数Derived::g(int)隐藏了Base::g(float),而不是重载。
(3)函数Derived::h(float)隐藏了Base::h(float),而不是覆盖。
示例8-2-2(b)中,bp和dp指向同一地址,按理说运行结果应该是相同的,可事实并
非这样。
#include <iostream.h> class Base { public: virtual void f(float x){ cout << "Base::f(float) " << x << endl; } void g(float x){ cout << "Base::g(float) " << x << endl; } void h(float x){ cout << "Base::h(float) " << x << endl; } }; class Derived : public Base { public: virtual void f(float x){ cout << "Derived::f(float) " << x << endl; } void g(int x){ cout << "Derived::g(int) " << x << endl; } void h(float x){ cout << "Derived::h(float) " << x << endl; } };
示例8-2-2(b)中,bp和dp指向同一地址,按理说运行结果应该是相同的,可事实并
非这样。
void main(void) { Derived d; Base *pb = &d; Derived *pd = &d; // Good : behavior depends solely on type of the object pb->f(3.14f); // Derived::f(float) 3.14 pd->f(3.14f); // Derived::f(float) 3.14 // Bad : behavior depends on type of the pointer pb->g(3.14f); // Base::g(float) 3.14 pd->g(3.14f); // Derived::g(int) 3 (surprise!) // Bad : behavior depends on type of the pointer pb->h(3.14f); // Base::h(float) 3.14 (surprise!) pd->h(3.14f); // Derived::h(float) 3.14 }
class Base { public: void f(int x); }; class Derived : public Base { public: void f(char *str); }; void Test(void) { Derived *pd = new Derived; pd->f(10); // error }
class Derived : public Base //这个符号表示的是继承???!!!
{
public:
void f(char *str);
void f(int x) { Base::f(x); }
};
参数的缺省值
有一些参数的值在每次函数调用时都相同,书写这样的语句会使人厌烦。C++语言采用
参数的缺省值使书写变得简洁(在编译时,缺省值由编译器自动插入)。
参数缺省值的使用规则:
【规则8-3-1 】参数缺省值只能出现在函数的声明中,而不能出现在定义体中。
例如:
void Foo(int x=0, int y=0); // 正确,缺省值出现在函数的声明中
void Foo(int x=0, int y=0) // 错误,缺省值出现在函数的定义体中
{
…
}
为什么会这样?我想是有两个原因:一是函数的实现(定义)本来就与参数是否有缺省
值无关,所以没有必要让缺省值出现在函数的定义体中。二是参数的缺省值可能会改动,
显然修改函数的声明比修改函数的定义要方便。
要注意,使用参数的缺省值并没有赋予函数新的功能,仅仅是使书写变得简洁一些。它
可能会提高函数的易用性,但是也可能会降低函数的可理解性。所以我们只能适当地使
用参数的缺省值,要防止使用不当产生负面效果。示例 8-3-2 中,不合理地使用参数的
缺省值将导致重载函数output产生二义性。
#include <iostream.h> void output( int x); void output( int x, float y=0.0); void output( int x) { cout << " output int " << x << endl ; } void output( int x, float y) { cout << " output int " << x << " and float " << y << endl ; } void main(void) { int x=1; float y=0.5; // output(x); // error! ambiguous call output(x,y); // output int 1 and float 0.5 }
在C++语言中,可以用关键字operator加上运算符来表示函数,叫做运算符重载。
例如两个复数相加函数:
Complex Add(const Complex &a, const Complex &b);
可以用运算符重载来表示:
Complex operator +(const Complex &a, const Complex &b);
运算符与普通函数在调用时的不同之处是:对于普通函数,参数出现在圆括号内;
而对于运算符,参数出现在其左、右侧。例如
Complex a, b, c;
…
c = Add(a, b); // 用普通函数
c = a + b; // 用运算符 +
如果运算符被重载为全局函数,那么只有一个参数的运算符叫做一元运算符,有两
个参数的运算符叫做二元运算符。
如果运算符被重载为类的成员函数,那么一元运算符没有参数,二元运算符只有一
个右侧参数,因为对象自己成了左侧参数。
运算符 规则
所有的一元运算符 建议重载为成员函数
= () [] -> 只能重载为成员函数
+= ,-= ,/= ,*= ,&= ,|= ,~= ,%= ,>>= ,<<= 建议重载为成员函数
所有其它运算符 建议重载为全局函数
(1)不要过分担心自己不会用,它的本质仍然是程序员们熟悉的函数。
(2)不要过分热心地使用,如果它不能使代码变得更加易读易写,那就别用,否则会
自找麻烦。
不能被重载的运算符
在C++运算符集合中,有一些运算符是不允许被重载的。这种限制是出于安全方面的
考虑,可防止错误和混乱。
(1)不能改变C++内部数据类型(如int,float 等)的运算符。
(2)不能重载‘.’,因为‘.’在类中对任何成员都有意义,已经成为标准用法。
(3)不能重载目前C++运算符集合中没有的符号,如#,@,$等。原因有两点,一是难以
理解,二是难以确定优先级。
(4)对已经存在的运算符进行重载时,不能改变优先级规则,否则将引起混乱。
内联函数
让我们看看 C++ 的“函数内联”是如何工作的。对于任何内联函数,编译器在符号表里
放入函数的声明(包括名字、参数类型、返回值类型)。如果编译器没有发现内联函数
存在错误,那么该函数的代码也被放入符号表里。在调用一个内联函数时,编译器首先
检查调用是否正确(进行类型安全检查,或者进行自动类型转换,当然对所有的函数都
一样)。如果正确,内联函数的代码就会直接替换函数调用,于是省去了函数调用的开
销。这个过程与预处理有显著的不同,因为预处理器不能进行类型安全检查,或者进行
自动类型转换。假如内联函数是成员函数,对象的地址(this )会被放在合适的地方,
这也是预处理器办不到的。
C++ 语言的函数内联机制既具备宏代码的效率,又增加了安全性,而且可以自由操作类
的数据成员。所以在C++ 程序中,应该用内联函数取代所有宏代码,“断言assert”
恐怕是唯一的例外。assert 是仅在Debug 版本起作用的宏,它用于检查“不应该”发生
的情况。为了不在程序的Debug 版本和 Release 版本引起差别,assert 不应该产生任何
副作用。如果assert 是函数,由于函数调用会引起内存、代码的变动,那么将导致 Debug
版本与Release 版本存在差异。所以assert不是函数,而是宏。(参见6.5 节“使用
断言”)
内联函数的编程风格
关键字inline必须与函数定义体放在一起才能使函数成为内联,仅将inline放在
函数声明前面不起任何作用。如下风格的函数Foo 不能成为内联函数:
inline void Foo(int x, int y); // inline仅与函数声明放在一起
void Foo(int x, int y)
{
…
}
而如下风格的函数Foo 则成为内联函数:
void Foo(int x, int y);
inline void Foo(int x, int y) // inline与函数定义体放在一起
{
…
}
所以说,inline 是一种“用于实现的关键字”,而不是一种“用于声明的关键字”。
一般地,用户可以阅读函数的声明,但是看不到函数的定义。尽管在大多数教科书中内
联函数的声明、定义体前面都加了 inline关键字,但我认为 inline 不应该出现在函数
的声明中。这个细节虽然不会影响函数的功能,但是体现了高质量C++/C 程序设计风格
的一个基本原则:声明与定义不可混为一谈,用户没有必要、也不应该知道函数是否需
要内联。
定义在类声明之中的成员函数将自动地成为内联函数,例如
class A
{
public:
void Foo(int x, int y) { … } // 自动地成为内联函数
}
将成员函数的定义体放在类声明之中虽然能带来书写上的方便,但不是一种良好的编程
风格,上例应该改成:
// 头文件
class A
{
public:
void Foo(int x, int y);
}
// 定义文件
inline void A::Foo(int x, int y)
{
…
}
内联是以代码膨胀(复制)为代价,仅仅省去了函数调用的开销,从而提高函数的
执行效率。如果执行函数体内代码的时间,相比于函数调用的开销较大,那么效率的收
获会很少。另一方面,每一处内联函数的调用都要复制代码,将使程序的总代码量增大,
消耗更多的内存空间。以下情况不宜使用内联:
(1)如果函数体内的代码比较长,使用内联将导致内存消耗代价较高。
(2)如果函数体内出现循环,那么执行函数体内代码的时间要比函数调用的开销大。
第九章 类的构造函数、析构函数与赋值函数
每个类只有一个析构函数和一个赋值函数,但可以有多个构造函数(包含一个拷
贝构造函数,其它的称为普通构造函数)。对于任意一个类A,如果不想编写上述函数,
C++编译器将自动为A 产生四个缺省的函数,如
A(void); // 缺省的无参数构造函数
A(const A &a); // 缺省的拷贝构造函数
~A(void); // 缺省的析构函数
A & operate =(const A &a); // 缺省的赋值函数
这不禁让人疑惑,既然能自动生成函数,为什么还要程序员编写?
原因如下:
(1)如果使用“缺省的无参数构造函数”和“缺省的析构函数”,等于放弃了自主“初
始化”和“清除”的机会,C++发明人Stroustrup的好心好意白费了。
(2)“缺省的拷贝构造函数”和“缺省的赋值函数”均采用“位拷贝”而非“值拷
贝”的方式来实现,倘若类中含有指针变量,这两个函数注定将出错。
本章以类String的设计与实现为例,深入阐述被很多教科书忽视了的道理。String 的
结构如下:
class String { public: String(const char *str = NULL); // 普通构造函数 String(const String &other); // 拷贝构造函数 ~ String(void); // 析构函数 String & operate =(const String &other); // 赋值函数 private: char *m_data; // 用于保存字符串 };
构造函数有个特殊的初始化方式叫“初始化表达式表”(简称初始化表)。初始
化表位于函数参数表之后,却在函数体 {} 之前。这说明该表里的初始化工作发生在函
数体内的任何代码被执行之前。
构造函数初始化表的使用规则:
如果类存在继承关系,派生类必须在其初始化表里调用基类的构造函数。
例如
class A
{…
A(int x); // A的构造函数
};
class B : public A
{…
B(int x, int y);// B的构造函数
};
B::B(int x, int y)
: A(x) // 在初始化表里调用A 的构造函数
{
…
}
类的 const 常量只能在初始化表里被初始化,因为它不能在函数体内用赋值的方
式来初始化(参见5.4 节)。
u 类的数据成员的初始化可以采用初始化表或函数体内赋值两种方式,这两种方
的效率不完全相同。
非内部数据类型的成员对象应当采用第一种方式初始化,以获取更高的效率。例
如
class A
{…
A(void); // 无参数构造函数
A(const A &other); // 拷贝构造函数
A & operate =( const A &other); // 赋值函数
};
class B
{
public:
B(const A &a); // B的构造函数
private:
A m_a; // 成员对象
};
示例9-2(a) 中,类B 的构造函数在其初始化表里调用了类 A 的拷贝构造函数,从而将成
员对象m_a 初始化。
B::B(const A &a)
: m_a(a)
{
…
}
示例9-2 (b)中,类B 的构造函数在函数体内用赋值的方式将成员对象m_a 初始化。我
们看到的只是一条赋值语句,但实际上 B 的构造函数干了两件事:先暗地里创建 m_a 对
象(调用了A 的无参数构造函数),再调用类A 的赋值函数,将参数a 赋给m_a。
B::B(const A &a)
{
m_a = a;
…
}
对于内部数据类型的数据成员而言,两种初始化方式的效率几乎没有区别,但后者的程
序版式似乎更清晰些。若类F 的声明如下:
class F
{
public:
F(int x, int y); // 构造函数
private:
int m_x, m_y;
int m_i, m_j;
}
示例9-2(c)中F 的构造函数采用了第一种初始化方式,示例9-2(d)中F 的构造函数采
用了第二种初始化方式。
数据成员在初始化表中被初始化
F::F(int x, int y)
: m_x(x), m_y(y)
{
m_i = 0;
m_j = 0;
}
数据成员在函数体内被初始化
F::F(int x, int y)
{
m_x = x;
m_y = y;
m_i = 0;
m_j = 0;
}
构造和析构的次序
构造从类层次的最根处开始,在每一层中,首先调用基类的构造函数,然后调用
成员对象的构造函数。析构则严格按照与构造相反的次序执行,该次序是唯一的,否则
编译器将无法自动执行析构过程。
一个有趣的现象是,成员对象初始化的次序完全不受它们在初始化表中次序的影响,只
由成员对象在类中声明的次序决定。这是因为类的声明是唯一的,而类的构造函数可以
有多个,因此会有多个不同次序的初始化表。如果成员对象按照初始化表的次序进行构
造,这将导致析构函数无法得到唯一的逆序。
示例:类String的构造函数与析构函数
// String的普通构造函数 String::String(const char *str) { if(str==NULL) { m_data = new char[1]; *m_data = ‘\0’; } else { int length = strlen(str); m_data = new char[length+1]; strcpy(m_data, str); } } // String 的析构函数 String::~String(void) { delete [] m_data; // 由于m_data是内部数据类型,也可以写成 delete m_data; }
不要轻视拷贝构造函数与赋值函数
由于并非所有的对象都会使用拷贝构造函数和赋值函数,程序员可能对这两个函
数有些轻视。请先记住以下的警告,在阅读正文时就会多心:
u 本章开头讲过,如果不主动编写拷贝构造函数和赋值函数,编译器将以“位拷
贝”的方式自动生成缺省的函数。倘若类中含有指针变量,那么这两个缺省的函数就隐
含了错误。以类String的两个对象a,b 为例,假设a.m_data的内容为“hello”,
b.m_data的内容为“world”。
现将a 赋给b,缺省赋值函数的“位拷贝”意味着执行b.m_data = a.m_data。这将造
成三个错误:一是b.m_data原有的内存没被释放,造成内存泄露;二是b.m_data和
a.m_data指向同一块内存,a 或b 任何一方变动都会影响另一方;三是在对象被析构时,
m_data被释放了两次。
u 拷贝构造函数和赋值函数非常容易混淆,常导致错写、错用。拷贝构造函数是
在对象被创建时调用的,而赋值函数只能被已经存在了的对象调用。以下程序中,第三
个语句和第四个语句很相似,你分得清楚哪个调用了拷贝构造函数,哪个调用了赋值函
数吗?
String a(“hello”);
String b(“world”);
String c = a; // 调用了拷贝构造函数,最好写成 c(a);
c = b; // 调用了赋值函数
示例:类String的拷贝构造函数与赋值函数
// 拷贝构造函数 String::String(const String &other) { // 允许操作other 的私有成员m_data int length = strlen(other.m_data); m_data = new char[length+1]; strcpy(m_data, other.m_data); } // 赋值函数 String & String::operate =(const String &other) { // (1) 检查自赋值 if(this == &other) //返回调用对象自身 return *this; // (2) 释放原有的内存资源 delete [] m_data; // (3)分配新的内存资源,并复制内容 int length = strlen(other.m_data); m_data = new char[length+1]; strcpy(m_data, other.m_data); // (4)返回本对象的引用 return *this; }
(1)也许有人会说:“即使出现自赋值,我也可以不理睬,大不了化点时间让对象复制自己
而已,反正不会出错!”
他真的说错了。看看第二步的delete ,自杀后还能复制自己吗?所以,如果发现自赋值,
应该马上终止函数。注意不要将检查自赋值的if语句
if(this == &other)
错写成为
if( *this == other)
(2)第二步,用 delete 释放原有的内存资源。如果现在不释放,以后就没机会了,将
造成内存泄露。
(3)第三步,分配新的内存资源,并复制字符串。注意函数strlen 返回的是有效字符
串长度,不包含结束符‘\0’。函数strcpy则连‘\0’一起复制。
(4)第四步,返回本对象的引用,目的是为了实现象 a = b = c 这样的链式表达。注
意不要将 return *this 错写成 return this 。那么能否写成 return other 呢?效果
不是一样吗?
不可以!因为我们不知道参数 other 的生命期。有可能 other 是个临时对象,在赋值结
束后它马上消失,那么return other返回的将是垃圾。
偷懒的办法处理拷贝构造函数与赋值函数
如果我们实在不想编写拷贝构造函数和赋值函数,又不允许别人使用编译器生成
的缺省函数,怎么办?
偷懒的办法是:只需将拷贝构造函数和赋值函数声明为私有函数,不用编写代码。
例如:
class A
{ …
private:
A(const A &a); // 私有的拷贝构造函数
A & operate =(const A &a); // 私有的赋值函数
};
如果有人试图编写如下程序:
A b(a); // 调用了私有的拷贝构造函数
b = a; // 调用了私有的赋值函数
编译器将指出错误,因为外界不可以操作A 的私有函数。
如何在派生类中实现类的基本函数
基类的构造函数、析构函数、赋值函数都不能被派生类继承。如果类之间存在继
承关系,在编写上述基本函数时应注意以下事项:
派生类的构造函数应在其初始化表里调用基类的构造函数。
#include <iostream.h> class Base { public: virtual ~Base() { cout<< "~Base" << endl ; } }; class Derived : public Base { public: virtual ~Derived() { cout<< "~Derived" << endl ; } };
在编写派生类的赋值函数时,注意不要忘记对基类的数据成员重新赋值。例如:
class Base { public: … Base & operate =(const Base &other); // 类Base的赋值函数 private: int m_i, m_j, m_k; }; class Derived : public Base { public: … Derived & operate =(const Derived &other); // 类Derived 的赋值函数 private: int m_x, m_y, m_z; }; Derived & Derived::operate =(const Derived &other) { //(1)检查自赋值 if(this == &other) return *this; //(2)对基类的数据成员重新赋值 Base::operate =(other); // 因为不能直接操作私有数据成员 //(3)对派生类的数据成员赋值 m_x = other.m_x; m_y = other.m_y; m_z = other.m_z; //(4)返回本对象的引用 return *this; }