原文:C++ 惯用法: const 常量和字面量
作者:Breaker <breaker.zy_AT_gmail>
C++ 中 const 关键字、常量和字面量的惯用法
关键字:const, enum, const_cast, const_iterator, mutable, 左值, 字面量
字面量 (literal),是指在 C++ 中直接书写的数字、字符和字符串,如 0x3f, '+', 1.23e-15L, "hello", L"world",具体语法参考 [CPP_LANG] 4.3.1 字符 4.4.1 整数 4.5.1 浮点数 5.2.2 字符串
左值 (l-value),是指想尽办法可以让其放到 = 左面的对象,这里的 = 是赋值而不是初始化,这里的对象可以是类类型和基本类型。想尽办法主要指强制转换和指针地址操作
本质上的常量,指非左值,字面量、enum 枚举值是非左值
是否能通过强制而修改,由编译优化和运行平台决定,这是 Win7 VC 2010 的情况:
static 数字字面量 const | 不可修改 |
non-static local 数字字面量 const | 可修改 |
non-static local const char[] | 可修改 |
static const char[] | 不可修改 |
const char* 字符串字面量 | 不可修改 |
这些通过强制而修改字面量 const 变量的代码很难移植,并且不是正常的逻辑,所以认为字面量 const 变量是本质上的常量是合理的
参考 [CPP_LANG] 5.5 引用
和字面量的 const 变量不同,字面量的 const T& 会引用一个临时变量
类类型也是如此,并且 const T& 的初始值可以不是类型 T 的,会自动隐式转换,而这一点对于 non-const T& 不成立的,如:
非本质的常量比本质的常量更容易理解和确定,通常是函数的 const 参数接受的 non-const 初始化,如:
非本质的常量的目的,是在一定执行区间内约束代码(不保证区间外是否 const),产生试图修改 const 的编译错误
本质上的常量,可以在编译期求值,它们或化为指令立即数,或保存在目标文件 (.obj) 和可执行文件 (.exe/.dll) 的特殊位置,如 .rdata 区段
也因在编译期求值,本质上的常量可以作为非类型模板参数,只需注意指针类型模板参数只接受外部链接对象的地址,而字符串字面量是内部链接的,这时用外部链接的字符数组代替即可
非本质的常量,在运行时求值
有一些在运行时求值的非平凡情况,评估它们的常量本质性:
左值一定分配存储,因此可以取其地址
本质的常量(非左值)不一定分配存储,是否分配由具体情况、编译优化和运行平台决定,参考 [CPP_LANG] 5.4 常量
enum 不分配存储
字面量的 const 变量,如果不引用其地址,如创建指向它的指针或引用,则也不需要分配存储,但具体视编译优化而定
类的 static 整数 const,如果不引用其地址,则可以只用声明式而不用定义式,此时不需要分配存储;如果引用其地址,则需要定义式,并且分配存储
const 关键字的横向对比物是 volatile,对比两者可以更明白本质
和编译优化相关
volatile 是防止变量访问被激进优化的修饰字,volatile 变量的每次读写都会产生实际的内存访问指令,以防止因编译期不可知的因素(如并发线程的共享变量访问)而优化去除 volatile 变量的内存访问(如访问寄存器中的旧值)
本质 const 可能被优化存储,如存储到 ROM 中
优化一定和具体编译器与平台有关,这里 C++ 是定义一种适当的目的描述,而非实现细节,如 VC 2005+ 的 volatile 变量读写带有 Acquire/Release 语义以防止编译期指令 reorder,但仅在 IA64 上保证相同的运行时模型,x86 x64 上仍允许运行时 CPU reorder
本质 const 的存储也是平台相关的,所以上面表格中的 const_cast 很难移植
非本质的 const 和 volatile
非本质的 volatile 此称谓并不适当,权作和 const 对比,通常是函数的 volatile 参数接受的 non-volatile 初始化,如 InterlockedExchange(volatile LONG*, LONG) 中,它的目的和 const 参数相似,是在一定执行区间内约束代码(不保证区间外是否 volatile),防止那里的激进优化
用 const_cast 强制去除 const, volatile 修饰字
const_cast 只能去除非本质 const 的 const 修饰
指向 const/volatile 的指针和 const/volatile 指针,参考 MSDN: const and volatile Pointers
一些 STL 容器如 vector 有 iterator 和 const_iterator 两种迭代器
vector<T>::const_iterator 是 const T*
const vector<T>::iterator 是 T* const
参考 [CPP_LANG] 10.2.7.1, 10.2.7.2 mutable
有时我们需要在 const 方法里修改对象的状态(成员变量),这时需要用 mutable 修饰那个被修改的成员变量
典型的惯用法:返回对象状态时,先检查其 cache 值,如果需要更新,则修改其值,如:
从 Widget 用户的角度看,Widget::area() 是具有 const 逻辑的
一些 STL 容器如 vector 有同一个 operator 的 const 和 non-const 两个版本,如 vector<T> 实例化后有两个 operator[]:
第一个 operator[] 可用来充当左值(准确的说是可变左值 modifiable l-value),因为所有的左值都是右值,所有它也可充当右值(注意 右值和非左值的区别)
那第二个版本 const 版本的 operator[] 岂不是多余
其实它和非本质 const 配合,用来约束代码,逻辑很合理:如果 vector<T> 是 const,那么每个元素都应该是 const,反之,假如元素能修改,就称不上是 const vector<T>,如:
分清两个位置 const 的作用:
作用 1, 返回值 const T&: 产生约束保护
作用 2, const 方法 (const* this): 产生重载规则,C++ 不能仅通过返回不同类型重载函数
也可以理解为,同一方法概念的两个版本:
non-const 版: set 式方法
const 版: get 式方法
虽然区分同一方法概念的两个版本,但大多数时候,const 和 non-const 版本的内部操作相同,仅在传入参数和返回值类型上不同
为了简化重复代码,可利用 static_cast/const_cast 将 non-const 方法转接到 const 方法,如 vector<T> 的 non-const operator 可如下转接:
反向的,将 const 转接到 non-const 上会违背 const 承诺,不要那么做
[CPP_LANG] 《C++ 程序设计语言》特别版, Bjarne Stroustrup
[EFF_CPP] "Effective C++", 3Ed, Scott Meyers, 条款 02, 03