C++中的四种转换,是一个老生常谈的话题。但是对于初学者来说,该如何选择哪种转换方式仍然会有点困惑。而且我总是觉得“纸上得来终觉浅”,于是便“绝知此事要躬行”。于是利用闲暇时光,整理一下reinterpret_cast、const_cast、static_cast和dynamic_cast这四种强制转换的相关知识。(转载请指明出于breaksoftware的csdn博客)
一般来说,我们需要类型转换的场景可以分为如下几种:
在测试如上场景时,我们往往会遇到阻碍。这种阻碍来源于两个方面:
为了更好讨论如上场景,我们先预备一些辅助结构。
class Parent { public: Parent() {m_strPointerFrom = "Parent Pointer";}; public: void print() {printf("%s From Parent Func\n", m_strPointerFrom.c_str());}; virtual void printv() {printf("%s From Parent Virutal Func\n", m_strPointerFrom.c_str());}; protected: std::string m_strPointerFrom; }; //#define USEERROR class Child : public Parent { #ifndef USEERROR public: Child() {m_strPointerFrom = "Child Pointer";}; public: void print() {printf("%s From Child Func.\n", m_strPointerFrom.c_str());}; virtual void printv() override {printf("%s From Child Virutal Func.\n", m_strPointerFrom.c_str());}; #else public: Child() {m_strPointerFrom = "Child Pointer"; m_strOnlyChild = "OnlyInChild";}; public: void print() {printf("%s From Child Func. %s\n", m_strPointerFrom.c_str(), m_strOnlyChild.c_str());}; virtual void printv() override {printf("%s From Child Virutal Func. %s\n", m_strPointerFrom.c_str(), m_strOnlyChild.c_str());}; private: std::string m_strOnlyChild; #endif }; class Temp{};
Temp类是一个无继承关系的原始类。
Child类继承于Parent类。
Child类中print函数隐藏了Parent类中定义的print函数的实现。
Child类也实现了Parent类中的虚方法printv。
为了区分Parent和Child类的对象,我们设计了一个变量——m_strPointerFrom。这两个类的所有方法都将这个变量打印出来,以帮助我们在之后的测试中标识其来源。
我们使用预定义控制了Child类的实现。我们可以先关注没有定义USEERROR这个宏的版本。另外一个版本我们将在后面介绍其设计意图。
如果是编译期间出错,我将在给出的代码示例中,使用注释方法使该代码行失效。如果是运行期间出错,我们将任由之存在,但是会在最后点出其出错的地方。所以看本博文切不可“断章取义”。在引入C++四种转换之前,我们先看下最常见的一种转换——类C语言方式的转换。
类c类型的强制转换是我们最常见的一种转换,比如:
int a = 0; double b = (double)a;
我们列出这种方式,是为了让其和我们即将讨论的四种C++强制转换进行对比。根据之前设计的方案,我们列出如下代码:
void c_like_cast_test() { { Parent* pParent = new (std::nothrow) Parent(); if (!pParent) { return; } int a = (int)(pParent); // 指针向整型转换 Parent* pParent1 = (Parent*)(a);// 整型向指针转换 double b = (double)(a); // 整型向浮点型转换 int a1 = (int)b; // 浮点型向整型转换 void* pv = (void*)pParent; // 指针向无类型指针转换 Parent* pParent2 = (Parent*)pv; // 无类型指针向指针转换 Temp* pTemp = (Temp*)pParent; // 无关系类型指针相互转换 Parent* pParent3 = (Parent*)pTemp;// 无关系类型指针相互转换 ETYPE e = (ETYPE)a; // 整型向枚举转换 int a2 = (int)e; // 枚举向整型转换 int a3 = reinterpret_cast<int>(pv); // 无类型指针转整型 Temp* pTemp1 = reinterpret_cast<Temp*>(pv); // 无类型指针转其他指针 delete pParent;}可以见得类C的转换对如上四种相互转换并不存在编译问题。至于是否存在运行时问题,就要看我们对数据的预期和对相关指针的使用了。
我们再看存在父子关系的指针的转换及不同长度类型数据转换的例子:
{ // A Parent* pParent = new (std::nothrow) Parent(); if (!pParent) { return; } pParent->print(); pParent->printv(); Child* pChild = (Child*)(pParent); pChild->print(); pChild->printv(); delete pParent; } { //B Child* pChild = new (std::nothrow) Child(); if (!pChild) { return; } pChild->print(); pChild->printv(); Parent* pParent = (Parent*)(pChild); pParent->print(); pParent->printv(); delete pChild; } { Child* pChild = new (std::nothrow) Child(); if (!pChild) { return; } Temp* pTemp = (Temp*)pChild; delete pChild; } { intptr_t p = 0xF000000000000001; Parent* pP = (Parent*)(p); printf("0x%x\n", pP); } }从这段代码可以看出,我们没有将任何一行有效代码注释掉。这个说明如上的写法也不会导致编译期间出现问题——但是这并不意味着这样的代码就是正确的——父子指针转换可能会导致运行期出错。这个问题我们会在之后讨论。我们先看下执行的结果。
上图中A、B区域和代码中的A、B区域相对照。由上面可以得出如下结论:
说到这个问题,可能就要扯一点C++对象的内存模型。这儿我并不详细介绍其模型,只是想引出几个原理:
如果能正确理解如上两点,则上例中的结果便可以得到理解了。
再回到类型转换上来。可以说类C的强制转换的能力是非常强大的,使用这种方法就意味着“通吃”。这也是大家非常喜欢使用它的一个原因。为什么它这么强大,我们看下汇编,以其中几段为例:
Parent* pParent = (Parent*)(pChild); 01077A5D mov eax,dword ptr [pChild] 01077A60 mov dword ptr [pParent],eax
int a = (int)(pParent); // 指针向int型转换 01077896 mov eax,dword ptr [pParent] 01077899 mov dword ptr [a],eax由上可见,它只是简单的二进制拷贝的过程。所以这种简单的实现,使之有强大的功能。但是也是这种简单的设计,使之使用也存在隐患,这个我们会在之后讨论。
reinterpret_cast是四种C++强制转换中和类C强制转换最接近的了。我们看一段来自cplusplus网站上对该转换的说明:
/* reinterpret_cast converts any pointer type to any other pointer type, even of unrelated classes. The operation result is a simple binary copy of the value from one pointer to the other. All pointer conversions are allowed: neither the content pointed nor the pointer type itself is checked. It can also cast pointers to or from integer types. The format in which this integer value represents a pointer is platform-specific. The only guarantee is that a pointer cast to an integer type large enough to fully contain it (such as intptr_t), is guaranteed to be able to be cast back to a valid pointer. reinterpret可用于任何指针向任何指针的转换。它只是简单的进行二进制拷贝。 它还可以用于将指针类型和整型类型相互转换(注意整型类型和指针类型的长度不一致)。 它不进行类型检查。 */从这段说明来看,其和类C转换没什么区别。但是我们的实验代码将证明它们还是存在不同之处的。
void reinterpret_cast_test() { { Parent* pParent = new (std::nothrow) Parent(); if (!pParent) { return; } int a = reinterpret_cast<int>(pParent); // 指针向整型转换 Parent* pParent1 = reinterpret_cast<Parent*>(a); // 整型向指针转换 // double b = reinterpret_cast<double>(a); // 整型向浮点型转换 // int a1 = reinterpret_cast<int>(b); // 浮点型向整型转换 void* pv = reinterpret_cast<void*>(pParent); // 指针向无类型指针转换 Parent* pParent2 = reinterpret_cast<Parent*>(pv); // 无类型指针向指针转换 Temp* pTemp = reinterpret_cast<Temp*>(pParent); // 无关系类型指针相互转换 Parent* pParent3 = reinterpret_cast<Parent*>(pTemp);// 无关系类型指针相互转换 // ETYPE e = reinterpret_cast<ETYPE>(a); // 整型向枚举转换 // int a2 = reinterpret_cast<int>(e); // 枚举向整型转换 int a1 = reinterpret_cast<int>(pv); // 无类型指针转整型 Temp* pTemp1 = reinterpret_cast<Temp*>(pv); // 无类型指针转其他指针 delete pParent; }上述代码中,我们一共注释了4行。这四行是会在编译时出错的。所以我们可以见得reinterpret_cast不可用于浮点和整型之间的转换。也不可以用于枚举和整型的转换。但是可以发现,它还是很强大的的——因为它也是简单的二进制转换:
Temp* pTemp = reinterpret_cast<Temp*>(pParent); // 无关系类型指针相互转换 013021DE mov eax,dword ptr [pParent] 013021E1 mov dword ptr [pTemp],eax Parent* pParent3 = reinterpret_cast<Parent*>(pTemp);// 无关系类型指针相互转换 013021E4 mov eax,dword ptr [pTemp] 013021E7 mov dword ptr [pParent3],eax其它父子类指针的代码及长度不一致的转换就不贴出代码了,这些代码和类C强制转换差不多,只是将转换方式改了下。
由上我们可以总结出:reinterpret_cast转换是在类C转换的基础上,在编译期间
那么C++中有没有提供整型、浮点和枚举类型的相互转换方法呢?有的!见static_cast。
static_cast也是使用非常多的一种强制转换。我们看一段来自cplusplus网站上对该转换的说明:
/* static_cast can perform conversions between pointers to related classes, not only upcasts (from pointer-to-derived to pointer-to-base), but also downcasts (from pointer-to-base to pointer-to-derived). No checks are performed during runtime to guarantee that the object being converted is in fact a full object of the destination type. Therefore, it is up to the programmer to ensure that the conversion is safe. On the other side, it does not incur the overhead of the type-safety checks of dynamic_cast. 它用于在存在继承关系的类指针之间转换。可以从派生类指针转为基类指针,也可以从基类指针转为派生类指针。 static_cast is also able to perform all conversions allowed implicitly (not only those with pointers to classes), and is also able to perform the opposite of these. It can: Convert from void* to any pointer type. In this case, it guarantees that if the void* value was obtained by converting from that same pointer type, the resulting pointer value is the same. Convert integers, floating-point values and enum types to enum types. 它可以将void*型向任意指针类型转换。还可以在整型、浮点型和枚举型将相互转换。 */看了这个说明,似乎static_cast可以实现类C转换的所有场景了。但是实际不然
void static_cast_test() { { Parent* pParent = new (std::nothrow) Parent(); if (!pParent) { return; } // int a = static_cast<int>(pParent); // 指针向整型转换 // Parent* pParent1 = static_cast<Parent*>(a); // 整型向指针转换 int a = 1; double b = static_cast<double>(a); // 整型向浮点型转换 int a1 = static_cast<int>(b); // 浮点型向整型转换 void* pv = static_cast<void*>(pParent); // 指针向无类型指针转换 Parent* pParent2 = static_cast<Parent*>(pv); // 无类型指针向指针转换 // Temp* pTemp = static_cast<Temp*>(pParent); // 无关系类型指针相互转换 // Parent* pParent3 = static_cast<Parent*>(pTemp); // 无关系类型指针相互转换 ETYPE e = static_cast<ETYPE>(a); // 整型向枚举转换 int a2 = static_cast<int>(e); // 枚举向整型转换 // int a3 = static_cast<int>(pv); // 无类型指针转整型 Temp* pTemp = static_cast<Temp*>(pv); // 无类型指针转其他指针 delete pParent; }
可以见得static_cast
其他继承关系类指针相互转换也不列出了。其代码同类C相似,只是修改了操作方式。而且static_cast在汇编级的代码和类C强制转换是一致的。
double b = (double)(a); // 整型向浮点型转换 01291872 fild dword ptr [a] 01291875 fstp qword ptr [b] int a1 = (int)b; // 浮点型向整型转换 01291878 fld qword ptr [b] 0129187B call @ILT+420(__ftol2_sse) (12911A9h) 01291880 mov dword ptr [a1],eax void* pv = (void*)pParent; // 指针向无符号指针转换 01291883 mov eax,dword ptr [pParent] 01291886 mov dword ptr [pv],eax Parent* pParent2 = (Parent*)pv; // 无符号指针向指针转换 01291889 mov eax,dword ptr [pv] 0129188C mov dword ptr [pParent2],eax上面代码是类C的强制转换,下面的是static_cast的。我将整型和浮点相互转换的反汇编代码也提了出来,可以见得也是一样的。
double b = static_cast<double>(a); // 整型向浮点型转换 012928CD fild dword ptr [a] 012928D0 fstp qword ptr [b] int a1 = static_cast<int>(b); // 浮点型向整型转换 012928D3 fld qword ptr [b] 012928D6 call @ILT+420(__ftol2_sse) (12911A9h) 012928DB mov dword ptr [a1],eax void* pv = static_cast<void*>(pParent); // 指针向无符号指针转换 012928DE mov eax,dword ptr [pParent] 012928E1 mov dword ptr [pv],eax Parent* pParent2 = static_cast<Parent*>(pv); // 无符号指针向指针转换 012928E4 mov eax,dword ptr [pv] 012928E7 mov dword ptr [pParent2],eax
说完上述两种转换,我们可以发现:在reinterpret_cast上,没有任何面向对象的痕迹。而static_cast出现了对继承的关系的约束。之后我们将介绍C++特性更强的转换——dynamic_cast。
在讨论dynamic_cast之前,我们要先回到最前面定义的两个辅助类——Parent和Child上。之前为了保证这两个类指针在相互转换后,调用相关函数不会出现运行时错误,我们没有定义USEERROR宏。现在我们要开启USERROR宏,使得Child类比Parent类多一个成员变量——m_strOnlyChild。并在Child类重写函数print和继承的虚函数printv中使用到该变量。于是我们之前的类C强制转换、reinterpret_cast和static_cast对父子类指针转换后函数调用,将出现运行时出错。我们以static_cast为例:
{ Parent* pParent = new (std::nothrow) Parent(); if (!pParent) { return; } pParent->print(); pParent->printv(); Child* pChild = static_cast<Child*>(pParent); pChild->print(); pChild->printv(); delete pParent; }代码运行到pChild->print()时将出错。根据我们之前介绍的C++对象模型的知识,我们可以知道pChild指针仍然指向的是一个Parent对象。因为print是被隐藏函数,其左侧指针pChild是Child*型,所以编译器会将调用指向Child的print函数入口。而Child的print函数需要的成员变量m_strOnlyChild只在Child对象中存在,而不在Parent对象内存空间中。所以运行时会报非法地址访问之类的错误。
在知道之前我们父类对象向子类指针转换的过程存在如此不安全的行为时,我们就要介绍dynamic_cast了。它有着很强烈的C++特性。我们先看下说明:
/* dynamic_cast can only be used with pointers and references to classes (or with void*). Its purpose is to ensure that the result of the type conversion points to a valid complete object of the destination pointer type. This naturally includes pointer upcast (converting from pointer-to-derived to pointer-to-base), in the same way as allowed as an implicit conversion. But dynamic_cast can also downcast (convert from pointer-to-base to pointer-to-derived) polymorphic classes (those with virtual members) if -and only if- the pointed object is a valid complete object of the target type. dynamic_cast can also perform the other implicit casts allowed on pointers: casting null pointers between pointers types (even between unrelated classes), and casting any pointer of any type to a void* pointer. dynamic_cast只可以用于指针之间的转换,它还可以将任何类型指针转为无类型指针,甚至可以在两个无关系的类指针之间转换。 */由上可以知道,dynamic_cast在编译层约束了非指针类型的转换。于是我们的测试代码中很多被注释掉
class TmpBase{ public: virtual void fun(){};}; class TmpDerived : public TmpBase{public: virtual void fun() override {};}; void dynamic_cast_test() { { Parent* pParent = new (std::nothrow) Parent(); if (!pParent) { return; } // int a = dynamic_cast<int>(pParent); // 指针向整型转换 // Parent* pParent1 = dynamic_cast<Parent*>(a); // 整型向指针转换 // double b = dynamic_cast<double>(a); // 整型向浮点型转换 // int a1 = dynamic_cast<int>(b); // 浮点型向整型转换 void* pv = dynamic_cast<void*>(pParent); // 指针向无符号指针转换 // Parent* pParent2 = dynamic_cast<Parent*>(pv); // 无符号指针向指针转换 Temp* pTemp = dynamic_cast<Temp*>(pParent); // 无关系类型指针相互转换 // Parent* pParent3 = dynamic_cast<Parent*>(pTemp);// 无关系类型指针相互转换 // ETYPE e = dynamic_cast<ETYPE>(a); // 整型向枚举转换 // int a2 = dynamic_cast<int>(e); // 枚举向整型转换 // int a2 = dynamic_cast<int>(pv); // 无符号指针转整型 // Temp* pTemp1 = dynamic_cast<Temp*>(pv); // 无符号指针转其他指针 TmpDerived* pTmp2 = dynamic_cast<TmpDerived*>(pParent); Child* pChild1 = dynamic_cast<Child*>(pTmp2); delete pParent; }这段代码最有意思的是后面的两个转换
TmpDerived* pTmp2 = dynamic_cast<TmpDerived*>(pParent); Child* pChild1 = dynamic_cast<Child*>(pTmp2);dynamic_cast将两个无关系的类指针进行了转换,而且没有出现编译错误。我们看到TmpDerived类继承于TmpBase类,且TmpBase类中存在虚函数。这样设计的原因,是为了保证dynamic_cast操作的指针是具有多态特性。否则编译器会报错。我们看下其汇编便可知
TmpDerived* pTmp2 = dynamic_cast<TmpDerived*>(pParent); 00D52D16 push 0 00D52D18 push offset TmpDerived `RTTI Type Descriptor' (0D5E034h) 00D52D1D push offset Parent `RTTI Type Descriptor' (0D5E000h) 00D52D22 push 0 00D52D24 mov eax,dword ptr [pParent] 00D52D27 push eax 00D52D28 call @ILT+885(___RTDynamicCast) (0D5137Ah) 00D52D2D add esp,14h 00D52D30 mov dword ptr [pTmp2],eaxdynamic_cast在底层并不像之前的介绍的几种转换方法使用简单的内存拷贝,而是使用了RTTI技术,所以它要求操作的指针是多态的。因为上例中两个类不存在继承关系,所以每个转换操作都是失败的——返回Null。这样的特性就要求我们在使用dynamic_cast时,需要对返回结果判空,否则就会出现空指针问题。而带来的好处是,我们将避免之前遇到的运行时出错的场景——这个场景排查起来相对困难些。
我们看段使用dynamic_cast规避掉运行时出错的代码
{ Parent* pParent = new (std::nothrow) Parent(); if (!pParent) { return; } pParent->print(); pParent->printv(); Child* pChild = dynamic_cast<Child*>(pParent); if (pChild) { // Bad pChild->print(); pChild->printv(); } else { printf("dynamic_cast error\n"); // Hit } try { Child& c = dynamic_cast<Child&>(*pParent); // Bad } catch (std::bad_cast& e) { printf("dynamic_cast error : %s\n", e.what()); // Hit } delete pParent; }根据之前介绍的知识,可以得知我们创建的是Parent对象。因为将Parent对象转换为Child指针存在潜在的安全问题。dynamic_cast将会对这次操作返回Null。以保证我们代码的运行安全性。这儿有个需要指出的是,如果我们使用dynamic_cast转换成一个引用对象,如果出错,将是抛出异常。如果不做异常捕获,将导致我们程序崩溃。
下面两段代码是安全的
{ Child* pChild = new (std::nothrow) Child(); if (!pChild) { return; } pChild->print(); pChild->printv(); Parent* pParent = dynamic_cast<Parent*>(pChild); if (pParent) { // Well pParent->print(); pParent->printv(); } else { printf("dynamic_cast error\n"); } try { Parent& p = dynamic_cast<Parent&>(*pChild); // Well p.print(); p.printv(); } catch (std::bad_cast& e) { printf("dynamic_cast error : %s\n", e.what()); // No Hit } delete pChild; } { Parent* pChild = new (std::nothrow) Child(); if (!pChild) { return; } pChild->print(); pChild->printv(); Parent* pParent = dynamic_cast<Parent*>(pChild); if (pParent) { // Well pParent->print(); pParent->printv(); } else { printf("dynamic_cast error\n"); } try { Parent& p = dynamic_cast<Parent&>(*pChild); // Well p.print(); p.printv(); } catch (std::bad_cast& e) { printf("dynamic_cast error : %s\n", e.what()); // No Hit } delete pChild; } }一般来说,因为RTTI技术作用于运行时,所以其会产生运行时的代价。所以很多人建议,如果在能明确转换安全的场景下,不要使用dynamic_cast方法进行转换,而是使用static_cast,以免进行一些不必要的运行时计算。
void printf_without_const(char* pbuffer){ if (!pbuffer || 0 == strlen(pbuffer)) { return; } *(pbuffer) = '$'; // can modify printf(pbuffer); }; void const_cast_test() { { const char* pbuffer = "const_cast_test"; char szbuf[64] = {0}; strncat(szbuf, pbuffer, strlen(pbuffer)); const char* psz = const_cast<const char*>(szbuf); //printf_without_const(psz); // error char* p = const_cast<char*>(psz); printf_without_const(p); } }总结一下:
参考文献:http://www.cplusplus.com/doc/tutorial/typecasting/