本节中所有情况与代码与解释都是VS2019的x86环境下进行的。其它编译环境下,可能会有一些些底层实现的小细节不一样。
多态按字面的意思就是多种形态,当类之间存在层次结构,并且类之间是通过继承关联时,就会用到多态。
具体点就是去完成某个行为,当不同的对象去完成时会产生出不同的状态。
C++ 多态意味着调用成员函数时,会根据调用函数的对象的类型来执行不同的函数。
举个栗子:比如买票这个行为,当普通人买票时,是全价买票;学生买票时,是半价买票;军人买票时,是优先买票。
再举个栗子: 最近为了争夺在线支付市场,支付宝年底经常会做诱人的扫红包-支付-给奖励金的活动。那么大家想想为什么有人扫的红包很大有8块、10块…,而有人扫的红包都是1毛,5毛…。其实这背后也是一个多态行为。支付宝首先会分析你的账户数据和用户行为等等,比如你是新用户、比如你没有经常支付宝支付等等,那么你需要被鼓励使用支付宝,那么就你扫码金额 = random()%99;比如你经常使用支付宝支付或者支付宝账户中常年没钱,那么就不需要太鼓励你去使用支付宝,那么就你扫码金额 = random()%1;总结一下:同样是扫码动作,不同的用户扫得到的不一样的红包,这也是一种多态行为。
还有就是花呗借呗每个人的额度不一样,也是分析每个人的账户数据、消费流水、消费频率等等,为不同的用户生成不同的额度。
ps:上述例子仅供娱乐。
多态是在继承关系中不同的类对象,去调用同一函数,产生了不同的行为。
比如 Student 继承了 Person。Person 对象买票全价,Student 对象买票半价。
在继承中要构成多态有两个条件缺一不可:
满足上述条件后,基类的指针指向基类对象则调用基类的虚函数,指向派生类对象则调用派生类的虚函数。
虚函数:被 virtual 关键字修饰的==类成员函数==称为虚函数。
虚函数重写(覆盖)的条件:
虚函数重写(覆盖)的两个例外:
派生类重写基类虚函数时,与基类虚函数返回值类型不同。即返回值必须为父子类类型的指针或引用时,称为协变。(了解一下,见得少)
// A和B为父子类
class A {};
class B : public A {};
class Person {
public:
virtual A* BuyTicket() // 返回值为父类(A)的指针
{
cout << "普通人 - 全价买票" << endl;
return new A;
}
};
class Student : public Person {
public:
virtual B* BuyTicket() // 返回值为子类(B)的指针
{
cout << "学生 - 半价买票" << endl;
return new B;
}
};
void Func(Person* ptr) {
// 多态 -- ptr指向基类对象则调用基类的虚函数,指向派生类对象则调用派生类的虚函数
ptr->BuyTicket();
}
int main() {
Person per;
Func(&per);
Student stu;
Func(&stu);
return 0;
}
析构函数的重写(基类与派生类析构函数名不同)
如果基类的析构函数为虚函数,此时派生类析构函数只要定义,无论是否加 virtual 关键字,都与基类的析构函数构成重写。虽然基类与派生类析构函数名字不同,看起来违背了重写的规则,其实不然,这里可以理解为编译器对析构函数的名称做了特殊处理,编译后析构函数的名称统一处理成了 destructor。
举个栗子,==在new对象特殊场景==下:
class Person {
public:
virtual ~Person() { cout << "~Person()" << endl; }
};
class Student : public Person {
public:
virtual ~Student() { cout << "~Student()" << endl; }
};
// 基类和派生类的析构函数不是虚函数,它们是隐藏关系
// 基类和派生类的析构函数是虚函数,它们是重写关系
int main()
{
// 普通场景下,虚函数是否重写都是ok的
Person p;
Student s;
// new对象特殊场景
// 只有派生类Student的析构函数重写了Person的析构函数,
// 下面的delete对象调用析构函数,才能构成多态,才能保证p1和p2指向的对象正确的调用析构函数。
Person* p1 = new Person;
Person* p2 = new Student;
delete p1; // p1->destructor + operator delete(p1)
delete p2; // p2->destructor + operator delete(p2)
return 0;
}
派生类中重写基类的虚函数可以不加 virtual 关键字(因为基类的虚函数被继承下来了在派生类依旧保持虚函数属性),但是该种写法不是很规范,所以建议加上。
有些书籍会把多态进行更细的划分:
C++针对继承和多态新增的两个关键字:final 和 override
从上面可以看出,C++对函数重写的要求比较严格,但是有些情况下由于疏忽,可能会导致函数名字母次序写反而无法构成重载,而这种错误在编译期间是不会报出的,只有在程序运行时没有得到预期结果时才来 debug 会得不偿失,因此:C++11提供了 final 和 override 两个关键字,可以帮助用户检测是否重写。
final:修饰虚函数,表示该虚函数不能再被重写。
// 基类
class Car
{
public:
// final修饰基类虚函数
virtual void Drive() final
{}
};
// 派生类
class Benz :public Car
{
public:
// 无法重写基类中被 “final” 修饰的虚函数
virtual void Drive() { cout << "Benz-舒适" << endl; }
};
【拓展思考】如何设计出一个不能被继承的类呢?
C++98的玩法是把基类构造函数设置成 private,但可以继承,只有你定义基类 / 派生类对象时才会报错!
而C++11有了新的玩法,用 final 修饰类,这样的类就不能被继承了,若被继承会直接报错!
class A final // final修饰类,这种方式简单明了
{};
class B : public A // error:不能将“final”类类型用作基类
{};
override:检查派生类虚函数是否重写了基类某个虚函数,如果没有重写则编译报错。
class Car // 基类
{
public:
virtual void Drive()
{}
};
class Benz : public Car // 派生类
{
public:
// override 检查派生类虚函数是否重写了基类某个虚函数
virtual void Drive() override
{
cout << "Benz-舒适" << endl;
}
};
在虚函数的后面写上 = 0 ,则这个函数为纯虚函数。包含纯虚函数的类叫做抽象类(也叫接口类),抽象类不能实例化出对象。派生类继承后也不能实例化出对象,只有重写纯虚函数,派生类才能实例化出对象。
纯虚函数规范了派生类必须重写,另外纯虚函数更体现出了接口继承。
// 基类 - 抽象类 - 不能实例化出对象
class Car
{
public:
virtual void Drive() = 0; // 纯虚函数,不需要实现它
};
// 派生类
class Benz :public Car
{
public:
virtual void Drive() // 必须重写基类虚函数,派生类才能实例化出对象
{
cout << "Benz-舒适" << endl;
}
};
int main()
{
// 基类是抽象类,不能实例化出对象,但可以定义基类指针,用来实现多态
Car* pBenz = new Benz;
pBenz->Drive();
return 0;
}
普通函数的继承是一种实现继承,派生类继承了基类函数,可以使用该函数,继承的是函数的实现。
虚函数的继承是一种接口继承,派生类继承的是基类虚函数的接口(声明),目的是为了重写函数的实现,达成多态,继承的是接口。所以如果不实现多态,不要把函数定义成虚函数。(可以先这样理解下:派生类中重写基类的虚函数可以不加 virtual 关键字,因为基类的虚函数的接口(声明)被继承下来了,在派生类依旧保持虚函数属性。)
// 这里常考一道笔试题:请问 sizeof(Base) 是多少(VS2019 x86)?
class Base
{
public:
virtual void Func1() { cout << "Base::Func1()" << endl; }
private:
int _b = 1;
};
int main()
{
cout << sizeof(Base) << endl;
return 0;
}
通过观察测试我们发现Base类的对象是 8 bytes,除了_b 成员,还多一个 __vfptr 放在对象的前面(注意有些平台可能会放到对象的最后面,这个跟平台有关),对象中的这个指针我们叫做虚函数表指针(v代表virtual,f代表function)。一个含有虚函数的类中都至少都有一个虚函数表指针,虚函数的地址被放在虚函数表中,虚函数表也简称虚表。那么派生类中这个表放了些什么呢?我们接着往下分析:
对上面代码进行改造:
// 1.Base再增加一个虚函数Func2和一个普通函数Func3
// 2.我们增加一个派生类Derive去继承Base
// 3.在Derive中重写Func1
class Base // 基类
{
public:
virtual void Func1()
{
cout << "Base::Func1()" << endl;
}
virtual void Func2()
{
cout << "Base::Func2()" << endl;
}
void Func3()
{
cout << "Base::Func3()" << endl;
}
private:
int _b = 1;
};
class Derive : public Base // 派生类
{
public:
virtual void Func1() // 重写基类虚函数Func1()
{
cout << "Derive::Func1()" << endl;
}
private:
int _d = 2;
};
int main()
{
Base b;
Derive d;
return 0;
}
Base 类对象模型:
Base 类对象和 Derive 类对象内存模型:
通过观察和测试,我们发现了以下几点问题:
虚函数表创建的时机是在编译期间。
编译期间编译器就为「每个有虚函数的类」确定好了「对应的虚函数表」里的内容。
虚函数表指针 __vfptr
创建的时机:在构造函数中的初始化列表位置,这里才是真正的初始化,这个时候才会生成虚表指针,并把虚函数表的首地址赋给虚表指针。
__vfptr
跟着对象走,所以对象什么时候创建出来,__vfptr
就什么时候创建出来,也就是运行的时候。程序在编译期间时,编译器会为构造函数中增加为
__vfptr
赋值的代码(这个是编译器的行为)。当程序在运行时,遇到创建对象的代码,执行对象的构造函数,那么这个构造函数里有为这个对象的
__vfptr
赋值的语句。
所以在程序运行时,编译器会把虚函数表的首地址赋值给虚函数表指针,这个虚函数表指针就有值了。
派生类对象 d 中也有一个虚表指针 __vfptr,d 对象由两部分构成,一部分是基类继承下来的成员,虚表指针也就是存在这部分的,另一部分是自己的成员。
基类 b 对象和派生类 d 对象虚表是不一样的,这里我们发现基类虚函数 Func1 在派生类中完成了重写,所以 d 的虚表中存的是重写的 Derive::Func1,所以虚函数的重写也叫作覆盖,覆盖就是指虚表中虚函数的覆盖。重写是语法的叫法,覆盖是原理层的叫法。
所以:派生类对象 d 的虚表中本来该放的是基类虚函数的地址,但是派生类重写了基类的虚函数,基类虚函数的地址就被覆盖变成了派生类虚函数的地址,本意是调用基类的虚函数,结果却调到了派生类的虚函数。这就实现了多态。
另外 Func2 继承下来后是虚函数,所以放进了虚表;Func3 也继承下来了,但它不是虚函数,所以不会放进虚表。
虚函数表本质是一个存放虚函数指针的指针数组,一般情况这个数组最后面放了一个 nullptr。
总结一下派生类的虚表生成:a.先将基类中的虚表内容拷贝一份到派生类虚表中。 b.如果派生类重写了基类中某个虚函数,用派生类自己重写的虚函数覆盖虚表中基类的虚函数。 c.派生类自己新增加的虚函数按其在派生类中的声明次序增加到派生类虚表的最后。
基类和派生类,无论是否完成了虚函数的重写,都有各自独立的虚表。
一个类的所有对象共享同一张虚表。(就像一个类的所有对象共享成员函数一样)
这里还有两个很容易混淆的问题:虚函数存在哪的?虚表存在哪的?
回答:虚函数存在虚表,虚表存在对象中。注意这个回答是错的。
注意:虚表存的是虚函数指针,不是虚函数,虚函数和普通函数一样的,都是存在代码段的,只是他的指针又存到了虚表中。另外对象中存的不是虚表,存的是虚表指针。那么虚表存在哪的呢?实际我们去验证一下会发现 vs 下是存在代码段的,Linux g++ 下大家可以自己去验证一下。
vs下验证代码:
class Base
{
public:
virtual void func1() { cout << "Base::func1" << endl; }
private:
int a;
};
void Test() {}
int main()
{
Base b;
int a1 = 0; // 栈帧
int* p1 = new int; // 堆区
const char* p2 = "hello"; // 常量区
auto pf = Test; // 函数地址
static int a2 = 1; // 静态区
printf("栈帧 :0x%p\n", &a1);
printf("堆区 :0x%p\n", p1);
printf("常量区 :0x%p\n", p2);
printf("函数地址 :0x%p\n", pf);
printf("静态区 :0x%p\n", &a2);
printf("虚函数表地址:0x%p\n", *((int*)&b));
return 0;
}
运行结果如下:
还是拿买票举例子:
// 基类
class Person {
public:
virtual void BuyTicket() { cout << "普通人 - 全价买票" << endl; }
};
// 派生类
class Student : public Person {
public:
virtual void BuyTicket() { cout << "学生 - 半价买票" << endl; }
};
void Func(Person& p) // 基类引用
{
p.BuyTicket();
}
int main()
{
Person per;
Func(per);
Student stu;
Func(stu);
return 0;
}
【观察 & 总结】
观察图中的红色箭头我们看到,p 引用 per 对象时,p.BuyTicket() 在 per 的虚表中找到虚函数是 Person::BuyTicket。
观察图中的蓝色箭头我们看到,p 引用 stu 对象时,p.BuyTicket() 在 stu 的虚表中找到虚函数是 Student::BuyTicket。
这样就实现出了不同对象去完成同一行为时,展现出不同的形态。
【思考 & 总结】
反过来思考我们要达到多态,有两个条件,一个是虚函数覆盖,一个是基类对象的指针(或引用)调用虚函数,反思一下为什么?
【思考一】基类对象的指针(或引用)调用虚函数的原理是什么?
不管基类指针(或引用)指向的是基类还是派生类,执行这段代码 p.BuyTicket() 的指令是一模一样的,都是先找到「虚表指针」(对象中的头 4 个字节),通过虚表指针找到虚表,取对应「虚函数的地址」并调用该虚函数。
下面是多态原理的部分汇编代码分析:
void Func(Person& p)
{
//...
p.BuyTicket();
// p中存的是per对象的地址,将p移动到[eax]中
00CA2571 mov eax,dword ptr [p]
// [eax]就是取eax的值s指向的内容,这里相当于把per对象头4个字节(虚表指针)移动到了[edx]
00CA2574 mov edx,dword ptr [eax]
00CA2576 mov esi,esp
00CA2578 mov ecx,dword ptr [p]
// [edx]就是取edx的值指向的内容,这里相当于把虚表中的头4字节存的虚函数指针移动到了[eax]
00CA257B mov eax,dword ptr [edx]
// call eax中存的虚函数指针。这里可以看出满足多态的调用,不是在编译时确定的,是运行起来以后到对象的中取找的
00CA257D call eax
00CA257F cmp esi,esp
00CA2581 call __RTC_CheckEsp (0CA12B2h)
}
int main()
{
Person per;
Func(per);
return 0;
}
【思考二】为什么多态必须要用基类的指针(或引用)来调用虚函数,而用基类对象调用却不行?
派生类对象赋值给基类对象,不会拷贝派生类的虚表指针,只会拷贝对象中的数据成员过去。
我们不妨这样来理解,一个类的所有对象共享同一张虚表,就像一个类的所有对象共享成员函数一样,只能供这个类自己的对象使用,所以派生类对象是不可能把虚表拷贝过去的,不然就违背同一个类共享的规则了。
结论:既然不会把派生类的虚表指针拷贝过去,那「基类对象」自然就不能调用到「派生类的虚函数」了。
对象调用虚函数,不满足多态条件,所以就是一个普通函数的调用,下面是部分汇编代码分析:
int main()
{
//...
// 首先BuyTicket()虽然是虚函数,但是per是对象,不满足多态的条件,所以这里是普通函数的调用,在编译时已经从符号表确认了函数的地址,直接call 函数地址
Person per;
per.BuyTicket();
00195182 lea ecx,[per]
00195185 call Person::BuyTicket (01914F6h)
//...
}
下面是上面继承关系中的 Person 类对象 per 和 Student 类对象 stu 模型:
解释了用基类引用(或指针)引用不同对象去完成同一行为时,如何展现出不同的形态。
多态的调用虚函数也是付出了代价的,因为要到虚表中去找,要付出一定的效率代价。
通过上面对汇编代码分析,可以看出:
满足多态以后的函数调用,不是在编译时确定的,是运行起来以后到对象中的虚表中去找函数地址的。(运行时决议)
不满足多态的函数调用,是在编译链接时确定函数地址。(编译时决议)
静态绑定又称为前期绑定(早绑定),在程序编译期间确定了程序的行为,也称为编译时多态性,和静态多态,比如:函数重载、内联函数、函数模板。
动态绑定又称后期绑定(晚绑定),是在程序运行期间,根据具体拿到的类型确定程序的具体行为,调用具体的函数,也称为运行时多态性,和动态多态,比如:虚函数。
本章5.2小节买票的汇编代码就很好的解释了什么是静态(编译器)绑定和动态(运行时)绑定。
请看下面这个例子:
class Base
{
public:
virtual void func1() { cout << "Base::func1" << endl; }
virtual void func2() { cout << "Base::func2" << endl; }
private:
int a;
};
class Derive :public Base
{
public:
virtual void func1() { cout << "Derive::func1" << endl; }
virtual void func3() { cout << "Derive::func3" << endl; }
virtual void func4() { cout << "Derive::func4" << endl; }
private:
int b;
};
int main()
{
Base b;
Derive d;
return 0;
}
通过调试,可以观察到,派生类对象 d 中的虚表看不到虚函数 Func3 和 Func4,这里是编译器的监视窗口故意隐藏了这两个函数,也可以认为是它的一个小bug。
那么我们如何查看对象 d 的虚表呢?下面我们使用代码打印出虚表中的函数。
虚函数表本质是一个存放虚函数指针的指针数组,一般情况这个数组最后面放了一个 nullptr.
同时为了方便打印,基类和派生类中的虚函数都是无参无返回值的
// 函数指针vfptr
typedef void(*vfptr)();
// 打印虚表,传入虚函数指针数组
// void PrintVFT(vfptr vft[])
void PrintVFT(void* vft[])
{
printf("虚表地址__vfptr:%p\n", vft);
for (size_t i = 0; vft[i] != nullptr; i++)
{
// 依次打印虚表各元素
printf("vft[%d]:%p->", i, vft[i]);
// 把虚表各元素由void*强转为函数指针类型后,赋值给函数指针ptr
vfptr ptr = (vfptr)vft[i];
// 调用函数
ptr();
}
printf("\n");
}
int main()
{
Base b;
Derive d;
// 思路:取出b、d对象的头4字节,就是虚表的指针,前面我们说了虚函数表本质是一个存虚函数指针的指针数组,这个数组最后面放了一个nullptr
// 1.先取b的地址,强转成一个int*的指针 --> (int*)&b
// 2.再解引用取值,就取到了b对象头4bytes的值,这个值就是指向虚表的指针 --> *((int*)&b)
// 3.再强转成void**,得到存放void*类型(虚函数指针类型)数组首元素的地址,即指针的地址,所以是v** --> (void**)(*((int*)&b))
// 4.将虚表首元素地址(即虚表指针)传递给PrintVFT进行打印虚表
// 5.需要说明的是这个打印虚表的代码经常会崩溃,因为编译器有时对虚表的处理不干净,虚表最后面没有放nullptr,导致越界,这是编译器的问题。我们只需要点目录栏的 - 生成 - 清理解决方案,再编译就好了。
PrintVFT((void**)(*((int*)&b))); // 打印对象b的虚表
PrintVFT((void**)(*((int*)&d))); // 打印对象d的虚表
return 0;
}
运行分析如下:
请看下面这个例子:
class Base1
{
public:
virtual void func1() { cout << "Base1::func1" << endl; }
virtual void func2() { cout << "Base1::func2" << endl; }
private:
int b1;
};
class Base2
{
public:
virtual void func1() { cout << "Base2::func1" << endl; }
virtual void func2() { cout << "Base2::func2" << endl; }
private:
int b2;
};
class Derive : public Base1, public Base2
{
public:
virtual void func1() { cout << "Derive::func1" << endl; }
virtual void func3() { cout << "Derive::func3" << endl; }
private:
int d1;
};
// 函数指针vfptr
typedef void(*vfptr)();
// 打印虚表,传入虚函数指针数组的地址(即虚表指针)
void PrintVFT(void* vft[])
{
printf("虚表地址__vfptr:%p\n", vft);
for (size_t i = 0; vft[i] != nullptr; i++)
{
// 依次打印虚表各元素
printf("vft[%d]:%p->", i, vft[i]);
// 把虚表各元素赋值给函数指针ptr
vfptr ptr = (vfptr)vft[i];
// 调用函数
ptr();
}
printf("\n");
}
int main()
{
Derive d;
// 打印第一张虚表
PrintVFT((void**)*((int*)&d));
// 打印第二张虚表
// 必须先强转成char*,然后加Base1大小个字节,再强转成int*,解引用,强转成void**
PrintVFT((void**)*((int*)((char*)&d + sizeof(Base1))));
return 0;
}
【思考一】Base1 和 Base2 中都有虚函数 func1,那么Derive类中的 func1 到底是重写的哪一个基类的呢?
两个基类 Base1 和 Base2 中的虚函数 func1 都会被重写。因为要满足多态条件。
Derive d;
Base1* p1 = &d; // 用基类1指针调
p1->func1();
Base2* p2 = &d; // 用基类2指针调
p2->func1();
【思考二】多继承体系,Derive 继承了两个基类,那么 Derive 对象中有几张虚表呢?-- 有两张
观察下图可以看出:多继承派生类的未重写的虚函数放在第一个继承基类部分的虚函数表中
说一个小点:这里 Derive 对象的两张虚表中的重写的 Derive::func1 函数,虽然函数地址不一样,当 Base1 或 Base2 指针指向 Derive对象时,调的都是 Derive 中的 func1,是同一个函数。具体原因和编译器设计有关。
实际中我们不建议设计出菱形继承及菱形虚拟继承,一方面太复杂容易出问题,另一方面这样的模型,访问基类成员有一定得性能损耗。所以菱形继承、菱形虚拟继承关系中的多态,它们的虚表我们就不看了,一般我们也不需要研究清楚,因为实际中很少用。如果好奇心比较强的朋友,可以去看酷壳陈皓大佬的两篇文章。
1、C++ 虚函数表解析 | 酷 壳 - CoolShell
2、C++ 对象的内存布局 | 酷 壳 - CoolShell