目录
1. 多态的概念
1.1 概念
2. 多态的定义及实现
2.1多态的构成条件
2.2 虚函数
2.3虚函数的重写
2.4 C++11 override 和 final
2.5 重载、覆盖(重写)、隐藏(重定义)的对比
3. 抽象类
3.1 概念
3.2 接口继承和实现继承
4.多态的原理
4.1虚函数表
4.2多态的原理
4.3 动态绑定与静态绑定
5.单继承和多继承关系的虚函数表
5.1 单继承中的虚函数表
5.2 多继承中的虚函数表
5.3. 菱形继承、菱形虚拟继承
需要声明的,本节课件中的代码及解释都是在 vs2022 下的 x86 程序中,涉及的指针都是 4bytes 。 如果要其他平台下,部分代码需要改动。比如:如果是 x64 程序,则需要考虑指针是 8bytes 问题 等等。
多态的概念:通俗来说,就是多种形态, 具体点就是去完成某个行为,当不同的对象去完成时会产生出不同的状态 。
举个栗子:大家都吃过海底捞吧,那么海底捞对大学生有一个69折扣以及不同的人在其中的会员情况是不同的,大家去消费时,或许是同样的饭菜,但是由于你是大学生或者你有更高级的会员卡,那么你就能够享受到更加优惠的价格。
我相信大家之前已经了解过一部分多态:我们C++入门时学习的函数重载其实就是一种静态的多态,当我们调用同一个函数会发生不同的行为,原理是编译时就已经实现了。
那动态的多态是什么呢?我们接下来会详细介绍:
- 必须通过基类的指针或者引用调用虚函数
- 被调用的函数必须是虚函数,且派生类必须对基类的虚函数进行重写
虚函数:即被virtual修饰的类成员函数称为虚函数。
class Person {
public:
virtual void BuyTicket() { cout << "买票-全价" << endl;}
};
虚函数的重写 ( 覆盖 ) : 派生类中有一个跟基类完全相同的虚函数 ( 即派生类虚函数与基类虚函数的返回值类型、函数名字、参数列表完全相同 ) ,称子类的虚函数重写了基类的虚函数。
例如下面这个:
class Person {
public:
virtual void BuyTicket() { cout << "买票-全价" << endl; }
};
class Student : public Person {
public:
virtual void BuyTicket() { cout << "买票-69折" << endl; }
};
在Student类中,就对Person类里面的虚函数BuyTicket进行了重写,另外值得注意的小细节是当父类写了虚函数时就算子类没有加virtual编译器也会被当作是重写,例如下面这种情况也是重写:
class Person {
public:
virtual void BuyTicket() { cout << "买票-全价" << endl; }
};
class Student : public Person {
public:
void BuyTicket() { cout << "买票-69折" << endl; }
};
我们看下面这个程序:
#include
using namespace std;
class Person {
public:
virtual void BuyTicket() { cout << "买票-全价" << endl; }
};
class Student : public Person {
public:
virtual void BuyTicket() { cout << "买票-半价" << endl; }
};
void fun(Person& p)
{
p.BuyTicket();
}
int main()
{
Person p;
Student s;
fun(p);
fun(s);
return 0;
}
上面程序在fun函数中我们用了一个父类类型的形参引用来接受传入的参数,当传入的参数对象是Person类型时就调用父类的虚函数,当传入的参数对象是Student类型时就调用子类的虚函数,而同一个函数当不同的对象去调用时就产生了不同的行为,这种就是多态。我们让程序跑起来:
我们发现程序与我们预期的结果类似,至于多态的原理我们在后面会给出解释。
从这里我们应该也会发现这里的多态并不是编译时就产生的(因为编译并不知道你要用哪个对象来调用),而是运行时具体实例化出对象而产生的。
大家想想下面这段程序构成多态吗?
p.BuyTicket();
s.BuyTicket();
这其实只是普通的通过对象调用而已,并没有通过父类的指针或者引用来调用虚函数。
派生类重写基类虚函数时,与基类虚函数返回值类型不同。即基类虚函数返回基类对象的指针或者引用,派生类虚函数返回派生类对象的指针或者引用时,称为协变。
比如下面这段程序:
class A {};
class B : public A {};
class Person {
public:
virtual A* f()
{
cout << "virtual A* f()" << endl;
return new A;
}
};
class Student : public Person {
public:
virtual B* f()
{
cout << "virtual B* f() " << endl;
return new B;
}
};
void fun(Person& p)
{
p.f();
}
int main()
{
Person p;
Student s;
fun(p);
fun(s);
return 0;
}
虽然父类中虚函数的返回值类型不等于子类中虚函数的返回值类型,但是他们依然是构成重写的,我们运行程序看看:
不难发现虚函数已经成功重写了。
如果基类的析构函数为虚函数,此时派生类析构函数只要定义,无论是否加 virtual 关键字,都与基类的析构函数构成重写,虽然基类与派生类析构函数名字不同 , 看起来违背了重写的规则,其实不然,这里可以理解为编译器对析构函数的名称做了特殊处 理,编译后析构函数的名称统一处理成 destructor 。
我们看看下面这段程序:
class Person {
public:
virtual ~Person() { cout << "~Person()" << endl; }
};
class Student : public Person {
public:
virtual ~Student() { cout << "~Student()" << endl; }
};
int main()
{
Person* p1 = new Person;
Person* p2 = new Student;
delete p1;
delete p2;
return 0;
}
我们我们new了一个Student类型的对象用了一个Person类型的指针来接受,假如Student类中的析构函数没有对Person类中的析构函数进行重写,那么当析构p2时不是就只调用Person类的析构函数,当Student类中有额外资源不就造成了内存泄漏了吗?所以在这里编译器会对析构函数做出特殊处理,会将析构函数的名字统一处理为destructor,这样就构成了多态。当然如果是下面这种用法就不会是多态了,就与我们之前讲解继承那儿一样为普通情况:
Person* p1 = new Person;
Student* p2 = new Student;
delete p1;
delete p2;
这时父类与子类中的析构函数构不构成多态已经不重要了,因为他们会各自调用自己的析构函数处理,这点大家一定不要被误导了。
class A
{
private:
A(int a=10)
:_a(a)
{}
int _a;
};
class B :public A
{
private:
int _b;
};
int main()
{
B b;
return 0;
}
我们创建一个B类型的对象试试:
我们甚至连A类型的对象都已经无法创建,那么假如已经确定了A类的构造函数私有了,那么如何构造出一个A类型的对象呢,这里可以用单例模式来处理:
class A
{
private:
A(int a=10)
:_a(a)
{}
int _a;
public:
static A GetOBJ(int a=10)
{
A* obj = new A(a);
return *obj;
}
};
class B :public A
{
private:
int _b;
};
int main()
{
A a = A::GetOBJ(12);
return 0;
}
这里我们创建对象用的是类域来访问类的静态成员函数,这样就很好的避免了用对象来访问在这种情况的尴尬之处。
但是C++11提供了final,用final修饰类表示该类不可以被继承。
class Car final
{
public:
virtual void Drive(){}
};
class Benz :public Car
{
public:
virtual void Drive() { cout << "Benz-舒适" << endl; }
};
用final修饰虚函数表示该虚函数不能够被重写:
class Car
{
public:
virtual void Drive()final {}
};
class Benz :public Car
{
public:
virtual void Drive() { cout << "Benz-舒适" << endl; }
};
override: 检查派生类虚函数是否重写了基类某个虚函数,如果没有重写编译报错。
在虚函数的后面写上 =0 ,则这个函数为纯虚函数。 包含纯虚函数的类叫做抽象类(也叫接口类),抽象类不能实例化出对象 。派生类继承后也不能实例化出对象,只有重写纯虚函数,派生 类才能实例化出对象。纯虚函数规范了派生类必须重写,另外纯虚函数更体现出了接口继承。
我们看下面一段程序:
class Car
{
public:
virtual void Drive() = 0;
};
class Benz :public Car
{
public:
virtual void Drive()
{
cout << "Benz-舒适" << endl;
}
};
class BMW :public Car
{
public:
virtual void Drive()
{
cout << "BMW-操控" << endl;
}
};
void Test()
{
Car* pBenz = new Benz;
pBenz->Drive();
Car* pBMW = new BMW;
pBMW->Drive();
}
我们知道Car类是一个抽象类,是不能够实例化出对象的,而派生类重写了纯虚函数后就能够实例化出对象来了,纯虚函数也更好的体现了接口继承。
普通函数的继承是一种实现继承,派生类继承了基类函数,可以使用函数,继承的是函数的实现。虚函数的继承是一种接口继承,派生类继承的是基类虚函数的接口,目的是为了重写,达成 多态,继承的是接口。所以如果不实现多态,不要把函数定义成虚函数。
大家看下面这一道题:(这是在X86环境下运行)
class Base
{
public:
virtual void Func1()
{
cout << "Func1()" << endl;
}
private:
int _b = 1;
char _c;
};
int main()
{
cout << sizeof(Base) << endl;
return 0;
}
如果按照我们之前的内存对齐规则,那么这个结果应该是:8
但是当我们运行程序时:
结果却是12,为什么呢?
那么派生类中这个表放了些什么呢?
我们可以看看接下来的程序:
class Base
{
public:
virtual void Func1()
{
cout << "Base::Func1()" << endl;
}
virtual void Func2()
{
cout << "Base::Func2()" << endl;
}
void Func3()
{
cout << "Base::Func3()" << endl;
}
private:
int _b = 1;
};
class Derive : public Base
{
public:
virtual void Func1()
{
cout << "Derive::Func1()" << endl;
}
private:
int _d = 2;
};
int main()
{
Base b;
Derive d;
return 0;
}
我们调试起来在监视窗口上查看_vfptr指向的表中存放的是什么?
我们发现:b的_vfptr指向的是func1和func2这两个虚函数的地址,d的_vfptr指向的虚表是拷贝b的_vfptr指向的虚表,但是由于子类中重写了func1,所以d中_vfptr指向的func1虚函数的地址发生了改变,而子类中没有重写的虚函数(func2)中的地址是不会发生改变的。
通过上面测试我们能够发现:
1. 派生类对象 d 中也有一个虚表指针, d 对象由两部分构成,一部分是父类继承下来的成员,虚表指针也就是存在这部分,另一部分是子类的成员。2. 基类 b 对象和派生类 d 对象虚表是不一样的,这里我们发现 Func1 完成了重写,所以 d 的虚表中存的是重写的 Derive::Func1 ,所以虚函数的重写也叫作覆盖 ,覆盖就是指虚表中虚函数 的覆盖。重写是语法的叫法,覆盖是原理层的叫法。3. 另外 Func2 继承下来后是虚函数,所以放进了虚表, Func3 也继承下来了,但不是虚函数,所以不会放进虚表。4. 虚函数表本质是一个存虚函数指针的指针数组,一般情况这个数组最后面放了一个 nullptr 。5. 总结一下派生类的虚表生成: a. 先将基类中的虚表内容拷贝一份到派生类虚表中 b. 如果派生类重写了基类中某个虚函数,用派生类自己的虚函数覆盖虚表中基类的虚函数 c. 派生类自己 新增加的虚函数按其在派生类中的声明次序增加到派生类虚表的最后。6. 这里还有一个很容易混淆的问题: 虚函数存在哪的?虚表存在哪的? 答:虚函数存在虚表,虚表存在对象中。注意上面的回答的错的 。注意 虚表存的是虚函数指针,不是虚函数 ,虚函数和普通函数一样的,都是存在代码段的,只是 他的指针又存到了虚表中。另外对象中存的不是虚表,存的是虚表指针。那么 虚表存在哪的 呢?实际我们去验证一下会发现 vs 下是存在代码段的, Linux g++ 下是存放在rodata中。7 虚表是编译时确定还是运行时确定?虚表是在编译时就已经确定了,而虚表指针是运行时在对象中找到也就是运行时确定的,这是实现多态的关键。8 静态成员函数能够成为虚函数吗?答案显然是不能够的,静态成员函数没有this指针,连对象地址都没有,所以根本就找不到虚表,就不能实现多态。
class Person {
public:
virtual void BuyTicket() { cout << "买票-全价" << endl; }
void fun() { cout << "fun()" << endl; }
};
class Student : public Person {
public:
virtual void BuyTicket() { cout << "买票-半价" << endl; }
};
void Func(Person& p)
{
p.BuyTicket();//运行时在对象里面找到虚函数表里面找
}
int main()
{
Person Mike;
Func(Mike);
Student Johnson;
Func(Johnson);
Person& pr = Johnson;
Person p = Johnson;
return 0;
}
当我们不使用父类的指针或者引用时,我们调试起来观察一下:
不难发现不使用父类的指针或者引用时基表指针指向的是父类的基表,那这样不就调用的是父类的虚函数了吗?就无法形成多态。有人或许会说,那为啥编译器不直接将子类的虚表拷贝给父类呢?这样不就调到了子类的虚函数了吗?但是这样做有一个很大的矛盾,就是此时父类的虚表不仅指向父类,还指向子类,这样不就乱套了吗?所以这样肯定是不可取的,换个角度如果这样允许的话那父类调用析构函数是调用父类的?还是子类的?
那为什么要虚函数覆盖呢?就是为了当我们使用不同的类型的对象时找到的虚函数的地址是不一样的,找到的虚函数不一样就自然完成了多态。
我们之前说过,多态不是在编译时确定的,而是在运行时在对象中取到地址的,我们可以通过VS的反汇编来看看:
从上面我们可以明显看到当满足多态是call的不是一个具体的地址,而是在有了对象后通过对象里面的虚函数表指针来找到这张表,从虚函数表里面取到该虚函数的地址,而下面不满足多态的条件,则是在编译时就已经确定好了虚函数的地址了。
通过这里,我们在提出一个有趣的问题;假如我们把子类虚函数的访问限定符改为private,此时我们还能正常的调用子类的虚函数吗?
如果按照我们之前的理解,这样的话子类的虚函数子类外面是不可被访问的,那就不可能调到,我们运行起来试试:
我们惊奇的发现,居然调到了,为什么呢?
我们想想实现多态我们是通过什么调到虚函数的?是不是从对象中找到了虚函数表指针,通过该指针找到了虚函数表,在从表中调到特定的虚函数,在这个过程中,与访问限定符半毛钱关系都没有,也就是此时访问限定符是什么已经不重要了,我们是通过虚函数表来找的地址,又没有通过对象调用的方式来使用。
1. 静态绑定又称为前期绑定 ( 早绑定 ) , 在程序编译期间确定了程序的行为 , 也称为静态多态 ,比如:函数重载2. 动态绑定又称后期绑定 ( 晚绑定 ) ,是在程序运行期间,根据具体拿到的类型确定程序的具体行为,调用具体的函数, 也称为动态多态 。
需要注意的是在单继承和多继承关系中,下面我们去关注的是派生类对象的虚表模型,因为基类的虚表模型前面我们已经看过了,没什么需要特别研究的。
我们来看看下面这种模型(ps:用的是VS2022X86环境下验证的):
class Base {
public:
virtual void func1() { cout << "Base::func1" << endl; }
virtual void func2() { cout << "Base::func2" << endl; }
private:
int a;
};
class Derive :public Base {
public:
virtual void func1() { cout << "Derive::func1" << endl; }
virtual void func3() { cout << "Derive::func3" << endl; }
virtual void func4() { cout << "Derive::func4" << endl; }
private:
int b;
};
我们发现bs里面的虚表指针指向的虚表里面存放的是fun1和fun2虚函数的地址,dr里面的虚表指针指向的虚表里面存放的是被重写的fun1的地址,以及拷贝过来的fun2的地址,那fun3和fun4的地址在哪里呢?其实我们可以通过内存窗口来观察观察:
其实fun3和fun4的地址就在fun1和fun2的后面,vs监视窗口知识没有显示出来罢了,我们打印一下在Base中func1和func2的地址和Derive中func3和func4的地址来看看:
我们惊奇的发现居然地址不相等,其实这就是VS对真实的地址进行了封装,我们在监视窗口上看见的就是被封装的地址,这个我就不验证了,大家自己可以下去在反汇编里面验证。
为了更加直观的看见虚函数表中的地址,我们可以通过打印的方式来观察观察:
typedef void(*VFPtr) ();
void PrintVTable(VFPtr vTable[])
{
// 依次取虚表中的虚函数指针打印并调用。调用就可以看出存的是哪个函数
cout << " 虚表地址>" << vTable << endl;
for (int i = 0; vTable[i] != nullptr; ++i)
{
printf(" 第%d个虚函数地址 :0X%p,->", i, vTable[i]);
VFPtr f = vTable[i];
f();//调用该函数
}
cout << endl;
}
为了方便打印,我们定义了一个函数指针类型,并通过该类型创建了一个函数指针数组,通过该数组(本质是一个指向函数指针数组的指针)来打印我们想要的虚函数地址。
现在问题是如何取到虚表指针,我们可以通过下面这种方式来取:
VFPtr* VFPtrBs = (VFPtr*)( * (int*)&bs);
PrintVTable(VFPtrBs);
VFPtr* VFPtrDr = (VFPtr*)( * (int*)&dr);
PrintVTable(VFPtrDr);
但是这样取大家想想还有一些其他什么问题吗?假如我们平台是64位的不就g了吗,要么写一个条件编译在不同平台下运行不同的代码(64位平台下就强转成long long类型)
更好的方式是用下面这种方式:
VFPtr* VFPtrBs = (VFPtr*)(*(void**)&bs);
PrintVTable(VFPtrBs);
VFPtr* VFPtrDr = (VFPtr*)(*(void**)&dr);
PrintVTable(VFPtrDr);
大家观察上面代码,这时无论是在哪个平台下上面代码都是正确的,我们来运行一下:
这样看我们就能够一目了然的观察到虚函数表里面存的是谁的地址。
大家看看下面的代码:
class Base1 {
public:
virtual void func1() { cout << "Base1::func1" << endl; }
virtual void func2() { cout << "Base1::func2" << endl; }
private:
int b1;
};
class Base2 {
public:
virtual void func1() { cout << "Base2::func1" << endl; }
virtual void func2() { cout << "Base2::func2" << endl; }
private:
int b2;
};
class Derive : public Base1, public Base2 {
public:
virtual void func1() { cout << "Derive::func1" << endl; }
virtual void func3() { cout << "Derive::func3" << endl; }
private:
int d1;
};
我们定义出一个对象d,那么我们猜猜func3是在Base1中还是在Base2中?
我们来验证验证:
大家仔细观察一下这张图,我们不难发现其实func3是在Base1中,也就是让大儿子领养。但是我们还发现了一个小问题:Base1中的func1居然与Base2中的fun1不相等(也就是图中绿色箭头),为啥捏?按道理他们应该都会被Derive重写成相同的地址,其实原因我们上面也已经提及了,VS对这个地址进行了封装,我们看到了并不是真正的地址,而是被封装后的地址,在底层中其实Base1中的func1与Base2中的fun1真实地址肯定是相同的。
我们打印起来看看:
这个与我们在监视窗口和内存窗口上看见的一样。
实际中我们不建议设计出菱形继承及菱形虚拟继承,一方面太复杂容易出问题,另一方面这样的模型,访问基类成员有一定得性能损耗。所以菱形继承、菱形虚拟继承我们的虚表我们就不看 了,一般我们也不需要研究清楚,因为实际中很少用。如果好奇心比较强的,可以去看下面 的两篇链接文章。
C++虚函数表解析
C++对象的内存布局