本篇博客基于VS2019X86环境下,后续关于多态原理相关验证都是基于vsX86环境,而虚表本质上是一个虚函数指针数组,在X86环境下VS编译器会在数组最后放一个unllptr!!
多态的概念:通俗来说,就是多种形态,具体点就是去完成某个行为,当不同的对象去完成时会产生出不同的状态。
比如买票这个行为,当普通人买票时,是全价买票;学生买票时,是半价买票;军人买票时是优先买票。
多态是在不同继承关系的类对象,去调用同一函数,产生了不同的行为。
但在继承中要构成多态还有两个条件:(后续会具体介绍其细节)
比如Student继承了Person。Person对象买票全价,Student对象买票半价:
class Person
{
public:
virtual void BuyTicket()//被virtual修饰的类成员函数称为虚函数
{
cout << "买票全价" << endl;
}
};
class Student : public Person
{
public:
virtual void BuyTicket()//对基类虚函数重写
{
cout << "买票半价" << endl;
}
};
void Func(Person& people)
{
people.BuyTicket();
}
int main()
{
Person p;
Func(p);//涉及赋值兼容规则,后续会介绍。
Student s;
Func(s);
return 0;
}
虚函数:即被virtual修饰的类成员函数称为虚函数。
class Person {
public:
//BuyTicket()为虚函数
virtual void BuyTicket() { cout << "买票-全价" << endl;}
};
虚函数的重写(覆盖):派生类中有一个跟基类完全相同的虚函数(即派生类虚函数与基类虚函数的返回值类型、函数名字、参数列表完全相同),称子类的虚函数重写了基类的虚函数。
tips:这里派生类的虚函数在不加virtual关键字时,我们认为也构成重写。原因在于,我们认为虚函数的重写继承了基类虚函数的接口,在派生类中重写实现。
class Person {
public:
virtual void BuyTicket() { cout << "买票-全价" << endl; }
};
class Student : public Person {
public:
virtual void BuyTicket() { cout << "买票-半价" << endl; }
/*注意:在重写基类虚函数时,派生类的虚函数在不加virtual关键字时,虽然也可以构成重写(因
为继承后基类的虚函数被继承下来了在派生类依旧保持虚函数属性),但是该种写法不是很规范,不建议
这样使用*/
/*void BuyTicket() { cout << "买票-半价" << endl; }*/
};
void Func(Person& p)
{
p.BuyTicket();
}
int main()
{
Person p;
Student s;
Func(p);
Func(s);
return 0;
}
派生类重写基类虚函数时,与基类虚函数返回值类型可以不同,但必须是父子类关系的指针或者引用。即基类虚函数返回基类对象的指针或者引用,派生类虚函数返回派生类对象的指针或者引用,称为协变。
class A {};
class B : public A {};
class Person
{
public:
virtual A* f() { return new A; }
};
class Student : public Person
{
public:
virtual B* f() { return new B; }
};
如果基类的析构函数为虚函数,此时派生类析构函数只要定义,无论是否加virtual关键字,都与基类的析构函数构成重写。虽然函数名不相同,看起来违背了重写的规则,其实不然,这里可以理解为编译器对析构函数的名称做了特殊处理,编译后析构函数的名称统一处理成destructor。
【实例】:
class Person {
public:
virtual ~Person() { cout << "~Person()" << endl; }
};
class Student : public Person {
public:
virtual ~Student() { cout << "~Student()" << endl; }
};
// 只有派生类Student的析构函数重写了Person的析构函数,下面的delete对象调用析构函
//数,才能构成多态,才能保证p1和p2指向的对象正确的调用析构函数。
int main()
{
Person* p1 = new Person;
Person* p2 = new Student;
delete p1;
// delete p1编译器处理为: p1->destrutor() + operator delete(p1)
delete p2;
// delete p2编译器处理为: p2->destrutor() + operator delete(p2)
return 0;
}
tips:大多数情况析构函数是不需要重写的。只有上述在上述情况下,如果普通析构函数,则p1、p2delete时调用的都是Person类的析构。但实际上p2指向的是Student类对象,原则上因该调用Student类的析构函数。所以为了正确调用析构函数,需要将析构实现为虚函数并重写。(记住上述情况,只有这种情况下才需要重写析构函数)
C++对函数重写的要求比较严格,但是有些情况下由于疏忽,可能会导致函数名字母次序写反而无法构成重写,而这种错误在编译期间是不会报出的,只有在程序运行时没有得到预期结果才来debug会得不偿失,因此:C++11提供了override和final两个关键字,可以帮助用户检测是否重写。
final:修饰虚函数,表示该虚函数不能再被重写。
class Car
{
public:
virtual void Drive() final {}
};
class Benz :public Car
{
public:
virtual void Drive() { cout << "Benz-舒适" << endl; }
};
override: 检查派生类虚函数是否重写了基类某个虚函数,如果没有重写编译报错。
class Car {
public:
virtual void Drive() {}
};
class Benz :public Car {
public:
virtual void Drive() override { cout << "Benz-舒适" << endl; }
};
在虚函数的后面写上 =0 ,则这个函数为纯虚函数。包含纯虚函数的类叫做抽象类(也叫接口类),抽象类不能实例化出对象,一般用于接口的定义。派生类继承后也不能实例化出对象,只有重写纯虚函数,派生类才能实例化出对象。纯虚函数间接强制派生类重写,另外纯虚函数更体现出了接口继承。
class Car
{
public:
virtual void Drive() = 0;//纯虚函数
};
class Benz :public Car
{
public:
virtual void Drive()
{
cout << "Benz-舒适" << endl;
}
};
class BMW :public Car
{
public:
virtual void Drive()
{
cout << "BMW-操控" << endl;
}
};
void Test()
{
Car* pBenz = new Benz;
pBenz->Drive();
Car* pBMW = new BMW;
pBMW->Drive();
}
普通函数的继承是一种实现继承,派生类继承了基类函数,可以使用函数,继承的是函数的实现。虚函数的继承是一种接口继承,派生类继承的是基类虚函数的接口,目的是为了重写,达成多态,继承的是接口。所以如果不实现多态,不要把函数定义成虚函数。
在了解虚函数前,我们先来看看这段代码中类对象的大小(X86环境下)
class Base
{
public:
virtual void Func1()
{
cout << "Func1()" << endl;
}
private:
int _b = 1;
};
int main()
{
Base b1;
cout << sizeof(b1) << endl;
return 0;
}
【运行结果】:
我们发现b的大小竟然是8bytes。为什么呢?这就不得不提到虚函数表了。
原来Base对象中,除了_b成员,还多一个__vfptr放在对象的前面(注意有些平台可能会放到对象的最后面,这个跟平台有关),对象中的这个指针我们叫做虚函数表指针(v代表virtual,f代表function)。一个含有虚函数的类中都至少都有一个虚函数表指针,因为虚函数的地址要被放到虚函数表中,虚函数表也简称虚表。
我们再来看看下面这段代码:
// 1.我们增加一个派生类Derive去继
// 2.Derive中重写Func1
// 3.Base再增加一个虚函数Func2和
class Base
{
public:
virtual void Func1()
{
cout << "Base::Func1()" << endl;
}
virtual void Func2()
{
cout << "Base::Func2()" << endl;
}
void Func3()
{
cout << "Base::Func3()" << endl;
}
private:
int _b = 1;
};
class Derive : public Base
{
public:
virtual void Func1()
{
cout << "Derive::Func1()" << endl;
}
private:
int _d = 2;
};
int main()
{
Base b;
Derive d;
return 0;
}
后续所有代码都是基于vsX86环境,而虚表本质上是一个虚函数指针数组,VS编译器会在数组最后放一个unllptr!!
虚函数存在哪的?虚表存在哪的?比较简单的方法就是将虚函数、虚表以及每个存储区间地址都打印出来进行比较。
比如:
class Base {
public:
virtual void func1() { cout << "Base::func1" << endl; }
virtual void func2() { cout << "Base::func2" << endl; }
private:
int _a;
};
void func()
{
cout << "void func()" << endl;
}
int main()
{
Base b1;
int a;
int* a2 = new int;
//const int a3 = 1;
const char* s = "hello world";
static int d4 = 0;
printf("栈:%p\n", &a);
printf("堆:%p\n", a2);
printf("静态区:%p\n", &d4);
//printf("代码段:%p\n", &a3);
printf("代码段:%p\n", s);
printf("虚表:%p\n", *(int*)(&b1));
//在类域中的函数地址比较特殊,要加&
printf("虚函数地址:%p\n", &Base::func1);
printf("普通函数地址:%p\n", func);
return 0;
}
【运行结果】:
我们发现虚表和代码段的存储在一起,虚函数和普通函数存储在一起,而普通函数又是存在代码段的。
总结:
多态的原理到底是什么?为啥指向不同对象,能调用不同函数呢?
我们来看看开头的这段代码:
class Person {
public:
virtual void BuyTicket() { cout << "买票-全价" << endl; }
};
class Student : public Person {
public:
virtual void BuyTicket() { cout << "买票-半价" << endl; }
};
void Func(Person& p)
{
p.BuyTicket();
}
int main()
{
Person Mike;
Func(Mike);
Student Johnson;
Func(Johnson);
return 0;
}
void Func(Person* p)
{
p->BuyTicket();
}
int main()
{
Person mike;
Func(&mike);
mike.BuyTicket();
return 0;
}
// 以下汇编代码中跟你这个问题不相关的都被去掉了
void Func(Person* p)
{
...
p->BuyTicket();
// p中存的是mike对象的指针,将p移动到eax中
001940DE mov eax,dword ptr [p]
// [eax]就是取eax值指向的内容,这里相当于把mike对象头4个字节(虚表指针)移动到了edx
001940E1 mov edx,dword ptr [eax]
// [edx]就是取edx值指向的内容,这里相当于把虚表中的头4字节存的虚函数指针移动到了eax
00B823EE mov eax,dword ptr [edx]
// call eax中存虚函数的指针。这里可以看出满足多态的调用,不是在编译时确定的,是运行起来
以后到对象的中取找的。
001940EA call eax
00头1940EC cmp esi,esp
}
int main()
{
...
// 首先BuyTicket虽然是虚函数,但是mike是对象,不满足多态的条件,所以这里是普通函数的调
用转换成地址时,是在编译时已经从符号表确认了函数的地址,直接call 地址
mike.BuyTicket();
00195182 lea ecx,[mike]
00195185 call Person::BuyTicket (01914F6h)
...
}
我们来看看的段代码:
class Base {
public:
virtual void func1() { cout << "Base::func1" << endl; }
virtual void func2() { cout << "Base::func2" << endl; }
private:
int a;
};
class Derive :public Base {
public:
virtual void func1() { cout << "Derive::func1" << endl; }
virtual void func3() { cout << "Derive::func3" << endl; }
virtual void func4() { cout << "Derive::func4" << endl; }
void func5() { cout << "Derive::func5" << endl; }
private:
int b;
};
class X :public Derive {
public:
virtual void func3() { cout << "X::func3" << endl; }
};
int main()
{
Base b;
Derive d;
X x;
return 0;
}
【监视窗口】:
在上述监视窗口中我们发现虚函数表中竟然只存有父类的虚函数以及相关虚函数的重写。也就是说新增的虚函数不会存储到虚表中!但真的如此吗?
真正原因在于:VS监视窗口是微软工程师处理过方便使用者观察的,但不一定是真实的!编译器的监视窗口故意隐藏了这些东西,也可以认为是他的一个小bug。要了解虚函数的地址是否一定会被放进类的虚函数,我们可以通过其真实内存,打印虚函数表来观察?
//将函数指针void (*)() 重定义为VFNC
typedef void (*VFUNC)();
//打印虚函数表
void printVFT(VFUNC* a)
{
//由于VSX86环境下,编译器会在虚表结尾放一个nullptr,所以此处结束条件为a[i]!=0
for (int i = 0; a[i] != 0; i++)
{
printf("[%d]->%p ", i, a[i]);
//调用a[i]中存储的函数
VFUNC f = a[i];
f();
//(*f)()
cout << endl;
}
}
int main()
{
Base b;
// 思路:取出b、d对象的头4bytes,就是虚表的指针,前面我们说了虚函数表本质是一个存虚函数
// 指针的指针数组,这个数组最后面放了一个nullptr
// 1.先取b的地址,强转成一个int*的指针
// 2.再解引用取值,就取到了b对象头4bytes的值,这个值就是指向虚表的指针
// 3.再强转成VFPTR*,因为虚表就是一个存VFPTR类型(虚函数指针类型)的数组。
// 4.虚表指针传递给PrintVTable进行打印虚表
// 5.需要说明的是这个打印虚表的代码经常会崩溃,因为编译器有时对虚表的处理不干净,虚表最
//后面没有放nullptr,导致越界,这是编译器的问题。我们只需要点目录栏的-生成-清理解决方案,再编译就好了。
printVFT((VFUNC*)(*((int*)(&b))));
printf("----------------------------------\n");
Derive d;
printVFT((VFUNC*)(*(int*)(&d)));
printf("----------------------------------\n");
X x;
printVFT((VFUNC*)(*(int*)(&x)));
return 0;
}
总结:
1.我们发现实际上虚函数的地址一定会被放进类的虚函数表。
和6.1一样,我们只需要将虚表中存储的值都打印出来,即可确定这个问题答案!
【代码如下】:
class Base1 {
public:
virtual void func1() { cout << "Base1::func1" << endl; }
virtual void func2() { cout << "Base1::func2" << endl; }
private:
int b1;
};
class Base2 {
public:
virtual void func1() { cout << "Base2::func1" << endl; }
virtual void func2() { cout << "Base2::func2" << endl; }
private:
int b2;
};
class Derive : public Base1, public Base2 {
public:
virtual void func1()
{
cout << "Derive::func1" << endl;
}
virtual void func3() { cout << "Derive::func3" << endl; }
private:
int d1;
};
//打印虚函数
typedef void(*VFUNC)();
void printVFT(VFUNC* a)
{
for (int i = 0; a[i] != 0; i++)
{
printf("[%d]->%p ", i, a[i]);
VFUNC f = a[i];
f();
}
cout << endl;
}
int main()
{
Derive d;
printVFT((VFUNC*)(*(int*)&d));
printf("-----------------------------\n");
//由于d对象中存有两张虚表,要打印第2张虚表,需要将&d偏移指向Base2开头,有如下几种方式
//printvft((vfunc*)(*(int*)((char*)&d+sizeof(base1))));
Base2* ptr = &d;
printVFT((VFUNC*)(*(int*)ptr));
return 0;
}
实际中我们不建议设计出菱形继承及菱形虚拟继承,一方面太复杂容易出问题,另一方面这样的模型,访问基类成员有一定得性能损耗。所以博主就不介绍了。如果感兴趣,这里附上两篇相关文章: