多态的概念:通俗来说,就是多种形态,具体点就是去完成某个行为,当不同的对象去完成时会产生出不同的状态
比如买票,不同的身份票价是不同的。
多态分为静态的多态和动态的多态
静态的多态就是函数重载,比如库提供的swap
动态(运行时)的多态:a、派生类继承父类,完成虚函数的重写 b、基类的指针或者引用才能调用这个重写的虚函数
基类的指针或引用指向基类对象,调用基类的虚函数
基类的指针或引用指向派生类对象,调用派生类的虚函数
效果:调用函数与对象有关,指向哪个对象就调用哪个虚函数
多态是在不同继承关系的类对象,去调用同一函数,产生了不同的行为。比如Student继承了Person。
Person对象买票全价,Student对象买票半价。
那么在继承中要构成多态还有两个条件:
虚函数:被virtual修饰的类成员函数称为虚函数
注意:这个virtual关键字与菱形虚拟继承的关键字没有关系,两者的作用不同
class Person { public: virtual void BuyTicket() { cout << "买票-全价" << endl; } };
虚函数的重写(覆盖):派生类中有一个跟基类完全相同的虚函数(即派生类虚函数与基类虚函数的返回值类型、函数名字、参数列表完全相同),称子类的虚函数重写了基类的虚函数
class Person { public: virtual void BuyTicket() { cout << "买票-全价" << endl; } }; class Student : public Person { public: virtual void BuyTicket() { cout << "买票-半价" << endl; } }; void Func(Person& p) { p.BuyTicket(); } int main() { Person ps; Student st; Func(ps); Func(st); return 0; }
效果:
协变(基类与派生类虚函数返回值类型不同)
派生类重写基类虚函数时,与基类虚函数返回值类型不同。即基类虚函数返回基类对象的指针或者引用,派生类虚函数返回派生类对象的指针或者引用时,称为协变。注意返回的两个类必须也是继承关系
class A{}; class B : public A {}; class Person { public: virtual A* f() { return new A; } }; class Student : public Person { public: virtual B* f() { return new B; } };
析构函数的重写(基类与派生类析构函数的名字不同)
如果基类的析构函数为虚函数,此时派生类析构函数只要定义,无论是否加virtual关键字,都与基类的析构函数构成重写,虽然基类与派生类析构函数名字不同。函数名不相同,看起来违背了重写的规则,其实不然,这里可以理解为编译器对析构函数的名称做了特殊处理,编译后析构函数的名称统一处理成destructor。
class Person { public: virtual ~Person() { cout << "~Person()" << endl; } }; class Student : public Person { public: virtual ~Student() { cout << "~Student()" << endl; } }; // 只有派生类Student的析构函数重写了Person的析构函数,下面的delete对象调用析构函数,才能构成多态,才能保证p1和p2指向的对象正确的调用析构函数,否则p2调用的是Person的析构函数,这样Student的资源就没有释放,会引起内存泄漏 int main() { Person* p1 = new Person; Person* p2 = new Student; delete p1; delete p2; return 0; }
如果Student不重写的话:
这样就会造成Student的内存泄漏,所以继承时要对析构进行重写。
重写基类虚函数时,派生类的虚函数在不加virtual关键字时,也可以构成重写(因为继承后基类的虚函数被继承下来了在派生类依旧保持虚函数属性),但是该种写法不是很规范,不建议这样使用
class Person { public: virtual void BuyTicket() { cout << "买票-全价" << endl; } }; class Student : public Person { public: //不加virtual关键字 void BuyTicket() { cout << "买票-半价" << endl; } };
从上面可以看出,C++对函数重写的要求比较严格,但是有些情况下由于疏忽,可能会导致函数名字母次序写反而无法构成重载,而这种错误在编译期间是不会报出的,只有在程序运行时没有得到预期结果才来debug会得不偿失,因此C++11提供了override和final两个关键字,可以帮助用户检测是否重写。
final:修饰虚函数,表示该虚函数不能再被继承
class Car { public: virtual void Drive() final {} }; class Benz :public Car { public: virtual void Drive() { cout << "Benz-舒适" << endl; } };
override: 检查派生类虚函数是否重写了基类某个虚函数,比如参数列表,返回值,函数名是否相同等,如果没有则编译报错
class Car{ public: virtual void Drive() {} }; class Benz :public Car { public: virtual void Drive() override { cout << "Benz-舒适" << endl; } };
在虚函数的后面写上 =0 ,则这个函数为纯虚函数。包含纯虚函数的类叫做抽象类(也叫接口类),抽象类不能实例化出对象。派生类继承后也不能实例化出对象,只有重写纯虚函数,派生类才能实例化出对象。纯虚函数规范了派生类必须重写,另外纯虚函数更体现出了接口继承
class Car { public: virtual void Drive() = 0; }; class Benz :public Car { public: //重写纯虚函数才能实例化出对象 virtual void Drive() { cout << "Benz-舒适" << endl; } }; class BMW :public Car { public: virtual void Drive() { cout << "BMW-操控" << endl; } }; void Test() { Car* pBenz = new Benz; pBenz->Drive(); Car* pBMW = new BMW; pBMW->Drive(); }
1.可以更好地去表示现实世界中,没有实例化对象对应的抽象类型。比如:植物、人、动物等
2.体现接口继承,强制子类取重写虚函数。如果不重写的话,子类也是抽象类
要注意和override区分,override是检查子类虚函数是否完成重写
普通函数的继承是一种实现继承,派生类继承了基类函数,可以使用函数,继承的是函数的实现。纯虚函数的继承是一种接口继承,派生类继承的是基类虚函数的接口,目的是为了重写,达成多态,继承的是接口。所以如果不实现多态,不要把函数定义成纯虚函数
// 这里常考一道笔试题:sizeof(Base)是多少? class Base { public: virtual void Func1() { cout << "Func1()" << endl; } private: int _b = 1; };
通过观察测试我们发现b对象大小是8bytes,除了_b成员,还多一个__vfptr*放在对象的前面(注意有些平台可能会放到对象的最后面,这个跟平台有关),对象中的这个指针我们叫做虚函数表指针(v代表virtual,f代表function)*。一个含有虚函数的类中都至少都有一个虚函数表指针,因为虚函数的地址要被放到虚函数表中,虚函数表也简称虚表。那么派生类中这个表放了些什么呢?我们接着往下分析
虚表指针——和菱形虚拟继承不一样
这里和虚拟继承那里不一样,他们都用了virtual关键字,但是它们的使用场景完全不一样,解决的也是不一样的问题,他们之间没有关联。虚继承产生的叫做虚基表,虚基表里面存的距离虚基类的偏移量。
// 针对上面的代码我们做出以下改造 // 1.我们增加一个派生类Derive去继承Base // 2.Derive中重写Func1 // 3.Base再增加一个虚函数Func2和一个普通函数Func3 class Base { public: virtual void Func1() { cout << "Base::Func1()" << endl; } virtual void Func2() { cout << "Base::Func2()" << endl; } void Func3() { cout << "Base::Func3()" << endl; } private: int _b = 1; }; class Derive : public Base { public: virtual void Func1() { cout << "Derive::Func1()" << endl; } private: int _d = 2; }; int main() { Base b; Derive d; return 0; }
通过观察和测试,我们发现了以下几点问题:
派生类对象d中也有一个虚表指针,d对象由两部分构成,虚表指针也就是指向这两部分的。一部分是父类继承下来的成员,另一部分是自己的成员。
基类b对象和派生类d对象的虚表是不一样的,这里我们发现Func1完成了重写,所以d的虚表中存的是重写的Derive::Func1,因此虚函数的重写也叫作覆盖,覆盖就是指虚表中虚函数的覆盖。重写是语法的叫法,覆盖是原理层的叫法。
另外Func2继承下来后是虚函数,所以放进了虚表,Func3也继承下来了,但是不是虚函数,所以不会放进虚表。
虚函数表本质是一个存虚函数指针的指针数组,这个数组最后面放了一个nullptr。
总结一下派生类的虚表生成:
这里还有一个很容易混淆的问题:虚函数存在哪的?虚表存在哪的?
答:虚函数存在虚表中,虚表存在对象中。
注意上面的回答的错的。但是很多童鞋都是这样深以为然的。注意虚表存的是虚函数指针,不是虚函数,虚函数和普通函数一样的,都是存在代码段的,只是他的指针存到了虚表中。另外对象中存的不是虚表,存的是虚表指针。那么虚表存在哪的呢?实际我们去验证一下会发现vs下是存在代码段的
测试:
void Test() { int tmp = 0; Base b; printf("虚函数表地址:%p\n", (*(int*)(&b))); printf("栈地址:%p\n", &tmp); printf("数据段地址:%p\n", &a);//a是全局变量 int* heap = (int*)malloc(sizeof(int)); printf("堆地址:%p\n", heap); const char* cp = "hello world"; printf("代码段地址:%p\n", cp); }
虚表指针是在哪初始化的?虚表什么时候生成的?
答:虚表指针是在构造函数的初始化列表初始化的(因此构造函数不能是虚函数),虚表在编译时就生成好了。
上面分析了这个半天了那么多态的原理到底是什么?还记得这里Func函数传Person调用的是Person::BuyTicket,传Student调用的是Student::BuyTicket
class Person { public: virtual void BuyTicket() { cout << "买票-全价" << endl; } }; class Student : public Person { public: virtual void BuyTicket() { cout << "买票-半价" << endl; } }; void Func(Person& p) { p.BuyTicket(); } int main() { Person Mike; Func(Mike); Student Johnson; Func(Jack); return 0; }
观察下图的红色箭头我们看到,p是Mike对象的引用时,p.BuyTicket在Mike的虚表中找到的虚函数是Person::BuyTicket。
观察下图的蓝色箭头我们看到,p是Jack对象的引用时,p.BuyTicket在Jack的虚表中找到的虚函数是Student::BuyTicket。
这样就实现出了不同对象去完成同一行为时,展现出不同的形态。
反过来思考我们要达到多态,有两个条件,一个是虚函数覆盖,一个是基类的指针或引用调用虚函数。反思一下为什么?
基类指针和引用,切片指向或者引用基类和派生类对象中切出来的那一部分(可以使用虚表指针vfptr)。而父类对象的切片赋值只会拷贝成员变量过去,不会拷贝vfptr过去。
如果是赋对象过去:
再通过下面的汇编代码分析,看出满足多态以后的函数调用,不是在编译时确定的,是运行起来以后到对象的、中去找的。不满足多态的函数调用是编译时确认好的
void Func(Person* p) { p->BuyTicket(); } int main() { Person mike; Func(&mike); mike.BuyTicket(); return 0; } // 以下汇编代码中跟这个问题不相关的都被去掉了 void Func(Person* p) { ... p->BuyTicket(); // p中存的是mike对象的指针,将p移动到eax中 001940DE mov eax,dword ptr [p] // [eax]就是取eax值指向的内容,这里相当于把mike对象头4个字节(虚表指针)移动到了edx 001940E1 mov edx,dword ptr [eax] // [edx]就是取edx值指向的内容,这里相当于把虚表中的头4字节存的虚函数指针移动到了eax 00B823EE mov eax,dword ptr [edx] // call eax中存虚函数的指针。这里可以看出满足多态的调用,不是在编译时确定的,是运行起来以后到对象的中取找的。 001940EA call eax 00头1940EC cmp esi,esp } int main() { ... // 首先BuyTicket虽然是虚函数,但是mike是对象,不满足多态的条件,所以这里是普通函数的调用转换成地址时,是在编译时已经从符号表确认了函数的地址,直接call 地址 mike.BuyTicket(); 00195182 lea ecx,[mike] 00195185 call Person::BuyTicket (01914F6h) ... }
总结:
构成多态,指向或引用谁就调用谁的虚函数,跟对象有关
不构成多态,对象类型是什么,调用的就是哪个虚函数,跟类型有关
需要注意的是在单继承和多继承关系中,下面我们去关注的是派生类对象的虚表模型,因为基类的虚表模型前面我们已经看过了,没什么需要特别研究的
class Base { public : virtual void func1() { cout<<"Base::func1" <<endl; } virtual void func2() { cout<<"Base::func2" <<endl; } private : int a; }; class Derive :public Base { public : virtual void func1() { cout<<"Derive::func1" <<endl; } virtual void func3() { cout<<"Derive::func3" <<endl; } virtual void func4() { cout<<"Derive::func4" <<endl; } private : int b; };
那么我们如何查看b、d的虚表呢?下面我们使用代码打印出虚表中的函数
typedef void(*vfptr)();//重命名函数指针 void PrintVfTable(vfptr table[]) { //依次取出虚函数表中的函数地址,并调用对应的函数建立起对应关系 cout << "虚表地址:" << table << endl; for (int i = 0; table[i] != nullptr; ++i) { printf("第%d个函数的地址->%p->", i, table[i]); //调用对应的函数 vfptr f = table[i]; f(); } } int main() { // 思路:取出b、d对象的头4bytes,就是虚表的指针,前面我们说了虚函数表本质是一个存虚函数指针的函数指针数组,这个数组最后面放了一个nullptr // 1.先取b的地址,强转成一个int*的指针 // 2.再解引用取值,就取到了b对象头4bytes的值,这个值就是指向虚表的指针 // 3.再强转成VFPTR*,因为虚表就是一个存VFPTR类型(虚函数指针类型)的数组。 // 4.虚表指针传递给PrintVTable进行打印虚表 // 5.需要说明的是这个打印虚表的代码经常会崩溃,因为编译器有时对虚表的处理不干净,虚表最后面没有放nullptr,导致越界,这是编译器的问题。我们只需要点目录栏的-生成-清理解决方案,再编译就好了。 Base b; printf("Base对象的虚函数表:\n"); PrintVfTable((vfptr*)(*(int*)&b)); Derive d; printf("Derive对象的虚函数表:\n"); PrintVfTable((vfptr*)(*(int*)&d)); return 0; }
多继承的虚表指针
继承了多少个类就有多少张表
class Base1 { public: virtual void func1() { cout << "Base1::func1" << endl; } virtual void func2() { cout << "Base1::func2" << endl; } private: int b1; }; class Base2 { public: virtual void func1() { cout << "Base2::func1" << endl; } virtual void func2() { cout << "Base2::func2" << endl; } private: int b2; }; class Derive : public Base1, public Base2 { public: virtual void func1() { cout << "Derive::func1" << endl; } virtual void func3() { cout << "Derive::func3" << endl; } private: int d1; }; typedef void(*vfptr)();//重命名函数指针 void PrintVfTable(vfptr table[]) { //依次取出虚函数表中的函数地址,并调用对应的函数建立起对应关系 cout << "虚表地址:" << table << endl; for (int i = 0; table[i] != nullptr; ++i) { printf("第%d个函数的地址->%p->", i, table[i]); //调用对应的函数 vfptr f = table[i]; f(); } } int main() { //因为Derive是多继承的,所以有两个虚表指针 Derive d; printf("Derive对象的虚函数表1:\n");//对应Base1 PrintVfTable((vfptr*)(*(int*)&d)); printf("Derive对象的虚函数表2:\n");//对应Base2 PrintVfTable((vfptr*)(*(int*)((char*)&d + sizeof(Base1)))); return 0; }
观察下图可以看出:多继承中派生类的未重写的虚函数放在第一个继承的基类部分的虚函数表中,而重写了的虚函数会照样覆盖。这样就能保证不同的基类指针调用的函数是对应自己基类的虚函数(如果重写了就调用重写的)
实际中我们不建议设计出菱形继承及菱形虚拟继承,一方面太复杂容易出问题,另一方面这样的模型,访问基类成员有一定的性能损耗。所以菱形继承、菱形虚拟继承我们的虚表我们就不看了,一般我们也不需要研究清楚,因为实际中很少用。如果好奇心比较强的宝宝,可以去看下面的两篇链接文章。