先编一个小故事来说明为什么要有泛型编程
在很多场景下,我们都会遇到一个需求,实现两个数据的交换,如冒泡算法,快速排序算法,逆置算法等。
学了函数重载后,你突发奇想地去实现一个通用的 swap 函数。
手搓完所有内置类型的 swap 函数之后,你打算开始手搓自定义类型,顺序表、链表、栈、队列、哈希表……
写着写着你不禁怀疑人生,自定义类型数不胜数,每出现一个类型,都得添加一份代码,每份代码之间除了数据类型不同以外没有任何区别,就算当重载的版本足够多,这个 swap 看起来像是通用的,这个真的算是一个通用的 swap 函数吗?
所以,只有函数重载是难以实现出不针对某个类型,而是面向广泛类型的通用函数。
仔细观察上面的 swap 函数,就会发现,它们的逻辑都是一样的,每一份代码除了类型不同外其余都相同,那么那么有没有一个像是模具一样的东西,通过给这个模具中填充不同材料(类型),来获得不同材料的铸件(即生成具体类型的代码),就像下面的模具浇筑一样。
答案是有的,C++创始人本·贾尼(Bjarne Stroustrup)提出一种叫做泛型编程的概念。
所谓泛型指的是,编写与类型无关的通用代码,泛型编程可以提高代码的复用性、灵活性和可维护性,降低维护成本,提高代码的质量。同时,它还可以将算法与数据结构完全分离,使得代码更加清晰和易于理解。
而模板就是泛型的基础,模板就是我们期待的那个模具。
函数模板是一种特殊的函数,它能够接受不同类型的数据参数,并且根据输入参数的类型生成相应的函数。它提供了一种方法,使得我们可以写出与数据类型无关的代码,提高了代码的复用性。
C++中,模板函数的定义格式如下:
template <typename T>
return_type function_name(parameter_list)
{
// function body
}
说明:
template
是模板声明,表示这个函数是一个模板函数;T
是模板参数;return_type
是函数的返回类型;function_name
是函数的名称parameter_list
是函数的参数列表。注意:typename
是用来定义模板参数关键字,typename
也可以替换成class
(切记:不能使用struct代替class)
函数模板是一个蓝图,它本身并不是函数,是编译器用使用方式产生特定具体类型函数的模具。所以其实模板就是将本来应该我们做的重复的事情交给了编译器。
下面是一个例子:
在编译器编译阶段,编译器需要根据传入的实参类型来推演生成对应类型的函数以供调用。比如:
实参d1,d2类型为double
,编译器推演出T
是double
,生成一份适用于double
类型swap函数
实参i1,i2类型为int
,编译器推演出T
是int
,生成一份适用于int
类型swap函数
实参a,b类型为char
,编译器推演出T
是char
,生成一份适用于char
类型swap函数
了解完原理之后我们就可以知道,所谓的函数模板的实例化就是编译器推演生成具体类型的函数过程,实例化分成两种,分别是隐式实例化和显式实例化。
上面原理部分时用的例子就是一个典型的隐式实例化,顾名思义,隐式实例化就是让编译器根据实参推演模板参数的实际类型
【以下例子为:编写一个程序查看汇编观察编译器是否推演生成了函数。】
但是隐式实例化还是有不小局限的,如果信息不足编译器无法完成实例化,或者信息上有冲突编译器也无法完成实例化。
【代码例子一:信息不足无法完成实例化】
template<typename T>
T* func(int n)
{
T* ret = new T[n];
return ret;
}
int main()
{
double* arr = func(10);
return 0;
}
说明:
函数 func 的参数并不以模板参数作为参数类型,编译器通过实参不知道将T
推演成double
,这时候编译器就会宕机,因为告知编译器的信息不足。
【代码例子二:参数匹配冲突无法完成实例化】
template<class T>
T Add(const T& left, const T& right)
{
return left + right;
}
int main()
{
int a1 = 10, a2 = 20;
double d1 = 10.0, d2 = 20.0;
Add(a1, a2); // 第一次调用
Add(d1, d2); // 第二次调用
Add(a, d); // 第三次调用
return 0;
}
说明:
该第三次函数调用语句不能通过编译,因为在编译期间,当编译器看到该实例化时,需要推演其实参类型通过实参a1
将T
推演为int
,通过实参d1
将T
推演为double
类型,但模板参数列表中只有一个T
,编译器无法确定此处到底该将T
确定为 int
或者 double
类型而报错。
注意:在模板中,编译器一般不会进行类型转换操作,因为一旦转化出问题,编译器就需要背黑锅。
这时候就需要用到显式实例化了。
显式实例化就是在函数模板实例化过程中告知编译器模板参数的类型,编译器不用再推演。
显式实例化:在函数名后以<类型1,类型2...>
的格式指定模板参数的实际类型。
例子:
template<class T1, class T2>
T Add(const T1& left, const T2& right)
{
return left + right;
}
int main(void)
{
int a = 10;
double b = 20.0;
// 显式实例化
Add<int, double>(a, b);
return 0;
}
显式类型转换也有注意点:如果类型不匹配,编译器会尝试进行隐式类型转换,如果无法转换成功编译器将会报错。
一个非模板函数可以和一个同名的函数模板同时存在,而且该函数模板还可以被实例化为这个非模板函数
对于非模板函数和同名函数模板,如果其他条件都相同,在调动时会优先调用非模板函数而不会从该模板产生出一个实例。如果模板可以产生一个具有更好匹配的函数, 那么将选择模板。
// 专门处理int的加法函数
int Add(int left, int right)
{
return left + right;
}
// 通用加法函数
template<class T>
T Add(T left, T right)
{
return left + right;
}
int main()
{
Add(1, 2); // 与非模板函数匹配,编译器不需要特化
Add<int>(1, 2); // 调用编译器特化成int类型的Add版本
Add<double>(1.0, 2.0); // 调用编译器特化成double类型的Add版本
return 0;
}
图中为函数调用的汇编指令,可以观察到三次调用的函数各不相同。
很显然,这份代码定义的是一个int
类型的栈,如果我们想要存放double
类型的数据,只需要将第一行的int
改成double
就可以了。
但是现在有一个新的需求,要在main
函数里创建两个栈,一个栈存放int
类型数据,另一个栈存放doule
类型数据,这该怎么实现?
目前来说,好像只能选择将这份代码拷贝一份,将原来的Stack
改成Stack_int
专门给int
用,新的那份改成Stack_double
专门给double
类型使用,但是这种方法的代码复用率极低。
而类模板可以解决这个问题。
C++中,类模板的定义如下:
// 类模板参数列表
template<class T1, class T2, ..., class Tn>
class 类模板名
{
// 类内成员定义
};
实际例子:动态顺序表类模板
// 注意:Vector不是具体的类,是编译器根据被实例化的类型生成具体类的模具
template<class T>
class Vector
{
public :
// 注意:虽然多了模板参数,但是定义指明构造函数名与类名相同
// 不能写成 Vector
Vector(size_t capacity = 10)
: _pData(new T[capacity])
, _size(0)
, _capacity(capacity)
{}
// 使用析构函数演示:在类中声明,在类外定义。
~Vector();
void PushBack(const T& data);
void PopBack();
// ...
size_t Size() {return _size;}
T& operator[](size_t pos)
{
assert(pos < _size);
return _pData[pos];
}
private:
T* _pData;
size_t _size;
size_t _capacity;
};
// 注意:类模板中函数放在类外进行定义时,需要加模板参数列表
template <class T>
Vector<T>::~Vector()
{
if(_pData)
delete[] _pData;
_size = _capacity = 0;
}
类模板的实例化和函数模板的实例化类似,但是类模板只能显式实例化。
用上面的例子的Vector
类模板分别实例化int
类型和double
类型的模板类:
Vector<int> s1;
Vector<double> s2;
注意点:
Stack
),类名即类型,但是对于模板类来说,类名不是类型,类名<数据类型>
才是类型。template class A {};
这个A就是类模板。编译器不会为类模板生成代码。