条款44:将与参数无关的代码抽离templates

1.前言

Template是个节省时间和避免代码重复的一个方法。不再需要键入20个类似的classes而每一个带有15个成员函数,只需要键入一个class template,留给编译器去具现化那20个你需要的相关classes和300个函数。(class template的成员函数只有在被使用时才被暗中具现化,只有在这300个函数的每一个都被使用,你才会获得这300个函数),function template有类似的诉求。替换写许多函数,只需写一个function template,然后让编译器做剩余的事情。

但如果不小心,使用template可能会导致代码膨胀:其二进制码带着重复的代码,数据。其结果可能是源码看起来合身且整齐,但目标码(object code)却不是那么一回事。

2.实例分析

当你编写某个函数,而你明白其中某些部分的实现码和另外一个函数的实现码实质相同,我们一般会抽象出两个函数的共同部分,把它放进第三个函数中,然后令原先两个函数调用这个新函数。同样的道理,如果你正在编写某个class,而其中的某些部分和另外一个class的某些部分相同,你也不会重复这共同的一部分,取而代之的是你会把共同部分搬移到新的class去,然后使用继承或复合,令原先的1classes取用这共同特性。而原的classes的互异部分仍然留在原位置不动。

编写templates时,也是做相同的分析,以相同的方式避免重复,但其中有个窍门。在non-template代码中,重复十分明确:你可以看到两个函数或两个classes之间有所重复。然而在template代码中,重复是隐晦的:毕竟只有一份template源码,所以必须训练自己去感受当template被具现化时可能发生的重复。

举个例子,假设你想为固定尺寸的正方矩阵编写一个temolate。该矩阵的形式之一是支持逆矩阵运算(matrix inversion)。

template//template支持n,x,n矩阵,
                                    //元素是类型T的objects;见以下关于//size_t参数信息
class SquareMatrix{    
    public:
        ...
        void invert();//求逆矩阵

};           

这个template接受一个类型参数T,除此以外还接受一个类型为size_t的参数那是个非类型参数(non-type parameter)。这种参数和类型参数比较起来不常见,但它们完全合法,就比如本例:

SquareMatrix sml;
...
sml.invert();//调用SquareMatrix::invert
SquareMatrix sm2;
...
sm2.invert();//调用SquareMatrix::invert

这会具象化两份invert,这些函数并非完完全全相同,因为其中一个操作的是5*5矩阵而另一个操作的是10*10矩阵,但除来常量5和10,两个函数的其它部分完全相同。这是template引出代码膨胀的一个典型例子。

如果你能看到两个函数完全相同,除了使用5和使用10的区别,本能是为它们建立一个带数值参数的函数,然后以5和10来调用这个带参数的函数,而不重复代码。下面是对SquareMatrix的第一次修改:

template
class SquareMatrixBase{

    protected:
        ...
        void invert(std::size_t matrixSize);//以给定的尺寸求逆矩阵
        ...

};
tempalate
class SquareMatrix:private SquareMatrixBase
{
    private:
        using SquareMatrixBase::invert;//避免遮掩base 版本的invert

    public:
        ...
        void invert() 
        {
            this->invert(n);
        }
};

正如所看到的,带参数的invert位于base class SquareMatrixBase中,和SquareMatrix一样,SquareMatrixBase也是个template,不同的是它只对”矩阵元素对象的类型“参数化,不对矩阵的尺寸参数化。因此对于给定之元素对象类型,所有矩阵共享同一个SquareMatrixBase class。它们也将因此共享这唯一一个class内的invert。

SquareMatrixBase::invert只是企图成为“避免derived class代码重复”的一种方法,所以它以protected替换public。调用它造成的额外成本应该是0,因为derived classes的inverts调用base class版本时用的是Inline调用。这些函数使用“this->”记号,假设不这样做,模板化基类内的函数名称会被derived classes掩盖。也请注意SquareMatrix和SquareMatrixBase之间的继承关系是private。这反映一个事实:这里的base class只是为了帮助derived class实现,不是为了表现SquareMatrix和SquareMatrixBase之间的is-a关系。

当然,这里目前还存在一些问题:SquareMatrixBase::invert如何知道该数据是什么数据,虽然可以从参数中知道矩阵尺寸,但如何知道哪个特定的矩阵的数据在哪?想必只有derived class知道,Derived class如何联络其base class做逆运算操作动作。一个可能的做法是为了SquareMatrixBase::invert添加另一个参数,也许是个指针,指向一块用来放置矩阵数据的内存起点,这个方法行得通。但invert不是唯一一个可写为“形式与尺寸无关并可移动到SquareMatrixBase内的SquareMatrixBase内“的SquareMatrix函数。如果有若干这样的函数,我们唯一要做的就是找出保存矩阵元素值得那块内存。我们可以对所有这样得函数添加一个额外得参数,却得一次又一次地告诉SquareMatrixBase相同地信息,这样似乎不好。

另一个办法是令SquareMatrixBase储存一个地址,指向矩阵数值所在得内存。而它只要存了那些东西,就可能存储矩阵得大小。类似这样:

template
class SquareMatrixBase{

    protected:
        SquareMatrixBase(std::size_t,T* pMem):size(n),pData(pMem)//存矩阵大
                                                                //小和一个指针,指向矩阵数值
        {

            
        }

        void setDataPtr(T* ptr)
        {
            pData=ptr;
        }
        ....
        private:
        std::size_t size;//矩阵大小
        T* pData;//指针,指向矩阵内容
};

这允许derived classes决定内存分配方式。某些实现版本也许会决定将矩阵数据存储在SquareMatrix对象内部:

template
class SquareMatrix:private SquareMatrixBase
{

    public:
        SquareMatrix():SquareMatrixBase(n,data) { }//送出矩阵大小和数据指针给base class
    ....
    private:
        T data[n*n];

};

这种类型的对象不需要动态分配内存,但对象自身可能性非常大,另一种做法是把每一个矩阵的数据放进heap(也就是通过new 来分配内存);

template
class SquareMatrix:private SquareMatrixBase
{
    public:
        SquareMatrix():SquareMatrixBase(n,0),pData(new T[n*n])//将base 的数据指针设为null
        {                                                    //为矩阵分配内存
            this->setDataPtr(pData.get());//将它的一个副本交给base class
        }
   
    private:
        boost::scoped_array pData;
}

3.总结

(1)Template生成多个classes和多个函数,所以任何template代码都不该与某个造成膨胀的template参数产生联系;

(2)因非类型模板参数而造成的代码膨胀,往往可以消除,做法是以函数参数或class成员变量替换template参数

(3)因类型参数(type parameters)而造成的代码膨胀,往往可降低,做法是让带有完全相同二进制表述的具现类型共享实现码。

你可能感兴趣的:(c++,开发语言)