VxWorks上STL的效率

沉醉于STL强大的功能及其中的泛型编程思想,在VxWorks上写程序时使用了STL,一切都正常,除了在最后做性能测试时根本不相信程序怎么会那么慢。

为此,专门编写了下面的小程序做对比测试。先看测试结果:

TestMap    last: 201
TestVector last: 116
Test       last: 2
另外,还要注意生成的.o文件的大小:
只有test:   38K
包含MAP:    98K
包含VECTOR:  68K
(按照VxWorks FAQ上所说,在编译时加入了-fno-exceptions -fno-rtti,似乎没有效果)

测试程序如下:

#include 
#include 
#include 
#include "tickLib.h"

using namespace std;

#define TEST_MAP
#define TEST_VECTOR

#ifdef TEST_MAP
int TestMap()
{
    map test_map;

    test_map.insert(make_pair(1, 111));
    test_map.insert(make_pair(2, 222));
    test_map.insert(make_pair(3, 333));

    map::iterator it = test_map.find(3);
    int ret = (*it).second;
    //printf("%d/n", ret);
    return 0;
}
#endif

#ifdef TEST_VECTOR
int TestVector()
{
    vector test_vec;
    test_vec.push_back(111);
    test_vec.push_back(222);
    test_vec.push_back(333);

    vector::iterator it = test_vec.begin();
    for( ; it != test_vec.end(); ++it) if (*it == 333);
    return 0;
}
#endif

int test()
{
    int arr[5];

    arr[0] = 111;
    arr[1] = 222;
    arr[2] = 333; 

    for (int i = 0; i < 3; i++) if (arr[i] == 333);
    //printf("%d/n", arr[2]);
    return 0;
}


int main()
{
    int i, num = 100000;

#ifdef TEST_MAP
    int map_tick = tickGet();
    for (i = 0; i < num; i++)
        TestMap();
    printf("TestMap last: %d/n", tickGet() - map_tick);
#endif

#ifdef TEST_VECTOR
    int vec_tick = tickGet();
    for (i = 0; i < num; i++)
        TestVector();
    printf("TestVector last: %d/n", tickGet() - vec_tick);
#endif

    int base_tick = tickGet();
    for (i = 0; i < num; i++)
        test();
    printf("Test last: %u/n", tickGet() - base_tick);
}
得到这个结果令人沮丧无比。不过,怎么可能这么慢呢?而且编译的为什么会那么大?

仔细想想,泛型编程中用到了大量的模板,模板虽不会像宏替换那样“简单”,但是,每次实例化一种容器,相当于用此实例,将容器的实现全部宏替换一下。这也是为什么使用模板定义的类只能在头文件中:它只是广义的类型(包括实现代码)。(我并没有深入了解模板的具体实现,只是推测)

这或许可以解释编译出的文件大,但为什么会那么慢呢?至少,Vector不应该那么慢吧?关于STL的效率,有句话是这么说的:它的效率与你自己实现时的效率一样。再仔细看程序,在push_back中,STL需要使用allocator分配内存;begin,end是两次函数调用。这些操作产生这样的效率应该不算不合理。

STL是个好东西,但是,并不是任何情况下它都是想要的那样。

你可能感兴趣的:(C++思维)