[STL] __gnu_cxx::hash_map使用中的一些问题

今天看《libstdc++ manual 20110201》中提到这个hash_map是为了向后兼容SGI/HP的代码,但是已经被废弃了,取而代之的是C++0x中的unordered_map/unordered_multimap,在tr1文件夹中(老版本的编译器一般不带这个文件夹)。

==============================================================================


这个不是gcc标准库的一部分,而是扩展ext中的一个功能,他提供了一个哈希表的实现。定义如下:

  1. template<class _Key, class _Tp, class _HashFcn  = hash<_Key>,  
  2.     class _EqualKey = equal_to<_Key>, class _Alloc =  allocator<_Tp> >  
  3.     class hash_map;  

可见,如果定义完整的hash_map,需要提供<key类型,value类型,哈希函数,key相等判断函数,value类型内存分配器>5个模板参数,由于后三个都有默认值,所以一般我们只需要提供前两个。

 

1> 定义__gnu_cxx::hash_map<string, int> myHash;不会出错,然而一旦对myHash进行操作,就会出现编译错误,“instantiated from here”,这是因为gnu版本的hash_map只实现了有限的几个hash模板函数(见第三个模板参数,这些函数在hash_fun.h中),而这些函数里包括hash<const char*>,但是不包括hash<std::string>的实例化。解决办法是定义哈希表前自己定义一个实例,这样编译器就知道调用这个函数了。

  1. namespace __gnu_cxx  
  2. {  
  3.     template<> struct hash<std::string>  
  4.     {  
  5.         size_t operator()(const std::string &s) constreturn hash(s.c_str()); }  
  6.     }  
  7. }  


 

2> 发现了gnu帮我们实现了hash<const char*>/hash<char*>的版本,那么实际上,有时候就可以直接利用这个版本了。然而还是会出现新的问题:

  1. __gnu_cxx::hash_map<char*, int> myHash;  
  2. char name1[10] = "panda";  
  3. char name2[10] = "panda";  
  4. myHash[name1] = 1;  
  5. __gnu_cxx::hash_map<char*, int>::iterator hit = myHash.find( name2 );  
  6. if( myHash.end() == hit ) printf( "Not Find\n" );  


你会发现,虽然name1name2都是panda,但是插入了name1,用name2去查找时,还是查无结果。这是涉及到第四个模板参数,判断key相等,默认的是std::equal_to,而这个函数的定义是用operator==来进行判断的,指针的相等当然就是地址一样了,而name1name2的地址显然不同。解决办法是用自己指定的函数模板替代默认的。

  1. template <class _Tp>  
  2. struct my_equal_to : public binary_function<_Tp, _Tp, bool>  
  3. {  
  4.     bool  
  5.     operator()(const _Tp& __x, const _Tp& __y) const  
  6.     { return strcmp( __x, __y ) == 0; }  
  7. };  
  8. // 定义哈希表时,用如下方法(这次不能跳过第三个模板参数,所以要指定):  
  9. __gnu_cxx::hash_map< char*, int, __gnu_cxx::hash<char*>, my_equal_to<char*> >  myHash;  


 

3> 遍历__gnu_cxx::hash_map出现了死循环,这个问题并不常见,然而遇到了可能真让人摸不到头脑。还好我之前见过这篇帖子,没有在这里陷很久。

http://blog.csdn.net/tototony/article/details/5689882

这个问题简单说来,就是gnu的实现是,内部有个_M_Cur指针指示当前位置A,每次计算operator++,都用当前位置的key调用hash函数计算下一个位置B,如果key传入hash_map以后,又在外部将其内容破坏,导致hash函数计算后的B位置在A位置之前,那么从B到达A以后,又会跳回B,形成B-A区间的死循环。

你可能感兴趣的:([STL] __gnu_cxx::hash_map使用中的一些问题)