STL中的map底层默认比较

大家知道,STL中的map底层是用红黑树实现的,其泛型原型如下:

template 
class map {
              ......
              }

其中_Key表示比较的键(key),_Tp表示值(value),_Compare表示比较方式,_Alloc表示内存分配器。

一般我们在写map的时候总是类似于写出如下代码:

map* my_map = new map;

表示键为int类型,值为字符串类型。这里之所以不对_Compare和_Alloc加以限制,是因为int是C++内置类型,有默认比较方式,_Alloc也采用STL的

默认的内存方案。但是如果有如下结构体:

struct Term{
    char* str;
    int   hashCode;
};

现在我们要将该Term作为map的键,并假设Term所对应的值为Term出现的频率(int型),那么能不能这样写:

map* my_map = new map;

显然这样写map是无法正常运作的,原因是struct Term并非C++的内置类型,默认不知道如何去比较它。这时候就需要修改map的默认比较方式:

复制代码

template 
struct Compare
{
  int operator()(const T& x, const T& k) const{
    if(x.hashCode >= k.hashCode) return 0;
    else return 1;
  }
};

复制代码

这里采用的是函数对象(function object)的方式去加载map的比较方式,表示使用Term的hashCode作为比较方式,以对红黑树进行查找、插入等操作。

这样我们就可以把map写成下面的形式:

map >* my_map = new map >;

这样map就可以正常运作了,比如进行插入操作:

Term my_term;
my_map->insert(make_pair(my_term, 1));

但是上面的struct Compare为什么要写成这样的形式,写成这样行不行:

复制代码

template 
struct Compare
{
  int operator()(const T& x, const T& k) const{
    if(x.hashCode >= k.hashCode) return 1;
    else return 0;
  }
};

复制代码

这是不行的。为什么不行,首先来看一看map中find的源代码:

复制代码

template 
typename _Rb_tree<_Key,_Value,_KeyOfValue,_Compare,_Alloc>::iterator 
_Rb_tree<_Key,_Value,_KeyOfValue,_Compare,_Alloc>::find(const _Key& __k)
{
  _Link_type __y = _M_header;      // Last node which is not less than __k. 
  _Link_type __x = _M_root();      // Current node. 

  while (__x != 0) 
    if (!_M_key_compare(_S_key(__x), __k))
      __y = __x, __x = _S_left(__x);
    else
      __x = _S_right(__x);

  iterator __j = iterator(__y);   
  return (__j == end() || _M_key_compare(__k, _S_key(__j._M_node))) ? end() : __j;
}

复制代码

上面的代码中_M_key_compare就表示我们的那个比较函数对象,_S_key(__x)表示取__x节点的key,并和__k比较。

if (!_M_key_compare(_S_key(__x), __k))
      __y = __x, __x = _S_left(__x);

表示如果_S_key(__x) >= __k即,如果节点的key大于或等于查找的key那么就__x就等于它的左子节点,否则就为右子节点。

但为什么等于的时候不直接返回呢,却在继续查找?举个例子来说:

如果我们要查找key为10的节点是否在树中时,首先从根节点开始查找,由于8<10,这时_M_key_compare返回1,那么此时,

转向root的右子树,然后由于10==10,_M_key_compare返回0,这时转向左子树,但左子树是空的,循环停止。

 return (__j == end() || _M_key_compare(__k, _S_key(__j._M_node))) ? end() : __j;

由于此时__j表示"10"这个节点(其实是个迭代器),由于__k为10,而__j._M_node的key为10,_M_key_compare返回0,有三元运算符可知,

此时返回是__j,即表示找到了。因此我们的比较函数对象必需写成:

当节点键大于等于所要查找或插入的键时,返回0(false),反之为1(true),这是由内部源代码所决定的。

你可能感兴趣的:(c/c++)