Dio夹心小面包

『 C++ - Hash 』闭散列与开散列哈希表详解及其实现 ( 万字 )

文章目录

- 哈希表概念
- 常见哈希函数
- - 直接定址法
  - 除留余数法
- 哈希冲突的解决方案
- - 闭散列与闭散列哈希表的实现
  - - 闭散列哈希表的节点设置与基本架构
    - 闭散列哈希表的插入逻辑及实现
    - 闭散列哈希表的扩容
    - 闭散列哈希表的查找
    - 闭散列哈希表的数据删除
    - 闭散列哈希表整体代码(供参考)
  - 开散列与开散列哈希表的实现
  - - 开散列哈希表的节点设置与基本架构
    - 开散列哈希表的插入逻辑及实现
    - 开散列哈希表的扩容
    - - 哈希表扩容的优化
    - 确保哈希表的泛型特性
    - 开散列哈希表的查找
    - 开散列哈希表的数据删除
    - 开散列哈希表整体代码(供参考)

哈希表概念

哈希表是一种常用的数据结构,该数据结构往往能存储大量的数据,在C++当中,底层为哈希表的容器最常见的为unordered_xxx系列,例如unordered_map与unordered_set,这两个容器是在C++当中以哈希表为底层的关联式容器,具体的关联式容器的特点参照上篇;

哈希表通过一个叫做哈希函数(Hash Function)的算法,将存储的每个数据项与一个唯一的键值(key)进行绑定;这个函数会将每个键值映射到哈希表中的一个位置,以便对数据进行快速访问;

哈希表的高效决定了这个数据结构在计算机中的地位:

高效增删查改

在理想情况下,哈希表在进行这些操作的时间复杂度一般可以达到接近O(1);

由于哈希表中的数据是以元素的存储位置与关键码的绑定映射的关系,那么在对数据进行查找的时候只需要通过所谓的关键码即能找到该元素;

本文主要实现对K,V键值对数据插入的哈希表模型;

该篇博客进行对哈希表中迭代器的封装

常见哈希函数

假设存在一组数据;

{13,10,7,4,8,9};

要将数据进行存储,即可以使用一种简单的哈希对数据进行存储;

以该图为例即为一种简单的哈希;

该方法也被称为直接定址法,即将数据以绝对映射的方式放置在顺序容器当中(例如数组),从而达到存储数据的目的;

直接定址法

在上面的例子当中即为直接定址法;

取关键字的某个线性函数为散列地址:Hash(Key) = A*Key + B;

以绝对映射的关系将数据进行存储,该方法方便快捷;

代码(简单实现,供参考):

#include 
#include 

using namespace std;

class HashTable {
private:
    vector<int> table;

public:
    HashTable(int size) {
        table.resize(size, -1); // 初始化哈希表，将所有元素设为-1
    }

    void insert(int key, int value) {
        if (key >= 0 && key < table.size()) {
            table[key] = value; // 将值插入哈希表中对应的位置
        } else {
            cout << "Key out of range!" << endl;
        }
    }
};

int main() {
    HashTable hashtable(100); // 创建一个大小为100的哈希表

    hashtable.insert(42, 10);
    hashtable.insert(15, 20);
    hashtable.insert(67, 30);
    
    return 0;
}

当然其有一个较大的缺点,该方法只支持数据量差值较小,或是数据相对集中的场景;

若是数据间差值较大,则可能导致空间浪费的情况;

存在一组数据为{3,2,5,7,1001};

在这种场景中若是使用直接定址法则至少需要开最大值1001+1个空间对数据进行存储;

而实际数据量仅仅为5个,这将大大浪费空间;

除留余数法

除留余数法能够大大降低直接定址法所出现的极端场景;

同样以上面直接定址法的极端场景为例:

存在一组数据为{3,2,5,7,1001};

使用除留余数法对数据进行存储:

将上述的数据取余表的大小,并将数据存储至余数部分;

{ 3 % 10 = 3 , 2 % 10 = 2 ,5 % 10 = 5 , 7 % 10 = 7 ,1001 % 10 = 1 }

即设散列表中允许的地址数为m,取一个不大于m但最接近或者等于m的质数P作为除数;

按照哈希函数:Hash(key) = key%p(p<=m)将关键码转换成对应的哈希地址(一般除数P为表的大小);

代码(简单实现,供参考):

#include 
#include 

using namespace std;

class HashTable {
private:
    vector<vector<int>> table;
    int size;

public:
    HashTable(int tableSize) {
        size = tableSize;
        table.resize(size);
    }

    int hash(int key) {
        return key % size; // 使用除留余数法计算哈希值
    }

    void insert(int key, int value) {
        int index = hash(key);
        table[index].push_back(value); // 插入值到哈希表的对应位置
    }

};

int main() {
    HashTable hashtable(10); // 创建一个大小为10的哈希表

    hashtable.insert(42, 10);
    hashtable.insert(15, 20);
    hashtable.insert(67, 30);


    return 0;
}

这种方法可以有效的解决极端情况当中对于两数之间差值较大的情况;

但是随之而来的又有另外的问题:

若是两个数据的取余余数相等应该如何进行解决?

如该问题所述,若是出现这种情况仍然将数据放置进对应的位置时,新数据将会把原来的数据进行覆盖,从而出现数据丢失的情况;

这种情况也被称为哈希冲突;

本文将着重以除留余数法为主题;

哈希冲突的解决方案

在上文当中,在使用除留余数法对数据进行存储时将会造成哈希冲突;

若是出现哈希冲突的情况下一样强行将数据进行存储那么将可能出现数据覆盖的问题;

上文中出现的两段代码,尤其是对于除留余数法都是简单的哈希表实现,而在实际的使用当中,在使用除留余数法对数据进行存储时应该注意哈希冲突的问题;

在一般情况下处理哈希冲突有两种方案:

闭散列
开散列

闭散列与闭散列哈希表的实现

闭散列（Closed Hashing）也被称作开放定址法;

当数据在插入时发生哈希冲突时,如果哈希表未满,说明在哈希表当中还有可以存放数据的位置;

而闭散列则为当哈希未满时将数据插入至其他非冲突位置;

而所谓的其他非冲突位置即为空位置;

至于空位置的位置决定于插入时的探测方式,一般的探测方式为以下两种:

线性探测

线性探测即为将数据插入至冲突位置的下一个空位;
二次探测

二次探测为将数据插入至下一个位置的乘方倍的位置,即 i² 位置;

闭散列哈希表的节点设置与基本架构

当数据插入时若是出现哈希冲突,则需要采用线性探测或者二次探测的方式对数据进行插入;

在删除时只需要使用插入时相同的哈希规则(映射关系)对数据进行查找并删除即可;

而实际当中,在数组中对数据直接进行删除其效率会变得尤其低效;

且若是对数据直接删除则会出现一种情况:

不能很好的在线性探测或者二次探测中探测到冲突数据应该插入的位置;

那么在这种情况下不能对数据直接进行删除,对应的应该采用一种伪删除法;

即表中所存储的数据也不能是所需要的数据,相对的应该存储一个原生结构,这个结构内应存放数据以及其存在状态;

代码(供参考):

enum State{
  //设置枚举类型
  /*
    分别为
    1.空
    2.存在
    3.删除
    三个状态
  */
    EMPTY,
    EXIST,
    DELETE
};

template<class K,class V>
struct HashiData{
      //设置节点
        std::pair<K, V> _kv;//Key Value模型
        State _state = EMPTY;//默认情况下节点为空
};

template<class K, class V>
class HashiTable{
    //整体构架
    public:
    typedef HashiData<K, V> Data;//使用typedef进行重命名方便后序的调用

    HashiTable():_tables(0),_n(0){}//构造函数使得初始的Vector容器的大小为0，_n表示当前存在的有效数据
    
    
    //其他成员函数...
    
    private:
        std::vector<Data> _tables;//利用vector容器实现闭散列的哈希表
        size_t _n;//存储数据个数
};

在该段代码中,使用了枚举的方式设置了数据存在状态的可能性(空,存在,删除);

并设置了一个节点,这个节点主要存储了数据及其存在的情况;

这段代码中整体结构主要存在两个成员:

_table

该容器即为本质哈希表的结构,为一个vector容器;
_n

这个成员表示了目前数据的存储个数,当然它表示的是表中状态为EXIST状态的数据个数;

闭散列哈希表的插入逻辑及实现

插入逻辑即为上文提到的除留余数法,当发生哈希冲突的时候使用线性探测或者二次探测的方式来解决哈希冲突的问题;

代码(供参考):

 bool Insert(const std::pair<K, const V> &kv) {

       size_t hashi = kv.first % _tables.size();//除留余数法确定数据需要插入的位置
       size_t index = hashi;
       size_t i = 0;

       while (_tables[index]._state == EXIST) {
        /*
        线性探测:
        	当该数据所需要存储的位置发生哈希冲突时则将数据插入至发生冲突的后一个位置;
        	若是后一个位置也存在数据则继续向后遍历;
        */
         index = (hashi + i)%_tables.size();
         ++i;
       }

       _tables[index]._kv = kv;
       _tables[index]._state = EXIST;
       ++_n;

       return true;
        }

在该段代码当中,使用了除留余数法对数据进行插入;

并在发生哈希冲突时使用线性探测对数据进行插入;

闭散列哈希表的扩容

在哈希表中,在使用除留余数法对数据进行插入时若是数据量到一定程度时则需要对表进行扩容;

那么当数据量到什么程度时可以对表进行扩容?

在哈希表当中,扩容的需求是在插入过程中进行的,所以只需要在插入中的对应环境进行扩容即可;

针对提出的问题可以引入一个新的概念,即负载因子;

什么是负载因子?

负载因子实际上是哈希表中现存的有效数据占表大小的一个因子;

其的计算即为表中存在有效数据/表的大小;

在该哈希表的实现当中可以看作_n/_tables;

负载因子的大小取决于用户需要表的能力以及实现,一般控制在0.7或是0.8;

当负载因子在0.7或是0.8时即可以对表进行扩容操作;

那么关键的问题是:

如何对表进行扩容?

从上面的大致结构可以看出,实际上闭散列的哈希表本质上是一个数组容器vector,那么是否可以直接对容器进行扩容?

实际上,在扩容时有一个非常重要的思想,即为哈希表的规则;

哈希表的规则自始至终都贯穿在整个结构当中,无论是增删查改;

那么如果忽略哈希表的哈希规则而直接采用vector中的resize()接口对齐进行扩容将会导致哈希规则错乱;

简而言之即为若是直接使用resize()接口对vector容器进行扩容时,其对应的映射关系将会打乱;

以该图为例,若是直接将vector容器进行扩容时将破坏原有的映射关系;

那么实际上在哈希表需要进行扩容时只需要另开一个新表并将原有的数据重新以新的哈希规则进行插入即可(可直接开辟新的哈希表遍历原哈希表并调用Insert接口进行插入);

而在插入过程当中还需要处理对初始插入时表大小为0的状态;

代码(供参考):

bool Insert(const std::pair<K, const V> &kv) {
		//-------扩容-------
        if(_tables.size() == 0 || (_n*100) / _tables.size() >=75){
          /*
            哈希表中存在一个概念为负载因子
            负载因子即为数据中存在的数据/表的大小 负载因子越大时越容易造成哈希冲突 [ps:哈希冲突指的是一个值占了另一个值的位置];
            当负载因子到达一定大小时需要扩大表的大小从而降低负载因子

            开空间时不能直接在原地开空间,若是使用在原地开空间则将会破坏原来的哈希规则 使得在查找以及下次插入时都存在问题;
            开空间时应该重新开辟一块空间 并且以新的表的大小来确定新的哈希规则重新对数据进行插入 
            同时新的哈希规则制定完毕以后 旧的哈希规则则可以摒弃遗忘 对应的空间也应该释放
            (因为闭散列中使用的哈希结构只采用了vector容器,故不需要再节点中指定对应的析构函数)
          */
          size_t newsize = _tables.size() == 0 ? 10 : _tables.size() * 2;
          HashiTable<K, V> newtables;
          newtables._tables.resize(newsize);
          for(auto &it : _tables){
            newtables.Insert(it._kv);
          }
        _tables.swap(newtables._tables);
        
        //-------正常插入-------
       size_t hashi = kv.first % _tables.size();
       size_t index = hashi;
       size_t i = 0;
    //    if (_tables[index]._kv.first == kv.first) return false;
       while (_tables[index]._state == EXIST) {
        
         index = (hashi + i)%_tables.size();
         ++i;
       }

       _tables[index]._kv = kv;
       _tables[index]._state = EXIST;
       ++_n;

       return true;
        }

当然,在哈希表中的负载因子并不是越小越好;

负载因子太小则,哈希冲突概率低,空间利用率低,查找效率高;
负载因子太大则,哈希冲突概率高,空间使用率高,查找效率低;

闭散列哈希表的查找

哈希表的查找只需要遵从当前的哈希规则进行查找即可;

即按照插入的逻辑思路进行查找;

代码(供参考):

Data* Find(const K& key){
          //与插入函数的逻辑相同
          
          if(_tables.size() == 0){
            //如果是空表则返不进行查找
            return nullptr;
          }

          size_t hashi = key % _tables.size();
          size_t index = hashi;
          size_t i = 0;
          while (_tables[index]._state != EMPTY) {  //如果不为空则循环继续找数据

            if (_tables[index]._state == EXIST &&//条件为数据存在在表中且状态为存在
             _tables[index]._kv.first == key)
              return &_tables[index];

            index = (hashi + i) % _tables.size();
            ++i;
            if(index == hashi) break;
            //在查找过程中如果没找到数据的前提下index又回到了hashi的位置则代表已经找了一圈了 说明不存在数据 可以跳出循环(极端情况)
          }
          return nullptr;
        }

由于在哈希表的逻辑当中需要用到取模运算%,所以若是表的大小为0时将会引发除零错误;

为了避免除零错误的发生,应该在查找之前判断表的大小是否为0,若是表为空则停止查找;

当然,在实际的使用当中,哈希表不能插入表中已经存在的数据,所以在插入函数Insert()的插入之前可以调用Find()接口进行检查;

若是表中存在相同数据则不再进行插入;

闭散列哈希表的数据删除

闭散列哈希表的删除采用的是一个伪删除法,即将对应数据中的状态进行修改即可;

代码(供参考):

bool Erase(const K& key){
          //采用伪删除法
          /*
            伪删除法的思路只要改变节点中的状态即可
          */
          Data *to_del = Find(key);
           if (to_del) {
            to_del->_state = DELETE;
            --_n;
            return true;
           }
          return false;
        }

闭散列哈希表整体代码(供参考)

#pragma once

//***************************************
//**********闭散列哈希表的实现***********
//***************************************

#include
#include

enum State{
  //设置枚举类型
  /*
    分别为 ( 1.空 2.存在 3.删除 ) 三个状态
  */
    EMPTY,
    EXIST,
    DELETE
};

template<class K,class V>
struct HashiData{
      //设置节点
        std::pair<K, V> _kv;//Key Value模型
        State _state = EMPTY;//默认情况下节点为空
};

template<class K, class V>
class HashiTable{
    //整体模型
    public:
     typedef HashiData<K, V> Data;//使用typedef进行重命名方便后序的调用

    HashiTable():_tables(0),_n(0){}//构造函数使得初始的Vector容器的大小为0，_n表示当前存在的有效数据

     bool Insert(const std::pair<K, const V> &kv) {

        Data *to_find = Find(kv.first);
        if(to_find) return false; 

        if(_tables.size() == 0 || (_n*100) / _tables.size() >=75){

          size_t newsize = _tables.size() == 0 ? 10 : _tables.size() * 2;
          HashiTable<K, V> newtables;
          newtables._tables.resize(newsize);
          for(auto &it : _tables){
            newtables.Insert(it._kv);
          }
        _tables.swap(newtables._tables);
   
       size_t hashi = kv.first % _tables.size();
       size_t index = hashi;
       size_t i = 0;
    //    if (_tables[index]._kv.first == kv.first) return false;
       while (_tables[index]._state == EXIST) {
        
         index = (hashi + i)%_tables.size();
         ++i;
       }

       _tables[index]._kv = kv;
       _tables[index]._state = EXIST;
       ++_n;

       return true;
        }

        Data* Find(const K& key){
          //与插入函数的逻辑相同
          
          if(_tables.size() == 0){
            //如果是空表则返不进行查找
            return nullptr;
          }

          size_t hashi = key % _tables.size();
          size_t index = hashi;
          size_t i = 0;
          while (_tables[index]._state != EMPTY) {  //如果不为空则循环继续找数据

            if (_tables[index]._state == EXIST &&//条件为数据存在在表中且状态为存在
             _tables[index]._kv.first == key)
              return &_tables[index];

            index = (hashi + i) % _tables.size();
            ++i;
            if(index == hashi) break;
            //在查找过程中如果没找到数据的前提下index又回到了hashi的位置则代表已经找了一圈了 说明不存在数据 可以跳出循环(极端情况)
          }
          return nullptr;
        }

        bool Erase(const K& key){
          //采用伪删除法
          /*
            伪删除法的思路只要改变节点中的状态即可
          */
          Data *to_del = Find(key);
           if (to_del) {
            to_del->_state = DELETE;
            --_n;
            return true;
           }
          return false;
        }
         
    protected:
       

    private:
        std::vector<Data> _tables;//利用vector容器实现闭散列的哈希表
        size_t _n;//存储数据个数
};

虽然闭散列的方式可以很好的对数据进行插入并且解决除留余数法中的哈希冲突的问题;

但虽然解决了哈希冲突的问题后又引发了一个问题:

即多组数据引发哈希冲突将会发生踩踏

当一组数据因为哈希冲突而使用线性探测的方式使得数据插入到了冲突位置的下一个位置时;

这个数据所插入的数据可能是后面数据所要插入的位置,这个问题即被称为哈希碰撞（Hash Collision）;

当发生哈希碰撞时可以使用二次探测来减少哈希碰撞的问题;

二次探测的说明参照上文;

虽然二次探测能够减少哈希碰撞的频率,但是无法完全避免;

所以为了解决该问题可以使用开散列的方式来实现哈希表;

开散列与开散列哈希表的实现

开散列（Open Hashing）也被称作拉链法;

当数据在插入时发生哈希冲突时,可以采用链式结构的方式对数据进行存储;

即本质上也是利用一个vector容器,只不过对应的容器内并不存放其他数据,而是存放一个节点的指针;

通过链式结构的方式将发生哈希冲突的数据链接在一起;

在开散列当中,哈希表的每个桶通常是一个链表(或是其他的动态数据结构),用于存储映射到同一哈希值的所有元素;

因此,当发生哈希冲突时,元素会被添加到对应的哈希值的链表当中;

这种方式能够很好的解决使用除留余数法的哈希冲突;

开散列哈希表的节点设置与基本架构

开散列的哈希表的节点设置并不像闭散列哈希表需要定义节点的状态;

对于开散列而言,vector容器中所存储的并不是数据本身,而是一个节点,所以对于开散列而言若是在数据删除时可以直接对数据进行delete操作,不需要定义其节点状态;

代码(供参考);

template <class K, class V>
struct HashNode {
  // 哈希表的节点设置
  typedef HashNode<K, V> Node;
  Node* _next = nullptr;
  std::pair<K, V> _kv;

  HashNode(const std::pair<K, V> kv) : _kv(kv) {}
};

template <class K, class V, class Hash = HashFunc<K>>
class HashTable {
 public:
  typedef HashNode<K, V> Node;

    //成员函数
    
 private:
  std::vector<Node*> _hashtable;  // 哈希表整体构造
  size_t _n = 0;                  // 负载因子
};

在开散列的哈希表中也需要一个负载因子来判断其是否需要进行扩容操作;

那么为什么开散列的哈希表也需要进行扩容操作?

实际上虽然开散列使用了拉链法的方式对数据进行插入,但若是一个桶下挂了过多的数据也会降低哈希表的整体效率;

所以在使用开链法实现哈希表时同样也要对哈希表进行扩容操作;

开散列哈希表的插入逻辑及实现

开散列哈希表的插入操作与闭散列哈希表的插入逻辑大部相同;

唯一不同的是

对于闭散列哈希表来说,当出现哈希冲突的问题时闭散列采用的是线性探测或是二次探测的解决方式;

而对于开散列而言,开散列只需要对数据进行头插即可,其并不需要担心发生的哈希冲突问题;

代码(供参考):

bool Insert(const std::pair<K, V> kv) {
    /*
    	扩容...
    */

    // 正常插入
    Node* newnode = new Node(kv);
    size_t hashi = to_int(kv.first) % _hashtable.size();
    // std::cout << kv.first <
    newnode->_next = _hashtable[hashi];
    _hashtable[hashi] = newnode;
    ++_n;
    return true;
  }

插入时只需要进行链表的头插即可;

开散列哈希表的扩容

在上文中提到,对于开散列而言也需要判断其是否需要进行扩容;

那么开散列哈希表在哪种情况中需要对表进行扩容操作?

在开散列的哈希表中,扩容操作一般取决于其最坏的情况;

即假设存在一个哈希表,它的大小为m,而最坏的情况即为表中各个桶下都挂上一个数据;

实际上只要数据的个数_n与表的大小相同,即负载因子为1时进行扩容;

当然,扩容的情况也可根据需要来进行变化;

在上文当中关于闭散列哈希表的扩容中提到在进行扩容时不能直接在原地扩容;

相同,由于开散列与闭散列的插入规则采用的都是哈希中的除留余数法进行操作,所以相对的开散列的哈希表也需要像闭散列一样新开一块空间并将原来的数据以新的哈希规则进行插入以免破坏对应的映射关系;

在扩容时也可按照闭散列中的方式,扩容之后重新建立哈希表并对数据进行重新插入;

但当数据重新插入后原有的数据将会被释放,但本质上并不会释放链表中的元素数据,所以应该在哈希表中进行析构函数的写入;

析构函数(供参考):

  ~HashTable() {
    Node* cur = nullptr;
    for (size_t i = 0; i < _hashtable.size(); ++i) {
      if (_hashtable[i]) {
        cur = _hashtable[i];
        Node* next = cur->_next;
        while (cur) {
          delete cur;
          cur = next;
        }
      }
    }
  }

该方法的扩容不进行赘述,参照闭散列中的扩容逻辑即可;

而使用上述这种方法虽然可以简短对于扩容操作的代码,但实际上这样将原来的哈希表即表中的数据全部进行删除使得整体在扩容中的效率变慢且进行了冗余的操作(对数据节点重新进行构造);

在不使用该方法的前提可以使用其他的方式将其进行扩容;

最简单的方式即为构建一个新的vector容器遍历原来的vector容器将对应的节点以新的哈希规则插入至新的vector容器当中;

代码(供参考);

  bool Insert(const std::pair<K, V> kv) {
    Hash to_int;//仿函数

    // 使用Find函数进行判断是否需要进行插入(需要预防除零错误)

    if (_n == _hashtable.size()) {
      // 判断负载因子是否为1 负载因子若是为1则进行扩容
    //   size_t newsize = _hashtable.size() == 0 ? 10 : _hashtable.size() * 2;
      size_t newsize = GetNextPrime(_hashtable.size());
      std::vector<Node*> newTable;
      newTable.resize(newsize);

      // for(Node *&cur : _hashtable) 遍历Node*指针数组
      for (auto& cur : _hashtable) {
        while (cur) {
          Node* next = cur->_next;
          size_t hashi = to_int(cur->_kv.first) % newTable.size();
          cur->_next = newTable[hashi];
          newTable[hashi] = cur;
          cur = next;
        }
      }
      _hashtable.swap(newTable);
    }

    // 正常插入
    Node* newnode = new Node(kv);
    size_t hashi = to_int(kv.first) % _hashtable.size();
    // std::cout << kv.first <
    newnode->_next = _hashtable[hashi];
    _hashtable[hashi] = newnode;
    ++_n;
    return true;
  }

该种方式所实现的扩容在代码层面中要比上一方法复杂;

但不可否认的是该方法实际上在效率当中要高于上一方法,因为该方法避免了同一节重复进行构造的冗余以及将原有节点进行释放的浪费操作;

在该段代码中存在一个仿函数为Hash,该仿函数具体的作用为将类型转化为可以在哈希表中实现的类型,具体实现将在下文中提到;

哈希表扩容的优化

在上文的代码中存在一个函数为GetNextPrime();

这个函数的功能是哈希表中在扩容中的一个优化;

其本身并不复杂,即设置一个全部为素数的扩容指数,当需要扩容时则去该函数中取下一个素数作为需要扩容的新大小;

代码(供参考):

  size_t GetNextPrime(size_t prime) {
    static const int __stl_num_primes = 28;
    static const unsigned long __stl_prime_list[__stl_num_primes] = {
        53,        97,         193,        389,       769,       1543,
        3079,      6151,       12289,      24593,     49157,     98317,
        196613,    393241,     786433,     1572869,   3145739,   6291469,
        12582917,  25165843,   50331653,   100663319, 201326611, 402653189,
        805306457, 1610612741, 3221225473, 4294967291};
    size_t i = 0;
    for (; i < __stl_num_primes; ++i) {
      if (__stl_prime_list[i] > prime) return __stl_prime_list[i];
    }
    return __stl_prime_list[i];
  }

那么为什么需要采取该操作?或者说使用该种方法进行扩容的优势是什么?
- 减少哈希冲突
  
  当哈希函数产生的地址分布不均时,会导致哈希冲突的概率增加,从而影响哈希表的性能;
  
  使用素数作为容量因子可以使得哈希值分布更加均匀。这是因为素数不能被除以其他较小的数（除了1和它自身），这有助于减少在哈希表中的“分组”现象，从而减少冲突。
- 优化哈希函数
  
  如果容量因子是一个素数，它可以帮助哈希函数更有效地分散键值，尤其是在键值本身具有一定的规律性时。
  
  如果键值倾向于在某些特定的数值范围内聚集，使用素数作为容量因子可以帮助打破这种规律性，使得哈希值更加分散。
- 提高计算效率
  
  在某些情况下，使用素数作为容量因子可以简化哈希函数的计算，提高效率。例如，在一些模运算中，使用素数作为模可以减少计算量。

可以发现,上述代码的容量因子实际是在素数的二倍附近进行取值;

确保哈希表的泛型特性

这个泛型特性实际上不只针对开散列哈希表,这是大部分哈希表中都需要的;

尤其是在使用除留余数法时,需要将数据进行取模操作,而进行取模操作的只能是整型数据;

而若是需要存储其他类型的数据时,本身并不支持;

最简单的方式即为使用一个仿函数将数据转换为整型数据;

代码(供参考):

template <class K>
struct HashFunc {
  size_t operator()(const K& key) {
    // std::cout << key << std::endl;
    return (size_t)key;
  }
};

使用该代码能够解决部分类型不匹配的问题;

那么为什么这里提到的是部分而不是所有;

在存储数据当中,可能遇到需要将字符串string类型数据进行存储;

而实际上string无法有效的转化为size_t整型数据;

所以需要对string数据在仿函数当中使其变为size_t类型;

最普遍的使用即为使用相加的操作将string字符串中的所有字符的ASCII码值进行相加;

那么使用该种方法时还会遇到另一个问题:

若是字符串中的字符相同而字符顺序不同该如何进行比较?

如该问题而言,若是使用普通的将字符串的ASCII码值进行相加的话将会出现顺序不同但其ASCII值相同;

例:abcd,adbc,bcad,dcba等;

而解决方法也很简单,在各大语言的对应的哈希表实现中都引用了一个概念,即乘数因子;

使用乘数因子的方法可以很好的避免string类型中对于字符串中字符(或是总ASCII码之和)相同但顺序不同的数据的插入;

即使用一个数作为乘数对当前遍历到的string中的字符的ASCII码值进行相乘;

即sum *= 乘数因子;后sum += ch(ch为当前字符的ASCII值);
那么这个乘数因子应该取什么值?

实际上这个乘数因子取谁都行,大多数乘数因子所取值都为素数,最常见用来作为乘数因子的值实际上是31;

具体原因31是一个小的素数,其能够快速计算(即左移5位后减去原值),且在实践中表现良好;

在Java中的 String.hashCode() 所使用的乘数因子即为31;

代码(供参考):

template <>
struct HashFunc<std::string> {
  size_t operator()(const std::string& key) {
    size_t hash = 0;
    for (auto it : key) {
      hash += it;
      hash *= 31;
    }
    // std::cout << hash << std::endl;
    return hash;
  }
};

实际上在对于string的处理可以使用模板中的特化进行处理;

编译器在处理时若是遇到该类型则走模板特化,否则走原仿函数即可("特化" 参考『C++ - 模板』之模板进阶中对于特化的理解;

开散列哈希表的查找

开散列哈希表的查找与闭散列哈希表的查找的思路相同,即在查找过程当中复用插入函数中的思路即可;

相比于闭散列哈希表而言,开散列哈希表的查找相对闭散列要简单,具体原因为开散列哈希表无需像闭散列哈希表那样再次进行线性探测;

对于开散列的哈希表的查找而言,只需要找到对应的哈希位置,并判断该位置是否存有指针:

存在指针

若是对应的哈希位置存在指针则要查找的数据可能存在该位置的链表当中,需要对链表进行遍历查找;
不存在指针(为空)

若是不存在指针(为空)时则表示该数据不存在;

当然上面两点的前提是你总体的哈希规则(映射关系)没有错乱;

代码(供参考):

  Node* Find(const K& key) {
    Hash to_int;

    if (_hashtable.size() == 0) return nullptr;  // 防止除零错误

    size_t hashi = to_int(key) % _hashtable.size();
    Node* cur = _hashtable[hashi];

    while (cur) {
      if (cur->_kv.first == key) {
        return cur;
      }
      cur = cur->_next;
    }
    return nullptr;
  }

当然,当Find()接口被实现后应该在插入时调用该接口判断所插入的数据是否存在,若是存在则不进行插入;

接下来的Erase()删除接口也可按照插入的判断来判断数据是否存在,当然这个并不是特别必要,因为删除的时间复杂度与查找的时间复杂度的差距不大,若是数据存在则还需要再次进行遍历,且再删除接口时也可判断该条件(按照具体需求适合进行调用);

在查找时也需要判断当前vector容器的大小是否为0,从而避免出现除零错误的问题;

开散列哈希表的数据删除

开散列哈希表的数据删除与查找的思路类似,即判断数据是否存在,若是存在则删除,若是不存在则删除失败;

开散列哈希表的删除与闭散列哈希表的删除并不相同,闭散列哈希表的删除采用的是伪删除法进行删除;

而开散列哈希表的数据删除为确确实实的删除,将节点进行释放;

当然开散列哈希表的数据删除也该分为两种情况:

删除数据的节点指针存在于链表当中

当删除数据的节点指针存在链表当中时,只需要进行普通的链表删除即可;
删除数据的节点指针存在于表(vector容器)中

当删除数据的节点指针存在于表(vector容器)当中时,在删除之后需要将删除后的节点的下一个节点赋值给表中对应的位置;

代码(供参考):

  bool Erase(const K& key) {
    Hash to_int;
    if (_hashtable.size() == 0) return false;  // 防止空的情况继续删除

    size_t hashi = to_int(key) % _hashtable.size();

    Node* cur = _hashtable[hashi];
    Node* prev = nullptr;
    while (cur) {
      if (cur->_kv.first == key) {
        if (prev) {
          prev->_next = cur->_next;
        } else {
          _hashtable[hashi] = cur->_next;
        }
        delete cur;
        return true;
      } else {
        prev = cur;
        cur = cur->_next;
      }
    }
    return false;
  }

开散列哈希表整体代码(供参考)

#include 
#include 
#include 

template <class K, class V>
struct HashNode {
  // 哈希表的节点设置
  typedef HashNode<K, V> Node;
  Node* _next = nullptr;
  std::pair<K, V> _kv;

  HashNode(const std::pair<K, V> kv) : _kv(kv) {}
};

template <class K>
struct HashFunc {
  size_t operator()(const K& key) {
    // std::cout << key << std::endl;
    return (size_t)key;
  }
};

template <>
struct HashFunc<std::string> {
  size_t operator()(const std::string& key) {
    size_t hash = 0;
    for (auto it : key) {
      hash += it;
      hash *= 31;
    }
    // std::cout << hash << std::endl;
    return hash;
  }
};

template <class K, class V, class Hash = HashFunc<K>>
class HashTable {
 public:
  typedef HashNode<K, V> Node;

  ~HashTable() {
    Node* cur = nullptr;
    for (size_t i = 0; i < _hashtable.size(); ++i) {
      if (_hashtable[i]) {
        cur = _hashtable[i];
        Node* next = cur->_next;
        while (cur) {
          delete cur;
          cur = next;
        }
      }
    }
  }

  bool Insert(const std::pair<K, V> kv) {
    Hash to_int;

    // 使用Find函数进行判断是否需要进行插入(需要预防除零错误)
    if (Find(kv.first)) {
      // 找到该数据说明该数据存在不予继续插入
      return false;
    }

    if (_n == _hashtable.size()) {
      // 判断负载因子是否为1 负载因子若是为1则进行扩容
    //   size_t newsize = _hashtable.size() == 0 ? 10 : _hashtable.size() * 2;
      size_t newsize = GetNextPrime(_hashtable.size());
      std::vector<Node*> newTable;
      newTable.resize(newsize);

      // for(Node *&cur : _hashtable) 遍历Node*指针数组
      for (auto& cur : _hashtable) {
        while (cur) {
          Node* next = cur->_next;
          size_t hashi = to_int(cur->_kv.first) % newTable.size();
          cur->_next = newTable[hashi];
          newTable[hashi] = cur;
          cur = next;
        }
      }
      _hashtable.swap(newTable);
    }

    // 正常插入
    Node* newnode = new Node(kv);
    size_t hashi = to_int(kv.first) % _hashtable.size();
    // std::cout << kv.first <
    newnode->_next = _hashtable[hashi];
    _hashtable[hashi] = newnode;
    ++_n;
    return true;
  }

  Node* Find(const K& key) {
    Hash to_int;

    if (_hashtable.size() == 0) return nullptr;  // 防止除零错误

    size_t hashi = to_int(key) % _hashtable.size();
    Node* cur = _hashtable[hashi];

    while (cur) {
      if (cur->_kv.first == key) {
        return cur;
      }
      cur = cur->_next;
    }
    return nullptr;
  }

  bool Erase(const K& key) {
    Hash to_int;
    if (_hashtable.size() == 0) return false;  // 防止空的情况继续删除

    size_t hashi = to_int(key) % _hashtable.size();

    Node* cur = _hashtable[hashi];
    Node* prev = nullptr;
    while (cur) {
      if (cur->_kv.first == key) {
        if (prev) {
          prev->_next = cur->_next;
        } else {
          _hashtable[hashi] = cur->_next;
        }
        delete cur;
        return true;
      } else {
        prev = cur;
        cur = cur->_next;
      }
    }
    return false;
  }

  void Check() {
    // 检查函数 没有太重要的意义
    int i = 0;
    for (auto cur : _hashtable) {
      std::cout << "(" << i << ")"
                << " == ";
      if (cur) {
        while (cur) {
          std::cout << cur->_kv.first << " : " << cur->_kv.second << " || ";
          cur = cur->_next;
        }
        std::cout << std::endl;
      } else {
        std::cout << "nullptr" << std::endl;
      }
      ++i;
    }
  }

 protected:
  size_t GetNextPrime(size_t prime) {
    static const int __stl_num_primes = 28;
    static const unsigned long __stl_prime_list[__stl_num_primes] = {
        53,        97,         193,        389,       769,       1543,
        3079,      6151,       12289,      24593,     49157,     98317,
        196613,    393241,     786433,     1572869,   3145739,   6291469,
        12582917,  25165843,   50331653,   100663319, 201326611, 402653189,
        805306457, 1610612741, 3221225473, 4294967291};
    size_t i = 0;
    for (; i < __stl_num_primes; ++i) {
      if (__stl_prime_list[i] > prime) return __stl_prime_list[i];
    }
    return __stl_prime_list[i];
  }

 private:
  std::vector<Node*> _hashtable;  // 哈希表整体构造
  size_t _n = 0;                  // 负载因子
};

你可能感兴趣的:(数据结构,C++,算法,哈希算法,c++,散列表)

C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
嵌入式系统LCD显示模块编程实践
本文还有配套的精品资源，点击获取简介：本文档提供了一个具有800x480分辨率的3.5英寸液晶显示模块LW350AC9001的驱动程序代码，以及嵌入式系统中使用C/C++语言进行硬件编程的实践指南。该模块的2mm厚度使其适用于空间受限的便携式设备。内容包括驱动程序源代码、硬件控制接口使用方法，以及如何在嵌入式系统中进行图形处理、电源管理与性能优化。1.嵌入式系统原理1.1嵌入式系统概念嵌入式系统是
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
【超硬核】JVM源码解读：Java方法main在虚拟机上解释执行 HeapDump性能社区 java 开发语言后端 jvm
本文由HeapDump性能社区首席讲师鸠摩（马智）授权整理发布第1篇-关于Java虚拟机HotSpot，开篇说的简单点开讲Java运行时，这一篇讲一些简单的内容。我们写的主类中的main()方法是如何被Java虚拟机调用到的？在Java类中的一些方法会被由C/C++编写的HotSpot虚拟机的C/C++函数调用，不过由于Java方法与C/C++函数的调用约定不同，所以并不能直接调用，需要JavaC
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
C++ 设计模式：抽象工厂（Abstract Factory）冀晓武 C++设计模式 c++设计模式抽象工厂模式
链接：C++设计模式链接：C++设计模式-工厂方法链接：C++设计模式-原型模式链接：C++设计模式-建造者模式抽象工厂（AbstractFactory）是一种创建型设计模式，它提供一个接口，用于创建一系列相关或相互依赖的对象，而无需指定它们的具体类。抽象工厂模式通常用于创建一组相关的产品对象，例如不同类型的机器人和它们的配件。1.问题分析在某些情况下，我们需要创建一组相关或相互依赖的对象，但我们
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
C++设计模式：简单工厂、工厂方法、抽象工厂起个别名 C++算法 c++
1.工厂模式的特点在我们现实生活中，买馒头和自己蒸馒头、去饭店点一份大盘鸡和自己养鸡，杀鸡，做大盘鸡，这是全然不同的两种体验：自己做麻烦，而且有失败的风险，需要自己承担后果。买现成的，可以忽略制作细节，方便快捷并且无风险，得到的肯定是美味的食物。对于后者，就相当于是一个加工厂，通过这个工厂我们就可以得到想要的东西，在程序设计中，这种模式就叫做工厂模式，工厂生成出的产品就是某个类的实例，也就是对象。
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
被动降噪的概念及编程实现 CodeByte 人工智能算法 javascript 编程
被动降噪是指通过编程技术和算法，对输入的数据进行处理，以减少或消除其中的噪声。噪声可以是各种形式的干扰，例如来自传感器、通信信号或其他外部源的干扰。在本文中，我们将探讨被动降噪的意义以及如何使用编程来实现这一目标。被动降噪的意义：噪声对数据的准确性和可靠性产生负面影响。在许多应用领域，例如图像处理、音频处理和信号处理中，噪声的存在可能导致数据质量下降，使得后续的分析和处理变得困难。因此，被动降噪技
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
反光衣识别漏检率 30%？陌讯多尺度模型实测优化
在建筑工地、交通指挥等场景中，反光衣是保障作业人员安全的重要装备，对其进行精准识别是智能监控系统的核心功能之一。但传统视觉算法在实际应用中却屡屡碰壁：强光下反光衣易与背景混淆、远距离小目标漏检率高达30%、复杂场景下模型泛化能力不足[实测数据来源：某智慧工地项目2024年Q1日志]。这些问题直接导致安全监控系统预警滞后，给安全生产埋下隐患。一、技术解析：反光衣识别的核心难点与陌讯算法创新反光衣识别
【GESP】C++三级真题 luogu-B4359 [GESP202506 三级] 分糖果 CoderCodingNo GESP c++java 开发语言
GESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较简单。题目题解详见：【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoder【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoderGESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较
C++设计秘籍：为什么所有参数都需类型转换时，非成员函数才是王道？讳疾忌医丶 c++前端开发语言
当所有参数都需要类型转换时，为什么要选择非成员函数？在C++的世界里，有一个看似简单却蕴含深意的设计原则：当所有参数（包括被this指针所指的那个隐式参数）皆须进行类型转换时，请为此采用非成员函数实现。这个原则背后隐藏着C++类型系统的精妙设计，也揭示了成员函数与非成员函数在处理隐式类型转换时的本质差异。想象一下，你正在设计一个数学计算库，需要支持整数与有理数的混合运算。如果你天真地将所有操作都实
【华为机试】HJ61 放苹果不爱熬夜的Coder 算法华为机试 golang 华为 golang 算法面试
文章目录HJ61放苹果描述输入描述输出描述示例1示例2解题思路算法分析问题本质分析状态定义与转移递推关系详解动态规划表构建算法流程图示例推导过程代码实现思路时间复杂度分析关键优化点边界情况处理递归解法对比实际应用场景测试用例分析算法特点数学原理完整题解代码HJ61放苹果描述我们需要将m个相同的苹果放入n个相同的盘子中，允许有的盘子空着不放。求解有多少种不同的分法。输入描述输入两个整数m,n(0B[
初始化列表与类型转换（C++） 2401_89195731 c++开发语言
初始化列表和构造函数体在C++中都是用于给类的成员变量赋初值区别：初始化列表是给每个成员变量定义初始化的地方，即使有成员变量没有给它显式在初始化列表初始化，它也会走初始化列表初始化时机初始化列表：在对象创建时，成员变量通过初始化列表被直接初始化，这发生在构造函数体执行之前。构造函数体内赋值：成员变量首先被默认初始化，然后在构造函数体内通过赋值语句进行赋值。性能差异初始化列表：通常更高效，因为它避免
list的一些特性（C++） 2401_89195731 c++开发语言
C++STL库中的std::list是一个带头双向循环链表，使用之前需要包头文件，它和vector的使用高度类似。构造list支持多种构造方式默认构造函数：创建一个空的列表。拷贝构造函数：从另一个相同类型的列表创建一个新的列表。范围构造函数：从一对迭代器指定的范围内复制元素到新的列表中。初始值列表构造函数：使用初始化列表（initializerlist）创建一个包含指定元素的列表。填充构造函数：创
.NET中的安全性之数字签名、数字证书、强签名程序集、反编译 hezudao25 NET .net assembly 加密算法 reference header
本文将探讨数字签名、数字证书、强签名程序集、反编译等以及它们在.NET中的运用（一些概念并不局限于.NET在其它技术、平台中也存在）。1.数字签名数字签名又称为公钥数字签名，或者电子签章等，它借助公钥加密技术实现。数字签名技术主要涉及公钥、私钥、非对称加密算法。1.1公钥与私钥公钥是公开的钥匙，私钥则是与公钥匹配的严格保护的私有密钥；私钥加密的信息只有公钥可以解开，反之亦然。在VisualStud
QML与C++相互调用函数并获得返回值 cpp_learners QML c++QML qt
这篇博客主要讲解在qml端如何直接调用c++的函数并获得返回值，在c++端如何直接调用qml的函数并获得返回值；主要以map或者jsonobject、list或者jsonarray为主！其他单个类型，常见的类型，例如QString、int等，就不演示了；一通百通。目录1准备工作1.1C++端1.2QML端2qml端直接调用c++端函数3c++端直接调用qml端函数3.1调用qml的qmlFuncO
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。