Sɪʟᴇɴᴛ໊ོ235

《数据结构》第四章：哈希表

4.1哈希表的概念

关键字集合K到一个有限的连续的地址集（区间）D的映射关系H表示为

H（key）：K->D,key∈K

K为主关键字集合，H称为哈希函数或散列函数。按哈希函数构建的表称为哈希表。D的大小m称为哈希表的地址区间长度。

例：假设要建立一个地址长度区间为13的哈希表。哈希函数为

H(key)=[Ord(关键字第一个字母)-1/2]

其中函数Ord为求字幕在字母表中的序号。例如A在字母表中的序号为1，Ord(‘A’)=1。现将关键字依次为Zhao、Qian、Sun、Li、Wu、Chen、Han的7个记录插入该哈希表。第一个关键字Zhao的哈希函数值为

H（Zhao）=[Ord(‘Z’)-1/2]=[(26-1)/2]=12

将Zhao存入112号单元。类似地，依次将各关键字映射到相应单元。

若要查找记录，则只需计算记录的关键字的哈希函数值，就可以直接找到该记录。

若在哈希表中插入关键字Xie，其哈希函数值为11，但十一号单元已被Wu占据，由此可见，不同关键字的哈希函数值可能相同，即

H(key1)=H(key2),Key1≠Key2

这种现象称之为冲突。哈希函数值相同的关键字称为同义字。

为了避免出现冲突，可以换一个哈希函数：

H(Key)=Ord（关键字第一个字母）%13

记录关键字对应的序列还是（Zhao、Qian、Sun、Li、Wu、Chen、Han）。若加入关键字Xie，则映射结果不会产生冲突。

但再加入关键字Dai，其哈希函数值为4，与Qian冲突。

在一般情况下，哈希函数是一种压缩映射，即关键字集的元素个数大于哈希地址集的元素个数，这就不可避免产生冲突。因此，在构建哈希表时不仅要设计一个好的哈希函数，而且要设定一个处理冲突的方法。

根据设定的哈希函数和处理冲突的方法将一组关键字映射到一个连续的有限地址集上，并以关键字在地址集中的“像”作为记录在表中的存储位置，这种表称为哈希表，这一种映射称为哈希造表或散列，所得存储位置称为哈希地址或散列地址。

4.2哈希函数的构造方法

若对于关键字集合中的任一个关键字，经哈希函数映射到地址集合中任何一个地址的概率是相等的，则称此类哈希函数为均匀的哈希函数。哈希函数越均匀，发生冲突的概率越低。

哈希函数的构造方法有很多，设计时应注意两个原则：第一、计算过程尽量简单。

第二、哈希函数尽量均匀。

4.2.1直接定址法

最简单的直接定址法直接用关键字key作为哈希地址，即H(key)=key。

例：

要查找11岁的儿童人数时，直接定位第11项即可。

虽然这种哈希函数简单，且不会产生冲突，但在实际应用中，关键字很少是连续的，采用这种特殊哈希函数会造成哈希表空间浪费。一般情况下，直接定址法可通过对关键字缩放和平移，获得和是的地址空间，即线性函数

H(key)=a×key+b

其中，a为缩放函数，b为平移系数。

算法：直接定址的哈希函数

int hash_d(int key){

    return a*key+b;//a为缩放函数，b为平移系数

}

例如某公司在职员工各年龄人数统计，年龄从18周岁到65周岁，就可以采用将关键字年龄减去18来作为数据的存储单元，即a=1，b=-18。

4.2.2除留余数法

对于地址区间长度为m的哈希表，除留余数法取某个不大于m的数p为模，将哈希函数定义为H(key)=key%p(p≤m)。

除留余数法简单常用，不仅可以对关键字直接取模，也可以在折叠、平方取中等运算后再取模。值得注意的是，模p的选择十分重要。当模p取不大于m且最接近m的素数，或不包含小于20的质因子的合数时，可使哈希地址尽可能均匀地分布再地址空间。

算法：除留余数地哈希函数

int hash_m(int key){

    return key%p;

}

为保证求得地哈希函数值再地址区间长度范围以内，其他哈希函数构造方法常把除留余数法作为其最后一步运算。

4.2.3 数字分析法

当关键字地位数很多时，可以通过对关键字地各位进行分析，去掉分布不均与地位，将分布均匀的位提取出来作为哈希值。数学分析法取关键字中某些取值较均匀的数位作为哈希地址，适合于关键字位数较多，且能预测关键字各位分布均匀度的情况。

例：构造一个数据元素个数n=60，哈希地址空间长度m=100的哈希表。假设关键字均为8为十进制数。

对于全部60个关键字分析发现，关键字从左到右的第1、2、3、6位取值较均匀，可选取其中的两位作为哈希地址。若选取最后两位作为哈希地址，则以上八个关键字的哈希地址分别为02、75、28、34、15、38、62、20。

显然数字分析法仅适用于事先直到表中所有关键字每一位数据的分布情况，它完全依赖于关键字集合。

4.2.4 折叠法

折叠法将关键字分割成位数相同的若干部分（最后一部分的位数可以较少），并取各部分的叠加和（舍去进位）作为哈希函数。折叠法适用于关键字位数较多且每一位分布大致均匀的情况。

分割后，可采用移位叠加或Z形叠加：移位叠加是将分割后每一部分的最低位对其，然后相加；Z形叠加是从一端向另一端沿分割界来回折叠，然后对齐相加。

算法：移位叠加的哈希函数

int hash_s(long key)

{

    int i,j=1,qu,sum=0;

    for(i=0;i

 
  设哈希表的地址区间长度为10000，关键字key=401108105302169891，允许的地址空间为4位十进制数，w=4，则这两种叠加情况为： 
   
  用移位叠加得到的哈希地址是2308，而用Z形叠加所得到的哈希地址为5115。 
  4.2.5 平均取中法 
  平均取中法先取关键字的平方，然后根据哈希表地址区间长度m的大小，选取平方数的中间若干位作为哈希地址。该方法通过取平方扩大关键字之间的差别，而平均值的中间若干位和这个数的每一位都相关，使得不同关键字的哈希函数值分布较为均匀，不易产生冲突。 
  设哈希表地址区间长度为1000，可取关键字平方值的中间3位。 
   
  算法：平方取中法的哈希函数算法 
  int hash_3(int key){

    long temp;

    temp=key*key/100;

    if(temp>=1000)//关键字平方值大于5位

    {

        temp-=temp/1000*1000;

    }

    return temp;

} 
  一般情况下，应该根据关键字的取值范围，来确定取关键字平方值的中间哪几位作为哈希地址。 
  4.3 处理冲突的方法 
  构造哈希表时，应根据关键字集合的特点选择合适的哈希函数，是哈希地址尽量均匀地分布在哈希地址区间内，以免出现或减少冲突。但哈希函数地构造与关键字地长度，哈希表地大小，关键字地实际取值状况等许多因素有关，而且有些因素事前不能确定，所以冲突不易避免，关键在于如何处理。 
  4.3.1 链地址法 
  链地址法将关键字为同义词地记录链接在同一单链表中。设哈希表地址区间长度为m，则可将哈希表定义为一个由m个头指针组成的指针数组T[0…m-1]。凡是哈希地址为i的记录，均插入以T[i]为头指针的单链表中，称该单链表为i同义单链表.T中各分量的初值置为空指针. 
  假设有8个关键字22,41,53,46,30,13,12,67,哈希表的地址区间长度为11,哈希函数为H(key)=(3*key)%11,采用链地址法,将记录插入其同义词链表的表头. 
   
  4.3.2 开放定址法 
  开放定址法是哈希表的地址空间内解决冲突.插入时一旦发生冲突,可使用某种探测技术在哈希表中计算得到另一个地址,若不冲突,则插入,否则求下一个地址,直到探测到空闲地址为止,插入新记录到该地址单元.在探测过程中,求得的一系列地址称为探测地址序列. 
  查找的探测过程与插入相同.沿着探测地址序列逐个查找,若找到给定的关键字,则查找成功;若探测到一个空闲地址,则表明表中无待查的关键字,查找失败. 
  两种常用的开放定址法:线性探测法和二次探测法. 
  1.线性探测法 
  线性探测法的基本思想是,假定哈希函数为H(key),哈希函数的地址区间长度为m,并将哈希表看成是一个循环空间,则线性探法的探测地址序列可表示为 
  Hi=(H(key)+i)%m  i≤i≤m-1 
  其中,Hi表示第i次冲突时探测的地址空间. 
  假设有8个关键字22,41,53,,46,30,13,12,67,哈希表的地址区间长度为11,哈希函数为H(key)=(3*key)%11,采用线性探测法处理冲突,可求得各关键字的哈希地址: 
  H(22)=0; 
  H(41)=2; 
  H(53)=5; 
  H(46)=6; 
  H(30)=2 H1(30)=3 
  H(13)=6 H1(13)=7 
  H(12)=3 H1(12)=4 
  H(67)=3 H1(67)=4 H2(67)=5 H3(12)=6 H4(67)=7 H5(67)=8 
   
   
  用线性探测法处理冲突,思路清晰,算法简单,但线性探测法很容易产生堆聚现象,就是存入哈希表的记录在表中连成一片.按照线性探测法处理冲突,如果堆聚的记录越多,则发生冲突是=时的探测次数越多. 
  2.二次探测法 
  二次探测法生成的探测地址序列不是连续的,而是跳跃式的,为后续待插入的记录留下空间从而减少堆聚.二次探测法的探测地址序列可表示为 
  Hi=(H(key)+di)%m 1≤i≤m-1 
  其中,di=12,-12,22,-22,…,k2,-k2(k≤m/2),即 
  H=H(key) 
  H1=(H+12)%m 
  H2=(H-12)%m 
  H3=(H+22)%m 
  H4=(H-22)%m 
  … 
  还是上面8个关键字22,41,53,,46,30,13,12,67,哈希表的地址长度为11,哈希函数仍为H(key)= (3*key)%11,但采用二次探测法处理冲突,可求得各关键字的哈希地址. 
  H(22)=0 
  H(41)=2 
  H(53)=5 
  H(46)=6 
  H(30)=2 H1(30)=3 
  H(13)=6 H1(13)=7 
  H(12)=3 H1(12)=4 
  H(67)=3 H1(67)=4 H2(67)=2 H3(12)=7 H4(67)=10 
   
  4.4 哈希表的实现 
  4.4.1 链地址哈希表的实现 
  采用链地址哈希表处理冲突的哈希表称为链地址哈希表,其类型定义如下: 
   
  typedef struct Node {

    RcdType r;

    struct Node* next;

}Node;

typedef struct {

    Node** rcd;

    int size;//哈希表容量

    int count;//当前表中含有的记录个数

    int (*hash)(KeyType key,int hashSize)//函数指针变量，选取的哈希函数

}HashTable; 
   
  链地址哈希表的接口定义如下: 
  Status InitHash(HashTable &H,int size,int(*hash)(KeyType,int));//初始化哈希表

Status DestroyHash(HashTable& H);//销毁哈希表

Node* SearchHash(HashTable H, KeyType key);//查找

Status InsertHash(HashTable& H, RcdType e);//插入

Status DeleteHash(HashTable& H, KeyType key, RcdType& e);//删除 
  1.链地址哈希表的初始化 
  该操作构造一个初始容量为size的哈希表H，并对每个元素赋初值为空指针。链地址哈希表的初始化实现算法如下： 
  算法：链地址哈希表的初始化 
   
  Status InitHash(HashTable& H, int size, int (*hash)(TeyType, int))

{

    //初始化哈希表

    int i;

    H.rcd = (Node**)malloc(size * sizeof(Node*));//分配长度为size的存储空间，元素类型为指针Node*

    if (NULL == H.rcd)

    {

        return OVERFLOW;//分配失败

    }

    for (i = 0; i < size; i++)

    {

        H.rcd[i] = NULL;

    }

    H.size = size;

    H.hash = hash;

    H.count = 0;

    return OK;

} 
   
  2.链地址哈希表的查找 
  该操作在哈希表H中查找关键字为定值key的记录。若查找成功，返回该结点的指针，否则返回空指针。 
  算法：链地址哈希表的查找 
   
  int hash(int key, int hashSize) {//哈希函数，hashSize为空间长度

    return (3 * key) % hashSzie;

}

Node* SearchHash(HashTable & H, int key) {//在哈希表H中查找关键字为key的记录

    int p = H.hash(key, H.size);

    Node* np;

    for (np = H.rcd[0]; np != NULL; np = np->next)

    {

        if (np->r.key == key)

        {

             return np;

        }

        return NULL;

    }

} 
   
  3.链地址哈希表的插入 
  该操作唉哈希表H中插入记录e。查找关键字为e.key的记录，若已存在，则不插入，返回ERROR；否则将记录e插入其同义词链表的表头。 
  算法： 
   
  Status InsertHash(HashTable& H, RcdType e)

{

    //在哈希表H中插入记录e

    int p;

    Node* np;

    if ((np = SearchHash(H, e.key)) == NULL) {//查找不成功时插入

        p = H.hash(e.key, H.size);

        np = (Node*)malloc(sizeof(Node));

        if (NULL == np)

             return OVERFLOW;

        np->r = e;

        np->next = H.rcd[p];//插入到表头

        H.rcd[p] = np;

        H.count++;

        return OK;

    }

    else

        return ERROR;

} 
   
  4.4.2 开放定址哈希表实现 
  采用开放定址法处理冲突的哈希表称为开放定址哈希表，其类型定义如下： 
  typedef struct{

    RcdType *rcd;//记录存储地址，动态分配数组

    int size;//哈希表容量

    int count;//当前表中含有的记录个数

    in *tag;//标记，0：空；1：有效；-1：已删除

    int (*hash)(KeyType key,int hashSize);//函数指针变量，选取的哈希函数

    void(*collision)(int &hashValue,int hashSize);//函数指针变量，用于处理冲突的函数

}HashTable; 
  开放定址哈希表的接口定义如下： 
  Status DestroyHash(HashTable &H);//销毁哈希表

Status CreatHash(HashTable &H);//构造哈希表

Status SearchHash(HashTable H,KeyType key,int &p,int &c);//在哈希表H中查找关键字为key的记录

int InsertHash(HashTable &H,RcdType e);//在哈希表H中插入记录e

Status DeleteHash(HashTable &H,KeyType key,RcdType &e);//在哈希表H中删除关键字为key的记录

Status InitHash(HashTable &H,int size,int(*hash)(KeyType,int),void(*collision)(int &,int));//初始化哈希表 
   
  1.开放定址哈希表的初始化 
  该操作构造一个初始容量为size的哈希表H，并将哈希表中的记录标记域值为空。 
  算法：开放定址哈希表的初始化 
  Status DeleteHash(HashTable &H,KeyType key,RcdType &e){//在哈希表H中删除关键字为key的记录

    int i;

    H.rcd=(RcdType*)malloc(size*sizeof(RcdType));//分配长度为size的存储空间

    H.tag=(int *)malloc(size*sizeof(int));//分配存储空间对应的标记数组

    if(NULL==H.rcd||NULL==H.tag)

    {

        return OVERFLOW;//开辟失败

    }

    for(i=0;i
 
  2.开放定址哈希表的查找 
  该操作是在哈希表H中查找关键字为给定值key的记录。若查找成功，令参数p指示待查记录在表中的位置，并返回SUCCESS；否则，令p指示该记录可插入的位置，并返回UNSUCCESS。参数c用于统计冲突发生次数，当达到某一阈值（小于哈希表地址区间长度），则需要重新构造哈希表。 
  算法：开放定址哈希表查找 
  Status SearchHash(HashTable H,KeyType key,int &p,int &c)//在哈希表H中查找关键字为key的记录

{

    p=H.hash(key,H.size);//求得哈希地址

    while((1==H.tag[p]&&H.rcd[p].key!=key)||-1==H.tag[p])

    {

        H.collision(p,H.size);//求得下一探测地址p

        c++;

    }

    if(H.rcd[p].key==key&&1==H.tag[p])

    {

        return SUCCESS;//查找成功

    }

    else

    {

        return SUCCESS;

    }

} 
  算法：线性探索法处理冲突 
  void collision(int &hashValue,int hashSize){

    hashValue=(hashValue+1)%hashSize;

} 
  3.开放地址哈希表的插入 
  该操作在哈希表H中插入记录e。查找关键字为e.key的记录，若已存在，则不插入，返回-1；否则插入并返回查找时发生的冲突次数。 
  算法：开放定址哈希表的插入 
  int InsertHash(HashTable &H,RcdType e){//在哈希表H中插入记录e

    int c=0;j;

    if(SUCCESS==SearchHash(H,e.key,j,c))

    {

        return -1;//表明已有与e.key相同的关键字的记录

    }

    else{//插入记录e

        H.rcd[j]=e;

        H.tag[j]=1;

        ++H.count;

        return c;

    }

} 
  在实际应用中，若冲突次数超过阈值，可能是因为插入记录过多，需要扩容哈希表，也可能是哈希表函数选取不当，需要更换哈希函数，重新构造哈希表。 
  4.开放定址哈希表的删除 
  该操作在哈希表H中删除关键字为key的记录。查找关键字为key的记录，若不存在，则返回UNSUCCESS；否则删除该记录，并返回SUCCESS。 
  假设8个关键字22,41,53,,46,30,13,12,67，哈希表的地址区间长度为11，哈希函数为H(key)= (3*key)%11，若需要删除关键字为30的记录，计算得到的哈希地址为2，该单元的值为41，不是30；探测下一个哈希地址为3，正好是30，查找成功，置H.tag[3]为删除标记-1表示删除。若置H.tag[3]为空闲标记0，若此时查找关键字为67的记录，计算得到的哈希地址为3，则发现该单元空闲，查找失败。但关键字67由于与关键字30，12，53，46和13有冲突放到了8号单元，而并非不存在，因此在删除操作中，被删除的tag域应设为删除标记-1。 
   
   
  算法：开放定址哈希表的删除 
  Status DeleteHash(HashTable &H,KeyType key,RcdType &e){

    int j,c;

    if(UNSUCCESS==SearchHash(H,key,j,c))

    {

        return UNSUCCESS;//表明哈希表中不存在关键字为key的记录

    }

    else{

        e=H.rcd[j];//被删除的记录

        H.tag[j]=-1//删除标记

        H.count--;

        return SUCCESS;

    }

} 
  4.5 哈希表的查找性能 
  对一组关键字，设定相同的哈希函数，若采用不同的处理冲突的方法，则构造出来的哈希表不同，他们的平均查找长度也不同。假设8个关键字22,41,53,,46,30,13,12,67，哈希函数为H(key)= (3*key)%11，地址区间长度为11.若采用链地址法处理冲突，找到67则只需要比较1次。若采用线性探测法处理冲突，查找67的比较次数为6.若采用二次探测法，同样查找67，则需要比较5次。 
  在概率查找成功的情况下，3种不同处理冲突的哈希表的平均查找长度不同。 
   
  在构造哈希表时，哈希表插入的记录数栈地址区间长度的比率称为装填因子α 
  α=表中填入的记录数/地址区间长度 
  一般情况下，处理冲突方法相同的哈希表，其平均查找长度依赖于α，直观上来看，α越大，发生冲突的可能性就越大，可以证明： 
  采用链地址法的哈希表查找成功时的平均查找长度为 
  Snc≈1+α/2 
  采用线性探测法的哈希表查找成功时的平均查找长度为 
  Snl≈1/2（1+1/（1-α）） 
  采用二次探测法的哈希表查找成功时的平均查找长度为 
  Snr≈-1/αln(1-α) 
  由于哈希表中查找不成功时所需比较的次数与给定值有关，则可类似地定义哈希表中查找不成功时平均查找长度为查找不成功时需和给定值进行比较地关键字个数地期望值。同样可以证明，不同处理冲突的方法构成的哈希表在查找不成功时的平均查找长度分别为 
  Unr≈α+e-α——链地址法 
  Unl≈1/2（1+1/（1-α）2）——线性探测法 
  Unr≈1/（1-α）——二次探测法 
  这三种处理冲突的方法中，装填因子与平均查找长度在查找成功和查找不成功的关系如图（为了方便对比，取0≤α≤0.9），在装填因子较小时（＜0.6时）,这三种处理冲突的方法性能相差不大；但装填因子大于0.6后，线性探测处理冲突的性能极具下降；而链地址法处理冲突随着装填因子的变化，其性能变化不大。 
   
  链地址法与开放定址法各有特点及适用情形 
   
   链地址法处理冲突简单，且无堆聚现象，即非同义词决不会发生冲突，因此平均查找长度较短，查找效率较高。 
   链地址法中链表的结点是动态申请的，更适合事前无法确定元素个数的情况 
   在用链地址法构造的哈希表中，删除操作易于实现，只需删去链表上相应的结点即可。而对开放地址法构造的哈希表，不能简单地将被删记录地存储单元置为空闲单元，而是置为删除标记，否则将截断探测路径，影响路径上该单元之后的记录查找。 
   开放定址法为了减少冲突要求装填因子较小，故哈希表需设置较大的地址区间长度耗费较多空间。而链地址法装填因子可以大于1，但需要另设指针空间。 
   
  对于预先知道且规模不大的关键字集，有时可以构造完美哈希函数。完美哈希函数是指没有冲突的哈希函数，即若K的大小为n，D的大小为m，m≥n，且哈希函数H不出现同义词。若m=n，则称为最小完美哈希函数（MPHF）

OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
数据结构之哈希表 X同学的开始数据结构数据结构散列表
哈希表(散列表)出现的原因在顺序表中查找时，需要从表头开始，依次遍历比较a[i]与key的值是否相等，直到相等才返回索引i；在有序表中查找时，我们经常使用的是二分查找，通过比较key与a[i]的大小来折半查找，直到相等时才返回索引i。最终通过索引找到我们要找的元素。但是，这两种方法的效率都依赖于查找中比较的次数。我们有一种想法，能不能不经过比较，而是直接通过关键字key一次得到所要的结果呢？这时，
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
C语言判断回文数 Y雨何时停T c语言学习
一，回文数概念“回文”是指正读反读都能读通的句子，它是古今中外都有的一种修辞方式和文字游戏，如“我为人人，人人为我”等。在数学中也有这样一类数字有这样的特征，成为回文数。设n是一任意自然数。若将n的各位数字反向排列所得自然数n1与n相等，则称n为一回文数。例如，若n=1234321，则称n为一回文数；但若n=1234567，则n不是回文数。二，判断回文数实现思路一：数组与字符串将数字每一位按顺序放
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
C语言代码练习（第十九天）小小框架 C语言 C语言重点练习 c语言
今日练习：52、有一个已经排好序的数组，要求输入一个数后，按原来排序的规律将它插入数组中53、输出"魔方阵"。所谓魔方阵是指它的每一行，每一列和对角线之和均相等。54、找出一个二维数组中的鞍点，即该位置上的元素在该行上最大、在该列上最小。也可能没有鞍点。有一个已经排好序的数组，要求输入一个数后，按原来排序的规律将它插入数组中运行代码intmain(){intarr[11]={1,3,9,12,15
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
4.C_数据结构_队列荣世蓥数据结构数据结构
概述什么是队列：队列是限定在两端进行插入操作和删除操作的线性表。具有先入先出(FIFO)的特点相关名词：队尾：写入数据的一段队头：读取数据的一段空队：队列中没有数据，队头指针=队尾指针满队：队列中存满了数据，队尾指针+1=队头指针循环队列1、基本内容循环队列是以数组形式构成的队列数据结构。循环队列的结构体如下：typedefintdata_t;//队列数据类型#defineN64//队列容量typ
C++八股 Petrichorzncu 八股总结 c++开发语言
这里写目录标题C++内存管理C++的构造函数，复制构造函数，和析构函数深复制与浅复制：构造函数和析构函数哪个能写成虚函数，为什么？C++数据结构内存排列结构体和类占用的内存：==虚函数和虚表的原理==虚函数虚表（Vtable）虚函数和虚表的实现细节==内存泄漏==指针的工作原理函数的传值和传址new和delete与malloc和freeC++内存区域划分C++11新特性C++常见新特性==智能指针
【树一线性代数】005入门 Owlet_woodBird 算法
Index本文稍后补全，推荐阅读：https://blog.csdn.net/weixin_60702024/article/details/141874376分析实现总结本文稍后补全，推荐阅读：https://blog.csdn.net/weixin_60702024/article/details/141874376已知非空二叉树T的结点值均为正整数，采用顺序存储方式保存，数据结构定义如下:t
python获取子进程返回值_Python对进程Multiprocessing子进程返回值 weixin_39752157 python获取子进程返回值
在实际使用多进程的时候，可能需要获取到子进程运行的返回值。如果只是用来存储，则可以将返回值保存到一个数据结构中；如果需要判断此返回值，从而决定是否继续执行所有子进程，则会相对比较复杂。另外在Multiprocessing中，可以利用Process与Pool创建子进程，这两种用法在获取子进程返回值上的写法上也不相同。这篇中，我们直接上代码，分析多进程中获取子进程返回值的不同用法，以及优缺点。初级用法
【数据结构-一维差分】力扣2848. 与车相交的点 hlc@ 数据结构数据结构 leetcode 算法
给你一个下标从0开始的二维整数数组nums表示汽车停放在数轴上的坐标。对于任意下标i，nums[i]=[starti,endi]，其中starti是第i辆车的起点，endi是第i辆车的终点。返回数轴上被车任意部分覆盖的整数点的数目。示例1：输入：nums=[[3,6],[1,5],[4,7]]输出：7解释：从1到7的所有点都至少与一辆车相交，因此答案为7。示例2：输入：nums=[[1,3],[5
JavaScript `Map` 和 `WeakMap`详细解释跳房子的前端 JavaScript 原生方法 javascript 前端开发语言
在JavaScript中，Map和WeakMap都是用于存储键值对的数据结构，但它们有一些关键的不同之处。MapMap是一种可以存储任意类型的键值对的集合。它保持了键值对的插入顺序，并且可以通过键快速查找对应的值。Map提供了一些非常有用的方法和属性来操作这些数据对：set(key,value):将一个键值对添加到Map中。如果键已经存在，则更新其对应的值。get(key):获取指定键的值。如果键
c++ 内存处理函数 heeheeai c++开发语言
在C语言的头文件中，memcpy和memmove函数都用于复制内存块，但它们在处理内存重叠方面存在关键区别：内存重叠:memcpy函数不保证在源内存和目标内存区域重叠时能够正确复制数据。如果内存区域重叠，memcpy的行为是未定义的，可能会导致数据损坏或程序崩溃。memmove函数能够安全地处理源内存和目标内存区域重叠的情况。它会确保在复制过程中不会覆盖尚未复制的数据，从而保证数据的完整性。效率:
【高阶数据结构】并查集椿融雪数据结构与算法数据结构并查集
文章目录一、并查集原理二、并查集实现三、并查集应用一、并查集原理在一些应用问题中，需要将n个不同的元素划分成一些不相交的集合。开始时，每个元素自成一个单元素集合，然后按一定的规律将归于同一组元素的集合合并。在此过程中要反复用到查询某一个元素归属于那个集合的运算。适合于描述这类问题的抽象数据类型称为并查集(union-findset)。比如：某公司今年校招全国总共招生10人，西安招4人，成都招3人，
C语言---程序设计练习题目及学习方法1 Wanyu677 C语言 c语言学习方法算法
学习方法要多练习在这些题目中的代码和题目自己动手去敲练习也是在熟悉语法，写代码第一步就是熟悉语法练习是在锻炼编程思维，把实际问题转换为代码的能力学会画图画图去理解内存，理解指针这些比较难懂的知识画图可以更好的理清思路辅助理解，强化理解学会调试借助调试，更好的理解代码和感知代码找出代码中的bug和程序逻辑（1）自增自减运算符inta=5,b,c,i=10;b=a++;c=++b;printf("a=
【C语言】- 自定义类型：结构体、枚举、联合 Cavalier_01 C语言
【C语言】：操作符（https://mp.csdn.net/editor/html/115218055）数据类型（https://mp.csdn.net/editor/html/115219664）自定义类型：结构体、枚举、联合（https://mp.csdn.net/editor/html/115373785）变量、常量（https://mp.csdn.net/editor/html/11523
python中文版软件下载-Python中文版编程大乐趣
python中文版是一种面向对象的解释型计算机程序设计语言。python中文版官网面向对象编程，拥有高效的高级数据结构和简单而有效的方法，其优雅的语法、动态类型、以及天然的解释能力，让它成为理想的语言。软件功能强大，简单易学，可以帮助用户快速编写代码，而且代码运行速度非常快，几乎可以支持所有的操作系统，实用性真的超高的。python中文版软件介绍：python中文版的解释器及其扩展标准库的源码和编
开发游戏的学习规划杰克逊的日记游戏学习
第一阶段：●C#语言快速系统地学习一遍（基础的语法、面向对象、基础的数据结构、基础的设计模式）●Unity的2D和3D部分及UI、动画、物理系统●阶段性测验：需要去用前面所学的这些基础知识来完成一个简单的2d或者3d的案例，将通过一个自制的《Flappybird》游戏案例讲解游戏开发的思想及方法，并将《Flappybird》这个游戏进一步改造成一个横版射击类游戏《Crazybird》以巩固并且升华
六、全局锁和表锁：给表加个字段怎么有这么多阻碍 nieniemin
数据库锁设计的初衷是处理并发问题。作为多用户共享的资源，当出现并发访问的时候，数据库需要合理地控制资源的访问规则。而锁就是用来实现这些访问规则的重要数据结构。根据加锁的范围，MySQL里面的锁大致可以分成全局锁、表级锁和行锁三类。6.1全局锁全局锁就是对整个数据库实例加锁。MySQL提供了一个加全局读锁的方法，命令是Flushtableswithreadlock(FTWRL)。当你需要让整个库处于
华南农业大学C语言oj第八章黑兔子撒 C语言 C语言华南农业大学编程程序
18058一年的第几天时间限制:1000MS内存限制:65535K提交次数:0通过次数:0题型:填空题语言:G++;GCC;VCDescription定义一个结构体类型表示日期类型（包括年、月、日）。程序中定义一个日期类型的变量，输入该日期的年、月、日，计算并输出该日期是一年的第几天。#include struct DATE { _______________________ }; int da
linux gcc 格式,Linux下gcc与gdb简介神奇的战士 linux gcc 格式
gcc编译器可以将C、C++等语言源程序、汇编程序编译、链接成可执行程序。gdb是GNU开发的一个Unix/Linux下强大的程序调试工具。linux下没有后缀名的概念。但gcc根据文件的后缀来区别输入文件的类别：.cC语言源代码文件.a由目标文件构成的库文件.C、.cc、.cppC++源码文件.h头文件.i经过预处理之后的C语言文件.ii经过预处理之后的C++文件.o编译后的目标文件.s汇编源码
Lua 与 C#交互 z2014z lua c#开发语言
Lua与C#交互前提Lua是一种嵌入式脚本语言，Lua的解释器是用C编写的，因此可以方便的与C/C++进行相互调用。轻量级Lua语言的官方版本只包括一个精简的核心和最基本的库，这使得Lua体积小、启动速度快，也适合嵌入在别的程序里。交互过程C#调用Lua:由C#文件调用Lua解析器底层dll库（由C语言编写），再由dll文件执行相应的Lua文件。Lua调用C#：1、Wrap方式：首先生成C#源文件
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo

《数据结构》第四章：哈希表

4.1哈希表的概念

4.2哈希函数的构造方法

4.2.1直接定址法

4.2.2除留余数法

4.2.3 数字分析法

4.2.4 折叠法

4.2.5 平均取中法

4.3 处理冲突的方法

4.3.1 链地址法

4.3.2 开放定址法

1.线性探测法

2.二次探测法

4.4 哈希表的实现

4.4.1 链地址哈希表的实现

1.链地址哈希表的初始化

2.链地址哈希表的查找

3.链地址哈希表的插入

4.4.2 开放定址哈希表实现

1.开放定址哈希表的初始化

2.开放定址哈希表的查找​​​​​​​

3.开放地址哈希表的插入

4.开放定址哈希表的删除

4.5 哈希表的查找性能

你可能感兴趣的:(c语言,数据结构)

2.开放定址哈希表的查找