字符串(一)、字符串Hash

今天开一手最不(tao)擅(yan)长的字符串算法:字符串Hash算法。

似乎提到字符串的话,KMP应该是更为常见的一种,但是hash有它的优点,被犇们称为“优雅的暴力”。

何谓hash?hash的中文称为哈希,这当然是音译,直译过来就是散列,或者也有叫预映射的。哈希的作用就是通过某个特殊函数的映射,将任意长度的输入映射为固定长度的输出。而字符串哈希涅,顾名思义当然就是把字符串转换为整数的函数。但是有些时候,这些映射无法做到一一对应,我们称之为碰撞/冲突,这时候就需要某些手段避免这些碰撞。

字符串hash的主要算法就是“BKDR Hash”,其采用了进制压缩的思想,把字符串中的每个字符看成一个大数每一位上的数字,然后对这个结果取模,我们认为取模后的结果和原来的结果是等价的,这样就可以在有一定的错误率的基础上进行判断了。当然也可以写成unsigned long long,自动对超过范围的数取模2^64。哈希的精度不够的话,还可以使用双哈希。


字符串哈希的思想非常简单,实现起来也很方便。在某些特定的情况下,例如判定字符串的重复性的时候,使用字符串hash会显得非常高效。

#include
#define INF 0x7ffffff
using namespace std;

char s[1007];

typedef unsigned long long ull;
ull a[20003];
ull base=233;


ull Hash(){
    int len=strlen(s);
    ull ans=0;
    for(int i=0;i>n;
    for(int i=0;i>s;
        a[i]=Hash();
    }
    sort(a,a+n);
    int ans=1;
    for(int i=1;i

你可能感兴趣的:(算法)