伪哈希函数降低索引长度

对于左前缀不易区分的列 ,建立索引的技巧
如 url列
http://www.baidu.com

http://www.zixue.it


列的前11个字符都是一样的,不易区分, 可以用如下2个办法来解决
1: 把列内容倒过来存储,并建立索引 
Moc.udiab.www//:ptth
Ti.euxiz.www//://ptth
这样左前缀区分度大,


2: 伪hash索引效果

同时存 url_hash列

注:伪hash使用到的函数是crc32(),在存入字符数据前,先对字符进行crc32处理为整形,然后存放到url_hash字段中,原来存放字符字段的索引可以删掉,然后在url_hash字段上加上索引,这样子做,可以减少key_len长度(此时key_len长度为4,即int的字符长度)

你可能感兴趣的:(伪哈希函数降低索引长度)