php的crc32的陷阱

前几天写了一个分表程序,用的hash算法是crc32.分表的函数如下:

 function _get_hash_table($station) {
        $str = crc32($station);debug($str);
        $hash = substr(abs($str), 0, 2);
        return 'table'.($hash%10);
    }

首先在本地32位window机上生成好数据并插入对应的表中。但是再把程序和数据传到服务器上(64为linux),发现查不到数据。经过排查后发现,原来服务器上crc32的结果和本地不同。再查php手册才知,crc32的接口原来和机器有关。

php手册的描述:

Because PHP's integer type is signed many crc32 checksums will result in negative integers on 32bit platforms. On 64bit installations all crc32() results will be positive integers though.

crc32返回的结果在32位机上会产生溢出,所以结果可能为负数。而在64位机上不会溢出,所以总是正值。

CRC算法是按字长位数bit进行计算的。
crc32函数会按照php中的两个常量参考计算 PHP_INT_SIZE,PHP_INT_MAX
这两个常量的定义:
整型数的字长和平台有关,尽管通常最大值是大约二十亿(32 位有符号)。PHP 不支持无符号整数。Integer值的字长可以用常量PHP_INT_SIZE来表示,自 PHP 4.4.0 和 PHP 5.0.5后,最大值可以用常量PHP_INT_MAX来表示。
输出下32位中PHP_INT_SIZE:4,PHP_INT_MAX:2147483647
输出下64位中PHP_INT_SIZE:8,PHP_INT_MAX:9223372036854775807

解决方法:

function _get_hash_table($station) {
        $checksum  = crc32($station);
        //decbin($str);
        if(8==PHP_INT_SIZE){//64位机,进行移位从处理成和32机一样
            if($checksum >2147483647){
                $checksum  = $checksum&(2147483647);//对64位机的先进截取后32位
                $checksum = ~($checksum-1);//取补码
                $checksum = $checksum&2147483647;//由于补码操作的修改,但是这时的checksum是正值而不是负值
            }
        }
        debug($checksum.':');
        $hash = substr(abs($checksum), 0, 2);//此处的abs是完全必要的
        return 'transit_dijkstra'.($hash%10);
    }
这样

你可能感兴趣的:(php的crc32的陷阱)