整形数值压缩---Vint与zigzag

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

vint相信大家比较熟悉了,是可变长的整形,笼统的说就是较小的正整形数值将占用较小的空间。如int value=10,将占用4个字节的空间,很明显1个字节就足以存储10了。编码的规则如下:标志位(1bit)+数据位(7bit),也就是将数值按7位进行截取,如果后续位的值不为0标志位为1否则为0,一直重复这样的步骤。

如10写成二进制形式00000000_00000000_00000000_00001010,采用vint表示00001010;

如266写成二进制形式00000000_00000000_00000001_00001010,采用vint表示 00000010_10001010;

但问题是负数采用vint编码一定会增加占用空间,因为最高位符号位为1。

如何对绝对值较小的负数如-1、-2等进行压缩是zigzag算法需要解决的问题。

算法规则如下:

1、将数值的符号位移动到第1位,数据位左移一位;

2、对于正数数值位不变,负数按位取反;

算法的代码如下:

编码:(i >> 31) ^ (i << 1)

解码:((i >>> 1) ^ -(i & 1))

这里异或运算很巧妙,可以参考“ java位运算--基础(不定期更新)”

以-1为例11111111_11111111_11111111_11111111经过zigzag编码后为00000000_00000000_00000000_00000001=1,

最后使用Vint压缩只占用1个字节。

 

 

转载于:https://my.oschina.net/u/1268334/blog/2051071

你可能感兴趣的:(整形数值压缩---Vint与zigzag)