整数压缩算法

1 0~255的整数可以只用一个字节表示,256~65535的数据只需2个字节,65536~16777215需要3个字节,16777216以上4个字节

 
  
int uncompressed[] = {...}
byte compressed[] = {...}

Encode Integers:
int outPos = 0, previous = 0;
for (int inPos = 0; inPos < n; inPos++) {
int delta = uncompressed[inPos] - previous;
while (delta >= 128) {
compressed[outPos++] = (delta & 127) | 128;
delta = delta >> 7;
}
compressed[outPos++] = delta;
}

Decode Integers:
int outPos = 0, previous = 0;
for (int outPos = 0; outPos < n; outPos++) {
for (int shift = 0; ; shift += 7) {
int temp = compressed[inPos++];
previous += ((temp & 127) << shift);
if (temp < 128) break;
}
uncompressed[outPos] = previous;
}
2 行程压缩算法 or( 游程长度压缩算法 )   RLE(Run Length Encoding)

http://blog.csdn.net/orbit/article/details/7062218

这里需要补充的是在传统的RLE算法里,并没有考虑到连续递增或递减的数据序列,例如:2,3,4,5,6,8,9,10,11。2,3,4,5,6是一个增序列,9,10,11,12也是一个增序列,对应这种序列,我们可以添加一个自己的模式来处理它。例如:00b表示连续相同的数字序列, 01b表示连续递增的数字序列,那么可以用(01000101)b表示递增序列的长度为5.

3 PForDelta索引压缩算法

4 NewPForDelta算法

5 variable byte / code 算法

6 LZMA算法,(Lempel-Ziv-Markov chain-Algorithm 的缩写)

7 DEFLATE压缩算法,是同时使用了LZ77算法与哈夫曼编码(Huffman Coding)的一个无损数据压缩算法

你可能感兴趣的:(算法)