使用Zlib库进行文件的压缩和解压

zlib介绍

zlib是提供数据压缩用的函式库,由Jean-loup Gailly与Mark Adler所开发,初版0.9版在1995年5月1日发表。zlib使用DEFLATE算法,最初是为libpng函式库所写的,后来普遍为许多软件所使用。此函式库为自由软件,使用zlib授权

配置

我是从网上直接下载了zlib的dll文件的,压缩包具体有几个部分,分别是头文件zconf.h,zlib.h;lib文件zdll.lib;dll文件zlib1.dll。
配置过程很简单,包含头文件目录或引入头文件;配置VS的工程属性页,在链接器-常规-附加库目录,添加lib文件所在目录,同时在链接器-输入-附加依赖项,添加zdll.lib;最后将zlib1.dll放到Debug目录和exe文件在一起就可以了。

例子

#include <stdio.h>
#include "zlib.h"

int main()
{
    /* 原始数据 */
    unsigned char strSrc[] = "hello world! aaaaa bbbbb ccccc ddddd 中文测试 yes";
    unsigned char buf[1024] = {0};
    unsigned char strDst[1024] = {0};
    unsigned long srcLen = sizeof(strSrc);
    unsigned long bufLen = sizeof(buf);
    unsigned long dstLen = sizeof(strDst);

    printf("Src string:%s\nLength:%ld\n", strSrc, srcLen);

    /* 压缩 */
    compress(buf, &bufLen, strSrc, srcLen);
    printf("After Compressed Length:%ld\n", bufLen);

    /* 解压缩 */
    uncompress(strDst, &dstLen, buf, bufLen);
    printf("After UnCompressed Length:%ld\n",dstLen);

    printf("UnCompressed String:%s\n",strDst);

    return 0;
}


输出结果是:

Src string:hello world! aaaaa bbbbb ccccc ddddd 中文测试 yes
Length:50
After Compressed Length:49
After UnCompressed Length:50
UnCompressed String:hello world! aaaaa bbbbb ccccc ddddd 中文测试 yes

这里,zlib只是把一段内存压缩,压缩后放的另一段内存上,这离压缩文件甚至文件夹的目标还很远。
确切的说,zlib可能并不是一个针对ZIP文件的库,它只是一个针对gzip以及deflate算法的库。它提供了一个叫做minizip (contrib\minizip) 例子来给出操作 ZIP 文件的方法。

Minizip

Minizip是一个Zip和UnZip文件的附加实例。minizip.c和miniunz.c分别实际的压缩、解压程序,除去其主程序minizip.c和miniunz.c后,剩下的部分我们可以看作是zlib的一个上层库,它封装了与ZIP文件格式相关的操作。

压缩的具体操作

压缩涉及到以下api:

  1. zipOpen64
  2. zipClose
  3. zipOpenNewFileInZip
  4. zipCloseFileInZip
  5. zipWriteInFileInZip

使用zipOpen64来打开/创建一个ZIP文件,然后开始遍历要被放到压缩包中去的文件。针对每个文件,先调用一次zipOpenNewFileInZip,然后开始读原始文件数据,使用zipWriteInFileInZip来写入到ZIP文件中去。zipOpenNewFileInZip的第三个参数是一个zip_fileinfo结构,该结构数据可全部置零,其中dosDate可用于填入一个时间(LastModificationTime)。它的第二个参数是ZIP中的文件名,若要保持目录结构,该参数中可以保留路径。

解压的具体操作

解压缩涉及到以下api:

  1. unzOpen64
  2. unzClose
  3. unzGetGlobalInfo64
  4. unzGoToNextFile
  5. unzGetCurrentFileInfo64
  6. unzOpenCurrentFile
  7. unzCloseCurrentFile
  8. unzReadCurrentFile

打开一个 ZIP 文件后,需要先使用 unzGetGlobalInfo64 来取得该文件的一些信息,来了解这个压缩包里一共包含了多少个文件,等等。目前我们用得着的就是这个文件数目。然后开始遍历 ZIP 中的文件,初始时自动会定位在第一个文件,以后处理完一个后用 unzGoToNextFile 来跳到下一个文件。对于每个内部文件,可用 unzGetCurrentFileInfo64 来查内部文件名。这个文件名和刚才 zipOpenNewFileInZip 的第二个参数是一样的形式,所以有可能包含路径。也有可能会以路径分隔符(/)结尾,表明这是个目录项(其实压缩操作的时候也可以针对目录写入这样的内部文件,上面没有做)。所以接下来要根据情况创建(多级)目录。unzGetCurrentFileInfo64 的第三个参数是 unz_file_info64 结构,其中也有一项包含了 dosDate 信息,可以还原文件时间。对于非目录的内部文件,用 unzOpenCurrentFile,打开,然后 unzReadCurrentFile 读取文件内容,写入到真实文件中。unzReadCurrentFile 返回 0 表示文件读取结束。

参考资料

Minizip

转载请注明作者Jason Ding及其出处
Github主页(http://jasonding1354.github.io/)
CSDN博客(http://blog.csdn.net/jasonding1354)
简书主页(http://www.jianshu.com/users/2bd9b48f6ea8/latest_articles)

你可能感兴趣的:(压缩,cpp)