文件压缩

1.需求分析

利用小堆,huffman编码,文件流操作,二进制文件的读写实现对普通文件的压缩和解压过程。



2.能力要求

A.熟悉对文件的读写操作。

B.熟悉小堆的原理。

C.熟悉HuffmanTree的实现原理、

D.会编码的获取。

E.对编码信息处理和存储。

F.最重要一点,要理解压缩和解压缩的过程。


3.模块介绍。

A设计的存储结构。.

B.压缩过程.

C.解压缩过程。

D.编码的获取。.

E.HuffmanTree的实现。

F.小堆的实现。

G.读文件的操作。


4.压缩和解压缩的原理。

压缩过程:利用数据结构,对文件里面的字符进行统计。以字符出现的频率构建小堆,再利用小堆,构建HuffmanTree。以HuffmanTree左右孩子遍历,左为0,右为1.将统计出来的结果存放到自己设计的结构中。在通过对字符编码进行位进制压缩,可以实现压缩过程。

 

解压缩过程:利用字符和统计次数写配置文件,解压缩就可以通过配置文件建立一颗HuffmanTree,在根据压缩文件内容遍历HuffmanTree,叶子节点即为原来的一个字符。


5.模块具体分析。

A设计的存储结构。


typedef long longtype;
struct FileInfo
{
unsigned char _ch;           //字符
longtype _count;                 //计数器
string _code;               //Huffman编码

}


B.压缩过程.

1.先把文件内容读进来,并进行字符统计。

2.统计字符出现字数,存入_count。

3.依据每个节点的_count值,构建相应的huffman树。

4.将编码压缩,存入文件。

5.把字符和出现次数按照(字符,次数)的形式,每行的保存到配置文件里。


C.解压缩过程。


1.读取配置文件里的内容,构建HuffmanTree。

2.根据压缩文件,和重建的huffman树解压.

3.根据压缩文件字符编码解压文件.


D.编码的获取


void huffmancode(HuffManNode* root, string& code)


E.HuffmanTree的实现。

struct HuffManNode
{
HuffManNode *_parent;
HuffManNode *_right;
HuffManNode *_left;


T _weight;

}


class HuffManTree
{
public:
typedef HuffManNode Node;

//仿函数
template
struct Compare
{
bool operator()(Node*& L, Node*& R)
{
return L->_weight < R->_weight;
}
};


private:
Node* _root;



F.小堆的实现。


Heap(const T* array, size_t size)
{
_array.reserve(size);
for (size_t i = 0; i < size; ++i)
{
_array.push_back(array[i]);
}


for (int begin = _array.size() / 2 - 1;
begin >= 0; begin--)
{
_AdjustDown(begin);
}
}

G.读文件的操作。


bool readline(FILE* str, string& code)

1.需求分析

利用小堆,huffman编码,文件流操作,二进制文件的读写实现对普通文件的压缩和解压过程。



2.能力要求

A.熟悉对文件的读写操作。

B.熟悉小堆的原理。

C.熟悉HuffmanTree的实现原理、

D.会编码的获取。

E.对编码信息处理和存储。

F.最重要一点,要理解压缩和解压缩的过程。


3.模块介绍。

A设计的存储结构。.

B.压缩过程.

C.解压缩过程。

D.编码的获取。.

E.HuffmanTree的实现。

F.小堆的实现。

G.读文件的操作。


4.压缩和解压缩的原理。

压缩过程:利用数据结构,对文件里面的字符进行统计。以字符出现的频率构建小堆,再利用小堆,构建HuffmanTree。以HuffmanTree左右孩子遍历,左为0,右为1.将统计出来的结果存放到自己设计的结构中。在通过对字符编码进行位进制压缩,可以实现压缩过程。

 

解压缩过程:利用字符和统计次数写配置文件,解压缩就可以通过配置文件建立一颗HuffmanTree,在根据压缩文件内容遍历HuffmanTree,叶子节点即为原来的一个字符。


5.模块具体分析。

A设计的存储结构。


typedef long longtype;
struct FileInfo
{
unsigned char _ch;           //字符
longtype _count;                 //计数器
string _code;               //Huffman编码

}


B.压缩过程.

1.先把文件内容读进来,并进行字符统计。

2.统计字符出现字数,存入_count。

3.依据每个节点的_count值,构建相应的huffman树。

4.将编码压缩,存入文件。

5.把字符和出现次数按照(字符,次数)的形式,每行的保存到配置文件里。


C.解压缩过程。


1.读取配置文件里的内容,构建HuffmanTree。

2.根据压缩文件,和重建的huffman树解压.

3.根据压缩文件字符编码解压文件.


D.编码的获取


void huffmancode(HuffManNode* root, string& code)


E.HuffmanTree的实现。

struct HuffManNode
{
HuffManNode *_parent;
HuffManNode *_right;
HuffManNode *_left;


T _weight;

}


class HuffManTree
{
public:
typedef HuffManNode Node;

//仿函数
template
struct Compare
{
bool operator()(Node*& L, Node*& R)
{
return L->_weight < R->_weight;
}
};


private:
Node* _root;



F.小堆的实现。


Heap(const T* array, size_t size)
{
_array.reserve(size);
for (size_t i = 0; i < size; ++i)
{
_array.push_back(array[i]);
}


for (int begin = _array.size() / 2 - 1;
begin >= 0; begin--)
{
_AdjustDown(begin);
}
}

G.读文件的操作。


bool readline(FILE* str, string& code)

 
  

你可能感兴趣的:(C++)