1.需求分析
利用小堆,huffman编码,文件流操作,二进制文件的读写实现对普通文件的压缩和解压过程。
2.能力要求
A.熟悉对文件的读写操作。
B.熟悉小堆的原理。
C.熟悉HuffmanTree的实现原理、
D.会编码的获取。
E.对编码信息处理和存储。
F.最重要一点,要理解压缩和解压缩的过程。
3.模块介绍。
A设计的存储结构。.
B.压缩过程.
C.解压缩过程。
D.编码的获取。.
E.HuffmanTree的实现。
F.小堆的实现。
G.读文件的操作。
4.压缩和解压缩的原理。
压缩过程:利用数据结构,对文件里面的字符进行统计。以字符出现的频率构建小堆,再利用小堆,构建HuffmanTree。以HuffmanTree左右孩子遍历,左为0,右为1.将统计出来的结果存放到自己设计的结构中。在通过对字符编码进行位进制压缩,可以实现压缩过程。
解压缩过程:利用字符和统计次数写配置文件,解压缩就可以通过配置文件建立一颗HuffmanTree,在根据压缩文件内容遍历HuffmanTree,叶子节点即为原来的一个字符。
5.模块具体分析。
A设计的存储结构。
typedef long longtype;
struct FileInfo
{
unsigned char _ch; //字符
longtype _count; //计数器
string _code; //Huffman编码
}
B.压缩过程.
1.先把文件内容读进来,并进行字符统计。
2.统计字符出现字数,存入_count。
3.依据每个节点的_count值,构建相应的huffman树。
4.将编码压缩,存入文件。
5.把字符和出现次数按照(字符,次数)的形式,每行的保存到配置文件里。
C.解压缩过程。
1.读取配置文件里的内容,构建HuffmanTree。
2.根据压缩文件,和重建的huffman树解压.
3.根据压缩文件字符编码解压文件.
D.编码的获取
void huffmancode(HuffManNode
E.HuffmanTree的实现。
struct HuffManNode
{
HuffManNode
HuffManNode
HuffManNode
T _weight;
}
class HuffManTree
{
public:
typedef HuffManNode
//仿函数
template
struct Compare
{
bool operator()(Node*& L, Node*& R)
{
return L->_weight < R->_weight;
}
};
private:
Node* _root;
F.小堆的实现。
Heap(const T* array, size_t size)
{
_array.reserve(size);
for (size_t i = 0; i < size; ++i)
{
_array.push_back(array[i]);
}
for (int begin = _array.size() / 2 - 1;
begin >= 0; begin--)
{
_AdjustDown(begin);
}
}
G.读文件的操作。
bool readline(FILE* str, string& code)
1.需求分析
利用小堆,huffman编码,文件流操作,二进制文件的读写实现对普通文件的压缩和解压过程。
2.能力要求
A.熟悉对文件的读写操作。
B.熟悉小堆的原理。
C.熟悉HuffmanTree的实现原理、
D.会编码的获取。
E.对编码信息处理和存储。
F.最重要一点,要理解压缩和解压缩的过程。
3.模块介绍。
A设计的存储结构。.
B.压缩过程.
C.解压缩过程。
D.编码的获取。.
E.HuffmanTree的实现。
F.小堆的实现。
G.读文件的操作。
4.压缩和解压缩的原理。
压缩过程:利用数据结构,对文件里面的字符进行统计。以字符出现的频率构建小堆,再利用小堆,构建HuffmanTree。以HuffmanTree左右孩子遍历,左为0,右为1.将统计出来的结果存放到自己设计的结构中。在通过对字符编码进行位进制压缩,可以实现压缩过程。
解压缩过程:利用字符和统计次数写配置文件,解压缩就可以通过配置文件建立一颗HuffmanTree,在根据压缩文件内容遍历HuffmanTree,叶子节点即为原来的一个字符。
5.模块具体分析。
A设计的存储结构。
typedef long longtype;
struct FileInfo
{
unsigned char _ch; //字符
longtype _count; //计数器
string _code; //Huffman编码
}
B.压缩过程.
1.先把文件内容读进来,并进行字符统计。
2.统计字符出现字数,存入_count。
3.依据每个节点的_count值,构建相应的huffman树。
4.将编码压缩,存入文件。
5.把字符和出现次数按照(字符,次数)的形式,每行的保存到配置文件里。
C.解压缩过程。
1.读取配置文件里的内容,构建HuffmanTree。
2.根据压缩文件,和重建的huffman树解压.
3.根据压缩文件字符编码解压文件.
D.编码的获取
void huffmancode(HuffManNode
E.HuffmanTree的实现。
struct HuffManNode
{
HuffManNode
HuffManNode
HuffManNode
T _weight;
}
class HuffManTree
{
public:
typedef HuffManNode
//仿函数
template
struct Compare
{
bool operator()(Node*& L, Node*& R)
{
return L->_weight < R->_weight;
}
};
private:
Node* _root;
F.小堆的实现。
Heap(const T* array, size_t size)
{
_array.reserve(size);
for (size_t i = 0; i < size; ++i)
{
_array.push_back(array[i]);
}
for (int begin = _array.size() / 2 - 1;
begin >= 0; begin--)
{
_AdjustDown(begin);
}
}
G.读文件的操作。