请设计一个算法,给一个字符串进行二进制编码,使得编码后字符串的长度最短。

解题的关键是我们只需利用哈夫曼树的思想,而不需要去真正的构造和保存哈夫曼树。

常规解决问题的思路:

1.统计每个字符在字符串出现的次数;

2.构造哈夫曼树,常规构造哈夫曼树的思想就是将整个哈夫曼树构造出来,然后遍历哈夫曼树,计算出每个叶子节点的深度Di.则minLength+=Wi*Di

而在实际解决问题过程中并不需要构造和遍历哈夫曼树来获取每个叶子节点的深度,而是在利用构造哈夫曼树的思想进行累加计算,直到将所有节点合并成一颗二叉树,其结果也就运算出来了。根据构造哈夫曼树的逻辑,优先选择所有节点中的两个权重最小的节点A,B进行合并,然后将合并的节点加入到之前的优先队列中,然后反复这个过程,直到结束,则计算公式如下:

 minLength+=W(A)+W(b);

从而省略了遍历哈夫曼树和保存哈夫曼树的过程,很大程度上简化了计算的复杂度,其中需要借助优先队列或者最小堆实现,每次获取优先队列或者堆的最小值进行合并操作,同时在一定程度上简化的储存的数据结构,我们只关心字符出现次数的队列,而无需关注其相应的字符。这里暂时省略构造哈夫曼树的逻辑。实现代码如下:

struct wordinfo
{
int  num;
char ch;
bool operator<(const wordinfo &other) const
{
if (this->num < other.num)
{
return true;
}
return false;
}
};


int calMinLength(string s)
{
int len = s.size();
map charcount;
for (int i = 0; i < len; i++)
{
charcount[s[i]]++;
}
//利用vector实现优先队列,也可用堆实现
vector chvecinfo;
for (auto i : charcount)
{
wordinfo temp;
temp.ch = i.first;
temp.num = i.second;
chvecinfo.push_back(temp);
}
//
sort(chvecinfo.begin(), chvecinfo.end());
//构造哈夫曼树过程,每次选择权重最小的两个点进行合并操作,并对其权重和进行累加计算
int sum = 0;
while (chvecinfo.size() != 1)
{
wordinfo temp,temp1,temp2;
temp1 = *chvecinfo.begin();
chvecinfo.erase(chvecinfo.begin());
temp2 = *chvecinfo.begin();
chvecinfo.erase(chvecinfo.begin());
sum += temp1.num + temp2.num;
temp.num = temp1.num + temp2.num;
chvecinfo.push_back(temp);
sort(chvecinfo.begin(), chvecinfo.end());
}
return sum;
}
int main()
{
       string s;
cin >> s;
calMinLength(s);
}


你可能感兴趣的:(请设计一个算法,给一个字符串进行二进制编码,使得编码后字符串的长度最短。)