[原创]桓泽学音频编解码（7）：MP3 和 AAC 中huffman解码原理，优化设计与参考代码中实现

1 不同标准中的huffman解码原理

1.1标准MP3的huffman解码原理

在MP3即mpeg-1 audio标准中，无噪声编码模块的输入是一组576个己量化的频谱数据。无噪声编码首先对频谱进行无噪声的动态范围压缩。编码模块最多可以分别对四个模值超过1的系数进行编码，并且在量化系数队列中保留符号位，用来传送符号。

为了使格组量化频谱系数所需的比特数最少，无噪声编码把一组576个量化频谱系数分成3个region，每个region一个霍夫曼码书。由低频到高频分别为big_value区，count1区，rzero区，big_value区一个huffman码字表示2个量化系数，使用32个huffman表，count1区一个huffman码字表示4个量化系数，一共使用了2本码书。Nzero区不用解码。表示余下子带谱线值全为0。

1.2标准MPEG2 AAC的Huffman解码原理

在13818-7即AAC标准中，无噪声编码模块的输入是一组1024个己量化的频谱数据。一共有13个有效的码本，1个用于scalefactor解码，其余的12个用于量化谱线的解码。

霍夫曼编码利用一个霍夫曼码表示4量化系数或2个量化谱线系数。编码时，一共使用了12本码书。利用这些码书，对系数的模值进行霍夫曼编码，而非零系数的符号位添加到码字中去。

为了使格组量化频谱系数所需的比特数最少，无噪声编码把一组1024个量化频谱系数分成一些区(section)，每个区由一个或多个比例系数频段组成，使用同一本霍夫曼码书。这样，对比例系数频段的每个分区都必须传输该区的长度以及该区所用码书的序号。

对scalefactor的解码，第一个比例系数代表了量化器的全局步长，称为全局增益值，也就是公共比例因子。它被编码为一个8位无符号整数PCM值，全局增益的动态范围足以表示一个24位PCM音源的所有值。后面所有的比例因子都利用一个特殊的霍夫曼码书(对第一个比例系数，则与全局增益)进行差分编码。为了提高压缩比，系统不传输系数值全为零的比例系数频段的比例系数。

标准区别	对SCF	码本组织	码本个数
MP3	查分定长编码	低频2个系数一组，中频4个系数一组	有效码本8个
AAC	Huffman编码	低频4个系数一组，中频2个系数一组	有效码本10个

2 Huffman的解码优化设计

Huffman的解码实现主要有以下几种:

线性搜索法

线性搜索法按码字非减的顺序间码本排成一个表，每次读取一个比特，然后看排序的表中是否有完全匹配，如有则找到索引，没有则继续寻找。它的优点是所用的表比较小，但是搜索较长码表的时候所需的时间太长,且不易扩展.

二叉树搜索法

二叉树搜索法要根据码表建立一个二叉树，叶节点表示相应的索引，左右子树分别用1 ,0表示，如图3-10(b)所示。进行搜索时，每次读入一个比特，当读入的值为1时进入左子树，为0时进入右子树，直到找到叶子节点。

直接查表法

直接查表法就是根据码字逆向建表，解码时每次读入码表中码字的最大长度个比特，查表后便可找到相应的索引。这种算法只需一次查表即可完成，是所有算法中速度最快的，但是因为需要建立庞大的码表而变得不可取。

分步搜索法等。

分步查表法避免了直接查表法中占用内存大的缺点，它灵活地把查表分为几次完成。这样就需要建几个表，前一个表相当于后一个表的索引，最后的表记录了相应码字的索引，如图3-10(a)所示的是两步查表法。它实际上是二叉树搜索法与直接查表法的折衷，当各个表的位宽为1时就是二叉树搜索法，当位宽为最长码长的长度时就变成直接查表法。所以分布查表法是各种解码方法中最灵活的，可以根据不同的应用限制制定相应的表的组织形式。

3 huffman解码算法模块在不同参考软件中的实现方法

Mp3

参考软件1:11172-5_1998(E)_Software_Simulation

顶层函数

III_hufman_decode

子函数1

initialize_huffman

从文件中读入huffman表

子函数2

huffman_decoder,解码big value和count1

解码一个码字的算法

/* 查找huffman树的方法. */

do {

if (h->val[point][0]==0) { /*end of tree*/

*x = h->val[point][1] >> 4;

*y = h->val[point][1] & 0xf;

error = 0;

break;

}

if (hget1bit()) {

while (h->val[point][1] >= MXOFF) point += h->val[point][1];

point += h->val[point][1];

}

else {

while (h->val[point][0] >= MXOFF) point += h->val[point][0];

point += h->val[point][0];

}

level >>= 1;

} while (level || (point < ht->treelen) );

参考软件2:libmp3dec

Libmp3dec的解码函数是从ffmpeg中提取出来,原意是想适应多个标准的huffman解码,所以书写比较复杂,但是效率较高.

有初始化表

init_vlc->调用build_table建立huffman表,其目的是通过建立huffman表减少huffman表在rom中的存储空间,一个huffman表最少有3个部分组成,码字,数据,码长.但是libmp3dec的方法省略了数据的存储,静态表只有码字和码长,这样的好处是省略了大量的数据的rom存储空间,而改用ram存储,这样多个标准存储的情况换成了1个标准执行存储ram的情况.尤其对音频这种组码的情况更加有效.

解码顶层

huffman_decode中

if (code_table) {

code = get_vlc(&s->gb, vlc);

if (code < 0)

return -1;

y = code_table[code];

x = y >> 4;

y = y & 0x0f;

} else {

x = 0;

y = 0;

}

这段代码用来解码一个码字.其中调用函数get_vlc解码, get_vlc函数设计的十分巧妙.但是这种巧妙主要用于多标准适应(可能包括视频),是来自ffmpeg的一个函数.里边调用一个关键的宏定义GET_VLC解码一个码字

#define GET_VLC(code, name, gb, table, bits, max_depth)\

int n, index, nb_bits;\

index= SHOW_UBITS(name, gb, bits);\ //bits=8(一般的情况下),step1,提取8位码流

code = table[index][0];\ //查找表

n = table[index][1];\ //

if(max_depth > 1 && n < 0){\ //n<0表示没找到, max_depth表示最大查找步长

LAST_SKIP_BITS(name, gb, bits)\

UPDATE_CACHE(name, gb)\

nb_bits = -n;\

index= SHOW_UBITS(name, gb, nb_bits) + code;\ //再次取数据

code = table[index][0];\

n = table[index][1];\

if(max_depth > 2 && n < 0){\ //还没找到,再查

LAST_SKIP_BITS(name, gb, nb_bits)\

UPDATE_CACHE(name, gb)\

nb_bits = -n;\

index= SHOW_UBITS(name, gb, nb_bits) + code;\

code = table[index][0];\

n = table[index][1];\

SKIP_BITS(name, gb, n)\

}

三步法完成查找.

参考软件3 Melo

使用与faad相似的2步法完成查表。

AAC

参考软件1: 13818-5_2005_Reference_Software

也是用分布查找法,没有init表,表是静态全局变量.

与mp3不同的是,scalefactor也是用的huffman解码,mp3中scalefactor不是的.

程序中是按如下定义的

顶层huffdecode

核心子函数1

get_ics_info

核心子函数2

Getics

Getics中调用huffcb解码section data

Getics中调用hufffac解码scale factor data

Getics中调用huffspec解码量化谱线系数

Hufffac和huffspec都调用了函数decode_huff_cw解码一个码字

其函数体是

i = h->len;

cw = getbits(i);

while (cw != h->cw) {

h++;

j = h->len-i;

i += j;

cw <<= j;

cw |= getbits(j);

}

Step1:解码huffman表中的index值.

下面是13818 -7 ISO官方参考代码中解码一个huffman码字的函数的流程图与注释:

int decode_huff_cw(Huffman *h)函数的流程图与注释

Step2:实现index值到量化谱线的映射

标准中的伪码

unsigned = 数组unsigned_cb[i]的布尔值, 见表2的第二列.

当unsigned=0时表示有符号数, unsigned=1表示无符号数.

dim = 码本的维数, 见表2的第三列.

lav = LAV,最大可编码量化谱线系数的绝对值, 见表2的第四列..

idx = 码字索引

if (unsigned) {

mod = lav + 1;

off = 0;

}

else {

mod = 2*lav + 1;

off = lav;

}

if (dim == 4) {

w = INT(idx/(mod*mod*mod)) - off;

idx -= (w+off)*(mod*mod*mod)

x = INT(idx/(mod*mod)) - off;

idx -= (x+off)*(mod*mod)

y = INT(idx/mod) - off;

idx -= (y+off)*mod

z = idx - off;

}

else {

y = INT(idx/mod) - off;

idx -= (y+off)*mod

z = idx - off;

}

注:这里的实际公式是

4-tuple : Idx = (w+off)*mod³ + (x+off)*mod² + (y+off)*mod + z + off

2-tuple: Idx = (y+off)*mod + z + off

之所以采取分组的整体huffman编码的方法是为了进一步压缩帧内的相关性节省码字.其实在编码端或或是解码端完全可以直接选用(w,x,y,z)制表,查表,但这样的查阅不便,加入了index的做法使思路清晰.但也给我们提出了优化的方向.

ISO参考代码中的unpack_idx函数(注:程序初始化阶段就计算出每个码本的mod和off值)

if(dim == 4){

qp[0] = (idx/(mod*mod*mod)) - off;

idx -= (qp[0] + off)*(mod*mod*mod);

qp[1] = (idx/(mod*mod)) - off;

idx -= (qp[1] + off)*(mod*mod);

qp[2] = (idx/(mod)) - off;

idx -= (qp[2] + off)*(mod);

qp[3] = (idx) - off;

}

else {

qp[0] = (idx/(mod)) - off;

idx -= (qp[0] + off)*(mod);

qp[1] = (idx) - off;

}

Step3:获取符号位

标准中伪码

if (y != 0)

if (one_sign_bit == 1)

y = -y ;

if (z != 0)

if (one_sign_bit == 1)

z = -z;

ISO参考代码

q:刚进行huffman解码的量化谱线数据

n:码本的维数

void get_sign_bits(int *q, int n)

{

while (n) {

if (*q) {

if (getbits(1)) { //1表示为负

*q = -*q;

}

n--;q++;

}

-----scale_factor_data部分的解码

输入:scale_factor_data部分码流

输出:差分scalefactor数据或差分intensity位置数据

Step1:

解码scalefactor差分值, 同解码量化谱线系数中的step1.index既是差分值.其他步骤参见scalefactor章节.

解码intensity位置的差分值, 同解码量化谱线系数中的step1.index既是差分值. 其他步骤参见intensity章节.

11.3 C参考代码:

Step1:

获得global_gain

Getics函数

*global_gain = getbits(LEN_SCL_PCM);

计算sf[g][sfb]

Hufffac函数

fac = global_gain;

t = decode_huff_cw(hcw);

fac += t - MIDFAC; /* 1.5 dB */

if(fac >= 2*maxfac || fac < 0)

return 0;

factors[i] = fac;

Step2 和 step3

来自huffspec函数

{

int sbk, nsbk, sfb, nsfb, fac, top;

Float *fp, scale;

i = 0;

fp = coef;

nsbk = info->nsbk;

for (sbk=0; sbk<nsbk; sbk++) {

nsfb = info->sfb_per_sbk[sbk];

k=0;

for (sfb=0; sfb<nsfb; sfb++) {

top = info->sbk_sfb_top[sbk][sfb];

fac = factors[i++]-SF_OFFSET;

//注释:小于TEXP的使用查找表

if (fac >= 0 && fac < TEXP) {

scale = exptable[fac];

}

else {

if (fac == -SF_OFFSET) {

scale = 0;

}

else {

scale = pow( 2.0, 0.25*fac );

}

for ( ; k<top; k++) {

*fp++ *= scale;

}

参考软件2:faad

Faad中调用huffman_scale_factor解码scalefactor数据,使用的是二叉树法

while (hcb_sf[offset][1])

{

uint8_t b = faad_get1bit(ld

DEBUGVAR(1,255,"huffman_scale_factor()"));

offset += hcb_sf[offset][b];

if (offset > 240)

{

// stop_huffman_timer();

/* printf("ERROR: offset into hcb_sf = %d >240!\n", offset); */

return -1;

}

调用huffman_spectral_data函数解码谱线数据使用的是2步法解码

总结

	AAC		Mp3
	官方	Faad or melo	官方	Libmp3dec	Lame
解码谱线	分步查表	码字宽度小于12的用2步查表码字宽度大于等于12的用二叉树	二叉树	3步查表	二叉树
解码scalefactor	分步查表	二叉树
Huffman表状态	静态表	静态表	静态表	动态表	静态表

参考文献

【1】基于risc的mpeg-4 aac编解码研究

【2】略

你可能感兴趣的:(Huffman)

05-树9 Huffman Codes（C） L_glonar c语言数据结构
日常，这一次，耗费我三天，其实第二天时便已经将对整个框架有清晰的了解了，（看了解析了），但是一步步排除，确实让我学到了很多。In1953,DavidA.Huffmanpublishedhispaper"AMethodfortheConstructionofMinimum-RedundancyCodes",andhenceprintedhisnameinthehistoryofcomputersci
基于Huffman编码的字符串统计及WPL计算 CUGLin 数据结构与算法 c++算法数据结构霍夫曼树
一、问题描述问题概括：给定一个字符串或文件，基于Huffman编码方法，实现以下功能：1.统计每个字符的频率。2.输出每个字符的Huffman编码。3.计算并输出WPL（加权路径长度）。这个问题要求对Huffman编码算法进行实现和扩展，具体涉及以下步骤：1.从键盘输入或文件中读取字符串/内容。2.统计每个字符的出现频率。3.根据频率构建Huffman树。4.为每个字符生成对应的Huffman编码
基于C语言实现文件压缩与解压缩算法极客代码玩转C语言算法 c语言开发语言
引言随着互联网的发展，数据传输和存储的需求日益增长，文件压缩技术成为提高数据处理效率的关键技术之一。压缩技术不仅可以减少存储空间的需求，还能加快数据在网络中的传输速度。霍夫曼编码作为一种有效的无损数据压缩算法，广泛应用于各种场景。本文将详细介绍如何使用C语言实现霍夫曼编码算法，并通过具体的代码实例展示其工作原理。霍夫曼编码简介霍夫曼编码是由DavidA.Huffman于1952年提出的，它是一种统
字符串压缩算法 Jr_l #字符串算法算法 python c语言
目录RLE（游程长度编码）算法原理步骤说明示例说明代码示例python语言：C语言：优缺点Huffman编码基本原理构造Huffman树编码与解码过程代码示例python语言：C语言：优缺点LZW压缩字典构建与压缩过程步骤说明代码示例python语言：C语言：优缺点字符串压缩算法用于减少字符串的存储空间，尤其是在需要传输或保存大量文本数据时。以下是三种常见的字符串压缩算法：RLE、Huffman编
4.贪心进阶与经典好题准确、系统、简洁地讲算法 OI/ACM核心算法详解含大量优质题目及题解！算法
贪心进阶Huffman问题Huffman树正确性证明：核心：证明大的Huffman树是由小的Huffman树经过一步贪心选择得来的，即证明大的Huffman树是由少了两个最小的叶子节点的小的Huffman树加上最小的两个叶子节点得到的。只需要证明大的Huffman树的wpl等于小的Huffman树的wpl加上最小的两个叶子节点的值即可。细节上，通过一些假设利用Huffman树是所有数中最小的“#i
前端性能优化 - Gzip压缩
什么是Gzip压缩？gzip是GNUzip的缩写，是一种文件的压缩格式（也可以说是若干种文件压缩程序），类似的压缩格式还有compress，deflate等。web上使用gzip编码格式传输有几个要点：浏览器和服务器都需要支持gzip编码采用LZ77算法与Huffman编码来压缩文件，是一种无损压缩算法压缩比率在3-10倍左右（纯文本），可以大大节省服务器的网络带宽是否前端所有资源都需要Gzip压
笔记---贪心---哈夫曼Huffman树 Die love 6-feet-under 算法基础课笔记笔记算法 c++
AcWing.148.合并果子在一个果园里，达达已经将所有的果子打了下来，而且按果子的不同种类分成了不同的堆。达达决定把所有的果子合成一堆。每一次合并，达达可以把两堆果子合并到一起，消耗的体力等于两堆果子的重量之和。可以看出，所有的果子经过n−1n−1n−1次合并之后，就只剩下一堆了。达达在合并果子时总共消耗的体力等于每次合并所耗体力之和。因为还要花大力气把这些果子搬回家，所以达达在合并果子时要尽
【蓝桥杯基础练习 Huffuman树】枝脉
欸~果然，迄今为止一个浏览量都没得，我好菜啊...住嘴，你这个美少女，你一点都不菜，要相信自己加油！！--------------------------------------------------------------------------------------------------------------------Huffman树在编码中有着广泛的应用。在这里，我们只关心Huff
JPEG图像格式加速神经网络训练--使用DCT训练CNN kadog By GPT 神经网络 cnn 人工智能计算机视觉图像处理深度学习
JPEG图像格式加速神经网络训练JPEG图像格式加速神经网络训练工作原理DCT系数与JPEG直接利用DCT系数阶段1:数据准备步骤1:读取JPEG文件结构步骤2:提取量化表和Huffman表步骤3:解析图像数据步骤4:反量化步骤5:获取DCT系数阶段2:输入处理预处理1:正规化（Normalization）预处理2:中心化（Centering）预处理3:选择性剔除预处理4:量化系数补偿预处理5:重
PYTHON蓝桥杯——每日一练（简单题）詹小菜蓝桥杯蓝桥杯 python
题目Huffman树在编码中有着广泛的应用。在这里，我们只关心Huffman树的构造过程。给出一列数{pi}={p0,p1,…,pn-1}，用这列数构造Huffman树的过程如下：1.找到{pi}中最小的两个数，设为pa和pb，将pa和pb从{pi}中删除掉，然后将它们的和加入到{pi}中。这个过程的费用记为pa+pb。2.重复步骤1，直到{pi}中只剩下一个数。在上面的操作过程中，把所有的费用相
求Huffman树的带权路径长度 .魚肉数据结构算法
Huffman树的建立过程：首先得到整个叶子结点的集合：求Huffman树的带权路径长度算法：书上讲常见的求Huffman树的带权路径长度算法为：从叶子结点权值乘路径长度：WPL=7*2+5*2+5*2+3*3+2*3=49另外一种求WPL的算法为：非叶子几点权值之和：WPL=22+12+10+5=49这种方法并不是毫无道理，应为同一个结点下的两个叶子结点的路径长度是一样的，叶子结点的路径长度完全
华为OD机试真题C卷-篇2 laufing 算法与数据结构(python)华为od 算法刷题 python
文章目录启动多任务排序有效子字符串最长子字符串的长度最长子字符串的长度（二）两个字符串间的最短路径问题生成Huffman树可以处理的最大任务中文分词模拟器手机App防沉迷系统根据IP查找城市文件缓存系统寻找最优的路测线路Wonderland游乐园项目排期/最少交付时间灰度图存储精准核酸检测运输时间启动多任务排序A任务依赖B任务，执行时需要先执行B任务，完成后才可以执行A任务；若一个任务不依赖其他任
数据结构高级算法 ->yjy Java 数据结构数据库
目录最小生成树Kruskal(克鲁斯卡尔)(以边为核心)9)不相交集合（并查集合）基础UnionBySize图-相关题目4.2GreedyAlgorithm1)贪心例子DijkstraPrimKruskal最优解（零钱兑换）-穷举法Leetcode322最优解（零钱兑换）-贪心法Leetcode3223)Huffman编码问题问题引入Huffman树Huffman编解码4)活动选择问题无重叠区间-
Python之----Huffman 哈夫曼编码的实现咸鱼_翻身 Python-贪吃蛇 python
1、哈夫曼树,即带权路径最小的树,权值最小的结点远离根结点,权值越大的结点越靠近根结点：2、简单介绍完原理，我们来看这个实现：#哈夫曼编码字典(键为字母，值为编码)codeDic={}#树节点类构建classTreeNode(object):def__init__(self,data):self.val=data[0]self.priority=data[1]self.leftChild=None
蓝桥杯训练-Huffman树（哈夫曼树）（day14） Introspection 蓝桥杯蓝桥杯 python
一、题目Huffman树在编码中有着广泛的应用，在这里，只关心Huffman树的构造过程。给出一列数{pi}={p0,p1,...pn-1},用这列数构造Huffman树的过程如下：1.找出{pi}中最小的两个数，设为pa和pb,将pa和pb从{pi}中删除，然后将它们的和加入{pi}中，这个过程的费用记作pa+pb.2.重复1的步骤，直到{pi}中只剩下一个数。在上面的操作过程中，把所有的费用相
AcWing算法学习笔记：贪心（区间问题 + Huffman树 + 排序不等式 + 绝对值不等式 + 推公式）一只可爱的小猴子算法学习笔记
贪心一、区间问题①区间选点②最大不相交区间数量③区间分组④区间覆盖二、Huffman树（合并果子）三、排序不等式（排队打水）四、绝对值不等式（货仓选址）五、推公式（耍杂技的牛）一、区间问题①区间选点算法将所有区间的右端点从小到大排序遍历所有的区间若该区间内没有点（左端点大于标记值），则将该区间的右端点设为新的标记值，并且点数加一若这个区间有点，则不处理，跳过该区间代码#include#includ
适用于嵌入式单片机的压缩算法 -飞鹤- 嵌入式单片机数据库
1.简介因为MCU的内存和算力的限制，那些对内存消耗大或算力需求大的压缩算法就不适合在MCU中使用。适用于MCU的压缩算法主要有：RLE、LZ77、Huffman、LZO、DEFLATE、LZ4。2.算法2.1.RLERLE(RunLengthEncoding)，也称为行程编码，压缩算法是一种无损压缩算法。算法特点：简单、易实现。使用RLE压缩方法可以将RRRRRGGBBBBBBABCD压缩为5R
数据结构—基础知识：哈夫曼树小哼快跑数据结构数据结构算法哈夫曼树考研
数据结构—基础知识：哈夫曼树哈夫曼树的基本概念哈夫曼（Huffman）树又称最优树，是一类带权路径长度最短的树，在实际中有广泛的用途。哈夫曼树的定义，涉及路径、路径长度、权等概念，下面先给出这些概念的定义，然后再介绍哈夫曼树路径：从树中一个结点到另一个结点之间的分支构成这两个结点之间的路径。路径长度：路径上的分支数目称作路径长度。树的路径长度：从树根到每一结点的路径长度之和。权：赋予某个实体的一个
多元Huffman编码问题南山芽木题解算法 c++贪心算法
多元Huffman编码问题Description在一个操场的四周摆放着n堆石子。现要将石子有次序地合并成一堆。规定每次至少选2堆最多选k堆石子合并成新的一堆，合并的费用为新的一堆的石子数。试设计一个算法，计算出将n堆石子合并成一堆的最大总费用和最小总费用。对于给定n堆石子,计算合并成一堆的最大总费用和最小总费用。Input输入数据的第1行有2个正整数n和k（n≤100000，k≤10000），表示
SCU_DataStructure_lab zhangbihan999 笔记 java c++数据结构霍夫曼树
链接里是一个gitcode仓库，里面是四川大学软件学院数据结构与算法课程实验的一个示例实现代码Lab01：基于C++的简易计算器Lab02：基于Java的Huffman编/解码器
数据结构—基础知识（15）：哈夫曼树阿庆i code 数据结构基础知识概念数据结构算法考研经验分享笔记
数据结构—基础知识（15）：哈夫曼树哈夫曼树的基本概念哈夫曼（Huffman）树又称最优树，是一类带权路径长度最短的树，在实际中有广泛的用途。哈夫曼树的定义，涉及路径、路径长度、权等概念，下面先给出这些概念的定义，然后再介绍哈夫曼树路径：从树中一个结点到另一个结点之间的分支构成这两个结点之间的路径。路径长度：路径上的分支数目称作路径长度。树的路径长度：从树根到每一结点的路径长度之和。权：赋予某个实
数据压缩解压（哈夫曼编码）跑马去追XX java数据结构与算法数据结构 java 算法
数据压缩解压（哈夫曼编码）基本介绍赫夫曼编码也翻译为哈夫曼编码(HuffmanCoding)，又称霍夫曼编码，是一种编码方式,属于一种程序算法赫夫曼编码是赫哈夫曼树在电讯通信中的经典的应用之一。赫夫曼编码广泛地用于数据文件压缩。其压缩率通常在20%～90%之间赫夫曼码是可变字长编码(VLC)的一种。Huffman于1952年提出一种编码方法，称之为最佳编码原理剖析通信领域中信息的处理方式1-定长编
南航数据结构课设——Huffman编码与解码 NUAA-附鹤@ 数据结构算法霍夫曼树链表
Huffman编码与解码(必做)（Huffman编码、二叉树）[问题描述]对一篇不少于5000字符的英文文章（source.txt），统计各字符出现的次数，实现Huffman编码(code.dat)，以及对编码结果的解码(recode.txt)。[基本要求]（1）输出每个字符出现的次数和编码,并存储文件(Huffman.txt)。（2）在Huffman编码后，英文文章编码结果保存到文件中(code
蓝桥杯 Java 试题基础练习 Huffuman树得之我幸cyz 蓝桥杯算法
试题基础练习Huffuman树资源限制时间限制：1.0s内存限制：512.0MB问题描述Huffman树在编码中有着广泛的应用。在这里，我们只关心Huffman树的构造过程。给出一列数{pi}={p0,p1,…,pn-1}，用这列数构造Huffman树的过程如下：1.找到{pi}中最小的两个数，设为pa和pb，将pa和pb从{pi}中删除掉，然后将它们的和加入到{pi}中。这个过程的费用记为pa+
（C++附代码！）哈夫曼编码（贪心算法） Legal！算法 c++数据结构贪心算法 huffman tree
（C++附代码！）哈夫曼编码（贪心算法）一、问题描述【问题描述】使用贪心算法求解Huffman编码问题，具体来说就是，根据每个字符的出现频率，使用最小堆构造最小优先队列，构造出字符的最优二进制表示，即前缀码。在程序开始说明部分，简要描述使用贪心算法求解Huffman编码问题的算法过程。【输入形式】在屏幕上输入字符个数和每个字符的频率。【输出形式】每个字符的Huffman编码。【样例输入】64513
数据结构C++——哈夫曼树及哈夫曼编码近景_ 数据结构与算法分析数据结构算法 c++霍夫曼树
数据结构C++——哈夫曼树及哈夫曼编码文章目录数据结构C++——哈夫曼树及哈夫曼编码一、哈夫曼树的介绍及概念二、哈夫曼树的构造及打印①哈夫曼树的存储结构②构造哈夫曼树③Select()函数的代码实现④打印哈夫曼树⑤测试的完整代码二、哈夫曼编码①哈夫曼编码的相关概念②哈夫曼编码的算法实现③输出哈夫曼编码④测试的完整代码三、总结一、哈夫曼树的介绍及概念哈夫曼(Huffman)树又称最优树，是一类带权路
如何提高车端报文数据压缩效率 MarkHD 汽车
提高车端报文的压缩效率可以采取多种方法，以下是一些常用的策略：数据类型编码：使用紧凑的数据类型编码可以减少存储和传输的空间。例如，使用整数代替浮点数，使用固定长度的数据类型代替可变长度的数据类型。数据压缩：使用数据压缩算法，如Huffman编码、LZ77或LZ78等，可以有效地减少报文的大小。这些算法通过识别和替换重复的模式或序列来工作。差分编码：如果报文包含时间序列数据，可以使用差分编码来减少数
6-112 哈夫曼编码燕朝铭算法
编写函数实现哈夫曼编码。输入结点个数(保证个数>1)及各结点的权值，为各结点进行编码。函数接口定义：CreateHuffman_tree(HuffmanTree&HT,intn);/*建立n个叶子结点的哈夫曼树*/Huffman_code(HuffmanTreeHT,HuffmanCode&HC,intn);//求哈夫曼编码其中HT为哈夫曼树，n为叶子结点个数，HC为哈夫曼编码。裁判测试程序样例：
4.贪心算法含例题 anditty 算法算法导论贪心算法 java
文章目录贪心算法一、一个基本的贪心算法问题：区间调度问题二、区间调度的推广：多个资源下的贪心算法三、最小延迟调度——交换论证四、最优超高速缓存问题五、图最短路径问题六、最小生成树问题七、实现kruskal八、聚类cluster九、霍夫曼树Huffman十、交换论证十一、例题1.贪心算法有效性证明2.依旧是贪心算法的证明——来看看交换论证3.一个比割性质和圈性质更强的性质4.多重价值贪心问题5.一个
哈夫曼编码(c++题解) hb_zhyu c++开发语言
题目描述哈夫曼编码是一种编码方式，是可变字长编码的一种，由Huffman于1952年提出。该方法完全依据字符出现概率来构造异字头的平均长度最短的码字，有时称之为最佳编码，一般就叫Huffman编码。简单地来说，就是出现概率高的字符使用较短的编码，反之出现概率低的则使用较长的编码，这便使编码之后的字符串的平均期望长度降低，从而达到无损压缩数据的目的。现在请你模拟这样的原则对给定的一个字符串进行字母统
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。