walkingMa

CABAC熵编码

整理网址：http://www.cnblogs.com/TaigaCon/p/5304563.html
　整理网址：http://blog.csdn.net/shakingwaves/article/details/52426244
　表格生成：http://pressbin.com/tools/excel_to_html_table/index.html
　
　在视频数据压缩种，按照压缩前后图像信息量是否有损失，可以将压缩方法分为两类：一类是无失真编码或熵编码；另一类是有限失真编码。
　基于混合编码的视频压缩标准中，变换、预测后的量化处理属于有限失真编码，消除的是信源空间和时间的冗余度。而对量化后的预测残差变换系数形成的语法元素，采用的熵编码消除的是码字之间的冗余度，属于无失真编码。

1. 信息熵的概念

信息熵是指信号源（信源）的信息量。设有一个离散信源，，它产生消息的概率是已知的，记为，，（），则信息量定义为：
（bit）（１）
　信息量仅反映了一个符号的信息量的大小，而信源都是由若干个符号所组成，如二进制信源由0和1两个符号，因此，用平均信息量，称为“熵”（entropy）来表示由多个符号所组成信源所携带的信息量，定义为：

　上式取以2为底的对数时，单位是比特：
（比特/符号）（２）

２. 定长编码

定长编码也称为等长编码，即为每个编码符号分配一个等长比特的码字。常用的二进制码如表1：
　
　在HEVC中，描述子*f(n)*表示有一个固定n比特的预定义值。具体到某一具体语法元素forbiden_zero_bit,它是一个f(1)码字，即1比特长度，其值为0。这种定长编码主要用于NAL单元头，slice分割头以及SPS/PPS中。

３. 变长编码

变长编码为各个编码符号分配的比特数不一定相等，常见的变长编码有哈夫曼、香浓、指数哥伦布编码等。变长编码的优势是编码的平均长度比定长编码短。例如概率分布为2的负幂次方的序列符号，具体如下：

图 3 概率分布为2的负幂次方的序列符号

3.1 哈夫曼编码

对图3采用哈夫曼如图：

　按照公式计算其平均码长为：

　若采用定长编码，则需要3位二进制等长码。

3.2 算术编码

3.2.1 传统编码方法

传统编码是通过符号映射实现的。映射包含符号（symbol）与码字（codeword）两个要素，如下面的例子

symbol	e	h	l	o
codeword	00	01	10	11

　通过上述的映射表，我们可以把“hello”编码成码流 01 00 10 10 11。　而诸如Haffuman，Shannon这些编码方法也没脱离这种编码模式，他们只是通过符号出现的概率对码字进行调优。　 ### 3.2.2 算术编码　从理论上讲，对信源数据采用哈夫曼熵编码方法可以获得最佳编码效果，但是在实际中，由于在计算机中存储和处理的最小数据单位是1bit，无法表示小数比特。例如两符号信源{*x*,*y*}，其对应的概率为{2/3,1/3}, 根据信息熵计算，*x*的最佳码长=$-log_2(2/3)bit=0.588bit$,*y*的最佳码长=$-log_2(1/3)bit=1.588bit$，平均码长=$0.588X(2/3)+1.588X(1/3)$$=0.961bit$。而计算机中不可能有非整数位出现，即采用哈夫曼对*x,y*编码，得到{*x，y*}的码字分别为0和1，可见对于出现概率大的符号*x*并未赋予较短的码字。而算术编码的产生正是为了解决计算机中必须以整数位进行编码的问题。　算术编码的思想是用0到1的区间上的一个数字来表示一个字符输入流，本质是为了整个输入流分配一个码字，而不是给输入流中的每个字符分别指定码字，算术编码是用区间递进的方法来为输入流寻找这个码字的，从第一个符号确定的初始区间0,1开始，逐个字符地读入输入流，在每一个新的字符出现后递归地划分当前区间，划分的根据就是各个字符的概率，将当前区间按照各个字符的概率划分为若干子区间，将当前字符对应的子区间取出，作为下一个字符时的当前区间，当处理完最后一个字符后，得到了最终区间，在最终区间中挑选一个数字作为输出。　算术编码分为浮点算术编码与定点算术编码，例如对浮点算术编码而言：用[0, 1]的概率区间，对一串字符编码后，得到了最终区间，在最终区间挑选一个数字作为编码输出，而这个数字是一个小数，受计算机精度的影响；为了避免这种影响，在实际使用中采用定点算术编码，且根据计算机的精度采用比例缩放的方法la来解决。在H264/H265中将[0, 1]区间放到至[0,$2^{10}$]，采用32位的寄存器实现。　　**算术编码有如下编码步骤：**

1.　首先我们需要根据概率设定各符号在[0,1)上的初始区间，其中区间的起点为表中前面的符号的累计概率

symbol	e	h	l	o
sum of probability	0	0.1	0.1+0.2	0.1+0.2+0.3
interval	[0,0.1)	[0.1,0.3)	[0.3,0.6)	[0.6,1

　“hello”的第一个符号为“h”，那么映射的区间为[0.1,0.3)。

2.　接下来我们需要根据符号的概率分割[0.1,0.3)上的区间，得到的结果如下

symbol	e	h	l	o
interval	[0.1,0.12)	[0.12,0.16)	[0.16,0.22)	[0.22,0.3)

　“hello”的第二个符号为“e”，那么映射的区间为[0.1,0.12)。

3.　按照这种方式继续进行区间映射，最终“hello”映射到的区间是[0.10888,0.1096)

映射区间	区间大小
初始值	[0,1)	1
编码完h后	[0.1,0.3)	0.2
编码完e后	[0.1,0.12)	0.02
编码完l后	[0.106,0.112)	0.006
编码完l后	[0.1078,0.1096)	0.0018
编码完o后	[0.10888,0.1096)	0.00072

4.　从区间[0.10888,0.1096)中任取一个代表性的小数，如“0.109”就是编码“hello”后的输出值*

　算术编码的总体的编码流程可以参考下图　

　算术编码总体上可以按照如下进行描述：

设输入符号串为 $s$ ， $s$ 中的符号值取自符号集 $S=\{ a_1,a_2,a_3,…,a_m \}$
这些符号出现的概率分别为 $p(a_k) = \{ p_1,p_2,p_3,…,p_m \}$
这些符号的累计概率为 $P(a_k) = \displaystyle{ \sum_1^{i-1}p_k }$ 。累计概率可以理解为，如果区间为[0,1)时，该符号的区间起点的位置<端点>。
区间大小更新为 $R_{i+1} = R_{i}p(a_k)$ ，初始值为 $R_0 = 1$
即新活动区间=前活动区间 X " $a_k$ "的概率
区间的起点更新为 $L_{i+1} = L_{i}+P(a_k)R_i$ ，初始值为 $L_0 = 0$
即新端点=前端点+前活动区间 X" $a_k$ "的端点

．当处理符号 $a_k$ 时，区间 $R$ 宽度根据 $a_k$ 出现概率 $p(a_k)$ 而变窄，符号序列越长，相应的子区间越窄，编码的位数越多。
　算术解码就只是需要判断代表性的小数在哪个区间，相应地就知道输入的符号了

3.2.3 二进制算术编码

二进制算术编码的编码方法跟算术编码是一样的，但是输入只有两个符号：“0”，“1”，也就是说输入的是二进制串。
　除了是对二进制串进行编码这个特征外，二进制算术编码跟普通的算术编码还有一些区别，总体上可以按照如下进行描述：

设输入符号串为 $s$ ， $s$ 中的符号分为两种：MPS(Most Probability Symbol)，LPS(Low Probality Symbol)，分别代表出现概率大小的符号，需要根据实际情况进行调整。如果输入的二进制串中的“0”较多，“1”较少，那么MPS = “0”，LPS =“1”
LPS出现的概率为 $p_{LPS}$ ，MPS出现的概率为 $p_{MPS} = 1- p_{LPS}$
在编码中进行区间选择时，MPS在前，LPS在后，因此

LPS的累计概率为 $P_{LPS} = p_{MPS} = 1-p_{LPS}$
MPS的累计概率为 $P_{MPS} = 0$

区间的大小更新为
- 如果当前编码的是LPS： $R_{i+1} = R_{LPS} = R_{i}\cdot p_{LPS}$
- 如果当前编码的是MPS：$R_{i+1} = R_{MPS} = R_{i}-R_{LPS} = R_i –(R_{i} \cdot p_{LPS}) $
区间的起点更新为
- 如果当前编码的是LPS： $L_{i+1} = L_{i} + R_{MPS}$
- 如果当前编码的是MPS： $L_{i+1} = L_{i}$

4. CABAC编码

CABAC采用的是二进制算术编码，在编码过程中需要传入二进制串，输出的也是二进制串。
　在h.264标准中，CABAC在语法结构中用ae表示，它只用于编码slice_data中的语法元素（包括slice_data内部的子模块的语法元素）
　CABAC实现分为四个部分

上下文变量的初始化
待编码语法元素二值化
上下文建模（确定上下文索引）
算术编码

4.1 上下文变量的初始化

初始化执行于slice开始之前，另外如果在编码过程中某个宏块是PCM宏块，那么在PCM宏块之后，编码下一个宏块之前也需要进行初始化。
　初始化主要工作就是确定所有上下文的初始MPS以及初始状态pStateIdx。求解方法如下

preCtxState = Clip3( 1, 126, ( ( m ∗ Clip3( 0, 51, SliceQPY ) ) >> 4 ) + n )

if( preCtxState <= 63 ) {
    pStateIdx = 63 − preCtxState
    valMPS = 0                          　　　　　　　　　　　　　　　　　　　　　　 ( 9-5)
} else {
    pStateIdx = preCtxState − 64
    valMPS = 1
}

上面的计算依赖于SliceQPY，m，n三个变量，其中不同的上下文索引（contex Index）对应不同的m、n，具体的m、n的取值请参考标准9.3.1中的各个表格。上下文索引是基于语法元素以及二值化后的二进制串的索引binIdx，我们将在下一小节进行阐述。
　在CABAC的初始化过程的结果会得到所有上下文索引对应的MPS与pStateIdx的初始值。如果确定了MPS为“0”，那么LPS为“1”，反之如果MPS为“1”，那么LPS为“0”。状态pStateIdx是什么呢？

4.1.1 LPS的概率

状态pStateIdx是LPS出现的概率 $p_{LPS}$ 的索引。在CABAC中规定了LPS的概率取值范围是 $p_{LPS}\in [0.01875,0.5]$ ，由于LPS是小概率符号，因此它的概率肯定是小于0.5的，如果某个小概率符号在状态转换的过程中超出了0.5，此时我们就需要把MPS与LPS进行交换。
　CABAC的状态机中共有64个状态，pStateIdx = 0,1,2,…,63，分别代表64个不同的概率，除了pStateIdx = 63外，其他的63个状态都满足上述状态转换规则，其中
$\left\{\begin{matrix} {p^{0}}_{LPS}=0.5 \qquad\\ {p^{62}}_{LPS}=0.01875 \end{matrix}\right.$
　结合4.1.2状态机的转换规则，我们可以得到状态转换参数

$\alpha = \left( \frac{0.01875}{0.5} \right)^{1/63} \approx 0.95$ 　

4.1.2 概率状态的更新

算术编码中最重要的要素就是符号的概率，CABAC是自适应的算术编码，也就是说符号的概率会随着符号的输入而改变，这种变化就是一种状态机，如果输入的是LPS的话，状态（概率）会怎样变化，如果输入的是MPS的话，状态（概率）又会怎么变化。CABAC的状态机转换的规则由HOWARD与VITTER的"exponential aging"模型借鉴而来，转换规则如下
${p^{(t+1)}}_{LPS}= \left\{\begin{matrix} \alpha \cdot {p^{t}}_{LPS}\qquad\qquad & if\ an\ MPS\ occurs\\ \alpha \cdot {p^{t}}_{LPS} + (1-\alpha) &if\ an\ LPS\ occurs \end{matrix}\right.$
　CABAC状态机的状态转换如下图（黑色实线代表输入的是MPS，红色虚线代表输入的是LPS），具体的pStateIdx变换请参考标准的表9-45

4.2 待编码语法元素二值化

CABAC编码的是slice data中的语法元素，在进行算术编码前，需要把这些语法元素按照一定的方法转换成适合进行二进制算术编码的二进制串，这个转换的过程被称为二值化（binarization）。
　二值化的方案共有７种
　
###4.2.1 一元码（Unary）
　对于一个非二进制的无符号整数值符号 $\geqslant 0$ ，在CABAC中的一元码码字由 $x$ 个“1”位外加一个结尾的“0”组成，见下表。例如，输入的语法元素值为3，其二值化结果为110。解码器靠搜索一个"0"来判断何时语法元素结束。

4.2.2 截断一元码（TU，Truncated Unary）

一元码的变体，用在已知语法元素的最大值cMax的情况。对于 $0\leqslant x < cMax$ 的范围内的取值，使用一元码进行二值化。对于 $x = c M a x$ ，其二值化的二进制串全部由“1”组成，长度为cMax。对于 $x > c M a x$ ，则取 $x = c M a z$ 进行编码。例如，当cMax=5时，语法元素值为4的二进制串为11110，语法元素值为5的二进制串为11111。

4.2.3 截断莱斯码(TR, Truncated-Rice)

在已知门限值cMax、莱斯参数R和语法元素值V的情况下，即可获得截断莱斯二元码串。截断莱斯码由前缀和后缀串接而成，前缀值P的计算方法为：
　

P = V > > R

　则其对应的前缀码获取过程是：若

P

小于值（

c M a x > > R

），则前缀码由

P

个1和一个0组成，长度为

P + 1

；若

P

大于等于值(

c M a x > > R

)，则前缀码由(

c M a x > > R

)个1组成，长度为(

c M a x > > R

)。当语法元素V小于cMax时，其后缀值S为：
　

　后缀码为S的二元化串，长度为R。当语法元素V大于等于cMax时，无后缀码。

4.2.4 k阶指数哥伦布编码（kth order Exp-Golomb，EGk）

一、指数哥伦布编码映射关系
　指数哥伦布码是一种压缩编码算法。指数哥伦布编码有四种映射关系，从Ｖ到code_num，其中，code_num是码字的编号，V是有符号数或无符号数。
　ue：无符号整数指数哥伦布编码的语法元素，这种映射关系应用在宏快类型、参考帧索引等。映射关系为：code_num=Ｖ；
　se：有符号整数指数哥伦布编码的语法元素，左位在先，这种映射关系应用在运动矢量插值、量化参数插值等。
　映射关系为：

code_num=2| Ｖ| ( Ｖ <= 0)
code_num=2| Ｖ|-1 ( Ｖ > 0)
　te：舍位指数哥伦布编码的语法元素；
　me：映射的指数哥伦布编码的语法元素，左位在先。参数k通过指定的表格映射到code_num。这种映射关系应用于coded_block_parttern参数。
　每种映射关系被设计成对出现频率高的值使用较短的码字，对出现频率低的值使用较长的码字。
　
　 二、指数哥伦布编码的逻辑结构
　指数哥伦布编码的逻辑结构为：[M个 Zeros] [1] [INFO]，包括前缀码和信息位两个部分。其中，INFO是M个bit所携带的信息。例如，如下码字：

　code_num 0 没有前缀码和INFO，code_num1 和 2 有1 bitINFO，code_num 3到6有两 bit INFO。每个哥伦布码字的长度为2M+1，并且基于code_num，每个codeword可以被重构，通过下面的公式：

M = floor[log2(code_num + 1)] INFO = code_num + 1 - 2^M 　一个codeword可以通过下面的方式来解码：　　（1）读入M个bit的前缀0，紧接着是1；　　（2）读入M个bit的INFO；　　（3）code_num = 2^M + INFO -1 (对于codework 0，M和INFO都为0). 　　

三、K阶指数哥伦布码
　K阶级指数哥伦布码如下表所示，表中给出了0阶、1阶、2阶和3阶的指数哥伦布码。

　k阶哥伦布编码的逻辑结构：[(M-k) Zeros] [1] [M bits INFO]

M = floor[log2(code_num + 2^k)] INFO = code_num + 2^k - 2^M 　码字长度：L = (M - K) + 1 + M = 2 * M - K + 1

四、k阶哥伦布码的编码过程
　用来表示非负整数的k阶指数哥伦布码，可以通过下面的方式获得：
　　（1）将数字以二进制的形式写出，去掉最低的k个比特位，然后加1；
　　（2）计算剩下的比特数，将此数减1，即得前缀0的个数M-k；

五、k阶哥伦布码的解码过程
　解析k阶指数哥伦布码时，首先从比特流的当前位置开始寻找第一个非零比特leadingZeroBits，然后根据公式计算出code_num的值：

code_num = 2^(leadingZeroBits + k) - 2^k + values; 　其中，values为第一个非零比特其后的(leadingZeroBits + k)个比特的值。　 ### 4.2.5 定长编码（FL，Fixed-Length）　用定长编码二进制的无符号语法元素，语法元素的最大值cMax已知，那么定长编码的长度为$fixlength = \left \lceil log_2(cMax+1) \right \rceil$，其中值就是语法元素的值的二进制。定长编码用于近似均匀分布的语法元素的二值化。　给定一个参数cMax，对于编码语法元素值x，必须满足$0\leq x

　具体哪个语法元素选择哪种二值化方案，请查看标准9.3.2中第一个表格。

4.3 上下文建模（确定上下文索引）

在前面初始化的时候就出现了上下文这个概念，那么上下文所指的是什么？
　以JM中的上下文结构体为例

 //! struct for context management
struct bi_context_type   
{ 
   unsigned long  count;  
   byte state; //uint16 state;         // index into state-table CP
   unsigned char  MPS;           // Least Probable Symbol 0/1 CP  
};

上下文包含两个变量：MPS、pStateIdx（count只是用于计数）。在CABAC编码的过程中会碰到需要修改这两个值的情况（如上面的状态变换），这些修改都是以上下文为单位的。
　语法元素在经过二值化后形成二进制串，二进制串中不同binIdx位置上的MPS（出现频率高的符号）可能会有所不同，并且概率也可能会不同，因此需要用一个概念来表示特定语法元素的二进制串中特定binIdx的MPS与pStateIdx，上下文就是这样的概念。
　在h.264标准中，用一个上下文索引ctxIdx来代表上下文，ctxIdx的取值为0~1023，就是说h.264的上下文一共有1024个。
　ctxIdx的计算方式分为两种
　如果语法元素为coded_block_flag、significant_coeff_flag、last_significant_coeff_flag、coeff_abs_level_minus1，即残差系数部分的语法元素，则
ctxIdx = ctxIdxOffset + BlockCatOffset(ctxBlockCat) + ctxIdxInc(ctxBlockCat)
　否则
ctxIdx = ctxIdxOffset + ctxIdxInc
　其中的变量有

ctxIdxOffset 每个语法元素都有一个ctxIdxOffset，甚至一些语法元素在二值化后分为前后缀，这种语法元素可能会有两个ctxIdxOffset，如下表格部分摘自h.264标准9.3.2的第一个表格

　表9-25中，maxBinIdxCtx以及ctxIdxOffset列中的某些单元格含有前缀、后缀的字样，例如语法元素列的mb_type（P, SP slices only），其二进制序列类型中含有前缀以及后缀，具体参见9.3.2.5节的规定：在 P 和 SP 条带中的 I 宏块类型二进制码串，对应 mb_type 的值从 5 到 30，包含了前缀和后缀的串联，这里前缀包含了表 9-28 中规定的值为 1 的单个比特，后缀在 9-27 中规定，通过 mb_type 减 5 所得的值索引。

ctxIdxInc 在特定的语法元素二值化后，会形成以binIdx为索引的二进制串，尽管是同一个二进制串，但是不同的binIdx上的上下文（MPS，pStateIdx）可能会有所不同，ctxIdxInc就是在这种情况下产生的一个值，它用于划分二进制串上不同的上下文。如下面一项表格摘自h.264标准9.3.3.1的第一个表格

　表9-30中当ctxIdxOffset取值为14时，binIdx取值为2时，ctxIdxInc可取2也可取3，具体参见9.3.3.1.2小节的第一个表格

　表９-32中ctxIdxInc列的b1、b3对应表9-25中二进制序列的相关类型，具体参见9.3.2.5小节：

**BlockCatOffset(ctxBlockCat) ** 其中ctxBlockCat的范围为0~13，分别代表不同残差块类型，如下表

　在残差系数部分，上下文是会根据不同的残差块类型做出不同选择的，BlockCatOffset就代表了不同的残差块类型的索引偏移，具体偏移值可以查看标准中的相关表格。

4.4 算术编码

算术编码是基于区间划分的，普通的概率划分需要使用到多位乘法。CABAC的算术编码为了降低计算复杂度，并便于硬件实现，采取了如下一些方法：

总是估计小概率符号LPS（ $p_{LPS}<0.5$ ）的概率，并将其概率离散化成64个不同概率状态。概率估计转换成基于表格的概率状态的转换（见初始化部分的描述）。
使用9bit的变量 $R$ 与10bit的 $L$ 表示当前区间，其中 $L$ 为区间的起点， $R$ 为区间长度
每当输入新符号时，会对区间的起点 $L$ 以及区间的长度 $R$ 进行更新，在前面的二进制算术编码时，我们已经得知两者的更新方法，其中 $R$ 与 $L$ 的更新包含了浮点数乘法 $R_{i}\cdot p$ ，为了降低运算复杂度，CABAC把乘法换算成了查表的形式。换算方法如下：

离散化的状态pStateIdx代表了符号的概率 $p$
9个bit的区间长度 $R$ 通过(R>>6)&3被量化成2个bit，即 ${0，1，2，3\}$ （因为 $R$ 总是大于等于 $2^8$ 小于 $2^9$ ，在后面的归一化可以看出来）
有了上述两个离散的变量，区间更新所需要的乘法就能转换成查表操作，表格请查看标准9.3.3.2中的第一个表格。

在算术编码的过程中，尽管是同一上下文，但是概率并不是固定的，每次输入一个新符号都会改变相应上下文的概率，也就是会进行状态转换（见初始化部分的描述）
对近似均匀分布的语法元素，在编码和解码时选择盘路（bypass）模式，可以免除上下文建模，提高编解码的速度。
由于编码区间是有限位表示的，因此在输入一个符号进行区间更新后，需要进行重归一化以保证编码精度。

4.4.1 算术编码过程

　该过程可分为5个步骤

通过当前编码器区间范围 $R$ 得到其量化值 $\rho$ 作为查表索引，然后利用状态索引 $p S t a t e I d x$ 与 $\rho$ 进行查表得出 $R_{LPS}$ 的概率区间大小。
根据要编码的符号是否是MPS来更新算术编码中的概率区间起点 $L$ 以及区间范围 $R$
$p S t a t e I d x = = 0$ 表明当前LPS在上下文状态更新之前已经是0.5的概率，那么此时还输入LPS，表明它已经不是LPS了，因此需要进行LPS、MPS的转换
更新上下文模型概率状态
重归一化，输出编码比特。

4.４.2 重归一化分析

在区间划分结束后，如果新的区间不在 $2^8,2^9)$ 之内，即 $R < 256$ ，256是最大编码区间的 $\frac{1}{4}$ ，那么就需要进行重归一化操作（incremental output and interval expansion），输出一位或多位编码比特。重归一化过程如下图所示。

　在CABAC编码过程中，在输入符号后，进行区间更新，接下来就是重归一化过程。下面就以 $0,2^{10})$ 表示区间 $[0, 1)$ 为例，分析重归一化过程

（请注意，在该过程中，$[0,2^{10})$只起到辅助作用，实际的区间为$R$）

$R < 2^8$ 的情况，如果 $L < 2^8$ ，则可知 $R + L < 2^9$ ，那么可以确定编码区间 $[L, L + R)$ 在区间 $[0, 0.5)$ 上，用二进制表示这个区间即为 $0.0 x$ ，因此输出 $0$ （只记录小数点后面的二进制）。最后用 $0,2^{10})$ 来表示区间 $[0, 0.5)$ ，也就是将原本的 $0,2^9)$ 线性扩增到 $0,2^{10})$
$R < 2^8$ 的情况，如果 $\geqslant 2^9$ ，那么就可以确定编码区间 $[L, L + R)$ 在区间 $[0.5, 1)$ 上，用二进制表示这个区间即为 $0.1 x$ ，因此输出 $1$ 。最后用 $0,2^{10})$ 来表示区间 $[0.5, 1)$ ，也就是将原本的 $2^9,2^{10})$ 线性扩增到 $0,2^{10})$
$R < 2^8$ 的情况，如果 $2^8 \leqslant L < 2^9$ ，则 $2^8 < R+L < 2^9 + 2^8$ ，编码区间 $[L, L + R)$ 可能在 $[0, 0.5)$ 区间内，也有可能跨越 $[0, 0.5)$ 与 $[0.5, 1)$ 两个区间，即可能是 $0.01 x$ ，也可能是 $0.10 x$ 。此时可以先暂缓输出，用 $0,2^10)$ 来表示区间 $[0.25, 0.75)$ ，也就是将原本的 $2^8,2^8+2^9)$ 线性扩增到 $0,2^10)$ ，然后进入重归一化的下一个循环继续判断。
$\geqslant 2^8$ 的情况，无法通过 $L < 2^8$ 来确定编码区间，需要通过输入下一个符号来对 $R$ 与 $L$ 进行更新后再继续进行判断，因此当前符号的编码流程结束。由于这个原因，因此在一个符号编码结束后，另一个符号编码开始前，总是 $2^8 \leqslant R < 2^9$ 。

4.４.3 输出

在编码输出“0”或者“1”的阶段，用PutBit(B)表示

　关于PutBit(B)的分析，参考上面重归一化的区间图，可以看到有三种情况

情况1，走PutBit(0)，直接输出“0”
情况2，走PutBit(1)，直接输出“1”
情况3，输出可能为“10”或者“01”，因此不能直接输出，走bitsOutstanding++的步骤。在下一次编码符号时，符合情况2，走PutBit(1)，此时bitsOutstanding = 1，因此输出“10”

．另外，PutBit(B)不会编码第一个bit。原因是CABAC在初始化的时候，会以 $0,2^{10})$ 表示区间 $[0, 1)$ ，而在初始化区间时 $R = 510 ， L = 0$ ，这意味着已经进行了第一次区间选择，区间为 $[0, 0.5)$ ，需要输出“0”。PutBit(B)在此阻止这个“0”的输出，这样就能得到正确的算术编码结果了。

4.5 旁路(bypass)编码

有些语法元素在二值化后选择的可能不是上述的算术编码，而是旁路编码，具体情况请查看h.264标准9.3.2的第一个表格。旁路编码中，假设待编码的符号符合近似的均匀分布。下图给出了旁路模式下的编码过程。
　旁路模式有几个特点：符号均匀分布，无需对 $R$ 进行量化与查表；每编码完一个符号后， $R$ 总是会小于 $2^8$ ，因此每次都需要对概率区间进行放大； $把对$ L$的移位操作提到了前面，因此旁路编码的重归一化的区间可以看作由 $0,2^{10})$ 变成了 $0,2^{11}]$ 。

　下面是旁路编码的一个例子

4.6 编码结束 EncodeTerminate

在编码语法元素end_of_slice_flag（ctxIdx = 276）以及I_PCM mb_type时会调用EncodeTerminate这个编码过程。在EncodeTerminate中，采用的是pStateIdx = 63的状态，这个状态表示的是当前宏块是否为该slice的最后一个宏块的概率。在该状态下，对概率区间的划分跟概率区间量化值无关。在编码end_of_slice_flag以及I_PCM的mb_type时，概率区间固定为 $R_{LPS} = 2$ 。如果当前宏块为slice的最后一个宏块（end_of_slice_flag = 1）或者当前编码为PCM宏块并且编码它的mb_type I_PCM时，结束CABAC编码，调用EncodeTerminate中的EncodeFlush。具体情况请参考标准中的9.3.4.5小节。

　在编码完成slice的最后一个宏块后，将会调用字节填充过程。该过程会往NAL单元写入0个或者更多个字节（cabac_zero_word），目的是完成对NAL单元的封装（标准9.3.4.6）。这里有计算如下

　如果k>0k>0，则需要将3字节长的0x000003添加到NAL单元kk次。这里的前两字节0x0000代表了cabac_zero_word，第三个字节0x03代表一个emulation_prevention_three_byte。
　如果k⩽0k⩽0，则无需添加字节到NAL单元。
　式子中的各个变量所代表的意思请查看标准

你可能感兴趣的:(CABAC熵编码)

FPGA实现JPEG编码器的完整项目指南
本文还有配套的精品资源，点击获取简介：JPEG编码是一种广泛使用的数字图像压缩技术，通过在FPGA上实现该编码器，可以为嵌入式系统提供高效的图像处理。FPGA的可编程逻辑单元使其成为实现JPEG编码的理想平台。实现过程包括颜色空间转换、分块、离散余弦变换（DCT）、量化和熵编码等关键步骤。此外，testbench仿真用于验证设计的功能和性能，而资源优化确保了设计的高效性和低功耗。该实现过程需要深入
FFmpeg 的算法体系 lianghu666 音视频硬件 Linux ffmpeg 算法 linux
️一、FFmpeg核心算法体系与作用1.编解码算法编解码是FFmpeg的核心能力，通过libavcodec实现音视频的压缩与还原。视频编码算法帧间预测：通过运动估计（菱形搜索、全搜索法）减少时间冗余，支持P帧（前向预测）和B帧（双向预测）变换与量化：采用整数离散余弦变换（DCT）将空域信号转为频域，再通过量化舍弃高频信息（H.264/H.265使用）熵编码：对残差数据采用CABAC（上下文自适应二
matlab实现图像压缩编码 aini_lovee matlab 计算机视觉图像处理
一、基于DCT的JPEG压缩（有损）1.核心步骤图像分块：将图像划分为8×8的小块。离散余弦变换（DCT）：对每个块进行DCT变换。量化：对DCT系数进行量化以减少高频信息。熵编码：使用哈夫曼或算术编码压缩量化后的数据。2.MATLAB代码实现%读取图像并转换为灰度图img=imread('lena.jpg');img_gray=rgb2gray(img);img_double=im2double
音频编码基础知识 zhou jiabo 音视频开发 aac
音频编码压缩分类：有损压缩（消除冗余信息）、无损压缩。所谓冗余信息就是人耳听觉范围外的音频信息以及被遮蔽掉的音频信息。频域遮蔽效应：频率相近的几个声源中，强度高的声音可能会将其它低强度声音遮蔽。无损编码（熵编码）：哈夫曼编码，算法编码，香农编码。音频编码过程：常见的音频编码器AAC、OPUS、Ogg、Speex、iLBC、G.711等音频编码质量对比：AAC编码器： AAC（advancedau
鲁棒可逆水印的攻击类型凌峰的博客算法
鲁棒可逆水印的攻击类型水印图像不可避免会遭受一些攻击，这些攻击会严重影响原始数据的使用，因此如何抵抗攻击是目前学者们研究的热点，常见的攻击方式主要有信号攻击与几何攻击。1、信号攻击信号攻击即图像处理攻击，是指对水印图像的内容进行一系列的改变[63]。其基本模型如图2-4所示。图2-4中JPEG压缩主要采用预测编码、离散余弦变换、熵编码的联合编码方式，以去除冗余的图像和彩色数据，一定程度上会造成原始
JPEG图像的压缩标准（1）凌峰的博客人工智能计算机视觉
分3个博客详细介绍JPEG图像的压缩标准，包含压缩和解压缩流程，熵编码过程和文件存储格式。一、JPEG压缩标准概述JPEG压缩标准由国际标准化组织(InternationalOrganizationforStandardization,ISO)制订，用于静态图像压缩。JPEG标准包含有损量化压缩和无损编码压缩两种压缩方式，利用了不同视觉信息在人眼中的敏感程度差异，在取得更高的压缩性能的同时，也有着
JPEG中系数的编码 superdont 图像加密计算机视觉
使用无损霍夫曼可变长度熵编码技术进一步压缩直流差分（ΔDC）和交流系数（r,v）对，并且所有系数都编码为二进制序列。具体地，每个ΔDC被编码成两部分：DC霍夫曼码（DCH）和DC可变长度整数码（DCV）；每个（r,v）对被编码成两部分：AC霍夫曼码（ACH）和AC可变长度整数码（ACV）。如图2所示，我们举一个无损霍夫曼可变长度熵编码的例子，其中category是系数幅度的范围，r对应于ACHum
H.264——H.264的基本介绍 Spark！ H.264 h.264 音视频
目录背景与基本概念特点H.264的应用场景编码整体架构编码结构H.264对一个宏块编码H.264标准采用的编码工具帧内预测帧间预测MV的亚像素差值整数变换与量化无损熵编码其他技术本文是对H.264编码标准研究系列的开端背景与基本概念发起者：ITU-T的VCEG（VideoCodingExpertsGroup）发起时间：2003最初版本支持8bit/sample，4：2：0色度采样，主要针对大部分通
视频编码结构一箭辰空音视频
VVCVVC标准对应的参考软件平台是VTM(VVCTestModel)两个基本目标1.高压缩性能，定义一套视频编码技术，其压缩性能要远优于以往的同类标准。2.宽应用领域，能够有效地用于比先前标准更广阔的范围。编码过程图像分块、预测、变换、量化、熵编码、环路滤波1.图像分块如图1所示，VVC在编码原理和基本结构方面没有突破，仍沿用从H.261就开始的基于块的混合视频编码框架，即预测加变换的分块编码方
JPEG压缩过程原理科研苟Gamber 信息隐藏图像处理
目录前言JPEG压缩过程第一步：RGB到YUV的映射转换（无损可逆变换）第二步：下采样（有损压缩）第三步DCT变换（无损可逆变换）第四步量化（留低频，弃高频）（有损压缩）第五步熵编码（zigzagscan&霍夫曼编码）无损总结：前言JPEG也就是大家常见的图片格式之一，它还有一个小名，ipg。JPEG是一种有损压缩格式，相比于其他图片格式文件更小，也就是一些细节在压缩过程中丢失了，比较适合存储复杂
【AI】深度学习在编码中的应用（6） giszz 人工智能人工智能深度学习
目录一、熵模型和自适应熵编码1.1区别1.2联系二、关于自适应熵模型前面我们讨论了基础架构设计、分析合成变换，本文来梳理和学习编码的第三步，自适应熵模型。一、熵模型和自适应熵编码自适应熵模型和熵编码在概念和应用上有一些区别，同时也存在一定的联系。1.1区别——定义与目标自适应熵模型：是一种能够根据输入数据的特性自动调整其内部参数以优化信息表示和处理的模型。它的目标是实现数据的高效表示和处理，例如通
【AI】深度学习在编码中的应用（9） giszz 人工智能人工智能深度学习
接上，本文来讨论基于条件熵编码的框架。智能图像压缩中的基于条件熵编码的框架是一种先进的编码技术，它利用图像数据的统计特性来实现高效的压缩。以下是关于该框架的定义、原理、优势和劣势，以及关键技术的详细解释，同时包括框架中的主要组成部分及其阐述。定义基于条件熵编码的框架是一种图像压缩方法，它通过分析图像数据的条件概率分布来编码像素或特征，从而达到减少数据存储量的目的。条件熵是衡量在已知某些条件下，随机
关于MediaCode播放H265/hevc的总结朝阳眯眼 android h265/HEVC mediacode
H.265HighProfile可实现低于1.5Mbps的传输带宽下，实现1080p全高清视频传输。H.265/HEVC的编码架构大致上和H.264/AVC的架构相似，主要也包含，帧内预测(intraprediction)、帧间预测(interprediction)、转换(transform)、量化(quantization)、去区块滤波器(deblockingfilter)、熵编码(entrop
Yuv420sp格式转成JPEG的原理以及代码实现过程孤舟簔笠翁 camera hal3框架 android
1，JPEG格式介绍以及存储方式介绍JPEG（JointPhotographicExpertsGroup）是一种用于连续色调静态图像压缩的标准，也被称为联合图像专家组。它是一种常用的图像存储格式，文件后缀名为.jpg或.jpeg。JPEG采用预测编码（DPCM）、离散余弦变换（DCT）以及熵编码的联合编码方式，以去除冗余的图像和彩色数据，属于有损压缩格式。JPEG的优点在于能够将图像压缩在很小的储
H264码流进行RTP包封装肖爱Kun RTP通讯协议
一.H264基本概念H.264从框架结构上分为视频编码层（VCL）和网络抽象层（NAL），VCL功能是进行视频编解码，包括运动补偿预测，变换编码和熵编码等功能；NAL用于采用适当的格式对VCL视频数据进行封装打包。VCL数据即被压缩编码后的视频数据序列，在VCL数据封装到NAL单元中之后，才可以用来传输或存储。NAL单元（NALU）是NAL的基本语法结构，它包含一个字节的头信息和一系列来自VCL的
jpeg格式说明与解码学习千灵域数字图像处理计算机视觉 jpeg jpeg编码 jpeg格式
jpeg格式说明与解码学习文章目录jpeg格式说明与解码学习参考资料中文资料英文资料格式介绍概念释义关于0xFF整体格式标签表解码哈夫曼表解码编码二次采样DC编码AC编码哈夫曼编码编码数据本文更加注重JPEG格式的具体解码实现，并不涉及编码实现（比如DCT、熵编码之类的，这些在很多书中都有详细的介绍，我就不赘述了）参考资料中文资料JPEG文件格式JFIF&Exif：很好的对JPEG格式的整体解释，
压缩算法之算术编码浅析与实现来知晓语音处理压缩算法算术编码熵编码
压缩算法之算术编码浅析与实现简介实现思路实现代码参考资料简介算术编码，属于熵编码的范畴，常用于各种信息压缩场合，如图像、视频、音频压缩领域。基本原理：核心原则：出现频率高的信息，分配少的比特，频率低的信息则分配多的比特简单来讲：将一串信息压缩到[0,1]区间的一个浮点值算法效果：举个例子解释：假设输入为ARBER，每个符号对应概率为上图将之一字排开到0-1实数轴上对ARBER编码，最终输出一个具体
语音处理：霍夫曼编码算法原理分析来知晓语音处理算法霍夫曼树数据结构
语音处理：霍夫曼编码算法原理分析前言霍夫曼编码解密扩展资料前言分类：无损编码中常见的为熵编码，主要分为霍夫曼编码和算术编码。霍夫曼编码是无损编解码中的经典压缩算法。效果：如果没有压缩算法，一张未经压缩的2M图片，同样内存可以放下70万字的鸿篇巨著红楼梦。特点：霍夫曼编码虽无法达到算术编码逼近信息熵极限的压缩效率，但由于算法简单、实现优美且可以避免大量算术编码的专利封锁，应用十分广泛，如mp3、aa
行程编码(RLE) chen_song_ 视频编码技术原理音视频
行程编码（RLE）一、行程编码原理1、具体例子二、代码实现一、行程编码原理又称为行程长度编码（RunLengthEncoding，RLE），是一种熵编码。编码原理：将具有相同值得连续串用其长和一个代表值代替。该连续串称为行程1、具体例子字符串：tttttiiiiiiiiiaaa行程编码后：[5,t][8,i][3,a]RLE编码后是：5t8i3a详细编码流程参考二、代码实现
CompressAI:深度学习与传统图像压缩 qq_41627642 深度学习多模态深度学习人工智能
1、图像压缩算法原理传统的有损图像压缩方法，如JPEG，JPEG2000，HEVC或AV1或VVC，在类似的编码方案上进行了迭代改进：将图像划分为像素块，使用变换域通过线性变换(例如:DCT或DWT)去相关空间频率，基于相邻值执行一些预测，量化转换系数，最后使用有效的熵编码器(例如:CABAC[11])将量化值和预测侧信息编码成比特流。另一方面，基于人工神经网络的编解码器主要依赖于学习分析和综合非
Day57| Leetcode 647. 回文子串 Leetcode 516. 最长回文子序列吼吼848 leetcode 算法职场和发展
Leetcode647.回文子串题目链接647回文子串本题目主要是注意遍历顺序，因为dp[i][j]是dp[i+1][j-1]推导出来的，所以，i要倒序遍历，j要正序遍历，下面就是三种情况情况一：下标i与j相同，同一个字符例如a，当然是回文子串情况二：下标i与j相差为1，例如aa，也是回文子串情况三：下标：i与j相差大于1的时候，例如cabac，此时s[i]与s[j]已经相同了，我们看i到j区间是
哈夫曼编码（Huffman Coding）原理详解 chenyfan_ 数据结构与算法霍夫曼树数据结构算法
哈夫曼编码哈夫曼编码，又称为哈夫曼编码（HuffmanCoding）是一种可变长编码（VLC,variablelengthcoding)）方式，比起定长编码的ASCII编码来说，哈夫曼编码能节省很多的空间，因为每一个字符出现的频率不是一致的；是一种用于无损数据压缩的熵编码算法，通常用于压缩重复率比较高的字符数据。如果我们通过转换成ASCII码对应的二进制数据将字符串BCAADDDCCACACAC通
音视频 — 视频编码原理为了维护世界和平_ 音视频视频编码原理 H264
目录视频编码主要分为图像的冗余熵编码帧内预测帧间预测DCT变换和量化编码器比较清晰度和耗时对比一部电影1080P，帧率25fps，时长2小时，文件大小1920x1080x1.5x25x2x360=521.4G数据量非常大，对存储和网络传输都有很大压力。因此视频压缩很有必要。视频编码主要分为熵编码、预测（帧内、帧间）、DCT变换和量化。每一帧图像，划分一个个块（宏块）进行编码，大小一般是16x16(
leetcode刷题详解十二 weixin_43209472 leetcode 算法职场和发展
回文子串首先回文子串问题涉及到的都是单个字符串，所以如果是单个字符串用动态规划的基本都是二维的，i-j其次，回文字符串，都是从后往前遍历的，这个要记住。因为dp的状态转移方程特性决定的647.回文子串还是用动态规划吧，中心扩散没太看懂参考链接说一下自己的想法，因为就单个字符串，因此我之前说过单个字符串的话是要有范围的。为什么外循环会从len-1开始，对于字符串“cabac来说”，如果s[0]的c=
【图像编码】基于信息熵理论的端到端图像编码中熵编码的概率估计繁星¹⁸⁹⁵ 图像视频编码论文精读视频编解码
信息熵理论和概率模型信息熵知识独立熵：H(X)=−∑x∈Xlog⁡P(x)独立熵：H(X)=-\sum_{x\inX}\logP(x)独立熵：H(X)=−∑x∈XlogP(x)，表示X的不确定性条件熵：H(Y∣X)=−∑x∈X∑y∈YP(x,y)log⁡P(y∣x)条件熵：H(Y|X)=-\sum_{x\inX}\sum_{y\inY}P(x,y)\log{P(y|x)}条件熵：H(Y∣X)=−∑
day57|● 647. 回文子串 ● 516.最长回文子序列 w.ww98 算法数据结构
647.回文子串当s[i]与s[j]不相等，那没啥好说的了，dp[i][j]一定是false。当s[i]与s[j]相等时，这就复杂一些了，有如下三种情况情况一：下标i与j相同，同一个字符例如a，当然是回文子串情况二：下标i与j相差为1，例如aa，也是回文子串情况三：下标：i与j相差大于1的时候，例如cabac，此时s[i]与s[j]已经相同了，我们看i到j区间是不是回文子串就看aba是不是回文就可
第一章：如何进行压缩算法的学习及深入黑猴子csd 压缩算法学习
学习基础知识：在开始研究压缩算法之前，需要了解一些基本知识，例如信息熵、码字、霍夫曼编码、熵编码、字典编码等等。可以在网上查找相关资料进行学习。了解不同类型的压缩算法：了解不同类型的压缩算法，例如无损压缩算法和有损压缩算法。无损压缩算法用于压缩数据而无需损失任何信息，而有损压缩算法可以牺牲一些信息以获得更高的压缩比。学习流行的压缩算法：在了解基础概念和不同类型的算法后，了解一些流行的压缩算法，例如
图像压缩论文GENERALIZED OCTAVE CONVOLUTIONS FOR LEARNED MULTI-FREQUENCY IMAGE COMPRESSION阅读笔记 _,_ 论文深度学习图像压缩
原文链接：http://arxiv.org/abs/2002.10032abstract基于深度学习的图像压缩最近显示出优于标准编解码器的潜力。最先进的率失真（R-D）性能是通过上下文自适应熵编码方法实现的，在这种方法中，超先验和自回归模型被联合用于有效地捕获潜在表示中的空间依赖性。然而，在以前的工作中，特征图是具有相同空间分辨率的特征映射，其中包含一些影响R-D性能的冗余。在本文中，我们提出了第
理解有限状态熵编码（Finite State Entropy，FSE） dc199706 CS-1级 #压缩与去重
理解有限状态熵编码（FiniteStateEntropy，FSE）介绍正文补充_0介绍FSE是近年来在熵编码领域的一个重大成果，它有着算术编码的压缩率和哈夫曼编码的速度，热度很大，据说被用在了FaceBook的Zstd中，很是值得学习。于是花了一天时间看了很多国外的博客。可能是方法不对的原因，跳来跳去地看导致我一整天都是懵的，几乎什么也没懂。于是今天又一次静下心来回头看，认真思考后算是有了一点理解
熵编码-算术编码 DX_dove 算法人工智能机器学习
熵的概念信息熵的公式：,P(i)是事件发生的概率。现在有一段英文字母：AABABCABAB，A出现了5次，B出现了4次，C出现了1次。则每个字母出现的概率为P(A)=0.5P(B)=0.4P(C)=0.1则这段字符的信息熵为：H=0.5*log(0.5)+0.4*log(0.4)+0.1*log(0.1)=1.361也就是指，这段字符的压缩极限为：每个字母可以用1.361个字节表示。算术编码为了能
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它