一箭辰空

视频编码结构

VVC

VVC标准对应的参考软件平台是VTM(VVC Test Model)

两个基本目标

1.高压缩性能，定义一套视频编码技术，其压缩性能要远优于以往的同类标准。

2.宽应用领域，能够有效地用于比先前标准更广阔的范围。

编码过程

图像分块、预测、变换、量化、熵编码、环路滤波

1.图像分块

如图1所示，VVC在编码原理和基本结构方面没有突破，仍沿用从H.261就开始的基于块的混合视频编码框架，即预测加变换的分块编码方式；VVC在编码细节上和HEVC很接近，也包含帧内预测、帧间预测、运动估计与补偿、正交变换、量化、熵编码和环路滤波等模块。但是，和HEVC相比较，VVC几乎在每一个编码环节上都采取了一项或多项改进措施，尽管每一项措施的效率提高并不显著，然而诸多措施的总体效果却使其编码效率比HEVC提高了一倍。当然，VVC付出的代价就是编码复杂度也比HEVC提高了好几倍。

1.1 3种编码结构

VVC与HEVC一样，为了应对不同应用场合，设立了3种编码结构，即全帧内(All Intra)编码、低延迟(Low Delay)编码和随机接入（Random Access）编码。在AI编码中，每一帧图像都是按帧内方式进行空间域预测编码，不使用时间参考帧。在LD编码中，只有第一帧图像按照帧内方式进行编码，并成为即时解码更新帧，随后的各帧都作为普通的P帧和B帧进行编码，这主要是为交互式实时通信设计的。在RA编码中，主要是分层B帧结构帧，周期性地插入一个随机访问帧，成为编码视频流中的随机访问点。这些随机访问点可以独立解码，不需要参考码流前面以及解码的图像帧。

1.2 图像的条/片/子图像划分

VVC在编码时将每一帧图像都划分为相同尺寸、紧密排列的编码树单元（CTU），根据编码图像局部特征的不同，编码树单元又可以灵活地划分为更小的编码单元（CU）。

和HEVC基本相同，VVC允许将图像帧划分为若干条，条由相邻的整数个CTU组成。VVC支持两种排列类型的Slice，顺序扫描Slice模式和矩形Slice模式。

VVC中也允许用水平和垂直的若干条边界将图像帧划分为多个矩形区域，每个区域就是一个片（Tile），每个片包含整数个CTU。VVC的Slice和Tile大体上和HEVC一致。

和HEVC不同，VVC还新增了矩形的子图像划分。一个子图像可包含一个或多个Slices，这些Slices共同覆盖图像的一个矩形区域。相应地，每个子图像的边界总是Slice的边界。图2是包含Suppicture（子图像）的划分一例，一帧图像被划分为18个片(Tiles)，其中12个较大的片Tiles在左边，每个Tile覆盖一个4*4 CTU的Slice；其余的6个较小的Tiles在右边，每个覆盖2个2*2 CTU的Slices，这样总共形成24个Slices和24个子图像（每个Slice就是一个子图像）。

1.3 CTU多类型树划分

在VVC中为了适应4K、8K等超高清视频编码的需要，将CTU的最大尺寸扩大到128*128，最小尺寸还是4*4。CTU可进一步分为若干编码单元（CU），最大的CU可等同于CTU，最小的CU为4*4。在HEVC中每个CU又可以划分为预测单元（PU）和变换单元（TU），但在VVC中将不再区分CU、PU、和TU，大多数情况下三者统一为CU。

不同于HEVC，VVC的CTU除了4叉树划分方式外，还引进了多类型树（MTT）划分，包括2叉树和3叉树。一个CTU首先按4叉树方式进行一次划分，4叉树的每个叶子节点既可以继续4叉树划分，也可以进一步按照多类型树方式进行划分：水平或垂直2叉树划分，水平或垂直3叉树划分，如图3所示。2叉树和3叉树划分可以交替并嵌套进行。但是需要注意，一旦采用了2叉树或3叉树划分，就不再允许进行4叉树划分。

图4给出了一个64*64的CTU的4叉树和嵌套多类型树划分的示例，这种划分方式可以根据图像内容自适应进行，提升了划分灵活性。

前面介绍的是亮度CTU的MTT划分，对于图像的色度部分，考虑到同一位置的亮度和色度信号可能具有不同的特性，因而在VVC中，I帧CTU的亮度分量和色度分量的划分方式可以不同，这时亮度和色度分量各使用一个编码树表示，对于P帧和B帧，则同一个CTU中的亮度和色度必须由相同的划分。由于色度信号的亚取样影响，色度信号在单独划分时禁止出现2*2、2*4或4*2尺寸的色度块。

至此可以看到，图像划分从单一、固定划分不断朝着多样、灵活的划分结构发展。

1.4 图像格式

对于输入视频和重建视频，VVC支持ITU-R BT.601建议规定的4:4:4、4:2:2和4:2:0图像亮度（Y）和色度（Cb和Cr）信号的取样结构；支持的ITU-R BT.2100的宽色彩空间；最少支持16级高动态范围（HDR）视频，最高亮度可达1000/4000/10000尼特。

像素的最大比特数表示图像灰度分辨率，又称为比特深度，其值通常为8比特，256个等级。这对于人眼的观赏已经足够了，但是对于编码处理或某些特殊应用场合，有时需要更高的比特深度。为此，VVC支持8至16比特深度的输入和输出视频，最常见是10比特深度。

VVC支持视频的0~120Hz可变帧率，以适应不同视频应用的需求。支持环绕立体视频或多角度视频编码，如360°、180°等全景视频。

至于尚存的隔行扫描视频，VVC和HEVC一样，不再提供专门的工具，只是将隔行视频的一帧看作两个独立的场，对各个场数据分别进行编码，简化了编码器的实现。

1.5 档次、水平和等级

为了使应用更加灵活，和HEVC一样，VVC中定义了编码的不同档次、水平和等级。

“档次”规定了视频编码采用什么编码工具和编码算法。VVC档次规定了一套用于产生不同用途码流的编码工具或算法，共有4个主档次，即常规10比特像素深度的Main 10，支持静止图像的Main 10 Still Picture，支持全取样的Main 10 4:4:4，支持全取样静止图像的Main 10 4:4:4 Still Picture。2个多层主档次，Multilayer Main 10和 Multilayer Main 10 4:4:4。档次的主要技术指标包括：像素的比特深度、色度采样方式和解码缓存的图像容量等。

“水平”规定了某一档次、等级的编码参数，如采样率、码率、压缩率、缓冲区容量等。VVC设置了1.0,2.0,2.1,3.0,3.1,4.0,4.1,5.0,5.1,5.2,6.0,6.1,6.2共13个水平，一个水平实际上就是一套对编码比特流的一系列编码参数的限制，如视频采样格式、图像分辨率（如从176*144到8192*4320）、最大输出码率等。如果说一个解码器具备解某一水平码流的能力，则意味着该解码器具有解码等于和低于这一水平所有码流的能力。

“等级”规定了每一水平的比特流的高低。对同一水平，按照最大码率金额缓存容量要求的不同，VVC设置了两个等级，高等级和主等级。主等级可用于大多数场合，要求码率较低；高等级可用于有特殊要求的场合，包括5.0到6.2的6个水平，允许码率较高。

2 帧内预测

2.1 亮度分量的预测模式

VVC的帧内预测技术的原理和HEVC类似，采用基于块的多方向帧内预测方式来消除图像的空间相关性，但是比HEVC预测方向更细、更灵活。如图5所示，VVC为亮度预测块定义了65种不同的基本帧内预测方向，相当于在HEVC帧内预测33个方向的每两个方向中间增加了一个方向，连同平面（Planar）和直流（DC）模式，共67种预测模式。VVC亮度帧内预测单元的尺寸从4*4到64*64，其中包含矩形单元。考虑到方便矩形帧内与预测块的宽角度模式，VVC的帧内预测编码总共有93个方向。

DC模式的编码块所有像素的预测值都等于其左侧和上方已编码的所有参考像素的平均值。Planar模式的预测值由待编码的亮度块的水平和垂直两个方向上的参考像素的线性内插产生，它们一般适用于图像的平坦区域。

2.2 帧内字块划分

VVC的帧内子块划分（ISP）就是根据编码块的尺寸将亮度预测块在水平或垂直方向上分为2个或4个子块。VVC规定每个帧内预测块至少要有16个样点，因此4*4块不再划分。允许ISP划分的最小尺寸为4*8或8*4，可划分为2个子块，如图6（a）所示；如果大于4*8或8*4则划分为4个子块，如图6（b）所示。

2.3 色度的跨分量线性模式

HEVC色度块采用依附亮度块的简化预测，共有5种模式，即Planar、DC、水平方向、垂直方向和派生模式（DM），DM直接复制对应亮度块的预测模式。VVC色度分量除了沿用这5种预测模式外，还考虑到亮度和色度之间的相关性，对色度分量增加了一种跨分量线性模型（CCLM）预测模式。在CCLM中，色度样值C（i，j）从同一个编码单元对应的已重建的亮度样值L'（i，j）通过线性模型预测得到，即C（i，j）=α*L'（i，j）+β，α和β为CCLM参数，可利用当前块左侧和上方相邻的像素通过计算得到。此外，还有单独使用左侧相邻像素预测的LM_L模式；或者上方相邻像素预测的LM_A模式。这样，色度分量在5种传统帧内预测模式的基础上，新增了CCLM、LM_A和LM_L三种模式，共有8种预测模式。

2.4 多行参考帧内预测

传统的帧内预测利用和当前块相邻的行和列的像素作为参考像素。如果当前块和参考行在内容上不连续，可能会导致较大的预测误差，为此VVC新增了多行参考（MRL）帧内预测技术，将参考行从相邻参考行0扩展为参考行0、参考行1和参考行3.实际预测时从3行中选择预测误差最小的参考行作为最终预测使用的最佳参考行，如图7所示。图7中A和F区域的已重建像素与当前块距离较远，有可能引入较大的误差，因此A区域的像素由B区域的距离最近的像素填充，F区域的像素由E区域距离最近的像素填充。

2.5 帧内预测模式的编码

帧内预测时，编码器需要从多种预测模式中选择一种最佳模式使得编码效率最优。如果直接对预测模式信息进行编码，需要较多的编码比特。考虑到相邻块之间的帧内预测模式也存在空间相关性，即当前块的预测模式很有可能与相邻块的预测模式一致，因此可以从相邻块的模式来预测当前块最可能的模式（MPM）。当前块的预测模式被划分为MPM和其余模式，然后对这两类模式分别编码，以提升编码效率。

3 变换和量化

视频压缩中的变换是将空间域的图像信号转换到频率域，大幅度解除了图像信号之间的相关性，为后续的量化压缩创造条件。因此，选择何种变换函数和采用什么量化方法就显得格外重要。

在HEVC中，对帧内预测生成的4*4亮度残差块采用离散正弦变换（DST）方式，对于其他的残差块，则使用离散余弦变换方式（DCT）。通过残差4叉树（RQT）对变换块系数进行排序和量化。

与HEVC不同，VVC为了提高压缩性能，在变换环节提供了更多可供选择的变换函数和不可分离的二次变换，在量化环节采用了基于率失真优化的量化方式和简洁的系数排序方式。

3.1 多变化选择

VVC将最大变换块尺寸扩展到64*64，在HEVC的DCT-2变换基础上，采用了多变换选择（MTS）技术，增加了DST-7和DCT-8两种变换函数，形成一组候选变换函数集，成为VVC中的主变换

对于长或宽等于64的大尺寸变换块，直接舍弃高频变换系数，仅保留低频变换系数。例如，对于长宽为M*N的块，若M等于64，只保留左边32列系数，若N等于64，只保留上方32行系数。

针对帧间预测的CU，VVC还采用了子块变换（SBT）技术。在SBT模式下，只需要对残差块的一个子部分进行变换处理，从而降低变换系数的高频分量，减少标记残差块是否为0的编码代价，提高压缩性能。

对不同的预测方式，编码器可以根据哪一种变换的编码效率最高来选择不同的变换方式。

3.2 二次变化

由于不可分离变换比可分离变换具有更好的去相关效果，VVC采用了基于归零的不可分离二次变化（NSST）技术。所谓的二次变化，就是对主变换系数进行第二次变换，将信号从一个变换域转换至另外一个变换域后再进行量化、熵编码等操作，其目的是进一步提高变换效率。AVC和HEVC都提供了自己的二次变化技术。VVC采用了NSST技术对高频系数采用归零方案，也就是仅保留二次变化的低频系数，高频系数假设为0，NSST也因此别称为低频不可分离二次变化（LFNST）。LFNST仅用于帧内编码的块，其变换集的选择与帧内预测模式有关。以16*16预测残差块为例，仅对左上角的3个4*4子块所包含的变换系数（拉成48*1的数据条）进行二次变换，因此一个LFNST变换核的大小为16*48，变换的结果为16个系数。

3.3 率失真优化的量化

普通量化是以量化失真最小为设计目标，但在视频编码中，编码比特率的高低也是非常重要的判断指标，两者并不完全一致。因此视频编码中的量化器设计需要权衡失真与比特率。对于一个变换系数，给出多个可选的量化值，用率失真优化准则选出最优的量化值，这就是率失真优化量化（PDOQ）方法。VVC在RDOQ量化时，需遍历编码块内系数。如果当前CU每一个4*4系数组（CG）量化后是全零CG，那么只需发送全零标志；否则，需要传送CG中量化后的系数。

和HEVC一样，VVC也是标量量化方式，但最大量化参数（QP）从51扩大为63。VVC采用了一种依赖性标量量化（DSQ）方法，它定义了两个不同重建水平的标量量化器，系数的量化按照一定的规则自适应地在这两个标量量化器间转换。其本质在于，在同一个量化间隔中有两个输出量化值供选择，可以降低量化误差。

和HEVC相同，VVC也支持默认量化矩阵和用户自定义量化矩阵。使用量化矩阵的目的是对不同位置的系数采用不同的量化步长，以适应人眼的视觉特性，比如人眼对高频分量不敏感，就可以对高频系数使用更大的量化步长。

3.4 系数组和扫描顺序

在视频编码中，一般需要将变换块中量化后的系数通过特定的扫描方式形成一维数据，然后对它进行熵编码。VVC将W*H的变换块量化后的变换系数值排列成一个W*H的矩阵。为了保证对所有尺寸的块统一进行扫描处理，也为了增加变换块的编码效率，考虑到编码块中信号能力一般集中在水平或垂直方向的低频率处，因此将变换块的系数分为若干系数组（CG），对每个CG及CG内系数使用多扫描路径以统一的方式进行编码。由于VVC也支持宽度和高度小于4的块，CG的形状取决于变换块尺寸。对于1*N或N*1（N≥16）的CU，CG的尺寸为1*16或16*1；对于2*N或N*2（N≥8）的CU，CG的尺寸为2*8或8*2；其他CU的CG尺寸都是4*4。

CG的编码顺序为图8所示的反向对角扫描顺序，和CG的尺寸无关。图8中每个小方块表示一个CG。系数块的CG从右下到左上的对角顺序处理，这里每个对角方向都是朝左下方向进行。为了限制解码器复杂度的最差情况，VVC将大变换块的高频系数强制置零。非零的量化指数只能表示在变换块的max（W，32）*max（H，32）左上角区域，而这一区域以外的CG就无需编码，从而也无需扫描，如图8（d）所示。CG内部系数的扫描顺序由相同的对角扫描方式来定义，图8（b）中的扫描也可表示4*4CG中的系数值的扫描顺序。

4 熵编码

输入视频在预测、变换和量化以后，还需对量化、扫描后的变换系数进行熵编码，以获得进一步的信息压缩。在熵编码中常见的有较为简单的变长编码（如Huffman编码）和效率较高的算术编码两大类。如果将编码方式和编码的内容联系起来，则可获得更高的编码效率，这就是常见的上下文自适应变长编码（CAVLC）和上下文自适应二进制算术编码（CABAC）。这两类熵编码都是高效、无损的压缩方法。其中CABAC要胜过CAVLC一筹，尤其是在高码率的情况下更是如此。VVC和HEVC一样，熵编码采用的是CABAC，但在HEVC基础上有所改进。

由于上下文自适应二进制算术编码（CABAC）较普通的变长编码性能优越，在AVC标准中是可选的两种熵编码方法之一，而在HEVC和VVC中则成为唯一的熵编码方法。尽管和HEVC采用同样的编码引擎，VVC为“常规编码模式”设计了一种新的灵活、高效的编码引擎。编码引擎由两部分组成：概率估计和码字匹配。

概率估计的目的在于确定下一个二进制符号其值为“1”的概率。这种估计是基于使用相同上下文的已编码符号值的历史，利用指数衰减窗口进行的。HEVC的编码引擎采用128状态单一有限状态机作为指数平滑估计器，虽然VVC也采用了这样的估计器，但有很大的不同：为了改进压缩性能，VVC为每个上下文维持两个估计器，每个估计器有自己的衰减系数，实际用于编码的概率是两个估计器的平均值。在概率估计中，VVC不使用状态机，而是由回归函数计算导出。实际上主要的差别在于VVC为每个上下文导出的值表示一个实际概率（线性空间），而在HEVC中，它表示状态机的一种状态（对数空间）。

至于码字匹配，当前的间隔被分为两个子间隔，每个子间隔对应二进制符号的值，0或1.每个子间隔的范围由当前间隔范围R和相对应的概率估计值相乘获得。在HEVC中，使用查表来近似这个乘法运算，以确定和最小概率符号（LPS）相关的子间隔范围R（LPS）。而在VVC中，就直接使用乘法获得LPS的子间隔范围。一旦R（LPS）确定后，HEVC和VVC的编码引擎就以相同的方式工作了。

5 帧间预测

HEVC的帧间预测有3种模式：跳过（Skip）模式，无需预测残差运动矢量从相邻块运动矢量得到，不需要编码运动参数；合并（Merge）模式，需要预测残差，当前块的运动参数由相邻块的运动参数得到，只需传递Merge模式的候选编号；普通帧间（Inter）模式，需预测残差，需进行运动估计获得运动矢量（MV），并利用相邻块得到运动矢量预测（MVP），MV和MVP相减得到运动矢量差（MVD），需参考图像索引。VVC在HEVC 3种预测模式的基础上，对帧间预测工具作了多方面的扩展和新增。

5.1 扩展Merge模式

（1）扩展的Merge预测（EMP）

VVC采用了扩展Merge预测（EMP）模式：增加了候选列表长度，由HEVC的5增加到现在的6；在列表构建过程中，首先检查空域各个邻编码块运动矢量预测（MVP），接着检查时域候选块，检查过程和顺序都和HEVC相同。

如果候选列表没有被填满，VVC增加了一种填充候选的基于历史运动矢量预测（HMVP）方法，维护并更新一个HMVP列表，当编码完一个块后，将该块的运动参数作为一个新的候选添加到HMVP列表的末尾，按照先进先出的规则将最前面的候选用作填充。

添加完HMVP候选后，将列表中的前4个候选MV，两两进行平均，再将平均值后有效的MV按一定顺序添加进Merge候选列表中。如果依然没有填满候选列表，则使用0运动矢量填满。这样候选列表的顺序为：空间域相邻块候选，时间域候选，历史候选，空间平均值候选，0运动矢量。

当候选列表构造好了之后，编码器就要对候选列表中的每一个候选进行率失真代价的计算，以得到一个性能最优的候选。

（2）带运动矢量差的Merge模式（MMVD）

在HEVC中的Merge模式中，Merge列表中的MVP直接用于当前CU的预测，VVC的Merge模式和Skip模式中可引入带有MVD的Merge模式（MMVD），MVP与MVD相加，得到真实的运动矢量MV，用于当前CU的帧间预测，是否使用MMVD的标志需要传至解码端。采用MMVD模式时，选择普通Merge列表中的前两个候选MV作为初始运动矢量，然后对该MV进行扩展，一个MV要在4个方向以8种步长进行扩展，两个MV就有4*8*2=64种新的MV，对所有64个扩展MV进行率失真代价比较，从中选择出最优的一个作为最终的MV传递至解码端。

5.2 改进运动估计

5.2.1 带有CU权重的双向预测（BCW）

对于一般双向预测块，最终的预测值Pbi由两侧的两个运动矢量预测值P0和P1平均得到：即Pbi = （P0+P1+1）/2。实际应用中同一内容随着时间变化有可能会产生光线强弱变化或阴影等现象，导致不同帧之间场景很相似，但是明暗差别较大，而且局部内容也会产生类似的光线变化，采用简单的平均方式会使得帧间预测的误差较大。为此，VVC提出了一种带有CU权重的双向预测（BCW）方法，它不是简单地求均值，而是在CU层面对两个预测值进行加权求和：

Pbi=（（8-w）*P0+w*P1+4）/8 。加权系数w的范围为{-2,3,4,5,10}，低延时应用中的权重可以从这5个系数中选取，其他应用则从{3,4,5}这3个系数中选取。

5.2.2 双向光流（BDOF）

基于分块的帧间双向预测是以块为单位来描述运动的，但往往在最小划分块内还有可能存在一些不一致运动的像素，现有帧间预测无法对这些像素实现最佳预测。为此，VVC对亮度分量采用双向光流（BDOF）技术，将光流的概念引入到双向预测当中。在传统双向预测运动补偿时，可用BDOF得到运动的修正量，实现像素级别的运动补偿，而且不增加额外的划分和运动矢量编码，从而提高编码效率。

5.2.3 仿射运动补偿预测（AMCP）

以往的标准在进行运动补偿时只考虑了平移运动，而在实际场景中往往存在各种运动，例如缩放、旋转等不规则运动。VVC中增加了基于块的仿射变换运动补偿预测（AMCP）。如图9所示，一个块的仿射运动向量可由2个控制点（4个参数）或3个控制点（6个参数）生成。

VVC考虑到计算复杂度，不进行以像素为单位的仿射运动估计，而以4*4块为单位进行运动补偿。也就是说，从4*4块单位来看，虽然与普通的运动补偿相同，但从整体CU来看，却是基于块的仿射的运动补偿。AMCP首先将块CU划分为4*4的亮度子块，然后对每个子块由仿射向量计算其中心像素的运动向量。然后，根据运动向量进行运动补偿插值滤波得到每个子块的预测值。对于色度分量同样是划分4*4的子块，其运动向量等于与其同位的4个4*4的亮度子块运动向量的平均值。和传统的帧间运动向量预测方式一样，仿射运动向量也有两种预测方式：仿射Merge模式和仿射AMVP模式。

5.2.4 几何划分模式（GPM）

在VVC中，当CU尺寸为8*8到64*64（除8*64和64*8）时，可根据需要采用几何划分模式（GPM），用自己块内的一直线将该CU分割成两个部分。GPM模式支持64种不同的划分，划分直线的角度和偏移参数需编码传送。每个部分都是一种Merge模式，并且只允许单向预测，因而只须一个单向的预测MV（运动矢量）以及对应的参考帧索引。两个部分可根据各自的MV，运动补偿出各自的预测值。这样，一个CU的两部分的预测计算量相当于一个双向预测的CU。在几何划分预测的CU中，在划分线周围的像素通过自适应地权值加权融合出新的预测值，分区其余地方的预测值不变，最终得到整个CU的预测值。

5.3 运动参数精细化

（1）基于子块的时域运动矢量预测（SbTMVP）

与HEVC中时域运动矢量预测（TMVP）类似，VVC中采用了基于子块的时域运动矢量预测（SbTMVP）技术：通过时域相邻运动信息对当前子块的运动矢量进行预测。当CU的宽和高都大于8时，才可以使用Sbtmvp模式，子块大小固定为8*8.与TMVP不同的是，SbTMVP基于子块进行处理，而且要利用空间相邻块的运动矢量信息。

SbTMVP首先检查左下角相邻块是否使用同位图像作为参考图像得到运动矢量，如果是，该运动矢量作为当前块的运动矢量位移（Shift），否则将运动矢量位移设置为（0,0）。然后，利用得到的运动位移（当前块的坐标加上运动位移）从同位图像中获得子块的运动信息，当前CU的每一个子块的运动信息都可通过同位图像对应子块的运动信息导出。、

（2）自适应运动矢量精度（AMVR）

在HEVC中亮度运动矢量差（MVD）仅使用1/4像素和整数像素精度。而在VVC中，采用自适应运动矢量精度（AMVR）方式，可以使用3种系数精度进行编码，分别是1/4像素精度、整数像素精度和4倍像素精度。编码器可以在3种精度中进行自由选择，并决定出一个性能最优的精度进行最终编码，使用一个标识符进行标记。这样可以在不同的图像中，自由地选择性能最佳的运动矢量差的精度。

（3）对称运动矢量差（SMVD）

为了进一步降低编码码率，VVC对双向预测中mvd 0和mvd 1编码时采用了对称运动矢量差（SMVD）编码方式，编码mvd 0，设置mvd 1为-mvd 0，如图10所示。

最终两个运动矢量mv 0和mv 1分别为

这样，使用SMVD模式时，传输双向预测信息时不需要传list0和list1中参考图像的索引和list1的MVD，这些运动信息可以在解码端生成。

（4）解码端运动矢量修正（DMVR）

为了提高Merge模式的双向预测的准确率，VVC提供了一种解码端运动矢量修正（DMVR）技术。在解码端，根据Merge候选列表得到当前块在前向参考列表L0和后向参考列表L1中对应的运动矢量MV0和MV1，然后计算得到对应的两个预测块。在MV0和MV1周围搜索，计算若干新的预测块，将最小的SAD（绝对误差和）对应的运动矢量MV0'和MV1'作为修正后的运动矢量，并用其计算得到双向预测信号。搜索包括整像素搜索阶段和分像素搜索阶段。该过程在解码端实现，因此不需要消耗额外的编码比特。大体来说，就是在解码得到的MV周围，找到更好的MV取代之。

5.4 联合预测方法

在以前的编码标准中，一个CU在预测时，帧内预测和帧间预测二者只能取其一。而VVC中提出了一种联合帧间、帧内预测（CIIP）技术，对一个CU同时使用帧内预测和帧间预测得出两个预测块，最终的预测块由这两个预测块加权得到。CIIP要求CU为Merge模式编码，且CU包含至少64个亮度采样，宽度和高度均小于128个亮度采样。

在CIIP中，帧间预测信号Pinter采用普通Merge模式的帧间预测过程得到，帧内预测信号Pintra采用普通Planar模式帧内预测得到。最后预测的结果P（CIIP）由两者加权平均得到，加权值wt由当前块左边和上边相邻块的编码模式决定

6 环路滤波

环路滤波位于编码器预测环路中，是预测环路的一部分，属于环内处理，而不是环外的后处理。环路滤波的目的就是消除编码过程中预测、变换和量化等环节引入的失真。由于滤波是在预测环路内进行的，减少了失真，存储后为运动补偿预测提供了较高质量的参考帧。VVC除了采用类似HEVC的去方块滤波（DBF）和样值自适应偏移（SAO）环路滤波工具外，为了进一步提升重建图像质量，减少重建图像与原图像之间的差异，还采用了自适应环路滤波（ALF）对不同块采用不同的滤波系数，使得重建图像和原始图像的误差最小。

6.1 去方块滤波

方块效应是由于采用图像分块压缩方法所形成的一种图像失真，尤其在块的边界处更为显眼。为了消除这类失真，可以在方块的边界按照“边界强度”进行自适应低通滤波，即去方块滤波（DBF）来减轻编码单元边界的块效应。HEVC为了减少复杂性，仅定义了3个边界强度，而没有对4*4块边界滤波，仅滤波边界附近的像素。

VVC扩展和改进了HEVC的去方块滤波：在滤波强度决策上不再只取决于QP，还增加了对重建图像的平均亮度的依赖。因为VVC最大量化参数从51扩展为63，视频量化精度从8比特扩展为10比特，因此对滤波参数表同步进行了扩展。在滤波边界上，VVC增加了对4*4边界的处理。在滤波强度上，考虑到大尺寸的编码块，对亮度块边界引入更大强度的双线性滤波，对色度块边界也新增了增强滤波模式。此外，考虑到VVC的帧内和帧间预测的需要，增加了子块划分，因此增加了对子块边界的滤波。

6.2 样值自适应偏移

在编码图像灰度比较陡峭的区域，容易丢失图像高频分量，从而引起振铃现象。VVC和HEVC一样，在环路滤波中采用了样值自适应偏移（SAO）技术，对要重建的图像逐像素进行滤波，以降低振铃效应。SAO先安装像素的灰度值或边缘的性质，将整个像素分为不同类型，然后按照不同的类型为每个像素值加上一个简单的偏移值，达到减少失真的目的。加偏移值由两种可选模式，带偏移（BO）和边缘偏移（EO），在码流中需给出模式选择的标识。

BO模式将像素值从0到最大值分为32个相等的间隔——“带（bands）”。例如，对10比特而言，最大值是1023，则此时的带的带宽就是1024/32=32,每个带所包含的像素值都比较相近。如果某CU的亮度值分布在4个相邻的带中间，说明这原本是一个比较平坦的图像区域，这样的区域人为失真容易出现，则需对这些像素值施加偏移量（可正可负），使像素值的分布趋向更集中。当然这个偏移量也要作为带偏移传输到解码端。

EO模式使用一种3像素结构来对所处理的像素进行分类。以处理像素为中心再加上最近邻的2个像素，形成45°、垂直、水平和135°四种“3像素结构”，如图11所示。

按照3像素值得不同分布，该像素可被分为峰值像素（如果其值大于相邻的2个像素），谷值像素（如果其值小于相邻的2个像素），边缘像素（如果其值等于任何一个相邻像素）和其他像素，共4类。对4类不同的像素所加的偏移值也不同。

6.3 自适应环路滤波

除了块效应和振铃效应，图像中所有像素在编码前后都有可能引入误差，VVC在DBF和SAO之后又新增了基于块的自适应环路滤波（ALF），对所有像素进行滤波修正，以降低编码图像的失真。ALF采用的是简化的中心对称的二维维纳滤波器，滤波器中心的位置对准的是当前滤波的像素，目标是使得原始图像和重建后图像之间的均方差最小。亮度分量和色度分量分别采用图12中7*7和5*5大小的菱形滤波器。VVC中采用的是基于块的ALF，将每一帧图像划分为4*4大小的块，然后按照一定的规则对所有块进行分类并选取不同的滤波系数。

对于亮度分量4*4块，VVC定义了最多25组滤波系数，根据4*4小块以及周围像素的梯度信息决定采用哪一组滤波系数，该块内所有像素均属于同一组。对于色度分量，Cb，Cr各自只定义一组系数。3个分量独立进行率失真优化、系数推导以及最终的滤波。

你可能感兴趣的:(音视频)

重塑音视频叙事：Premiere文本剪辑与Podcast AI降噪的革命性工作流
一、开篇的另一些心里话最近淘到个好东西，是来自奥地利Blueskyy艺术学院的Adobe教育版授权，深度体验下来，感觉就像是给我的创意工具箱做了一次“满配”升级，有些心得不吐不快，必须跟同路的设计师朋友们碰一碰。在分享那些让我拍案叫绝的技巧之前，依旧惯例，先聊聊这个订阅版最让我心动的几个地方。最直观的就是FireflyAI的积分，每周1500点，用“挥霍”来形容毫不过分，让我在AI创作时彻底告别了
音视频学习（二十三）：srs+ffmpeg实现rtmp的推拉流却道天凉_好个秋音视频学习音视频学习 ffmpeg
rtmp协议：https://blog.csdn.net/www_dong/article/details/131026072rtmp收流：https://blog.csdn.net/www_dong/article/details/135073488rtmp发流：https://blog.csdn.net/www_dong/article/details/135254847安装和配置SRS服务器
iOS开发-进阶:音频播放、录音、视频播放、拍照、视频录制 nikoLiLol
转自:http://www.cnblogs.com/kenshincui/p/4186022.html#audioRecord文章太长了,如果我这里写的质量不好,请参考原文;概览随着移动互联网的发展，如今的手机早已不是打电话、发短信那么简单了，播放音乐、视频、录音、拍照等都是很常用的功能。在iOS中对于多媒体的支持是非常强大的，无论是音视频播放、录制，还是对麦克风、摄像头的操作都提供了多套API。
互联网大厂Java面试指南：从基础到高阶技术栈与业务场景实战 yiiyx Java场景面试宝典 Java Spring Boot 微服务面试分布式系统
互联网大厂Java面试指南：从基础到高阶技术栈与业务场景实战场景介绍本文模拟互联网大厂高级Java工程师面试场景，涵盖JavaSE、Spring生态、微服务、数据库、缓存、消息队列等技术栈，结合音视频、电商、金融等业务场景，提供3轮渐进式提问与详细解析。技术栈核心语言与平台:JavaSE(8/11/17),JakartaEE(JavaEE),JVM构建工具:Maven,Gradle,AntWeb框
SpringBoot+WebSocket实现直播连麦雨轩智能 java及Linux相关教程 spring boot websocket 后端
一、引言随着互联网技术的发展，直播已成为一种主流的内容传播形式。其中，连麦功能作为直播互动的重要手段，能够有效提升用户参与感和观看体验。本文将介绍如何使用SpringBoot和WebSocket技术构建一个直播连麦系统，实现主播与观众之间的实时音视频交流和文字聊天功能。为了方便DEMO的运行，本系统基于纯内存操作实现核心业务逻辑，不依赖外部数据库或者缓存组件。二、技术设计2.1技术栈后端：Spri
WebRTC（十一）：RTCP和SRTCP 却道天凉_好个秋 WebRTC webrtc
RTCP基本概念RTCP是RTP的控制协议，用于监控媒体传输质量和参与者状态，并与RTP一起工作。RTP用于传输媒体数据（如音视频），RTCP则用于传输控制信息。RTCP通常和RTP同时使用，并通过不同端口（通常RTP使用偶数端口，RTCP使用其下一个奇数端口）。主要用于：传输质量反馈：丢包率、时延、抖动等统计信息。媒体源身份识别：包括CNAME（CanonicalName）标识每个参与者。带宽控
腾讯云产品都有哪些苹果企业签名分发腾讯云
之前我已经系统分析过腾讯云的未来方向，现在需要转向产品架构的实用性介绍。要注意避免简单罗列，而是按用户使用场景分层展开——毕竟直接扔出200+产品名称只会让人眼花缭乱。用户没限定细分领域，所以得覆盖主流服务：先从基础计算存储网络讲起，这是上云刚需；再提PaaS层关键服务如数据库和容器，这是技术选型重点；最后补充音视频、AI等腾讯特色产品，呼应之前提到的战略方向。政企客户可能还关心专有云方案，要单独
腾讯云市场怎么样苹果企业签名分发火山引擎人工智能智能体
腾讯云作为国内头部云服务商，确实值得从几个维度分析。首先想到它的核心优势是背靠腾讯生态，尤其在游戏、音视频、社交应用领域有天然解决方案整合优势。不过用户没说明使用场景，所以回复既要展示专业能力，又要避免信息过载。注意到用户没提比较对象（比如和阿里云对比），说明ta更关注腾讯云本身特性。应该重点突出：①腾讯系产品的联动性（微信/QQ生态支持）②本土化服务优势③性价比特点。但也不能回避问题，比如国际市
设计一个监控摄像头物联网IOT（webRTC、音视频、文件存储） Amarantine、沐风倩✨ 物联网IOT 物联网 java html5 webrtc 音视频视频编解码七牛云存储
前言：设计一个完整的监控摄像头物联网IoT平台涉及视频直播和点播、WebRTC和文件存储模块，可以分为以下几个主要部分：摄像头设备、服务端处理、Web前端、视频流存储和回放。以下是结合这些技术的一个具体完整流程设计，涵盖了各个组件的相互关系、数据流动及关键技术点。1.系统组成监控摄像头：摄像头设备负责采集实时视频流并进行编码（如H.264或VP8）。Java服务端：服务端基于SpringBoot等
华为云welink考试试题_华为内部开启WeLink项目，华为云是这样考虑的-通信/网络-与非网... weixin_39820437 华为云welink考试试题
协同办公市场竞争激烈华为云WeLink是华为旗下智能工作平台，它融合消息，邮件，会议、音视频、云空间、小程序等服务，可助力用户随时、随地、通过各类终端设备等实现协作办公。华为还宣布携手合作伙伴成立华为云WeLink生态联盟，金山办公、中软国际、致远互联、罗技、华为商旅、红圈营销、合思费控、Coremail论客、芯盾集团、视源股份、喜马拉雅等成为首批生态伙伴。IDC曾发布了《2018年下半年中国企业
WebRTC（九）：JitterBuffer 却道天凉_好个秋 WebRTC webrtc
JitterBufferJitter“Jitter”指的是连续到达的媒体包之间时间间隔的变化。在网络传输中，由于：网络拥塞路由路径变化队列排队不同链路带宽差异导致包之间的接收时间不一致，这就是网络“抖动”。作用**JitterBuffer（抖动缓冲区）**的作用是：缓冲网络传输过来的数据包重新排序乱序的包缓冲一定时间再输出实现稳定的音视频帧输出，避免播放中出现卡顿、跳帧、音频破音工作流程图网络接收
B站视频下载技术揭秘：从浏览器抓包到FFmpeg音视频合成 soonlyai 音视频 ffmpeg
摘要本文旨在深入探讨B站（哔哩哔哩）视频的实际加载与分发机制，并通过Python脚本实现一个功能性的视频下载器。我们将从使用浏览器开发者工具分析B站播放页的网络请求入手，定位获取视频流地址的关键API。在此基础上，本文将详细讲解如何利用Python的requests库模拟API请求、通过携带Cookie获取登录后才能访问的4K高清视频流，并最终调用ffmpeg工具将B站特有的音、视频分离流合并为完
《从0到1：C/C++音视频开发自学指南》空云风语机器视觉 Opencv QT c语言 c++音视频
开启自学之旅：为何选择C/C++音视频开发在当今数字化时代，音视频开发的应用场景极为广泛，深刻融入了我们生活与工作的方方面面。从火爆的直播行业，无论是电商直播中主播与观众的实时互动，还是游戏直播里精彩赛事的实时呈现；到备受欢迎的短视频平台，各种创意短视频的制作与分享；再到便捷的视频会议，让远程办公、在线教育成为可能，实现了跨地域的高效沟通与协作。这些丰富多样的应用场景，都离不开音视频开发技术的有力
抖音的视频怎么下载下来——下载狗解析工具 Java搬砖组长音视频
如果你想下载抖音视频，可以使用「下载狗解析工具」来获取抖音无水印高清视频。以下是详细的操作步骤，适用于电脑端和手机端。方法1：电脑端下载（无水印高清）步骤1：获取抖音视频链接打开抖音官网或手机APP，找到要下载的视频。点击视频右下角的「分享」按钮，选择「复制链接」。步骤2：使用「下载狗解析工具」解析在浏览器中打开「下载狗解析工具」官网（www.xiazaitool.com）。将复制的抖音链接粘贴到
调试HDMI音频能8通道播放声音 hxHardway Android/Linux 功能实现文档音视频 linux
一、使用场景我们是通过rk主控的hdmi接口播放音视频给到ite68051芯片解析出8声道数据，分别通过4路i2s的数据脚给给到fpga去解析调试步骤：1.根据相关手册配置hdmi输出，hdmi声卡注册，如下:hdmi0_sound:hdmi0-sound{ status="disabled"; compatible="rockchip,hdmi"; rockchip,mclk-
【GStreamer】减小延时的参数设置、从RTP中获取时间戳郭老二视频 GStreamer
1、问题描述在使用GStreamer实现RTSP转RTMP时，延时很大，2～5秒，这是为了应对网络抖动、丢包重传、音视频同步等问题，建立了一些缓冲区。2、解决方法在可以损失流畅度、画面质量的前提下，可以使用如下参数来减小延时1）rtspsrc参数：buffer-mode=auto：自动调整缓冲区大小drop-on-latency=true：缓冲区满时丢弃旧数据latency=0：最小化RTSP接收
C# WinForms局域网即时通讯系统设计与实现深刻如此
本文还有配套的精品资源，点击获取简介：本项目是一个使用C#WinForms技术开发的局域网内即时通讯工具，支持文字、文件传输和音视频通信。它旨在为学生毕业答辩提供一个本地网络通信平台，展示开发者在.NET环境下的网络编程和GUI设计能力。项目不仅要求掌握C#基础和WinForms控件开发，还需实现网络通信、多线程处理、数据安全等高级功能。通过项目开发，学生能深入理解软件开发的各个方面，提升软件工程
WebRTC（七）：媒体能力协商却道天凉_好个秋 WebRTC webrtc
目的在WebRTC中，每个浏览器或终端支持的音视频编解码器、分辨率、码率、帧率等可能不同。媒体能力协商的目的就是：确保双方能“听得懂”对方发的媒体流；明确谁发送、谁接收、怎么发送；保障连接的互操作性和兼容性。P2P的基本流程参与角色角色说明peerA发起连接的端（通常是主叫）peerB接收连接的端（通常是被叫）signal信令服务器，用于中转SDP和ICE信息，但不参与媒体传输stun/turnS
ESP FOURCC 编码介绍乐鑫科技 Espressif 乐鑫科技多媒体编码
FOURCC（FourCharacterCode，四字符编码）是一种在多媒体领域被广泛使用的标识符，常用于快速识别音视频编码格式、封装格式、像素格式等。乐鑫科技定义了一套完整的FOURCC编码标准，称为ESPFOURCC，该标准可在开源项目ESP-GMF中的esp_fourcc.h头文件中找到，涵盖了音视频编解码、图像、封装格式和各种像素格式。本文将深入介绍ESPFOURCC的背景意义、定义原则、
MX_Player_Pro_专业精简版AC3/DTS/EAC3 By.SOLDIER-就要应用网91apps.cn syx594
MX_Player_Pro1.32.8_专业精简版_AC3/DTS/EAC3MXPlayer是安卓市场功能最强大的视频播放器支持几乎所有的音视频文件，强力的硬件加速和多种字幕支持。优化说明：不需要Root或LuckyPatcher或GooglePlayModded；禁用/删除不需要的权限及服务；优化和压缩对齐的图形以及清理不必要的资源，以实现快速加载；从Android.manifest中删除了广告
请编写一个sip Android音视频客户端又可乐 android android studio ide
编写一个SIP客户端需要以下步骤：了解SIP协议:SIP(SessionInitiationProtocol)是一种通信协议，用于建立、维护和终止多媒体会话(如语音和视频通话)。选择开发工具:可以使用Java语言和AndroidStudio开发安卓应用程序。获取SIP栈:可以使用现有的SIP栈库，如pjsip，或开发自己的SIP栈。设计界面:可以使用Android的XML语言设计用户界面，包括呼叫
音视频及H264/H256编码相关原理 Everbrilliant89 音视频开发音视频视频编解码 H264编码 H265编码音视频编解码
一、音视频封装格式原理：我们播放的视频文件一般都是用一种封装格式封装起来的，封装格式的作用是什么呢？一般视频文件里不光有视频，还有音频，封装格式的作用就是把视频和音频打包起来。所以我们先要解封装格式，看有哪些视频流和哪些音频流，此时的音频流和视频流都还是压缩数据，不能直接用于显示的，这就需要解码。如FFmpeg视频文件就是一个容器(视频流（H264）音频流(aac))。1、视频文件封装格式：封装格
【音视频】PJSIP库——pjsua命令使用详解郭老二视频音视频
1、源码编译1）安装依赖库sudoaptinstalllibsrtp2-devsudoaptinstalllibopus-devalsa-toolslibalsaplayer-devffmpeglibalsa*pulseaudio-module-jacksudoaptinstalljackdlibjack-jackd2-devlibjack-devlibsdl2-devlibv4l-devliba
【音视频】SIP基础、搭建服务器和客户端郭老二视频音视频
1、概念SIP（SessionInitiationProtocol，会话初始协议）是一种用于创建、修改和终止实时通信会话（如语音、视频通话）的应用层协议。1.1架构SIP架构分为客户端和服务器端1）客户端：发起或接收会话请求，例如：手机上的VoIP应用、pjsua程序2）服务端：存储客户端注册的信息，比如IP、端口等注册服务器（RegistrarServer）：存储用户的当前位置信息（IP+端口）
FFmpeg 的算法体系 lianghu666 音视频硬件 Linux ffmpeg 算法 linux
️一、FFmpeg核心算法体系与作用1.编解码算法编解码是FFmpeg的核心能力，通过libavcodec实现音视频的压缩与还原。视频编码算法帧间预测：通过运动估计（菱形搜索、全搜索法）减少时间冗余，支持P帧（前向预测）和B帧（双向预测）变换与量化：采用整数离散余弦变换（DCT）将空域信号转为频域，再通过量化舍弃高频信息（H.264/H.265使用）熵编码：对残差数据采用CABAC（上下文自适应二
ZLMediaKit2023-10-15master分支编译版下载：实时音视频传输解决方案昌焘同
ZLMediaKit2023-10-15master分支编译版下载：实时音视频传输解决方案去发现同类优质开源项目:https://gitcode.com/项目介绍ZLMediaKit是一款开源的实时音视频传输框架，专为流媒体传输而设计。2023年10月15日基于master分支编译完成的版本，为广大开发者提供了Windows平台下的便捷使用体验。该版本集成最新的功能特性，无需复杂编译过程，下载即可
Permute 3.5 最好用的苹果电脑视频压缩转换工具 blank_t Permute Permute mac 视频压缩视频处理
类别：视频版本：3.5大小：19.2MBMB语言：简体中文标签：视频转换视频编辑兼容性：OSX10.11或更高版本更新：2020年07月23日软件介绍Permute3.5强大易用的视频格式转换已通过小编安装运行测试100%可以使用。Permute3.5是Mac系统最容易使用的视频格式转换器，它很容易使用，无需配置，你只需将文件拖放进界面窗口，对所有的媒体进行转换。支持丰富的音视频文件格式（甚至还支
Mac电脑-媒体文件格式转换-Permute 2401_88856700 媒体 mac macos 格式转换
Permute是一款功能强大的媒体文件格式转换工具。支持多种音视频和图像格式，包括但不限于MP4、AVI、MOV、MKV、MP3、WAV、FLAC、JPEG、PNG等。操作界面简洁明了，只需拖拽文件或点击添加按钮来选择需要转换的文件。转换设置区域，可自由选择输出格式、输出路径、输出参数等，实现个性化转换。原文地址：Permute媒体文件格式转换工具
XMOS将在CES 2025上展出多款由边缘AI驱动的创新音效、音频、识别和处理解决方案电子科技圈 XMOS 人工智能音视频嵌入式硬件科技物联网 mcu iot
全球智能物联网技术领导者暨匠心独到的半导体科技企业XMOS宣布：该公司将再次参加2025年国际消费电子展（CES2025），并将在本届CES上展出一系列由人工智能（AI）驱动的全新空间音效、语音捕获与降噪、音视频多模态AI处理等多种全新音频技术与应用解决方案。它们皆由XMOS在单一器件中集成了高性能AI、DSP、I/O和控制功能的xcore.ai系列多核控制器支持，将边缘AI技术与音频和话音媒介特
音视频面经_音视频知识解析：第三章FFMPEG编写视频解码 2301_79125642 java
小调查一次小调查，各位javaer除了用springboot写过项目，还用过啥框架写项目？有没有牛友来指点一二，真的好纠结本人位于湖南某民办二本(在湖南民办二本里算好的)，目前大三下，准备找工作干java后端，跟着b站的黑勇攀高峰6月12日举行的毕业典礼，一周的时间很快就过去了。回想起整个春招，机会确实很少，大概只有字节美团快手#和牛牛一起刷题打卡(51733)##和牛牛一起刷题打卡#简历求指导投
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓