涵小呆

AV1视频编解码器核心编码工具概述

一、介绍

在过去的十年里，基于网络的视频应用变得非常普遍，现代设备和网络基础设施推动了高分辨率、高质量内容消费的快速增长。因此，占主导地位的带宽消费者，如视频点播（VoD）、实时流媒体和会话视频，以及新兴的新应用，包括虚拟现实和云游戏，这些都非常依赖于高分辨率和低延迟，对传输基础设施提出了严峻的挑战，因此对高效视频压缩技术的需求更加强烈。

二、AV1编码工具

1.编码块划分

VP9使用从64×64级别到4×4级别的四种划分方式，对于8×8以下的块有额外的限制，在8x8块中，所有子块都应保存相同的参考帧，如图1上半部分所示，以确保色度块至少可以用4×4块单元处理。注意，图中标有为R的分块是递归的，因此R分块可以重复再划分，直到达到最低的4×4级。

AV1将最大编码块单元增加到128×128，并扩展分区树以支持10种可能的结果，以进一步包括4:1/1:4矩形编码块尺寸。与VP9相似，仅允许使用方形块进行进一步细分。此外，AV1为8x8以下的块增加了更大的灵活性，使每个编码块都可以在行内/帧内模式和参考帧选择之间进行切换。为了支持这种灵活性，它允许对色度分量进行2×2的帧间预测，同时保持最小的变换大小为4×4。

2.帧内预测

VP9支持10种帧内预测模式，包括8种方向模式，分别对应45到207度的角度模式，以及两种非定向预测器：DC和true motion（TM）模式。AV1，潜在的帧内编码进一步探索了不同的方法：方向预测的粒度进一步升级，而非方向性的预测，纳入了梯度和相关性，亮度的一致性和色度信号也得到充分利用，并开发出针对人造视频内容特殊优化的工具。

1）帧内预测方向的增强

以利用方向纹理中更多种类的空间冗余。在AV1中，对于大于8 × 8的块，方向帧内模式被扩展到具有更精细粒度的角度集。最初的8个角度是标称角度，在此基础上引入3度步长的细微角度变化，即预测角度由标称内部角度加上角度增量表示，角度增量是步长的-3 ~ 3倍。为了通过一般方式在AV1中实现方向预测模式，48种扩展模式由统一的方向预测器实现，该方向预测器将每个像素链接到边缘中的参考子像素位置，并通过2抽头双线性滤波器插值参考像素。AV1总共支持56种方向帧内模式。

AV1中方向帧内预测的另一个增强是，在参考像素值用于预测目标块之前，对其应用低通滤波器。滤波器强度是基于预测角度和块大小预先定义的。

2）无方向平滑帧内预测器

VP9有两种非定向帧内预测模式:DC_PRED和TM_PRED。AV1在此基础上增加了三种新的预测模式: SMOOTH_PRED、SMOOTH_V_PRED和SMOOTH_H_PRED。第四种新的预测模式PAETH_PRED [19]是现有的TM_PRED模式。新模式的工作原理如下:

SMOOTH_PRED:用于预测具有平滑梯度的块。它的工作原理如下:用当前块第一行的最后一个像素的值来估计最右列上的像素，使用左列中的最后一个像素来估计当前块最后一行中的像素。然后，根据像素与预测像素的距离，通过垂直和水平方向上的二次插值的平均值来计算其余像素。
SMOOTH_V_PRED:类似于SMOOTH_PRED，但只在垂直方向使用二次插值。
SMOOTH_H_PRED:类似于SMOOTH_PRED，但只在水平方向使用二次插值。
PAETH_PRED: Calculate base = left + top − top_left. 根据哪个像素最接近“base”，预测这个像素为左、上或左上像素。其思想是:(I)如果估计的梯度在水平方向上更大，那么我们从“top”预测像素；(ii)如果它在垂直方向上较大，那么我们从“left”预测像素；否则(iii)如果两者相同，我们从“top-left”预测像素。

3）基于递归滤波的帧内预测器

为了捕捉边缘具有参考的衰减空间相关性，通过将块视为二维不可分离马尔可夫模型，为亮度块设计了FILTER _ INTRA模式。为AV1预先设计了五种滤波器帧内模式，每种模式由一组八个7-tap滤波器表示，反映了与补片相邻的4 × 2 p像素之间的相关性(例如，图2中蓝色补片的P0 P6)。一个帧内块可以选择一个滤波器帧内模式，并以4 × 2 的补丁的进行批量预测。通过所选的一组7抽头滤波器对8个像素位置的相邻像素进行不同的加权，来预测补丁块。对于那些没有完全附着到块边界上的参考的4 × 2单元，例如图2中的绿色块，将直接相邻的预测像素用作参考，这意味着在4 × 2补丁块之间递归地计算预测，以便合并更多较远位置上的边缘像素。

4）从亮度预测色度

Chroma from Luma（CfL）是仅用于色度的帧内预测器，通过以重建后亮度像素的线性函数建模得到色度像素。预测的色度像素是通过将DC预测加到缩放的交流贡献上而获得的。DC预测是使用DC帧内预测模式通过当前块相邻的重建色度像素计算的。在零均值二次采样的重合重建亮度像素中，通过比特流中信号表示的比例因子。二次抽样步骤和平均减法相结合，以减少误差。为每个色度分量发信号通知缩放因子，但是它们是联合编码的。信号比例因子降低了解码器的复杂性，并产生更精确的研发优化预测。更多信息请参考图3和[20]。

5）调色板作为预测器

有时，尤其是对于像截屏和游戏这样的人工视频，块可以用少量独特的颜色来近似。因此，AV1将调色板模式引入帧内编码器，作为通用的额外编码工具。块的每个平面的调色板预测器由(I)具有2-8种颜色的调色板和(ii)块中所有像素的颜色索引来指定。基色的数量决定了保真度和紧凑度之间的权衡。通过参考相邻块的基色，在比特流中传输块的基色。然后，不存在于相邻块调色板中的基色被增量编码。颜色索引是使用基于邻域的上下文逐像素熵编码的。亮度和色度通道可以决定是否独立使用调色板模式。对于亮度通道，调色板中的每个条目都是一个标量值；对于色度通道，中的每个条目都是一个二维元组。在用调色板模式建立块的预测之后，变换编码和量化被应用于残差块，就像其他帧内预测模式一样。

6）帧内块内复制

AV1允许其帧内编码器参考同一帧中先前重建的块，其方式类似于帧间编码器引用前一帧中块的方式。这对于通常包含重复纹理的屏幕内容视频非常有用。具体来说，一种名为IntraBC的新预测模式被引入，它将在当前帧中拷贝一个重建的块作为预测。参考块的位置由位移矢量指定，其方式类似于运动补偿中的运动矢量压缩。位移矢量以亮度平面的整像素为单位，可以指相应色度平面上的半像素位置，其中双线性滤波用于子像素插值。

IntraBC模式仅用于关键帧或者仅帧内编码的帧。它可以通过帧级标志打开和关闭。IntraBC模式不能引用当前Tile之外的像素。为了便于硬件实现，对参考区域有一些额外的限制。例如，当前superblock和IntraBC可能引用的最新superblock之间有256个水平像素的延迟。另一个限制是当IntraBC在当前帧打开时，必须关闭包括去块滤波器、环路恢复滤波器和CDEF滤波器在内的环路滤波器。尽管有所有这些限制，IntraBC模式仍然为屏幕内容视频带来了显著的压缩改进。

3.帧间预测

运动补偿是视频编码中必不可少的模块。在VP9中，在最多三个候选参考帧中允许最多两个参考，然后预测器将进行基于块平移的运动补偿，或者如果有两个参考信号则取这两次预测的平均值。AV1具有更强大的帧间编码器，极大地扩展了参考帧和运动矢量库，打破了基于块的平移预测的局限性，并通过使用适应性强的加权算法和信源来增强复合预测。

1）扩展参考帧

AV1将每个帧的参考数量从3个扩展到7个。除了VP9的LAST (最近过去的)帧、GOLDEN(遥远过去的)帧和ALTREF(临时过滤的未来)帧之外，我们还添加了两个过去的帧(LAST2和LAST3)和两个未来帧(BWDREF和ALTREF2)[21]。图4展示了GOLDEN组的多层结构，其中自适应数量的帧共享相同的GOLDEN帧和ALTREF帧。BWDREF是一种直接编码的超前帧，无需应用时域滤波，因此更适合用作相对距离较短的后向参考。ALTREF2用作GOLDEN和ALTREF之间的中间过滤的将来参考。所有的新参考方式都可以通过单个预测模式使用，也可以被组合成复合模式使用。AV1提供了丰富的参考帧对集合，既提供双向复合预测，又提供单向复合预测，从而可以对各种具有动态时域相关特性的视频进行更自适应、更优化的编码。

2）动态时间与空间运动矢量参考

有效的运动矢量(MV)编码对于视频编解码器至关重要，因为它占用了帧间的很大一部分码率成本。为此，AV1结合了复杂的MV参考选择方案，以通过搜索空间和时间候选来获得给定块的良好MV参考。AV1不仅搜索比VP9更广的空间邻域来构建空间候选库，而且利用运动场估计机制来生成时间候选。运动场估计过程分为三个阶段：运动矢量缓冲、运动轨迹创建和运动矢量投影。首先，对于每个编码后的帧，我们存储其参考帧索引和相关的运动矢量。该信息将被下一编码帧参考以生成其运动场。运动场估计检查运动轨迹，例如图5中的MVRef2将一个参考帧Ref2中的块指向另一个参考帧Ref0Ref2的某个位置，可能会通过每个64×64处理单元，检查最多3个参考中并列的128×128缓冲运动矢量场。接下来，在编码块级别，一旦已经确定参考帧，就通过将运动轨迹线性投影到期望的参考帧上(例如，将图5中的MVRef2转换为MV0或MV1)来生成运动矢量候选。一旦所有的空间和时间候选被聚集在池中，它们被排序、合并和排序以获得最多四个最终候选[22，23]。评分方案依赖于计算当前块具有特定MV作为候选的可能性。为了编码MV，AV1用信号通知从列表中选择的参考MV的索引，然后根据需要对运动矢量差进行编码。

3）重叠块运动补偿(OBMC)

OBMC通过平滑地组合从邻近运动矢量创建的预测，可以大大减少块边缘附近的预测误差。在AV1中，设计了一种两面因果重叠算法，以使OBMC轻松适合高级分块框架[9]。它通过在垂直和水平方向上应用预定义的一维滤波器，逐步将基于块的预测与二次帧间预测器结合在上方边缘和左侧边缘。二次预测器仅在当前块的上/左半部分的受限重叠区域中操作，因此它们不会在同一侧彼此缠绕(参见图6)。AV1OBMC仅对使用单个参考帧的块启用，并且仅与具有两个参考帧的任何邻居的第一个预测器一起工作，因此最坏情况下的存储器带宽与传统复合预测器所要求的相同。

4）扭曲运动补偿

AV1通过两种仿射预测模式(全局和局部扭曲运动补偿)开发扭曲运动模型[25]。全局运动工具用于处理摄影机运动，并允许在帧和每个参考之间发出仿射模型的帧级信号。局部扭曲运动工具旨在通过从分配给因果邻域的运动矢量信号的二维位移中推导块级模型参数，从而以最小的开销隐式描述变化的局部运动。通过比较两种编码工具在块级别转换模式，只有在RD成本方面有优势时才选择它。更重要的是，AV1中的仿射扭曲受到的限制较小，因此可以在SIMD和硬件中通过水平剪切和垂直剪切来有效地实现仿射扭曲（图7），其中每个剪切点使用1/64像素精度的8-tap插值滤波器。

5）高级复合预测

为提高AV1编码器间的通用性，开发了一系列新的复合预测工具。在本节中，可以将任何复合预测操作针对像素（i，j）概括为：: pf (i, j) = m(i, j)p1(i, j)+(1 − m(i, j))p2(i, j)，其中p1和p2是两个预测变量，而pf是最终的复合预测，其中[0，1]中的加权系数m（i，j）专为不同的用例而设计，可以很容易从预定义表中生成。 [11]

复合楔形预测：移动对象的边界通常很难用网格块来近似。AV1中的解决方案是预定义16个可能的楔形分区的代码簿，当编码单元选择同样以这种方式进一步分区时，在位流中发信号通知楔形索引。如图8所示，针对正方形和矩形块设计了16个形状的代码簿，其中包含水平，垂直或倾斜度为±2或±0.5的分区方向。为了减轻由两个预测变量直接并置而产生的寄生高频分量，采用软悬崖形的二维楔形遮罩对目标分区周围边缘进行平滑处理，即m（i，j）接近于0.5边缘，并逐渐在两端转换为二进制权重。

差分调制掩码预测：在很多情况中，一个预测器中的区域将包含第二个预测器中不存在的有用内容。例如，一个预测器可能包括先前被移动对象遮挡的信息。在这些情况下，允许最终预测的某些区域更多地来自一个预测值而不是另一个预测值是有用的。AV1复合预测变量还可以通过从两个预测变量的值不同的内容来创建非均匀加权。具体来说，p1和p2之间的像素差用于在基值之上调制权重。掩码通过m(i, j) = b+a|p1(i, j)−p2(i, j)|生成，其中b控制的是在不同区域内一个预测变量对另一个加权变量的加权强度，其中比例因子a则是为了实现平滑调制。
基于帧距离的复合预测：除了非均匀加权之外，AV1还通过考虑帧距离来使用修改的均匀加权方案。帧距离被定义为两个帧的时间戳之间的绝对差。直观地，如果一个参考帧正好紧挨着当前帧，而另一个帧位于离当前帧更远的位置，则预期来自第一帧的参考块与当前块具有更高的相关性，因此应该比另一个具有更高的权重。设d1和d2(d1，≥，d2)表示从当前帧到参考帧的距离，由此计算p1和p2。W1和w2是从d1和d2导出的权重。最自然的方案是权重和帧距离成正比，即w1/w2=d2/d1。然而，仔细观察发现，复合预测应该具有两个主要功能：利用视频信号中的时间相关性和消除重构参考帧中的量化噪声。线性方案没有考虑量化噪声。在具有多个参考帧的分层编码结构中，两个参考帧与当前帧的相对距离可以基本上不同。线性模型将使分配给来自较远帧的块的权重太小而不能中和量化噪声。另一方面，传统的平均加权虽然并不总是密切跟踪时间相关性，但总体上表现出很好的降低量化噪声的性能。为了平衡这两个因素，AV1采用了一种改进的加权方案，将权重分配给远处的预测器。过实验获得码本，并将其固定在AV1中：

复合帧内预测：复合帧内预测模式将帧内预测p1和单参考帧间预测p2相结合，处理新出现的内容和混合了旧对象的区域。对于帧内部分，支持四种常用的帧内模式。遮罩m（i，j）包含两种类型的平滑功能：（i）类似于为楔间交互模式设计的平滑遮罩，（ii）依赖模式的遮罩，其中权重p1，以内部模式的主方向为导向的衰减模式。

4. 变换编码

1）变换块分区

AV1无需像VP9中那样强制执行固定的变换单元大小，而是将亮度帧间编码块划分为多种大小的变换单元，这些变换单元可以由递归分区（最多递减两个级别）表示。为了合并AV的扩展编码块分区，我们支持从4×4到64×64的正方形，2:1/1:2和4:1/1:4比例也都可以。此外，色度转换单元总是要尽可能地大。

2)扩展变换核

AV1中为帧内和帧间定义了更丰富的变换核集合。完整的2-D核集由四种1-D变换类型的水平/垂直组合生成，总共产生16个核选项[27]。一维变换类型包括VP9中使用的DCT和ADST、flipADST则以相反的顺序应用ADST，并且身份变换（IDTX）意味着沿某个方向跳过变换编码，因此对于编码锐利边缘特别有用。。在实践中，这些内核中的几个在较大的块大小时会给出类似的结果，从而允许随着变换大小的增加而逐渐减少可能的内核类型。

5. 熵编码

1) 多符号熵编码

VP9使用基于树的布尔型非自适应二进制算术编码器对所有语法元素进行编码。AV1转向使用符号间自适应多符号算术编码器。AV1中的每个语法元素都是由N个元素组成的特定字母表中的成员，上下文由一组N个概率和一个小计数组成，以便于早期快速适应。概率被存储为15位累积分布函数(CDFs)。与二进制算术编码器相比，精度更高，从而可以准确地跟踪字母表中不太常见的元素的概率。概率通过简单的递归缩放进行调整，其中更新因子基于字母大小。由于符号比特率是由编码系数、运动矢量和预测模式共同决定的，所有这些都使用大于2的字母，因此对于典型的编码方案，与纯二进制算术编码相比，这种设计实际上使吞吐量降低2倍以上。

在硬件中，复杂度由核心乘法器的吞吐量和大小决定，核心乘法器会重新调整算术编码状态间隔。编码实际上并不需要跟踪概率所需的较高精度。这允许通过从16×15位四舍五入到8×9位乘法器来实质上减小乘法器大小。通过强制执行最小间隔大小，可以简化此舍入，而最小间隔大小又允许简化的概率更新，其中值可能变为零。在软件中，操作计数比复杂度更重要，并且减少吞吐量和简化更新相应地减少了每个编码/解码操作的固定开销。

2）水平图系数编码

在VP9中，编码引擎按照扫描顺序顺序处理每个量化的变换系数。用于每个系数的概率模型与先前编码的系数级别，其频带，变换块大小等相关。为了正确捕获广阔基数空间中的系数分布，AV1更改为用于较大变换系数建模的电平图设计和压缩[28]。它建立在以下观察基础上：较低的系数水平通常会占主要的费率成本。

对于每个变换单元，AV1系数编码器从编码一个跳过符号开始，然后是变换核类型和当不跳过变换编码时所有非零系数的结束位置。然后，对于系数值，并没有采用为所有系数级别统一分配上下文的模型，而是将级别分为不同的平面。在结束位置被编码之后，低层和中层平面以相反的扫描顺序被编码在一起。然后，符号平面和更高级别平面以正向扫描顺序编码在一起。低层平面对应于0–2的范围，中层平面负责3–14的范围，高层平面覆盖15及以上的范围。这种分离允许我们将丰富的上下文模型分配给较低级别的平面，而这一平面充分考虑了变换维、块大小、以及邻近系数信息，以适度的上下文模型大小提高压缩效率。较高级别的平面对3到15之间的级别使用简化的上下文模型，并使用ExpGolomb代码直接对15级以上的残差进行编码。

6. 环路滤波工具和后处理

AV1允许将多个环路滤波工具相继应用于解码帧数据的过程。第一级是去块滤波器，它与VP9中使用的去块滤波器大致相同，只是做了些微小改动。最长的滤波器从VP9中的15抽头减少到13抽头。此外，对于亮度和每个色度平面，现在在水平和垂直方向上发出单独滤波级别的信号，更具灵活性，并且能够在超级块之间更改级别。AV1中的其他过滤工具描述如下：

1）约束方向增强滤波器(CDEF)

CDEF是一种细节保持去块滤波器，设计为在去块之后应用。它的工作原理是估计边缘和图案的方向，然后应用一个大小为5 × 5、12个非零权重的不可分离的非线性低通方向滤波器。为了避免发送方向信号，解码器使用标准的快速搜索算法来估计方向。解码过程的完整描述可以在参考文献中找到。[29]。

方向估计:将待滤波图像分成8 × 8像素的块，足够大，可以进行可靠的方向估计。对于每个方向d，如图9所示，给每个像素分配一个l i n e数k，并确定行k的像素平均值。通过最小化平方误差来找到最佳方向，平方误差计算为各个像素值之间的平方差和对应线的平均值。

非线性低通滤波器:非线性低通滤波器旨在消除编码伪像，而不会模糊边缘。这是通过基于所识别的方向选择抽头并独立地沿着和穿过该方向选择滤波器强度来实现的。滤波器可以表示为

其中N包含x（i，j）附近的像素，权重wm，n，f（）和g（）是下面描述的非零非线性函数，R（x）将x舍入为最接近零的整数。 f（）函数修改要过滤的像素与相邻像素之间的差异，并由分别在64×64块级别和帧级别指定的两个参数（强度S和阻尼值D）确定。强度S钳位允许的最大差值减去D所控制的削减。g（）函数将要过滤的像素x的修改值限制为x与支撑区域中x（m，n）之间的最大差值保持滤波器的低通特性。

2)环路恢复滤波器

循环恢复过滤器：AV1在CDEF之后添加了一组用于循环应用的工具，这些工具的使用是相互斥的，其可选大小为64×64、128×128、或256×256的被称之为循环恢复单元（LRU）。具体来说，对于每个LRU，AV1允许在如下两个滤波器[15]之一之间进行选择。

可分离对称归一化Wiener滤波器:用7×7可分离维纳滤波器滤波，其系数在比特流中用信号表示。由于标准化和对称性的限制，每个水平/垂直滤波器只需要发送三个参数。编码器进行了巧妙的优化，以决定使用正确的滤波器抽头，但是解码器只使用从位流接收到的滤波器抽头。
双自导滤波器：对于每个LRU，解码器首先应用两个简易的整数化自导滤波器，其支持大小分别为3×3和5×5，并通过比特流中的信号通知噪声参数。（注意，自我引导意味着引导图像与要过滤的图像相同）。接下来，将两个滤波器r1和r2的输出与同样在比特流中用信号发送的权重（α，β）组合，以获得最终恢复的LRU为x + α(r1 − x) + β(r2 − x)，其中x是原始降级的LRU。即使r1和r2本身不一定是好的，但在编码器端适当选择权重可使最终组合版本更接近于未降级的源。

3)帧超分辨率

根据当前带宽自适应切换帧分辨率是视频流服务中的常见做法。例如，当可用带宽较低时，服务可以发送较低分辨率的帧，然后将它们升级到显示设备分辨率。然而，这种缩放现在发生在视频编解码器之外。

AV1中新的帧超分辨率框架背后的动机是通过使其成为编解码器本身的一部分来使这一缩放过程更加有效。这种编码模式允许以较低的空间分辨率对帧进行编码，然后在更新参考缓冲器之前，以标准方式在环路内超分辨率至全分辨率。后来，这些超分辨参考缓冲区可用于预测后续帧，即使它们的分辨率不同，这要归功于AV1的有限预测能力。

在客观指标上，超分辨率几乎总是比在编解码器之外放大较低分辨率的帧好得多。此外，在非常低的比特率下，就感知度量而言，有时也观察到比全分辨率更好。此外，它为编码器的速率和质量控制提供了额外的维度。虽然在这一领域有大量的研究，但图像处理文献中的大多数超分辨率方法对于视频编解码器中的环路操作来说过于复杂。在AV1中，为了使运算在计算上易于处理，超分辨过程被分解为线性向上扩展，随后以更高的空间分辨率应用循环恢复工具。具体来说，维纳滤波器特别擅长超分辨率和恢复丢失的高频。唯一附加的标准操作是在使用循环恢复之前的线性升级。此外，为了实现成本有效的硬件实现，不需要线缓冲器中的开销，放大/缩小被限制为仅水平操作。图11描述了使用帧超分辨率时环路滤波管道的总体架构，其中CDEF以编码（较低）分辨率运行，但是在线性升频器水平扩展图像以解决部分分辨率后，环路恢复运行较高的频率丢失。

4)胶片颗粒合成

AV1中的胶片颗粒合成是应用于编码/解码循环之外的标准后处理[31]。富含电视和电影内容的电影胶片通常是电影的一部分。它的随机性使得传统的编码工具很难压缩。相反，在压缩之前从内容中去除颗粒，其参数被估计并在AV1比特流中发送。解码器基于接收到的参数合成颗粒，并将其添加到重建的视频中(参见图12的细节)。

颗粒被建模为自回归（AR）过程，其中亮度的最高AR系数为24，每个色度分量的AR系数为25。这些系数用于生成64×64亮度颗粒模板和32×32色度模板。然后从模板中的随机位置获取小颗粒补丁并将其应用于视频。补丁之间的不连续性可以通过可选的重叠来缓解。薄膜的颗粒强度也随信号强度而变化，因此每个颗粒样品都按比例缩放[16]。

该工具支持胶片颗粒强度和信号强度之间关系的灵活建模，如下所示:

Y’是用胶片颗粒重噪声的结果亮度，Y是添加胶片颗粒之前亮度的重建值，GL是亮度胶片颗粒样本。这里，f(Y)是一个分段线性函数，根据亮度分量值缩放胶片颗粒。这个分段线性函数被信号通知给解码器，并且可以被实现为预先计算的查找表(LUT)，该查找表在运行当前帧的颗粒合成之前被初始化。对于色度分量（例如Cb），当色度中的膜颗粒强度取决于luma分量时，使用以下公式调制噪声以便于颗粒强度建模：

其中u是LUT中对应于Cb分量比例函数的索引，参数bCb、dCb和hCb用信号通知解码器。

一组胶片颗粒参数最多可占用大约145个字节。每个帧可以接收一组新的纹理参数，或者如果先前解码的帧中的一个可用，则可以重复使用这些参数。

7.Tiles and multi-threading

1) AV1Tiles

AV1支持由多个超级块（super blocks）组成的独立tiles，tiles可以任意顺序编码和解码。由编码参数定义，tiles可以是均匀的(即tiles具有相同的尺寸)或不均匀的(即tiles可以具有不同的尺寸)。独立的tiles支持提供了编码的灵活性，这样编码器和解码器就可以运行了，并且可以变得更快。

在libaom代码库中，多线程(MT)已经在编码器和解码器中实现，包括基于tile的MT和基于行的MT。当允许使用tile，基于tile的MT提供了显著的加速。当不使用或很少使用tile时，基于行的MT允许线程对单个超级块行进行编码和解码，从而进一步提高了速度。在一个720p视频编码中使用四个tiles和四个线程，编码器的加速比约为3倍，解码器的加速比约为2.5倍。

2)大规模tiles

随着虚拟现实(VR)应用的日益普及，AV1第一次提供了一种使实时VR应用可行的解决方案。大规模平铺工具允许解码器只提取帧中感兴趣的部分，而不需要解压缩整个帧。这显著地降低了解码器的复杂性，并且对于实时应用非常有用，例如光场，其随着观看者的头部移动呈现帧的单个部分。

参考文献

[1] D. Mukherjee, J. Bankoski, A. Grange, J. Han, J. Koleszar, P. Wilkins,

Y. Xu, and R.S. Bultje, “The latest open-source video codec VP9 - an

overview and preliminary results,” Picture Coding Symposium (PCS),

December 2013.

[2] G. J. Sullivan, J. Ohm, W. Han, and T. Wiegand, “Overview of the

high efficiency video coding (HEVC) standard,” IEEE Transactions on

Circuits and Systems for Video Technology, vol. 22, no. 12, 2012.

[3] T. Wiegand, G. J. Sullivan, G. Bjontegaard, and A. Luthra, “Overview of

the H.264/AVC video coding standard,” IEEE Transactions on Circuits

and Systems for Video Technology, vol. 13, no. 7, 2003.

[4] J. Bankoski, P. Wilkins, and Y. Xu, “Technical overview of VP8, an open

source video codec for the web,” IEEE Int. Conference on Multimedia

and Expo, December 2011.

[5] “Alliance for Open Media,” Home.

[6] L. N. Trudeau, N. E. Egge, and D. Barr, “Predicting chroma from luma

in AV1,” Data Compression Conference, 2018.

[7] W. Lin, Z. Liu, D. Mukherjee, J. Han, P. Wilkins, Y. Xu, and K. Rose,

“Efficient AV1 video coding using a multi-layer framework,” Data

Compression Conference, 2018.

[8] J. Han, Y. Xu, and J. Bankoski, “A dynamic motion vector referencing

scheme for video coding,” IEEE Int. Confernce on Image Processing,

2016.

[9] Y. Chen and D. Mukherjee, “Variable block-size overlapped block

motion compensation in the next generation open-source video codec,”

IEEE Int. Confernce on Image Processing, 2017.

[10] S. Parker, Y. Chen, and D. Mukherjee, “Global and locally adaptive

warped motion comprensationin video compression,” IEEE Int. Confernce on Image Processing, 2017.

[11] U. Joshi, D. Mukherjee, J. Han, Y. Chen, S. Parker, H. Su, A. Chiang,

Y. Xu, Z. Liu, Y. Wang, J. Bankoski, C. Wang, and E. Keyder, “Novel

inter and intra prediction tools under consideration for the emerging AV1

video codec,” Proc. SPIE, Applications of Digital Image Processing XL,

2017.

[12] S. Parker, Y. Chen, J. Han, Z. Liu, D. Mukherjee, H. Su, Y. Wang,

J. Bankoski, and S. Li, “On transform coding tools under development

for VP10,” Proc. SPIE, Applications of Digital Image Processing XXXIX,

2016.

[13] J. Han, C.-H. Chiang, and Y. Xu, “A level map approach to transform

coefficient coding,” IEEE Int. Confernce on Image Processing, 2017.

[14] S. Midtskogen and J.-M. Valin, “The AV1 constrained directional

enhancement filter (CDEF),” IEEE Int. Conference on Acoustics, Speech,

and Signal Processing, 2018.

[15] D. Mukherjee, S. Li, Y. Chen, A. Anis, S. Parker, and J. Bankoski,

“A switchable loop-restoration with side-information framework for the

emerging AV1 video codec,” IEEE Int. Confernce on Image Processing,

2017.

[16] A. Norkin and N. Birkbeck, “Film grain synthesis for AV1 video codec,”

Data Compression Conference, 2018.

[17] “AWCY,” Are We Compressed Yet?.

你可能感兴趣的:(AV1,视频编码,AV1)

深入探索视频格式标准及其应用 D哥有个初二君
本文还有配套的精品资源，点击获取简介：视频格式标准对于数字媒体的编码、存储、传输和播放至关重要，它涵盖了容器格式、视频编码、音频编码等多个方面。本简介详细介绍了容器格式如MP4、AVI、MKV和TS；常见的视频编码标准包括H.264/AVC、H.265/HEVC、VP9和AV1；音频编码标准有AAC、FLAC和Opus；格式转换和流媒体协议如RTMP、HLS和DASH的重要性；以及分辨率和帧率对视
FFmpeg 视频编码灬Sunnnnn FFmpeg 实战项目-视频播放器 ffmpeg 音视频
1.简介编码视频数据，如下图所示，将原始的YUV数据编码为H.264或者H.265。使用FFmpeg进行视频编码的流程通常包括以下几个步骤：注册编解码器：通过av_register_all()函数注册FFmpeg所有编解码器，这是使用任何编解码器的前提条件。初始化输出上下文：使用avformat_alloc_output_context2()函数来初始化输出码流的AVFormatContext，这
ffmpeg 视频编码流程及主要API melonbo FFMPEG ffmpeg 音视频
一、编码流程初始化组件配置编码器参数打开编码器处理输入帧编码循环写入输出数据收尾释放资源二、核心步骤与API详解1.初始化与参数配置注册组件（旧版本需手动注册，新版本自动处理）avformat_network_init();//网络相关初始化（可选）查找编码器AVCodec*codec=avcodec_find_encoder(AV_CODEC_ID_H264);//支持H.264/HEVC等创建
SmartDV推出先进的H.264和H.265视频编码器和解码器IP 电子科技圈 h.264 h.265 音视频
向全球市场提供灵活、高度可配置、可定制的半导体设计知识产权（IP）和验证IP（VIP）的开发商SmartDV™Technologies近日宣布：公司现已提供即刻可用的H.264和H.265视频编码器和解码器IP解决方案。针对每一种技术，SmartDV都提供了所有三种配置的IP产品，包括H.264的基本配置（Baseline）、主流配置（Main）和高性能配置（High）版本，以及H.265的主流（
高性能AI核心板Z3588CV1：基于瑞芯微RK3588的旗舰级解决方案——8K视觉处理 · 6TOPS NPU算力 · 多场景边缘计算九鼎创展科技嵌入式硬件边缘计算 arm开发 android
RK3588处理器技术细节计算单元CPU：4×[email protected]（大核集群）4×[email protected]（能效集群）支持ARMDynamIQ混合架构，可实现任务智能调度GPU：Mali-G610MP4，支持OpenGLES3.2/2.0/1.1、Vulkan1.28KVPU视频编解码：H.265/H.264/AV1格式，支持60fps实时处理NPU：6TOPS算力（INT
Cortex-A9解码H265遇到的程序崩溃问题 melonbo FFMPEG ffmpeg
1、应用背景处理器采用Cortex-A9，从网络摄像机拉取RTSP视频流，编码格式为H265，在打开rtsp视频流时有小概率出现程序崩溃的问题。2、分析根据coredump文件显示，问题出现在hevcdsp_sao_neon.s文件，它的作用是优化HEVC视频编码器的性能，特别是在处理视频帧时，通过NEON指令集实现的并行处理能力，可以显著提高视频编码的速度。ARMNEON指令集是ARM平台上的S
在使用 HTML5 的＜video＞标签嵌入视频时，有时会遇到无法播放 MP4 文件的问题蹦极的考拉 html5 音视频前端
原因分析：只能播放声音，却无法播放视频。这通常是由于视频编码格式不兼容导致的。虽然MP4是一种常见的视频格式，但它包含多种编码方式，并非所有编码方式都受HTML5支持。解决方案：确认视频编码格式：使用视频播放器或专门的工具查看视频文件的属性，确认其编码格式。HTML5支持H.264编码的MP4文件（MPEG-4），VP8编码的WebM文件和Theora编码的Ogg文件。转换视频编码格式：如果视频编
ESP FOURCC 编码介绍乐鑫科技 Espressif 乐鑫科技多媒体编码
FOURCC（FourCharacterCode，四字符编码）是一种在多媒体领域被广泛使用的标识符，常用于快速识别音视频编码格式、封装格式、像素格式等。乐鑫科技定义了一套完整的FOURCC编码标准，称为ESPFOURCC，该标准可在开源项目ESP-GMF中的esp_fourcc.h头文件中找到，涵盖了音视频编解码、图像、封装格式和各种像素格式。本文将深入介绍ESPFOURCC的背景意义、定义原则、
Android Camera系列（八）：MediaCodec视频编码下-OpenGL ES离屏渲染如果可以003 Android Camera Android OpenGL ES Android音视频音视频 OpenGL ES MediaCodec android
所有随风而逝的都是属于昨天的，所有历经风雨留下来的才是面向未来的AndroidCamera系列（一）：SurfaceView+CameraAndroidCamera系列（二）：TextureView+CameraAndroidCamera系列（三）：GLSurfaceView+CameraAndroidCamera系列（四）：TextureView+OpenGLES+CameraAndroidCa
Android Camera系列（七）：MediaCodec视频编码中-OpenGL ES多线程渲染如果可以003 Android Camera Android音视频 Android OpenGL ES android OpenGL ES MediaCodec 硬编码
你做的再好，也还是有人指指点点；你即便一塌糊涂，也还是有人唱赞歌。所以不必掉进他人的眼神，你需要讨好的，仅仅是你自己。AndroidCamera系列（一）：SurfaceView+CameraAndroidCamera系列（二）：TextureView+CameraAndroidCamera系列（三）：GLSurfaceView+CameraAndroidCamera系列（四）：TextureVi
ffmpeg 带alpha透明层的视频编码 Ternence_Hsu ffmpeg alpha 透明层视频编码 png
png编码可以封装为mp4、mov等ffmpeg-fimage2-r25-iinput_%d.png-vffps=25-vcodecpngoutput.mov-yqtrle编码只能封装为mov，不可以封装为mp4ffmpeg-iinput.mov-vcodecqtrleoutput.mov输入流编码信息：Stream#0:0(eng):Video:qtrle(rle/0x20656C72),bgr
FFmpeg 的算法体系 lianghu666 音视频硬件 Linux ffmpeg 算法 linux
️一、FFmpeg核心算法体系与作用1.编解码算法编解码是FFmpeg的核心能力，通过libavcodec实现音视频的压缩与还原。视频编码算法帧间预测：通过运动估计（菱形搜索、全搜索法）减少时间冗余，支持P帧（前向预测）和B帧（双向预测）变换与量化：采用整数离散余弦变换（DCT）将空域信号转为频域，再通过量化舍弃高频信息（H.264/H.265使用）熵编码：对残差数据采用CABAC（上下文自适应二
ios苹果app应用程序录屏开发有哪些难点和注意点咕噜企业签名分发-大圣 ios
iOS苹果应用程序录屏开发的难点和注意点主要包括：难点：一、权限管理iOS录屏功能需要用户授权才能使用，开发者需要处理用户授权的逻辑，包括请求权限、处理用户拒绝授权的情况以及提供友好的提示信息等。二、视频编码和压缩录制屏幕上的内容会产生大量的数据，因此对生成的视频文件进行编码和压缩是必要的。开发者需要选择合适的视频编码器，并合理地设置视频质量和压缩参数，以保证生成的视频文件既有足够的清晰度，又不会
H.264/H.265 编码入门到实战：嵌入式安防新人快速掌握视频压缩核心技巧创视谷 ipc网络摄像头研发技术相关网络音视频 h.264 h.265 安防
目录H.264编码基础H.265编码基础GOP架构与关键帧码率控制策略帧率与分辨率调优帧率调优分辨率调优硬件支持与兼容性对比常见问题与排查典型安防场景配置建议H.264编码基础标准概述：H.264（MPEG-4AVC）是2003年推出的高清视频编码标准，采用混合编码结构（帧内+帧间压缩），在同等画质下比前代格式大幅提升了压缩效率。其兼容性好、硬件需求低，因而在网络视频传输、流媒体和视频监控等领域得
音视频基础概念扫盲 Charlotte_jc 音视频
音视频概念相关参考地址ffmpeg视频压缩视频尺寸（视频分辨率/帧大小）视频分辨率，常见的分辨率有4096×2160,2560x1440,1920*1080,1280*720视频编码视频编码方式就是指通过特定的压缩技术，将某个视频格式的文件转换成另一种视频格式文件的方式。常见的编码格式有：H264,VP8，AVS,RMVB，WMV，QuickTime音频编码音频编码方式指通过特定的压缩技术对音频数
Python 高效图像帧提取与视频编码：实战指南清水白石008 python Python题库 python 音视频开发语言
Python高效图像帧提取与视频编码：实战指南在音视频处理领域，图像帧提取与视频编码是基础但极具挑战性的任务。Python结合强大的第三方库（如OpenCV、FFmpeg、PyAV），可以高效处理视频流，实现快速帧提取、压缩编码等关键功能。本文将深入介绍如何优化这些流程，提高处理效率，确保代码实用性强，适用于各种应用场景。1.引言：Python在音视频处理中的优势Python之所以在音视频处理领域
FFmpeg —— 通过直接修改yuv数据，将视频转为黑白并输出显示（附：源码）信必诺 FFmpeg 音视频
效果说明 YUV，是一种颜色编码方法。常使用在各个视频处理组件中。YUV在对照片或视频编码时，考虑到人类的感知能力，允许降低色度的带宽。“U”和“V”表示的则是色度（Chrominance或Chroma），作用是描述影像色彩及饱和度，用
视频编码实战生椰_李点点 ffmpeg 音视频
FFmpeg流程从本地读取YUV数据编码为h264格式的数据，然后再存⼊到本地，编码后的数据有带startcode。与FFmpeg示例⾳频编码的流程基本⼀致。函数说明：avcodec_find_encoder_by_name：根据指定的编码器名称查找注册的编码器。avcodec_alloc_context3：为AVCodecContext分配内存。avcodec_open2：打开编解码器。avco
嵌入式音视频开发学习（视频编码原理及RV1126 VENC模块） Les maths 音视频学习
视频编码原理(一)1.视频为什么要编码？在我们做音视频产品的时候，经常会把音视频数据进行网络传输，而此时音视频数据就需要进行编码(所谓编码就是指压缩)。因为在网络传输的时候，网络带宽有限，若此时网络传输的时候还用原始数据进行传输的时候，则会对网络带宽造成极大的负担。比方说一个分辨率为1280*720帧率为30帧的视频，按照YUV420格式的计算，它每秒传输的数据量就是1280*720*30*3/2
HTML5关键知识点之多种视频编码工具的深度应用奋斗的小羊羊 html5 音视频前端
HTML5关键知识点之多种视频编码工具的深度应用在学习HTML5相关知识的过程中，我积累了不少实用的经验，特别想和大家分享，希望能和大家一起进步，更深入地掌握视频编码技术在HTML5中的应用。知识点总结HandBrake命令行批量编码H.264视频：HandBrake有命令行版本，需从指定网站下载。命令行提供诸多选项，如指定预设配置、视频宽度、平均比特率、编码方式、输入输出文件名等。通过设置这些参
FFmpeg视频编码的完整操作指南视频砖家 FFmpeg 视频安全 ffmpeg 音视频
步骤如下：安装和准备FFmpeg：确保包含所需编码器（如libx264）。基本命令行编码：使用ffmpeg命令进行转码，设置视频编码器、CRF、预设等。API编码流程（针对开发者）：a.注册组件（旧版本可能需要，新版本可能自动处理）b.初始化上下文和输出格式c.查找并打开编码器d.配置编码参数（分辨率、帧率、码率等）e.处理输入帧（读取、转换格式）f.编码循环（发送帧，接收包）g.时间戳处理和时间
python视频裁剪_Python MovePy 视频区域裁剪 weixin_39528525 python视频裁剪
importcv2importnumpyasnpcoor_x,coor_y=-1,-1#初始值并无意义，只是为了能够使用np.row_stack函数#"""定义视频编码器#FourCC全称Four-CharacterCodes，代表四字符代码(fourcharactercode),#它是一个32位的标示符，其实就是typedefunsignedintFOURCC;#是一种独立标示视频数据流格式的四
FFmpeg 与 C++ 构建音视频处理全链路实战（五）—— 音视频编码与封装 achene_ql 音视频开发 ffmpeg c++音视频
在前面的系列文章中，我们已经层层深入，从MP4与FLV封装格式的剖析，到H.264和AAC原理的探索，再到FFmpeg的解封装、解码，以及音频重采样、视频尺寸变化的代码实现，为音视频处理打下了坚实基础。而今天，我们将迎来整个系列的终章——音视频编码与封装，完成从原始音视频数据到可播放媒体文件的最后蜕变。一、音视频编码基础回顾与进阶理解在深入编码实战之前，我们先简单回顾并进一步拓展音视频编码的核心概
iOS视频编码详细步骤（视频编码器，基于 VideoToolbox，支持硬件编码 H264/H265） Unlimitedz app开发 ios 音视频
iOS视频编码详细步骤流程1.视频采集阶段视频采集所使用的代码和之前的相同，所以不再过多进行赘述初始化配置：通过VideoCaptureConfig设置分辨率1920x1080、帧率30fps、像素格式kCVPixelFormatType_420YpCbCr8BiPlanarFullRange设置摄像头位置（默认前置）和镜像模式授权与初始化：检查并请求相机权限创建AVCaptureSession会
运用fmpeg写一个背英文单词的demo带翻译 Arenaschi java 笔记 tcp/ip java eclipse maven 其他
-男生会因为不配而离开那个深爱的她吗？？一，fmpeg-7.0.1是做什么用的？？FFmpeg7.0.1是FFmpeg的一个版本，FFmpeg是一个开源的多媒体框架，用于处理音视频数据。FFmpeg提供了强大的工具和库，可以用来录制、转换、流式传输和播放音视频。它广泛用于音视频编码、解码、转码、合并、拆分、流媒体处理等任务。具体来说，FFmpeg7.0.1（或者其他版本）可能包括以下功能：视频和音
鸿蒙5.0&next开发【典型场景的视频编码配置】音视频编解码是秃子总会反光鸿蒙系列视频编解码音视频 harmonyos 华为鸿蒙系统
典型场景的视频编码配置此文档描述了AVCodec视频编码能力在不同应用场景下的推荐配置参数，供调用者根据实际应用场景进行视频编码应用的开发。视频编码在视频通话、视频会议、直播、视频编辑、视频分享等场景均有广泛使用，按照体验要求，上述场景可归纳划分为低时延、实时流媒体、离线编码三大类别应用场景。本文将给出三大类别应用场景下视频编码的推荐参数配置，供调用者根据不同的应用场景下的需求进行参数配置选择。通
【笔记】H.265/HEVC 视频编码（一） lock。 HEVC学习笔记视频编码音视频
为什么要进行视频压缩？就拿一个例子来说，720P的视频，假设帧率30fps，三个色彩分量的每个像素点为8bit，那么每一秒的数据量为12807203830=6.64*10^8比特，这还只是一秒的数据量，一部电影少也有90分钟左右，可见原始视频的数据量是非常惊人的，无法直接用于传输或存储，因此需要视频压缩。视频压缩的目的是尽可能去除视频数据的冗余成分，减少表征视频的数据量。一、视频压缩与编码概述1、
音视频开发从入门到精通：编解码、流媒体协议与FFmpeg实战指南阿牛的药铺 LINUX驱动学习音视频人工智能
音视频开发从入门到精通：编解码、流媒体协议与FFmpeg实战指南音视频技术作为数字媒体领域的核心，正在成为互联网和移动应用的重要组成部分。本文将全面介绍音视频开发的学习路径，从基础概念到高级应用，从编解码原理到实战案例，帮助你构建完整的音视频技术知识体系，并掌握面试所需的关键技能。一、音视频编解码基础：H.264/H.265详解1.1视频编码的必要性与基本原理视频编码的核心目的是解决原始视频数据量
通过WPF和Emgu.CV实现时间延摄影綾音Ayane
本文还有配套的精品资源，点击获取简介：时间延摄影术是一种将长时间视频或照片序列压缩为短时间快放视频的技术，常用于展示自然现象的变化。本文介绍的项目资源包括一个利用WPF和Emgu.CV库的C#项目，该项目通过网络摄像头捕获图像并制作时间延摄影视频。关键知识点涉及WPF、Emgu.CV、网络摄像头编程、图像处理、时间间隔计算、视频编码与合成、多线程编程、事件驱动编程、文件管理和存储以及调试与优化。1
震撼发布｜pion/webrtc v4.1.0重磅升级，AV1全支持+多编解码协商，实时通信体验全面进阶！福大大架构师每日一题文心一言vschatgpt webrtc av1
大家期待已久的pion/webrtcv4.1.0版本终于来了！本次更新不仅带来稳定完善的AV1视频编码支持，更重磅推出多编解码协商功能，大幅提升实时音视频通信的灵活性和兼容性。除此之外，还有众多底层协议和性能优化，助力开发者打造更流畅、更高质量的WebRTC应用。下面我们来详细解读此次版本的亮点和新特性。一、全新发布节奏，持续活跃迭代官方宣布从本版本开始，将在每个月最后一个周末发布小版本更新，保持
eclipse maven IXHONG eclipse
eclipse中使用maven插件的时候，运行run as maven build的时候报错 -Dmaven.multiModuleProjectDirectory system propery is not set. Check $M2_HOME environment variable and mvn script match. 可以设一个环境变量M2_HOME指
timer cancel方法的一个小实例 alleni123 多线程 timer
package com.lj.timer; import java.util.Date; import java.util.Timer; import java.util.TimerTask; public class MyTimer extends TimerTask { private int a; private Timer timer; pub
MySQL数据库在Linux下的安装 ducklsl mysql
1.建好一个专门放置MySQL的目录 /mysql/db数据库目录 /mysql/data数据库数据文件目录 2.配置用户，添加专门的MySQL管理用户 >groupadd mysql ----添加用户组 >useradd -g mysql mysql ----在mysql用户组中添加一个mysql用户 3.配置，生成并安装MySQL >cmake -D
spring------>>cvc-elt.1: Cannot find the declaration of element Array_06 spring bean
将-------- <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3
maven发布第三方jar的一些问题 cugfy maven
maven中发布第三方jar到nexus仓库使用的是 deploy:deploy-file命令有许多参数，具体可查看 http://maven.apache.org/plugins/maven-deploy-plugin/deploy-file-mojo.html 以下是一个例子： mvn deploy:deploy-file -DgroupId=xpp3
MYSQL下载及安装 357029540 mysql
好久没有去安装过MYSQL，今天自己在安装完MYSQL过后用navicat for mysql去厕测试链接的时候出现了10061的问题，因为的的MYSQL是最新版本为5.6.24，所以下载的文件夹里没有my.ini文件，所以在网上找了很多方法还是没有找到怎么解决问题，最后看到了一篇百度经验里有这个的介绍，按照其步骤也完成了安装，在这里给大家分享下这个链接的地址
ios TableView cell的布局张亚雄 tableview
cell.imageView.image = [UIImage imageNamed:[imageArray objectAtIndex:[indexPath row]]]; CGSize itemSize = CGSizeMake(60, 50); &nbs
Java编码转义 adminjun java 编码转义
import java.io.UnsupportedEncodingException; /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符，也叫作ISO646-US、Unicode字符集的基本拉丁块 */ public static final Strin
Tomcat 配置和spring aijuans spring
简介 Tomcat启动时，先找系统变量CATALINA_BASE，如果没有，则找CATALINA_HOME。然后找这个变量所指的目录下的conf文件夹，从中读取配置文件。最重要的配置文件：server.xml 。要配置tomcat，基本上了解server.xml，context.xml和web.xml。 Server.xml -- tomcat主
Java打印当前目录下的所有子目录和文件 ayaoxinchao 递归 File
其实这个没啥技术含量，大湿们不要操笑哦，只是做一个简单的记录，简单用了一下递归算法。 import java.io.File; /** * @author Perlin * @date 2014-6-30 */ public class PrintDirectory { public static void printDirectory(File f
linux安装mysql出现libs报冲突解决 BigBird2012 linux
linux安装mysql出现libs报冲突解决安装mysql出现 file /usr/share/mysql/ukrainian/errmsg.sys from install of MySQL-server-5.5.33-1.linux2.6.i386 conflicts with file from package mysql-libs-5.1.61-4.el6.i686
jedis连接池使用实例 bijian1013 redis jedis连接池 jedis
实例代码： package com.bijian.study; import java.util.ArrayList; import java.util.List; import redis.clients.jedis.Jedis; import redis.clients.jedis.JedisPool; import redis.clients.jedis.JedisPoo
关于朋友 bingyingao 朋友兴趣爱好维持
成为朋友的必要条件：志相同，道不合，可以成为朋友。譬如马云、周星驰一个是商人，一个是影星，可谓道不同，但都很有梦想，都要在各自领域里做到最好，当他们遇到一起，互相欣赏，可以畅谈两个小时。志不同，道相合，也可以成为朋友。譬如有时候看到两个一个成绩很好每次考试争做第一，一个成绩很差的同学是好朋友。他们志向不相同，但他
【Spark七十九】Spark RDD API一 bit1129 spark
aggregate package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} //测试RDD的aggregate方法 object AggregateTest { def main(args: Array[String]) { val conf = new Spar
ktap 0.1 released bookjovi kernel tracing
Dear, I'm pleased to announce that ktap release v0.1, this is the first official release of ktap project, it is expected that this release is not fully functional or very stable and we welcome bu
能保存Properties文件注释的Properties工具类 BrokenDreams properties
今天遇到一个小需求：由于java.util.Properties读取属性文件时会忽略注释，当写回去的时候，注释都没了。恰好一个项目中的配置文件会在部署后被某个Java程序修改一下，但修改了之后注释全没了，可能会给以后的参数调整带来困难。所以要解决这个问题。 &nb
读《研磨设计模式》-代码笔记-外观模式-Facade bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 百度百科的定义： * Facade（外观）模式为子系统中的各类（或结构与方法）提供一个简明一致的界面， * 隐藏子系统的复杂性，使子系统更加容易使用。他是为子系统中的一组接口所提供的一个一致的界面 * * 可简单地
After Effects教程收集 cherishLC After Effects
1、中文入门 http://study.163.com/course/courseMain.htm?courseId=730009 2、videocopilot英文入门教程（中文字幕） http://www.youku.com/playlist_show/id_17893193.html 英文原址： http://www.videocopilot.net/basic/ 素
Linux Apache 安装过程 crabdave apache
Linux Apache 安装过程下载新版本： apr-1.4.2.tar.gz（下载网站：http://apr.apache.org/download.cgi） apr-util-1.3.9.tar.gz（下载网站：http://apr.apache.org/download.cgi） httpd-2.2.15.tar.gz（下载网站：http://httpd.apac
Shell学习之变量赋值和引用 daizj shell 变量引用赋值
本文转自：http://www.cnblogs.com/papam/articles/1548679.html Shell编程中，使用变量无需事先声明，同时变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）中间不能有空格，可以使用下划线（_）不能使用标点符号不能使用bash里的关键字（可用help命令查看保留关键字）需要给变量赋值时，可以这么写：
Java SE 第一讲（Java SE入门、JDK的下载与安装、第一个Java程序、Java程序的编译与执行） dcj3sjt126com java jdk
Java SE 第一讲： Java SE：Java Standard Edition Java ME: Java Mobile Edition Java EE：Java Enterprise Edition Java是由Sun公司推出的（今年初被Oracle公司收购）。收购价格：74亿美金 J2SE、J2ME、J2EE JDK：Java Development
YII给用户登录加上验证码 dcj3sjt126com yii
1、在SiteController中添加如下代码： /** * Declares class-based actions. */ public function actions() { return array( // captcha action renders the CAPTCHA image displ
Lucene使用说明 dyy_gusi Lucene search 分词器
Lucene使用说明 1、lucene简介 1.1、什么是lucene Lucene是一个全文搜索框架，而不是应用产品。因此它并不像baidu或者googleDesktop那种拿来就能用，它只是提供了一种工具让你能实现这些产品和功能。 1.2、lucene能做什么要回答这个问题，先要了解lucene的本质。实际
学习编程并不难,做到以下几点即可! gcq511120594 数据结构编程算法
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
Java面试十问之三：Java与C++内存回收机制的差别 HNUlanwei java C++finalize()堆栈内存回收
大家知道， Java 除了那 8 种基本类型以外，其他都是对象类型（又称为引用类型）的数据。 JVM 会把程序创建的对象存放在堆空间中，那什么又是堆空间呢？其实，堆（ Heap）是一个运行时的数据存储区，从它可以分配大小各异的空间。一般，运行时的数据存储区有堆（ Heap）和堆栈（ Stack），所以要先看它们里面可以分配哪些类型的对象实体，然后才知道如何均衡使用这两种存储区。一般来说，栈中存放的
第二章 Nginx+Lua开发入门 jinnianshilongnian nginx lua
Nginx入门本文目的是学习Nginx+Lua开发，对于Nginx基本知识可以参考如下文章： nginx启动、关闭、重启 http://www.cnblogs.com/derekchen/archive/2011/02/17/1957209.html agentzh 的 Nginx 教程 http://openresty.org/download/agentzh-nginx-tutor
MongoDB windows安装基本命令 liyonghui160com
windows安装安装目录： D:\MongoDB\ 新建目录 D:\MongoDB\data\db 4.启动进城： cd D:\MongoDB\bin mongod -dbpath D:\MongoDB\data\db &n
Linux下通过源码编译安装程序 pda158 linux
一、程序的组成部分　　Linux下程序大都是由以下几部分组成：　　二进制文件：也就是可以运行的程序文件　　库文件：就是通常我们见到的lib目录下的文件　　配置文件：这个不必多说，都知道　　帮助文档：通常是我们在linux下用man命令查看的命令的文档　　二、linux下程序的存放目录　　linux程序的存放目录大致有三个地方：　　/etc, /b
WEB开发编程的职业生涯４个阶段 shw3588 编程 Web 工作生活
觉得自己什么都会 2007年从学校毕业，凭借自己原创的ASP毕业设计，以为自己很厉害似的，信心满满去东莞找工作，找面试成功率确实很高，只是工资不高，但依旧无法磨灭那过分的自信，那时候什么考勤系统、什么OA系统、什么ERP，什么都觉得有信心，这样的生涯大概持续了约一年。根本不是自己想的那样 2008年开始接触很多工作相关的东西，发现太多东西自己根本不会，都需要去学，不管是asp还是js，
遭遇jsonp同域下变作post请求的坑 vb2005xu jsonp 同域post
今天迁移一个站点时遇到一个坑爹问题,同一个jsonp接口在跨域时都能调用成功,但是在同域下调用虽然成功,但是数据却有问题. 此处贴出我的后端代码片段 $mi_id = htmlspecialchars(trim($_GET['mi_id '])); $mi_cv = htmlspecialchars(trim($_GET['mi_cv '])); 贴出我前端代码片段: $.aj

AV1视频编解码器核心编码工具概述

一、介绍

二、AV1编码工具

1.编码块划分

2.帧内预测

1） 帧内预测方向的增强

2）无方向平滑帧内预测器

3）基于递归滤波的帧内预测器

4）从亮度预测色度

5）调色板作为预测器

6）帧内块内复制

3.帧间预测

1）扩展参考帧

2）动态时间与空间运动矢量参考

3）重叠块运动补偿(OBMC)

4）扭曲运动补偿

5）高级复合预测

4. 变换编码

1）变换块分区

2)扩展变换核

5. 熵编码

1) 多符号熵编码

2）水平图系数编码

6. 环路滤波工具和后处理

1）约束方向增强滤波器(CDEF)

2)环路恢复滤波器

3)帧超分辨率

4)胶片颗粒合成

7.Tiles and multi-threading

1) AV1Tiles

2)大规模tiles

参考文献

你可能感兴趣的:(AV1,视频编码,AV1)

1）帧内预测方向的增强