m0_46303430

第四章视频编码原理与技术

4.4.1概述

视频概念
视频编码分类
视频编码的依据

1、视频概念

活动图像信号，也称为数字序列图像或连续帧图像，指由多幅尺寸相同的静止图像组成的图像序列。例如数字化后的电视或视频信号。其中每幅静止图像称为一个帧。

活动图像与静止图像相比，可以认为多了一个时间轴，成为三维信号，因此活动图像也被称为三维图像。

视频图像编码的必要性：由于电视信号数字化后的码率太高，必须先对数据进行压缩编码，然后再进行存储和传输。视频图像编码的目的：就是要在人眼不能察觉、有失真条件下，尽可能采用比较简单有效的编码方法，降低码率，便于能够在给定的通信信道上实时传输视频信号。

视频图像编码的要求：

实时性：图像传输系统必须能实时地对活动电视图像进行编码传输。
高效性：必须能使数字视频信号以一定目标码率传输。如视频信号8bit/像素，数码率高达216Mbit/s。

2、视频编码分类

帧内编码：也称为空间压缩。利用每幅(单帧)图像内部的相关性进行帧内压缩编码。当压缩一帧图像时，仅考虑本帧的数据而不考虑相邻帧之间的冗余信息。帧内一般采用有损压缩算法。压缩后的视频数据仍可以以帧为单位进行编辑。帧内压缩一般达不到很高的压缩比。

帧间编码：也称为时间压缩。利用时间轴上相邻帧之间的相关性(前后两帧信息变化很小)进行帧间压缩编码。帧间压缩一般是无损的。

混合编码：为不同的编码方法组合在一起相结合的编码方法。例如变换编码和帧间预测编码相结合。

3、视频编码的依据

（1）图像信号中存在大量冗余度可供压缩

图像信号中的冗余度存在于图像的结构和统计中。就图像信号结构而言，其帧内和帧间存在很强的相关性，这种相关性就是结构冗余。
在同一幅图像中规则的物体和规则的背景都具有很强的相关性，称之为空间冗余。
相邻帧的时间间隔很短(1/25~1/30s)，在景物运动不很剧烈场合，相邻帧间相关性很强，称之为时间冗余。
信号中这些大量的冗余度可以压缩，在解码后又可以把这些冗余不失真的恢复。

（2）根据内容的重要程度压缩

任何一幅图像，画面的主体或者人们感兴趣的仅仅是其中的中心部分，如人的脸，特别是人的眼睛，这些部分要求准确、细致地出来，而对其每一个像素进行精确的采样、传输、转换。而对画面的背景空间，人眼不十分敏感，则可以进行粗略的描述出来，对数据进行大量的压缩。
可以根据帧的内容，对不同区域(主体和非主体区域)采用不一样的数据传输进行处理，这样可减少传送的数据量，让图像得到压缩(空间压缩)。统计表明，电视信号在相邻像素间，相邻行间存在很强的相关性，即它们之间存在很大的冗余，这也可以让图像得到压缩(结构压缩)。

背景区：指摄像机不动而摄取人物后面的背景。

一般背景区是静止的，若外界条件不变，则这两帧背景区绝大部分数据相同，意味着两帧背景区之间帧间相关性很强。

运动物体区：若将物体运动近似看作简单平移，则第k帧与第k-1帧的运动区的数据也基本相同。

简单平移看作只有x方向位移量 $D_{x}$ ，则可采用某种位移估值方法对位移量进行“运动补偿”。

暴露区：指在运动后所暴露出的原来曾被物体遮盖住区域。

若有存储器将这暴露区的数据暂时存储，则再次经遮盖后再暴露出来的数据与原先存储数据相同，这为一帧间相关性。

这三类区域的帧间相关性是帧间压缩编码的重要依据。

注意：如果将整个画面从一类景物切换为另一类景物时，则谈不上帧间相关性利用。因为整个画面内容数据全部改变了。

（3）利用人的视觉心理特征压缩

人眼的图像的细节分辨率、运动分辨率、对比度分辨率等的要求都有一定限度，而这三者的分辨能力是相互制约的，即人眼对图像的某种分辨率要求很高时，对其他分辨率的要求就低，因此图像信号在空间、时间、幅度等几方面进行数字化的精细程度，只要达到上述分辨率的限制即可，超过没有必要。

人眼的视觉特性是图像压缩编码的另一个重要根据。人眼的视觉系统对于图像的注意是非均匀和非线性的，图像的编码和解码处理尽管引入了噪声使图像发生了变化，但这些变化如果不一定被视觉所查觉，称之为视觉冗余。视觉冗余是可以被压缩的。

（4）从频域分析，图像可压缩

在PAL制电视图像信号的频带宽度6MHZ，但信号的主体只集中了3MHZ以下的中低频段，其高频段往往只是为了表示画面中突变的轮廓和为数不多的图像纹理细节及景物的快速运动。

统计说明，图像信号在大部分时间并不是含有如此高频率分量的信息。所以，从频域的角度来说，图像信号的数据是可以压缩。

4.2.1运动估计与运动补偿

视频编码的关键问题
运动估计
运动补偿
运动补偿帧间预测编码

1、视频编码的关键问题

对于序列图像中大量存在的静止或缓变区域，如何把运动区域和静止或缓变区域分割开来?对于静止区域如何压缩编码？对于运动区域如何压缩编码？

（1）如何把运动区域和静止或缓变区域分割？

（2）如何对于静止或缓变区域压缩编码？

帧(场)重复工作模式:

通常用在可视电话等传输码率很低应用场合。
在序列图像传输中进行抽帧，使少传一些帧。
在接收端可以采用对前帧重复读出方式补满。

（3）如何对运动区域进行压缩编码？

采用运动估计与运动补偿预测方法：

相邻画面高度相似，其中差别变化是由于物体运动或摄像机运动所引起的。
画面中物体或像素的运动是可以估计的。
因此,可以从前面的画面预测当前画面，编码器只对预测误差进行编码。
不能进行预测的画面或区域使用JPEG进行编码（利用画面内部相关性)。

2、运动估计

定义：

将活动图像分为若干个块，检测出当前帧中每个块在前一帧(参考帧)图像中的对应位置，从而可以估计出这个块的位移，用运动矢量表示。这个过程叫做运动估计。运动估计主要用来估计运动矢量。
运动估计通常以宏块为单位进行，计算被压缩图像与参考图像在对应位置处的宏块间的位置偏移。
该位置偏移是以运动矢量描述，代表水平和垂直两个方向的位移。

3、运动补偿

定义

就是根据求出的运动矢量，找到当前帧的像素（或像素块）是从前一帧的哪个位置移动过来的，从而得到当前帧像素（或像素块）的预测值。
由于用当前帧在前一帧图像中对应部分来对当前帧进行预测，而相邻两帧中对应的运动部分图像信息会有所不同，所以一般会产生补偿残差。
运动估计及补偿的基本原理：利用帧间运动估计得到待编码图像块的一个(或多个)参考块，然后用这个参考块进行运动补偿，将补偿后残差进行DCT变换和可变长编码。

4、运动补偿帧间预测编码

定义

对于运动的物体，如果能估计出物体在相邻帧内的相对位移，那么用上一帧中物体的对应区域对当前帧物体进行预测，编码传输预测误差部分，就可压缩这部分区域的码率。这种考虑了运动物体对应区域的位移或运动的预测方式称为运动补偿帧间预测编码。

运动补偿帧间预测编码技术的组成：

物体的划分：划分静止区域和运动区域。这里假设运动物体仅作平移。
运动估计：对每一个运动物体进行位移估计。
运动补偿：由位移估值建立同一运动物体在不同帧空间位置对应关系，建立预测关系。
补偿后的预测信息编码：对运动物体的补偿后的位移帧差信号，以及运动矢量等进行编码传输。

4.4.2块匹配运动估计

基本思想
1. 块与运动矢量的关系
2. 子块大小的选择
提高搜索效率的主要技术
1. 初始搜索点的选择
2. 匹配准则
3. 运动搜索策略

1、基本思想

将视频序列的每一帧都划分为许多大小相同、互不重叠的子块(并做假设：子块内所有像素具有运动一致性，并且只做平移运动，不包含旋转、伸缩)
对每个子块到参考帧某一给定特定搜索范围(匹配窗)内根据一定的匹配准则找出与当前块最相似的块，即预测块（匹配块)
预测块与当前块的相对位移即为运动矢量(Motion Vector,MV)，预测块和当前块之间的差值称为残差图像。

视频压缩的时候，只需保存运动矢量和残差数据就可以完全恢复出当前块；预测越准确，残差中的数值越小,编码后所占用的比特数越少；

利用运动矢量在参考帧上进行运动补偿，补偿残差经DCT变换、量化、编码后与运动矢量共同编码传送。

子块大小的选择：

必须足够大，太小会发生匹配到有相同像素值但与场景无关的块；块小也会增加运算量，同时增加所需传输的运动矢量信息；
必须足够小，若一个块里存在不同的运动矢量，匹配块不能提供准确有效估计。

2、提高搜索效率的主要技术

运动估计算法研究的目标——提高预测精度，加快估计速度，降低编码比特率；
提高算法效率采用的方法：
- 初始搜索点的选择
- 匹配准则
- 运动搜索策略

（1）初始搜索点的选择

运动估计算法研究的目标——直接选择参考帧对应的(0，0)位置。该方法简单，但是易陷入局部最优点(初始步长太大，原点不是最优点，有可能使快速搜索跳出原点周围可能性较大的区域而去搜索远距离的点，导致搜索方向不确定，可能陷入局部最优)。

改进：利用相关性预测初始搜索点，减少搜索次数。

基于SAD(sum of difference)值的起点预测方法——求出当前块与相邻块间的SAD值，选取SAD最小的块的运动矢量作为预测值。预测精度高，计算量大；
基于相邻运动矢量相等的起点预测方法，保证精度基础上利用运动矢量相关性大大减少计算量。

（2）匹配准则

不同的准则函数也就是不同的统计量里面所涉及的运算如上表所示。

（3）运动搜索策略

即如何进行搜索，以保证运动估计的准确性和搜索速度；
存在计算复杂度和搜索精度的矛盾，往往采取折中。
搜索方法有：全搜索、三步搜索、交叉搜索、分层运动估计算法等。

4.3.1快速块匹配算法

分层的和多分辨率的快速块匹配方法
固定搜索模式的快速块匹配方法
降低匹配准则复杂度的快速块匹配方法
基于时空相关性和视觉特性的快速块匹配方法

（1）分层的和多分辨率的快速块匹配方法

用低分辨率块的运动矢量预测较高分辨率块的运动矢量，或者用同一分辨率下大尺寸块的运动矢量预测其内部子块的运动矢量，并在后续搜索中做进一步修正。

缺点：构造多层/多分辨率图像有较大的计算复杂度，且内存需求较大。

（2）固定搜索模式的快速块匹配方法

该方法假设匹配误差随着离全局误差最小点的距离增加而单调增加；
一般从原点开始，采用固定的搜索模板和搜索策略得到最佳匹配块；
著名的算法有：三步法、梯度下降法、四步法、菱形法、六边形法等。

（3）降低匹配准则复杂度的快速块匹配方法

不会减少搜索点数，而是着眼于匹配准则计算复杂度的降低，因而常常用于全搜索法的快速实现；
例如：像素子采样法

像素子采样法：

通常的匹配准则是把块里所有的象素点进行计算和比较，事实上一个块里相邻象素的差别很小，使得它们之间也存在冗余；

子采样运动估计算法就利用了这一事实，只取其中的一部分象素进行计算(比如，可以把这个块中隔行或者隔列进行采样)，可大大减少计算量，但同时降低了准确性。

（4）基于时空相关性和视觉特性的快速块匹配方法

针对固定模式法的不足，近几年来，人们针对序列图像的时空相关性和人眼视觉特性，提出了许多改进算法，主要可分类下面几类：

预测搜索起点、在终止条件上提出改进算法、改进搜索模版、宏块运动类型判别。

<1>预测搜索起点

<2>改变终止条件

由于一般序列中背景块占有相当的比例，对背景块的快速检测对搜索算法的性能提高很大，一般使用终止判别方法；门限值的选择至关重要：

设为固定值
根据邻块SDA值自适应确定(自适应方法一般取邻块SDA的加权和，权重的设计又是一个研究点)

<3>改进搜索模块

在序列图像中，大多数的运动矢量都位于水平或垂直方向，因此有设计了扁平搜索模板（非对称搜索模板)；

在新的算法中，针对运动特别剧烈的宏块，设计了另两种超大模版：大十字模板、多层次六边形模版。

<4>宏块运动类别判断

总结

这节主要是四种类型的快速块匹配方法，以及在每种类型中如何进行思考和改进，来提高块匹配方法的速度和准确度。

4.3.2 全搜索法和三部搜索法

在经典运动估计算法中有一大类就是固定搜索模式的搜索算法，经典运动估计算法中有多种，全搜索法、三步搜索法、新三步搜索法、四步搜索法、基于块的梯度下降搜索法、菱形搜索法、六边形搜索法等等。

1、全搜索法

2、三步搜索法

绿色像素点，所标注的是第一步搜索过程中所设定的9个待匹配位置，这9个待匹配位置相应有9个宏块，这9个宏块和待编码块进行求它的匹配测度，第一步算得9个匹配测度，在这9个匹配测度中最小的那个值，认为是第一步的最优值。

从中心位置到粉色点的矢量就是运动矢量。

3、新三步搜索法（New Three Step Search,NTSS）

视频序列，运动矢量的分布在中心位置上的概率最大，即运动矢量具有中心偏移特性。

4.3.3四步搜索法和菱形搜索法

1、四步搜索法

基于现实中序列图像一个特征，即运动矢量都是中心分布的，从而在5×5搜索窗上构造了9个检测点的搜索模板；

首先用5×5搜索窗
每一步将搜索窗的中心移向最小块误差点处
后两步搜索窗大小依赖于最小块误差点的位置
计算复杂度低，搜索幅度较平滑，不会出现方向上误导

若这次的最匹配点不在窗口边上也不再角上而是在窗口的中心，则缩小搜索窗口为3*3，如果是在边上或四个角上，需要重复上述的步骤。

窗口缩小到3*3后，计算出相邻检测点的最小匹配误差，从而找到最匹配点的位置，即对应最佳运动矢量。

2、菱形搜索法(DS)

搜索窗口太小易陷入局部最优，搜索窗口太大易产生错误的搜索路径；

统计表明，视频图像进行运动估计最优点通常在零矢量周围；基于上述事实，采用两种模板：9个检测点的大菱形模板和5个检测点的小菱形模板；先用大模板计算当最小块误差点出现在中心处时，换为小模板，此时5个点中最小块误差点即为最优匹配点。

菱形搜索法性能分析：

选用了大小两种形状的搜索模版，先用大模板搜索，步长大搜索范围广，进行粗定位，避免搜索窗口太小时，陷入局部最优；粗定位后，再用小模板准确定位，保证匹配精度；
搜索时各步之间相关性强，模板移动只需要在几个新的检测点处进行匹配计算，提高了搜索速度。

固定模式搜索法的缺点：

没有利用图像本身的相关信息，不能根据物体运动的剧烈程度自适应的改变搜索起点和搜索半径；
以菱形法为例，对背景图像，也要经历从大模板到小模板的转换过程，至少需要13个搜索点，搜索速度还有待改进;
对于运动剧烈的图像，从原点开始搜索时，要经过多次搜索才能找到匹配点，搜索点过多，且容易陷入局部最优点。

4.4.1高效视频编码中的编码结构

编码结构的作用

编码结构就是规定图像在编码的时候的编码顺序以及编码类型(对应着编码技术)的，编码类型定了之后相对应的就使用那些具体的编码技术对当前图像进行编码。

全帧内编码结构：在编码时将视频中的所有帧都用帧内预测技术进行编码。视频中所有帧的编码帧类型都是I帧，帧内帧(当前图像中的块在做预测的时候它的最优匹配块只能够在与当前块处于同一个图像里面的其他块来寻找)

在编码视频的时候，会将内容相近相邻的几幅图像组成一起，我们称之为图像组(GOP)

在一个GOP中会将不同的图像分配到不同的时间层。编号1234这四幅图像，认为处在第一个GOP，这四副图像又会近一步分配到不同的时间层上，编号为4的图像处在时间1层，编号为2的处在时间2层，编号为13的两幅图像处在时间3层。

图中箭头表示参考帧的方向，之所以叫帧间帧，也就是说当前图像在编码的时候，处在当前的图像里边的块，它在寻找最优匹配块的时候除了可以在本图像内的块找之外，它还可以在其他图像里边找。

使用帧间预测技术可以有效的消除视频中的时域冗余，因为它利用了图像之间的相关性。

使用低时延编码结构，图像的编码顺序和它的显示顺序是一致的，不存在编码时延的一个问题。

随机接入编码结构的一个缺点：在编码的时候图像的编码顺序和它的实际显示顺序是有差别的，会带来一个比较大的编码时延，不适用于对实时性要求高的场景。

4.5.1高效视频编码中的量化参数选择技术

然后通过结论进行函数化简，再使用数学方法求解函数。

pyhon+ffmpeg 常用音视频处理命令不再游移 ffmpeg 音视频 python
FFmpeg是多媒体领域的万能工具。只要涉及音视频领域的处理，基本上没有它做不了的事情！通俗点讲，从视频录制、视频编辑再到播放，它都能做！前段时间做了个短视频自动化脚本项目，需要自动处理音视频（包括一些合成、拼接、转场、调色等等），当时做的时候找各种命令还是很痛苦的，因此对用到的所有处理命令做了个汇总，方便以后使用。目录一、获取音频时长二、获取视频信息三、获取视频时长四、多个视频合并五、视频提取视
音视频知识图谱 2022.04 关键帧Keyframe
前些时间，我在知识星球上创建了一个音视频技术社群：关键帧的音视频开发圈，在这里群友们会一起做一些打卡任务。比如：周期性地整理音视频相关的面试题，汇集一份音视频面试题集锦，你可以看看《音视频面试题集锦2022.04》。再比如：循序渐进地归纳总结音视频技术知识，绘制一幅音视频知识图谱。下面是2022.04月知识图谱新增的内容节选：1）图谱路径：**采集/音频采集/声音三要素/响度******主观计量响
【物联网技术大作业】设计一个智能家居的应用场景 Dream_Chaser～期末复习智能家居物联网技术期末大作业
前言：本人的物联网技术的期末大作业，希望对你有帮助。目录大作业设计题（1）智能家居的概述。（2）介绍智能家居应用。要求至少5个方面的应用，包括每个应用所采用的设备，性能，功能。（3）画出智能家居应用图，并设计使用。大作业设计题设计一个智能家居的应用场景。要求：（1）智能家居的概述。答：智能家居，又称为智能住宅或家庭自动化，是指运用综合布线、网络通信、安全防范、自动控制及音视频等技术，将家居设施集成
抖音视频搬运如何才能不违规？抖音搬运视频违规有什么后果？氧惠导师
在抖音平台中搬运短视频的人非常多，经常能看到一些视频，别的平台中也会出现，但是又会有所不一样，其实是进行了二次编辑，那么抖音搬运视频怎么做才不会违规呢?➤推荐网购薅羊毛app“氧惠”，一个领隐藏优惠券+现金返利的平台。氧惠只提供领券返利链接，下单全程都在淘宝、京东、拼多多等原平台，更支持抖音、快手电商、外卖红包返利等。（应用市场搜“氧惠”下载，邀请码:521521，全网优惠上氧惠！）➤由于信息差的
WebRTC之LiveKit的基础入门使用（入门必看） tabzzz 前端 webrtc web3 typescript
LiveKit本文主要是讲解在Next13+中如何使用LiveKit来实现简单的音视频通话，想了解更多的还是要去官方文档去掌握更复杂、高级的使用方法。什么是LiveKitLiveKit是一个开源的实时通信平台，基于WebRTC，主要用于构建高质量的音视频通话、实时数据传输和互动应用。LiveKit除了方便以外的大优势就是它提供了丰富的API和SDK，支持多种平台，包括Web、iOS、Android
FFmpeg安装与使用教程 vvvae1234 ffmpeg
FFmpeg是一个强大且灵活的命令行工具，用于处理音频和视频文件。无论是视频格式转换、音频提取还是视频编辑，FFmpeg都能够轻松完成。掌握FFmpeg，将为你的视频处理工作提供极大的便利。在本教程中，我们将详细介绍FFmpeg的安装和使用，包括一些实用的操作案例，帮助你更好地理解如何使用这个强大的工具。2.FFmpeg简介2.1什么是FFmpegFFmpeg是一个开源的音视频处理库，提供了丰富的
Android平台轻量级RTSP服务模块技术接入说明音视频牛哥大牛直播SDK 轻量级RTSP服务 android 音视频轻量级RTSP服务 Android RTSP服务 Android RTSP服务器安卓RTSP服务器大牛直播SDK
技术背景为满足内网无纸化/电子教室等内网超低延迟需求，避免让用户配置单独的服务器，大牛直播SDK在推送端发布了轻量级RTSP服务SDK。轻量级RTSP服务解决的核心痛点是避免用户或者开发者单独部署RTSP或者RTMP服务，实现本地的音视频数据（如摄像头、麦克风），编码后，汇聚到内置RTSP服务，对外提供可供拉流的RTSPURL，轻量级RTSP服务，适用于内网环境下，对并发要求不高的场景，支持H.2
音视频入门基础：WAV专题（11）——FFmpeg源码中计算WAV音频文件每个packet的pts_time、dts_time的实现 cuijiecheng2018 FFmpeg源码分析音视频技术音视频 ffmpeg
=================================================================音视频入门基础：WAV专题系列文章：音视频入门基础：WAV专题（1）——使用FFmpeg命令生成WAV音频文件音视频入门基础：WAV专题（2）——WAV格式简介音视频入门基础：WAV专题（3）——FFmpeg源码中，判断某文件是否为WAV音频文件的实现音视频入门基础：W
移动应用-音视频播放绚烂的萤火移动开发 android 音视频
一.音频1.Mediaplayer设置数据源的三种方式:应用自带的音频,SD卡中的音频、网络音频MediaPlayerplayer＝newMediaPlayer();player=Mediaplayer.create(this,R.raw.XX);player＝MediaPlayer.setDatasource("SD卡路径/网络路径");设置按钮并添加监听事件,实现音乐的播放、暂停2.Sound
2023-06-02《青楼文学与中国文化》陶慕宁64 每天坚持
20230602四点三十一《青楼文学与中国文化》陶慕宁64今天早上起床的闹钟我并没有听见，是我老婆把我叫醒了，昨天晚上睡得挺好，很快就睡觉了，早上有点不想起床，被老婆叫起来了。按说昨天我应该是听完了陶慕宁老师讲的课，但是我的听课记录上显示我没有听完，还是感觉喜马拉雅手机版记录的比较详细，但是喜马拉雅电脑版上的记录没有那么详细，感觉这些音视频软件应该更精准的记录一个人的听课位置，对于我们这些学习的人
神奇酷炫的下拉菜单紫藤11
下拉菜单目前公司的销售报表上，用有这个功能，真心方便，感谢小哈录制的抖音视频，但操作更简单。一、基本用法直接按住Alt+↓即可快速生成,注意：想要实现这样的功能前提是已经输入部分内容二、进阶用法1.提示信息2.出错警告3.圈释无效信息第一次作用圈释无效信息的功能三、动态下拉列表选取数据→定义名称→数据验证→序列→输入=名称四、快速录入当前时间=now（）数据验证设置单元格格式五、借贷只能一方输入选
01-Flink安装部署及入门案例（仅供学习），音视频时代你还不会NDK开发小猪佩琪962 2024年程序员学习 flink 学习大数据
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新大数据全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵
千万级规模高性能、高并发的网络架构经验分享搬砖养女人网络架构经验分享
主题：INTO100沙龙时间：2015年11月21日下午地点：梦想加联合办公空间分享人：卫向军（毕业于北京邮电大学，现任微博平台架构师，先后在微软、金山云、新浪微博从事技术研发工作，专注于系统架构设计、音视频通讯系统、分布式文件系统和数据挖掘等领域。）架构以及我理解中架构的本质在开始谈我对架构本质的理解之前，先谈谈对今天技术沙龙主题的个人见解，千万级规模的网站感觉数量级是非常大的，对这个数量级我们
2023-07-25《优势教养》127 每天坚持
20230725四点三十五星期二《优势教养》127昨天晚上睡得早，我八点五十多就到家了，催着孩子们睡觉，孩子们睡的就早，我在水里边洗了一会，拉了几下单杠，顺着老路回来了，昨天温度比较低，感觉能听进去音视频。昨天下午没有怎么睡着，晚上也感觉没有精神。昨天下午老婆带着儿女去收拾牙，我在家没事，也没有写文章，昨天上午去姐家看她家修水，耽误昨天的两千字的电子日记也没有完成，昨天的作业打卡还没有设计好，昨天
音视频编解码技术（二）：AAC 音频编码技术音视频开发老马音视频开发流媒体服务器 Android音视频开发视频编解码音视频网络协议实时音视频网络
一、AAC编码概述AAC是高级音频编码（AdvancedAudioCoding）的缩写，出现于1997年，最初是基于MPEG-2的音频编码技术，目的是取代MP3格式。2000年，MPEG-4标准出台，AAC重新集成了其它技术包括SBR或PS特性，目前AAC可以定义为⼀种由MPEG-4标准定义的有损音频压缩格式二、AAC编码规格简述AAC共有9种规格，以适应不同的场合的需要：MPEG-2AACLC低
ffplay音视频同步分析攻城狮百里音视频音视频 C++ffplay
ffplay默认也是采用的这种同步策略。主流程ffplay中将视频同步到音频的主要方案是，如果视频播放过快，则重复播放上一帧，以等待音频；如果视频播放过慢，则丢帧追赶音频。这一部分的逻辑实现在视频输出函数video_refresh中，分析代码前，我们先来回顾下这个函数的流程图：在这个流程中，“计算上一帧显示时长”这一步骤至关重要。先来看下代码：staticvoidvideo_refresh(voi
音视频入门基础：WAV专题（5）——FFmpeg源码中解码WAV Header的实现 cuijiecheng2018 FFmpeg源码分析音视频技术音视频 ffmpeg
=================================================================音视频入门基础：WAV专题系列文章：音视频入门基础：WAV专题（1）——使用FFmpeg命令生成WAV音频文件音视频入门基础：WAV专题（2）——WAV格式简介音视频入门基础：WAV专题（3）——FFmpeg源码中，判断某文件是否为WAV音频文件的实现音视频入门基础：W
OpenHarmony 5.0 纯血鸿蒙系统 ejinxian harmonyos 华为
OpenHarmony-v5.0-Beta1版本已于2024-06-20发布。OpenHarmony5.0Beta1版本标准系统能力持续完善，ArkUI完善了组件通过CAPI调用的能力；应用框架细化了生命周期管理能力，完善了应用拉起、跳转的能力；分布式软总线连接能力和规格进一步增强；媒体完善了框架能力、视频编解码能力、音视频的应用能力，媒体库丰富了使用场景，提供更好的使用体验。OpenHarmon
即时通讯项目 NingDream816 即时通讯项目网络 redis 数据库服务器缓存设计模式
即时通讯项目需求分析功能约束可行解更优解高性能接入层优化存储层优化消息时序一致性高可用需求分析功能添加好友聊天会话列表单聊AB群聊多设备登录消息漫游消息已读，查看已读/未读列表视频通话(学音视频技术时补上)语音通话约束DAU(DailyActiveUsers，日活跃用户数量)10亿假设每人平均每天发100条消息，1000Mli*100/86400=12MliQPS(Queriespersecond
MediaStream 的媒体流对象 (stream) 和流媒体轨道 (track) 详解 Wu Youlu 前端
navigator.mediaDevices.getUserMedia和MediaStream是实时音视频处理的重要API。通过这些API，可以从摄像头、麦克风或其他设备捕获音视频流，应用于视频通话、录制等场景。本文将介绍navigator.mediaDevices.getUserMedia的参数配置、MediaStream的传参、属性和方法，配合详细的代码示例，特别是如何动态添加和移除音视频轨道
ffmpeg一些基本用法 980205 ffmpeg 流媒体
来源：ffmpeg一些基本用法|王石头的博客(iwangsen.com)音视频操作，几乎绕不开ffmpeg，因为市面上绝大多数音视频播放软件、转码软件，内核都是它。它非常的强大，轻松几条命令就可以顺利完成你想做的工作我来汇总一些经常使用的命令首先在cmd窗口进入到ffmpeg目录里面最简单的视频格式转换ffmpeg-iD:\Media\IMG_0873.MOV-ccopyD:\Media\outp
走自己的路，随自己的心减读
“走自己的路，让别人去说吧”，就是一种人生态度。别人去说，是在浪费他自己的时间，而你只管活好自己的生活。被大家熟知的超级演说家总冠军刘媛媛曾经在她的抖音视频中说：“不喜欢我的人，为啥不是你改是我改，你让别人改，别人不改，然后你就会很痛苦。”最后一句“你不喜欢我，你自己改吧。”未尝不是一种只随我心的人生态度。还记得那位今年在《脱口秀大会》上爆火的北大女生李雪琴吗？她看起一脸“丧”劲儿，凭着自己的智慧
抖音视频去水印，获取无水印原视频的方法及过程分析。附上代码截图，很简单，主要是分析过程废了些时间。 liqizheng_ 笔记 php
抖音视频去水印获取原视频地址的方法及过程分析。附上代码截图，很简单，主要是分析过程废了些时间.前言：抖音视频自己保存的都带有抖音的logo和视频片尾，让一些做自媒体和搬运工的朋友感到不爽，想要搬运还有水印，于是网上出现好多视频无水印解析的网站，包括微信小程序和公众号都在做，引流也确实可以，但是大部分都是调用的其它网站提供的解析接口，往往一些还要付费，或者不稳定各种问题。，因为他们都不是从最原始的代
抖音视频怎么去水印保存到手机上 Java搬砖组长音视频
抖音已经成为人们日常消遣的主要平台之一。无论是搞笑的视频、感人的短片，还是充满创意的短视频，抖音总能给人带来无限的欢乐与惊喜。有时候我们可能会想要将喜欢的视频保存到手机上，方便离线观看或与朋友分享，但这些视频通常会带有抖音的水印。这篇文章将向大家介绍如何去除抖音视频的水印并保存到手机上。1.使用第三方工具网站去水印许多第三方应用程序和网站可以帮助用户去除抖音视频的水印。例如，“视频解析器（www.
FFmpeg任意文件读取漏洞分析音视频开发老马 ffmpeg
背景介绍FFmpeg是一套目前非常流行的可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序。它提供了录制、转换以及流化音视频的完整解决方案。目前有非常多的视音频软件或是视频网站、手机APP都采用了这个库，但是这个库历史上曝出的漏洞也非常之多。这次的漏洞是利用了ffmpeg可以处理HLS播放列表的功能，在AVI文件中的GAB2字幕块中嵌入了一个HLS文件，然后提供给ffmpeg进行转
rk3588音视频硬件编解码介绍三十度角阳光的问候音视频
目录ffmpegrk3588系列芯片编程方法最终的输出结果ffmpeg示例程序ffmpeg音视频处理中通常是用ffmpeg进行软件音视频编解码aac/h264编码，但其运行速度过慢消耗cpu占用率。因此需要寻找音视频硬件编解码方法。rk3588系列芯片自带音视频硬件编解码框架ffmedia或者mpp，其内部原理是配合内部硬件rga内存，把音视频数据读入内部rga内存中进行Mpp硬件编解码计算，包括
OpenglEs之EGL环境搭建 FlyerGo Opengl 音视频 c++opengl
前言前面我们发布了一系列的入门教程，例如C++系列的指针扫盲、多线程的使用等，JNI入门系列，ffmpeg入门系列等，有感兴趣的童鞋们可以关注往回自行查阅。今天我们的主题依然是音视频开发的范畴，做过音视频开发的都知道Opengl也是音视频开发中的一项重要技能，特别是涉及到视频录制、特效处理、画质渲染细分功能。因此后续笔者打算再出一系列的OpenglES的学习笔记，希望能与大家共同温故知新。因为前面
FFmpeg的入门实践系列七(滤镜) 星海逐愿 ffmpeg ffmpeg
欢迎诸位来阅读在下的博文~在这里，在下会不定期发表一些浅薄的知识和经验，望诸位能与在下多多交流，共同努力文章目录前期博客一、滤镜过滤器filter的简介FFmpeg编程的四大结构体1.滤镜AVFilter2.滤镜图AVFilterGraph3.滤镜实例AVFilterContext4.滤镜输入输出参数AVFilterInOut二、使用滤镜加工音视频前期博客FFmpeg的入门实践系列一(环境搭建)F
Linux 编译 qtav,QtAV 1.3.3 发布，跨平台音视频播放库丶本心灬 Linux 编译 qtav
QtAV1.3.3发布-支持调用NVIDIA的cuvid库进行CUDA硬解。支持平台：windows,linux。(是linux上第一个支持cuda硬解的么？)。有些视频播放会抖动，目前原因还不清楚。4k硬解画面貌似有点花，效果不如lavfilters好。-OpenGL和OpenGLES2支持16-bit的YUV渲染，包括9,10,12,14,16bit的little/bigendian的yuv。
ffmpeg命令详解 weixin_42178492 java 基础工作相关经验集锦
ffmpeg命令详解(转)FFmpeg是一套可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化音视频的完整解决方案。它包含了非常先进的音频/视频编解码库libavcodec，为了保证高可移植性和编解码质量，libavcodec里很多code都是从头开发的。[百度百科]ffmpeg使用语法ffmpeg使用语法：ffmpeg[[o
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源

第四章 视频编码原理与技术