随心飘散

浅谈视频会议中H.264编码标准的技术发展

数字视频技术广泛应用于通信、计算机、广播电视等领域，带来了会议电视、可视电话及数字电视、媒体存储等一系列应用，促使了许多视频编码标准的产生。ITU-T 与ISO/IEC 是制定视频编码标准的两大组织，ITU-T 的标准包括H.261、H.262、H.263、H.264，主要应用于实时视频通信领域，如会议电视；MPEG 系列标准是由ISO/IEC制定的，主要应用于视频存储(DVD)、广播电视、因特网或无线网上的流媒体等。两个组织也共同制定了一些标准，H.262 标准等同于MPEG-2 的视频编码标准，而目前最热门的H.264 标准则是MPEG-4 的第10 部分。

一、视频编码标准的发展
1、H.261 视频编码标准
H.261 是ITU-T 为在综合业务数字网(ISDN)上开展双向声像业务(可视电话、视频会议)而制定的，速率为64kb/s的整数倍。H.261 只对CIF 和QCIF 两种图像格式进行处理，每帧图像分成图像层、宏块组(GOB)层、宏块(MB)层、块(Block)层来处理。
H.261 是最早的运动图像压缩标准，它详细制定了视频编码的各个部分，包括运动补偿的帧间预测、DCT 变换、量化、熵编码，以及与固定速率的信道相适配的速率控制等部分。

2、H.262 视频编码标准（又称MPEG-2）
由MPEG-1 扩充而来，支持隔行扫描。使用十分广泛，几乎用于所有的数字电视系统，适合标清和高清电视，适合各种媒体传输，包括卫星、有线、地面等，都能有效地传输。

3、H.263 视频编码标准
H.263 是最早用于低码率视频编码的ITU-T 标准，是ITU-T 为低于64kb/s 的窄带通信信道制定的视频编码标准。它是在H.261 基础上发展起来的，其标准输入图像格式可以是S-QCIF、QCIF、CIF、4CIF 或者16CIF 的彩色4∶2∶0 亚取样图像。H.263 与H.261 相比采用了半象素的运动补偿，并增加了4 种有效的压缩编码模式。随后出现的第二版(H.263+)及H.263++增加了许多选项，使其具有更广泛的适用性。由于H.263的编码效率很高，H.263 Version 1只用H.261码率的一半就可以达到相同的重建图像质量，因此成为视频会议和可视电话应用的主角。通过前后三个版本的更新，H.263的编码性能得到很大提高。多个算法被最新标准H.264所沿用。

4、H.264 视频编码标准
H.264 是由ISO/IEC 与ITU-T 组成的联合视频组(JVT)制定的新一代视频压缩编码标准。1996 年制定H.263标准后，ITU-T 的视频编码专家组(VCEG)开始了两个方面的研究：一个是短期研究计划，在H.263 基础上增加选项(之后产生了H.263+与H.263++)；另一个是长期研究计划，制定一种新标准以支持低码率的视频通信。长期研究计划产生了H.26L 标准草案，其目标是研制出新的压缩标准，与以前的任何标准相比，效率要提高一倍，同时具有简单、直观的视频编码技术，网络友好的视频描述，适合交互和非交互式应用（广播、存储、流煤体）。
2001 年，ISO 的MPEG 组织认识到H.26L 潜在的优势，随后ISO 与ITU 开始组建包括来自ISO/IEC MPEG与ITU-T VCEG 的联合视频组(JVT)，JVT 的主要任务就是将H.26L 草案发展为一个国际性标准。于是，在ISO/IEC中该标准命名为AVC(Advanced Video Coding)，作为MPEG-4 标准的第10 个选项；在ITU-T 中正式命名为H.264标准。该标准在2003 年3 月正式获得批准。

二、各类视频编解码标准比较分析
比较之前的标准H.261建议，H.263提高性能的技术包括：无限制运动补偿，8×8的帧间预测方块（于是每个宏块包含4个帧间预测方块所对应的4个运动矢量），重叠块运动补偿，变换域的直流及低频信号成份块间预测，基于语法的算术编码等。还有一些应用较少的技术包括可交替使用的帧间VLC变长码模式，PB帧，降低分辨率的编码方法。H.263还允许使用多个过去帧作为参考帧。其中H.263 Annex N只考虑差错适应力，每一帧使用同一个参考帧。H.263 Annex U兼顾编码效率和差错适应力，在宏块层次上选择最佳运动补偿帧间预测的参考帧，每一个宏块使用同一个参考帧。
MPEG-2和MPEG-4是另外一个国际标准化组织—国际标准化组织IEO和国际电工委员会IEC的联合体 JTC1属下的运动图像专家组MPEG （Moving Picture Experts Group）制定的视频信源编码国际标准。其中MPEG-2标准编号ISO/IEC 13818，名称为“运动图像及其伴音的通用编码”；MPEG-4标准编号ISO/IEC 14496，名称为“音视频对象的编码”。本来，VCEG制定的H.26x建议更多考虑实时视频传输应用，如视频会议及其简化形式—可视电话，而MPEG标准更多考虑满足视频存贮（DVD），广播视频（电视广播），流媒体传输（如通过Internet，数字用户线DSL以及无线信道的视频传输）的应用要求，但是自MPEG-2作为第一个通用视频编码标准（通用的意思就是标准内容考虑到并且适合于所有应用）出现以后，MPEG标准也提供了适合于会议电视和可视电话的工具集（称为Profile），从而具备了应用于会议电视和可视电话的条件。在专门针对会议电视和可视电话应用的MPEG标准Profile中，第一版本的MPEG-4（称为MPEG-4 SP）在性能上与H.263+相当，内容相互借鉴，具体算法大同小异；第二版本的MPEG-4（称为MPEG-4 ASP）在加入1/4像素精度运动补偿后优于H.263+，但是因其运算量及实现复杂度较高（其1/4像素精度运动内插过程甚至在运算量及实现复杂度上高于H.264的1/4像素精度运动内插过程）未投入实际应用；MPEG-2则在性能上优于H.261而劣于H.263。
最新视频编码标准H.264比以前性能最好的标准H.263和MPEG-4提高编码效率约50%。意味着H.264仅需H.263或MPEG-4一半的码率便可重建出相同质量的图像，采用H.264的多媒体系统在图像质量上大大优于现有系统，包括当前主流的基于H.263的会议电视系统。H.264仍然沿用H.261奠定的运动补偿帧间预测结合分块正交变换的常规编码方法。相对于现有标准，H.264的变化实际上是放松了施加在现有标准上的实现复杂度和运算量的限制，把现有常规算法发挥至极限，从而以巨大运算量为代价取得图像质量的提高。其中H.264改善性能的内容包括：
4×4整数变换—变换矩阵系数只有±1、±2取值，具有较小方块(意味着较少运算量)、整数变换、无乘法、16位运算位长的优点，避免了一向困扰视频编码的浮点IDCT失谐问题，同时增强运动模型对于复杂运动的适应力。
二次正交变换—为了改善大面积平坦图像区域的编码性能，H.264提供一种新的16×16帧内编码模式，对亮度信号执行二重变换：第一次变换是H.264的4×4变换；第二次变换是对16个4×4变换系数块的直流系数执行4×4 Hadamard变换，对色差信号也采用相似的处理，从而提高压缩性能
7种运动补偿分块形状和精细到8x8的树状块分割方法—H.264提供16×16、16×8、8×16、8×8、8×4、4×8、4×4共7种方块，同时把16x16的宏块分成4个8×8亚宏块，同亚宏块同形状，而同16x16宏块内不同8x8亚宏块的方块形状可以不同，从而能够更精确地描述图像运动，获得更高编码效率
1/4像素精度运动补偿和运动矢量—运动补偿和运动矢量达到更高精度，不仅使求得的图像帧间位移更精确，而且改善预测图像的低通滤波性质，获得更高的预测效率
精细到8×8亚宏块层的多参考帧选择—H.264在8×8亚宏块层次上选择最佳预测的参考帧，增加了搜索到比前一帧最佳预测图像块更优的图像块的机会，提高帧间预测对于复杂图像内容的适应力
空间域的帧内块间预测—为了弥补4×4变换在消除大面积图像区域相关性上不如8×8变换的缺陷，H.264在图像空间域利用编解码顺序前的相邻的4x4块的边界重建图像像素值对每个4x4方块进行低频成份的块间预测，帧内块间预测方式共9种。对于16×16帧内编码模式也用类似的块间预测，预测方式有4种。H.264的块间预测算法可以获得高于H.263 Annex I块间预测算法的编码效率，尤其对于P帧和B帧中出现机会不大的帧内编码宏块。
两种熵编码—针对会议电视和可视电话应用的H.264基线版本对除变换系数以外的语法元素采用通用变长编码UVLC（Universal Variable Length Coding），对变换系数采用基于文本的自适应变长编码CAVLC（Content-based Adaptive Variable Length Coding），其中UVLC优点是：①直接随码字构造规则无限扩充码字；②不需要符号与码字转换的查找表；③码字的结尾标志使译码简单；CAVLC属于高阶Markov链相关信源编码，使变换系数的run和level符号的码表能够自适应于各自的概率统计模型，从而获得高于UVLC的编码效率
去方块效应滤波—H.264的去方块滤波放置在环路内，能够自适应于图像波形和编码情况，执行适度平滑处理，做到：既有效去除方块效应，又保持图像的真实边缘和纹理细节，同时达到图像质量和运算量的良好折衷
参数集—从媒体流中把与很多个Slice相关的共同信息抽出来，形成一个自包含的数据包，这种更高层的信息以独立于Slice流更可靠地、异步地传输，其中把一个视频码流序列中所有帧图像码流所共同的头信息提取出来，形成序列参数集，把一帧图像码流中所有slice码流所共同的头信息提取出来，形成图像参数集，参数集的好处在于灵活地传送更高层数据：①当改变参数集时(如更改图像尺寸)，不需要在Slice流中同步发送参数集，如果发送端和接收端同时拥有一系列的参数集，由每个Slice头的参数集id指示码字指示所采用的参数集；②通过应用层的设计可以使确定的两端之间永远也不发送任何参数集；③参数集的传输方式任意，可以独立于Slice流的传输，可以通过H.264外部方式传送，如能力交换或控制协议
视频码流的封装格式—H.264标准本身提供一种视频码流的封装格式，称为网络提取层单元NAL（Network Abstraction Layer）Unit，经过NALU封装的视频码流数据既适合于包传输（如通过IP网的包交换传输）又适合于字节流传输（如通过PSTN网的电路交换传输）

三、H.263与H.264的率失真性能比较

图为：H.263与H.264的率失真性能比较

图中测试结果显示，对于通常的逐行扫描的视频源，2003年4月的H.264（参考软件版本JM6）与1999年8月的H.263和早期的H.264（当时称为H.26L，相应参考软件版本TML-1）比较，在相同码率下解码重建图像质量提高2~3dB，或者当重建图像质量相同时码率下降40%~60%。
以上测试结果由ITU-T发布，见于T. Wiegand， et al. Overview of the H.264/AVC Video Coding Standard. IEEE Trans. on CSVT， July 2003， 13(7): 560-576。

以上测试表明H.264 Main Profile比H.263++在采用五个参考帧的情况下在相同重建图像质量下码率下降48.80%。

四、H.261、H.263、H.264应用对比表

H.264 标准的推出，是视频编码标准的一次里程碑式的重要进步，它与现有的MPEG-2、MPEG-4 SP 及H.263相比，具有明显的优越性，特别是在编码效率上的提高，使之能用于许多新的领域。同等的图像质量条件下，H.264的数据压缩比能比当前DVD系统中使用的MPEG-2高2-3倍，比MPEG-4高1.5-2倍，比H.263高2倍。

五、视讯会议发展的现状和未来
目前视讯会议系统已经切换到以H.264为主的发展道路上来。目前各厂家实现得最多的是H.264 CIF实时编码，却很少有厂家做到真正实时的H.264 4CIF编码。在这种情况下，各厂家都却将眼光直接放在了更高分辨率的实时编码上，也就是720p。
这里先解释一下几种标准分辨率的大小:
CIF 352×288 像素 25帧/秒
4CIF 704×576 像素 25帧/秒 50场/秒
720P 1280×720像素 60帧/秒
1080I 1920×1080像素 30帧/秒 60场/秒
1080P 1920×1080像素 60帧/秒
这里能够看到，4CIF和1080I这2个分辨了是有场的概念的，而CIF 720P 1080P是没有场的概念的。原因是CIF分辨率太小，无法形成两场数据，4CIF和1080I的采集和显示是隔行扫描的，而720P 1080P是逐行扫描的。
视频显示有两种基本方式：隔行扫描和逐行扫描。逐行扫描，一次显示图象的所有水平线，作为一帧。当帧频能够达到要求时，逐行扫描无疑是最佳方案，而当帧频不能达到要求时，人肉眼会看到图像有跳动感，隔行扫描解决这个问题。隔行扫描，一次只显示一半水平线，第一个扫描场，包含所有奇数线，接下来的第二个扫描场，包含所有偶数线。隔行扫描依赖人眼的视觉暂留特性，形成人眼感觉到的是整幅图象。隔行扫描的优点是只要原来的一半数据量就可以获得高连续性，缺点是在高亮度物体边缘处易出现闪烁等缺陷，因为通常要增加图像滤波以避免这些缺陷。
720p是60帧/秒的逐行扫描图像。然而，目前能够实现的720p却不是真正意义的720p，目前能够实现的720p只有30帧/秒。人肉眼能够察觉的时间间隔是20ms左右，而对于30帧/秒的720p，两帧之间的时间间隔为33ms，肉眼可以明显察觉到图像的跳动感，会感觉眼睛疲劳。而4CIF的采集及播放都是采用50场/秒的隔行扫描方式，两场之间的时间间隔为20ms，肉眼刚好感觉图像是连续的。因此在图像连续性上，也就是肉眼对运动物体的感觉舒适度上，720p 30帧/秒败给了4CIF 50场/秒。
所以，H.264 720p 30帧/秒不能做为一个行业的发展方向，而只能是很快被淘汰的过渡产品。真正的发展方向应该是H.264 720p 60帧/秒或1080i 60场/秒。

Metal初探 Jeffery_zc
1.Metal简介Metal是苹果为了减少对OpenGLES的依赖所封装的框架，在iOS系统中，Metal可以发挥GPU的最大性能。在做音视频编码和解码时，由于需要进行大量高并发的运算，在苹果中，运用到了硬件加速器，也就是GPU芯片，因为GPU上有大量的计算单元，可以做到真正的高并发运算。在Metal框架中，也为我们提供了可以自定义编程的入口，可以对一些机器学习进行并发处理，像一些AI处理等。也就
20240210使用剪映识别字幕的时候的GPU占比RX580-RTX4090 南棱笑笑生杂质杂质
20240210使用剪映识别字幕的时候的GPU占比RX580-RTX40902024/2/1017:54【使用剪映识别不同的封装格式，不同的音视频编码，对GPU的占用率可能会有比较大的不同！】很容易发现在在WIN10下使用剪映的时候，X99+RX550组合。GPU部分：3D占用率刚好过半！Copy几乎没有使用！VideoEncode拉满！VideoDecode几乎没有使用！专用显存占用过半。4GB
SkeyeWebPlayer.js H5播放器打响第一枪 javascript 前端
SkeyeWebPlayer.jsH5播放器，是一款能够同时支持HTTP、HTTP-FLV、HLS（m3u8）视频直播与视频点播等多种协议，支持H.264、H.265、AAC等多种音视频编码格式，支持mse、wasm等多种解码方式。功能说明支持m3u8/HLS播放;支持HTTP-FLV/WS-FLV播放;支持H265播放;支持直播和点播播放;支持全屏显示;支持重连播放；SkeyeWebPlayer
【Android音视频开发】音频编码原理 JesseAndroid Android音视频开发音视频音频视频编解码
文章变更表文章版本号变更内容变更日期备注0.0.1创建2022/9/29初版0.0.2补充编码原理和音频格式等内容2022/9/301.前言在【Android音视频开发】这一系列文章的开头，介绍一下音视频编码的原理是很有必要的，有利于对后续出现的概念的理解。此处先讲音频，视频编码的原理将在另一篇文章中讲述。2.正文2.1声音的本质声音的本质是在介质中传递的声波，既然是一种波，那么它就会具有以下几个
Android音视频编码(2) helloworddm android 音视频
Android本身提供了音视频编解码工具，很多时候是不需要第三方工具的，比如ffmpeg,OpenCV等，在android中引入第三库比较复杂，在Android音视频编码中介绍了如何引入第三方库libpng来进行进行图片处理，同时引入这些第三方库，是程序结构变得复杂。本文介绍的音视频编解码利用的就是android自带的MediaCodec。视频编码之后，你可以对视频做任何形式的处理，比如添加广告，
C/C++编程：ffmpeg简介 OceanStar的学习笔记 C++c++java
什么是ffmpegffmpeg即使一款音视频编解码工具，同时也是一组音视频编解码开发套件，作为编解码开发套件，它为开发者提供了丰富的音视频处理的调用接口ffmpeg提供了多种媒体格式的封装和解封装，包括多种音视频编码、多种协议的流媒体、多种色彩格式转换、多种采样率转换、多种码率转换等；ffmpeg框架提供了多种丰富的插件模块，包含封装和解封装的插件、编码与解码的插件等官网ffmpeg的基本组成ff
FFmpeg视频解码流程笔记 fdsafwagdagadg6576 音视频 ffmpeg
系列文章：https://blog.csdn.net/fdsafwagdagadg6576/article/details/122788243FFmpeg音视频编码流程_fdsafwagdagadg6576的专栏-CSDN博客本文内容摘自附录blog,介绍使用libavcodec和不使用两种情况，解码流程一视频解码封装文件解码流程(使用libavcodec)2.1ffmpeg的解码和编码都遵循其基
交叉编译-16：live555交叉编译(Windows和君正平台) 椰果奶茶加冰交叉编译 liv555 交叉编译
一、简介Live555是一个为流媒体提供解决方案的跨平台的C++开源项目，它实现了对标准流媒体传输协议如RTP/RTCP、RTSP、SIP等的支持。Live555实现了对多种音视频编码格式的音视频数据的流化、接收和处理等支持，包括MPEG、H.263+、DV、JPEG视频和多种音频编码。同时由于良好的设计，Live555非常容易扩展对其他格式的支持。目前，Live555已经被用于多款播放器的流媒体
音视频编码基础知识 WongKyunban 音视频开发音视频
视频编码指的是通过特定的压缩技术将一种视频格式文件转换成另一种视频格式文件的过程。常见的视频编码：MPEG类MPEG1（VCD等使用），MPEG2（DVD等使用），MPEG4（DivX，XviD是它的变体），MPEG4AVC等H.26x类H.261,H.262,H.263,H.263+,H.263++,H.264,H.265常见的音频编码：MPEGAudioLayer1/2，MPEGAudioLa
什么是流媒体 WongKyunban 音视频开发音视频 ffmpeg
所谓的流媒体是指将一连串的媒体数据压缩后，经过网络分段发送数据，在网上即时传输音视频以供观赏的一种技术。如果没有流媒体技术，那么在观赏前必须下载整个媒体文件。常见流媒体协议：RTSPRTPHTTPHLSRTMPHTTP-FLV等目前应用流媒体技术就多的场景就是直播场景。完整的直播系统包括以下这些过程：音视频采集音视频编码音视频推流音视频拉流音视频分发音视频转码认证鉴权还有响应政策方面的自动鉴黄它的
音视频的编码格式与封装格式 WongKyunban 音视频开发音视频
音视频的编码格式与封装格式是两个不同的概念，视频封装格式常见的有：mp4，rmvb，avi，mkv，mov，mpg，vob，3gp，asf，rmvb，wmv，divx，flv，ts/ps，rm，webm，dat，mpeg，ogg，这些视频封装格式是包裹了音视频编码数据的容器，把特定编码标准编码的视频流和音频流混在一起。在移动端一般将视频封装为mp4格式，mp4支持H.264,H.265等视频编码和
FFmpeg项目的组成 WongKyunban 音视频开发 ffmpeg
主要由三个部分组成：工具ffmpeg：用于音视频转码、转换ffplay：音视频播放器ffserver：流媒体服务器ffprobe：多媒体码流分析器SDK这个部分是供开发者使用的SDK，SDK是编译好的库。基本上每个平台都有对应的SDK。这个SDK包括以下这些库：libavcodec：音视频编码器和解码器。libavutil：编程工具，如随机数生成器、数据结构、数学函数等。libavformat：多
ffmpeg相关命令云端一散仙 FFmpeg ffmpeg
视频转码dav转化为mp4格式ffmpeg-i2021-08-10.dav-codeccopy11.mp4二进制文件转为mp4格式//-c:v指定视频流编码器，不指定编码会默认用mp4这种容器的默认音视频编码进入编码//copy：不重新编码直接copy源视频流ffmpeg-i1701687125-4fc72a-0100-2988-c:vcopy1.mp4ffmpeg-iin.mkv-c:vlibx
AAC音视频编码详解音视频开发老马 Android音视频开发音视频开发流媒体服务器 aac 音视频 ffmpeg 视频编解码实时音视频
一、AAC编码概述AAC是高级音频编码（AdvancedAudioCoding）的缩写，出现于1997年，最初是基于MPEG-2的音频编码技术，目的是取代MP3格式。2000年，MPEG-4标准出台，AAC重新集成了其它技术（PS,SBR），为区别于传统的MPEG-2AAC，故含有SBR或PS特性的AAC又称为MPEG-4AAC。AAC是新一代的音频有损压缩技术，它通过一些附加的编码技术（比如PS
音视频封装格式：AAC音频基础和ADTS打包方案详解音视频开发老马音视频视频编解码实时音视频 webrtc c++
问题背景：现在主流的封装格式支持的音视频编码标配是H264+AAC，其中像TS、RTP、FLV、MP4都支持音频的AAC编码方式。当然，后继者不乏Opus这种编码方式，它主要应用在互联网场景，比如现在谷歌的WebRTC音视频解决方案就用的Opus，最新发布的Android10支持的音视频编码方式就是AV1和Opus，但是AAC目前在广电，安防，电影院等还是应用最多，Opus目前还不足以威胁到AAC
ffmpeg 命令行总结若之灵动音视频 ffmpeg 音视频 ffmpeg命令行
ffmpeg：超快音视频编码器ffplay：简单媒体播放器ffprobe：简单多媒体流分析器#将视频文件转成yuvffmpeg-itest.mp4-s960*544-pix_fmtyuv420ptest.yuv#将帮助信息输出到文件中ffmpeg-h>ffmpeg_h.logffmpeg-hlong>ffmpeg_h_log.logffmpeg-hfull>ffmpeg_h_full.logffp
王学岗视频编码————视频编解码基础与MediaCodec编解码(对应1234节) qczg_wxg android音视频开发音视频
为什么要学习音视频核心竞争力，高端人才相当缺乏，技术迭代慢，为什么音视频学不好资料比较少，音视频最难的地方在于编码，没有形成完整的体系关于音视频编码上1，视频文件：MP4，RMVB，AVI，FLV2，现在学音视频和以前的区别，以前：播放本地文件，现在：播放网络流(视频流和音频流)3，RMVB、MP4等是封装格式，是一个容器，包含音频流和视频流4，在网络上传播不传RMVB、MP4这些封装格式，我们传
js获取音视频编码 LionHeart丶 javascript 开发语言 ecmascript
1、（推荐）mp4box详细链接js获取视频编码格式信息-菜小牛-博客园2、mediainfo.js详细链接mediainfo.js获取视频详细信息，js获取视频帧数-灰信网（软件开发博客聚合）
音视频封装格式：AAC音频基础和ADTS打包方案详解十年编程老舅音视频开发音视频 aac ADTS ffmpeg 音视频开发音视频编解码 C++音视频
现在主流的封装格式支持的音视频编码标配是H264+AAC，其中像TS、RTP、FLV、MP4都支持音频的AAC编码方式。当然，后继者不乏Opus这种编码方式，它主要应用在互联网场景，比如现在谷歌的WebRTC音视频解决方案就用的Opus，但是AAC目前在广电，安防，电影院等还是应用最多，Opus目前还不足以威胁到AAC的地位。本篇文章准备讲解下AAC的封装格式ADTS字段含义和解封装，顺便讲解下A
音视频开发（二十四）：音视频基础知识程序员老舅音视频开发进阶音视频视频编解码实时音视频 webrtc 实时互动
目录视频播放器原理音频编码基础知识视频编码基础知识从这篇开始我们进入ffmpeg系列的学习实践，作为开篇，我们先来了解下音视频相关的基础知识。一、视频播放器原理雷神的这张图很清晰的说明了视频播放的流程：解封装—》音/视频解压缩—》音视频编码—》音视频裸数据PCM和YUV—》音视频同步处—》音频播放、视频渲染二、音频的基本知识对声音将模拟信号转为数字信号，要经过三个步骤：采样、量化、编码人耳能够听到
音视频编码格式与封装格式橘啊橘啊软件测试音视频
一、编码格式与封装格式编码格式：存在的目的主要是压缩原始数据的体积。用来存储/传输编码数据，并按一定规则把音视频、字幕等数据组织起来，播放器可以按照这些信息来匹配解码器、同步音视频。封装格式：适应不同的播放需求，也称多媒体的容器，为多媒体编码提供一个“外壳”，蒋所有通过算法处理好的音视频包装到一个文件容器内，再呈现给用户；我们所看的视频包含音频和视频两个部分（有时还包括字幕），H.264等是视频编
前端多媒体处理工具——ffmpeg的使用搜捕鸟了知识积累 Node.js 前端 ffmpeg node.js 后端项目工程化开发 process
写在前面在前端领域，FFmpeg是一个非常有用的工具，它提供了多种媒体格式的封装和解封装，包括多种音视频编码、多种协议的流媒体、多种色彩格式转换、多种采样率转换、多种码率切换等。可以在多种操作系统安装使用。安装下载FFmpeg在网站根据对应电脑系统下载对应版本即可，windows下载下图版本。下载完成后选择合适的路径存放此工具包，根据对应路径配置环境变量：我是将工具包放在下图目录：因此环境变量是这
ArmSoM-W3之RK3588安装ffmpeg ArmSoM ArmSoM-W3 RK3588 开发板 ffmpeg linux 运维服务器 arm开发驱动开发
1.简介FFmpeg是一个完整的、跨平台的音频和视频录制、转换和流媒体解决方案。既是一款音视频编解码工具，同时也是一组音视频编解码开发套件，作为编解码开发套件，它为开发者提供了丰富的音视频处理的调用接口。FFmpeg提供了多种媒体格式的封装和解封装，包括多种音视频编码，多种协议的流媒体，多种色彩格式转换，多种采样率转换，多种码率转换等。ffmpeg发展至今，已经被许多开源项目使用。FFmpeg官网
音视频二：H264宏块划分原理轰天裂天罗三炮
在上一篇《音视频一、音视频本质及ffmpeg安装》中介绍了视频文件格式，视频封装格式，音视频编码格式，以及利用ffmpeg验证音视频主要由音频和视频组成。本章主要是对音视频一些基础概念的理解。块结构的混合编码第一种采用“块结构的混合编码”方案的编码标准：音视频鼻祖H261。先看一个例子：假如一个渐变的图片，按像素保存的方式和块结构保存的方式，两种方式对比：按像素保存的方式：一张200*100的图片
FFmpeg 命令：从入门到精通 | 查看帮助文档 UestcXiye FFmpeg ffmpeg
FFmpeg命令：从入门到精通|查看帮助文档FFmpeg命令：从入门到精通|查看帮助文档FFmpeg库模块ffmpeg命令查看帮助文档ffplay命令查看帮助文档ffprobe命令查看帮助文档注意事项FFmpeg命令：从入门到精通|查看帮助文档FFmpeg库模块ffmpeg：HyperfastAudioandVideoencoder（超快音视频编码器）ffplay：Simplemediaplaye
【vue】vue+easyPlayer 实现宫格布局及视频播放心酱儿 vue.js 音视频前端
由于业务需要，ant-design-vue框架集成easyPlayer.js作为视频播放器。EasyPlayer.jsH5播放器，是一款能够同时支持HTTP、HTTP-FLV、HLS（m3u8）、WS视频直播与视频点播等多种协议，支持H.264、H.265、AAC等多种音视频编码格式，支持mse、wasm等多种解码方式。官方教程地址：https://www.npmjs.com/package/@e
2020-06-06GLSurfaceView+openGL播放VR视频/全景视频（VR解码器）羁拥_f357
OpenGLES/SDL渲染，FFmpeg；VR分屏之OpenGL-OpenGLES来播放视频.MediaPlayer+GLSurfaceView+openGLOpenGLES用来绘制屏幕及分屏，FFmpeg用来音视频编码解码等。正在跳转(iOS交流裙密码：123)>OpenGL与Unity3DOpenGL是一个相对底层的框架。会提供一系列函数框架作为API提供给开发者使用。OpenGL制作VR播
使用easywasmplayer实现视频流播放
easywasmplayer文档地址：https://www.npmjs.com/package/easywasmplayer一：介绍EasyPlayer.jsH5播放器，是一款能够同时支持HTTP、RTMP、HTTP-FLV、HLS（m3u8）视频直播与视频点播等多种协议，支持H.264、H.265、AAC等多种音视频编码格式，支持mse、wasm等多种解码方式，支持Windows、Linux、
音视频编码格式-AAC ADT 触底向上音视频 aac
1408(16进制):0001010000001000audioObjectType为00010,即2，profie=(audioObjectType-1)AACLCsamplingFrequencyIndex为1000,即8,对应的采样频率为16000channelConfiguration为0001,表示channel数量为1
FFmpeg入门详解之113：live555简介福优学苑@音视频+流媒体福优学苑音视频/流媒体音视频流媒体 live555
live555简介Live555是一个为流媒体提供解决方案的跨平台的C++开源项目，它实现了对标准流媒体传输协议如RTP/RTCP、RTSP、SIP等的支持。Live555实现了对多种音视频编码格式的音视频数据的流化、接收和处理等支持，包括MPEG、H.263+、DV、JPEG视频和多种音频编码。同时由于良好的设计，Live555非常容易扩展对其他格式的支持。目前，Live555已经被用于多款播放
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt

浅谈视频会议中H.264编码标准的技术发展

你可能感兴趣的:(音视频编码)