Neil-

音视频基础知识

音频量化

音频量化基本概念

采样大小

每个采样使用多少bit存放，一般采用16bit

采样率

常见的有8k、16k、32k、44.1k、48k
人耳能听到的声音频率范围是20HZ~20000HZ；根据奈奎斯特采样定理，采样率需要高于被采样信号频率的2倍时才能将被采样信号重建；
因此对信号采样时的频率至少为40KHZ，常见的AAC音频采用的是44.1khz的频率；

声道数

单声道、双声道、多声道

音频量化过程

模拟信号 => 采样 => 量化 => 编码 => 数字信号

音频码率计算

PCM音频流的码率 = 采样率 * 采样大小 * 声道数

音频压缩技术

消除冗余数据
有损压缩技术；这里的冗余数据主要包括人类听觉范围之外的音频信号以及时域、频域掩蔽掉的音频信号；
哈夫曼无损编码
无损编码技术，是一种变长字节编码（频率高的字符使用较短的编码，频率低的字符使用较长的编码）

音频编码过程

时域到频域的变换：便于分析和量化；
心理声学模型：过滤人类听觉范围外的信号；
频域信号和心理声学模型处理后的信号输入进行量化编码；
通过一些辅助数据转为比特流进行输出；

视频基础

定义

视频可以看做是满足一定条件的一系列连续图像的合集；
视频技术泛指将一系列静态影像以电信号的方式加以捕捉、纪录、处理、储存、传送与重现的各种技术。
上面提到了一系列图像想要成为视频需要满足一定条件，这个条件就是结合人眼的视觉暂留特性使得观看者感受不到不连贯性；

人眼的视觉特性

人眼可见光范围
400nm（紫）~700nm（红），敏感度曲线类似于正态分布，对555nm左右的光线最为敏感
视细胞
主要有视锥细胞和视杆细胞
视锥细胞：主要感受强光和颜色的细胞；在视网膜的黄斑中央凹处，只有视锥细胞，光线可直接到达视锥细胞，故此处感光和辨色最敏锐
视杆细胞：以视杆细胞为主的视网膜周缘部，则光的分辨率低，色觉不完善，但对暗光敏感
韦伯定律
韦伯定律是描述物理量与心理量之间关系的定律，其表明心理量与物理量的对数呈线性关系；也就是心理量的增加落后于物理量，呈对数关系；也就是说人眼对暗光的变化感知能力高于强光；
通俗理解：屋子里没有蜡烛到点燃一支蜡烛时感知的亮度增加 >> 已有99支点燃的蜡烛时增加一支感知的亮度增加；
在光学系统感知中也同样实验；如下图，我们将这类曲线称为gamma曲线（幂函数）；γ<1时曲线对亮度的变化为下凸；γ>1时曲线对亮度的变化为上凸，同等亮度增量带来的心理感知量增量逐渐变大；
马赫效应
当亮度发生跃变时，会有一种边缘增强的感觉，视觉上会感到亮侧更亮，暗侧更暗。马赫效应会导致局部阈值效应，即在边缘的亮侧，靠近边缘像素的误差感知阈值比远离边缘阈值高3~4倍，可以认为边缘掩盖了其邻近像素，因此对靠近边缘的像素编码误差可以大一些。
视觉暂留特性
指的是光线停止进入人眼后，人眼对物体的视觉感知仍然能够持续一定的时间不消失，直到过了某个时间点或者有新的图像替代它；
有研究表明这个时长大约为1/15秒，因此早期的无声电影为16fps即可感受不到停顿，至于电影24fps的来源可以参考文献4、5；

基本概念

视频的采集与展示流程

如下图的流程图所示：
将自然界中的真实场景记录下来并最终展示到显示器上，通常需要通过采集、编码、传输、解码、显示等步骤；这其中需要经过两个重要的非线性变换OETF和EOTF；

OETF

光电转换函数，将光信号转为对应的电信号；

EOTF

电光转换函数，将电信号转为对应的光信号；

Gamma校正与图像显示

encoding gamma曲线幂指数小于1，display gamma曲线幂指数大于1；
两者的乘积大于1时心理感知量略迟滞于自然场景亮度变化；
但是由于人眼的感知其实与周围环境亮度也相关，在较暗的地方感知度相对更强，所以一般电影院采用的gamma值（乘积）为1.5，而明亮的室内采用1.125；
常见的gamma应用：sRGB：编码gamma - γ=0.45（1/2.2）， CRT：显示gamma - γ=2.2；

gamma校正的意义：

先上答案：gamma 校正实际上是用来解决显示设备亮度灰阶不足的问题的。如果设备存储和显示位宽支持扩展到32位甚至更高，那么的确可以不需要gamma校正；
两段 gamma 校正实际上是一对逆过程，一个将光信息转化为数字
信息，一个将数字信息转化为光信息。因此，按照常理来说，并不需要进行这样复杂的

非线性映射，只需要将归一化之后的光信息记录下来，然后再让显示设备进行输出即可。
从这种角度来说，gamma 校正是一个不必要的操作。然而我们目前常用像素位宽为8位，也就是说我们图像灰阶需要用256级模拟真实场景亮度；
根据韦伯定律，人眼对亮度的感知呈现γ<1的gamma曲线；参考下图可以看到，我们需要用256*20%的灰阶取表示人眼可感知的纯黑到中灰的一半亮度范围，而用剩余80%灰阶表示人眼感知的另一半亮度范围；这样显然不合理；
因此，更加合理的显然是在记录时结合人眼的亮度非线性特性，采用γ<1的gamma函数，使得量化亮度128的自然界亮度正好映射为心理感知量的0.5；

理论上，encoding gamma和display gamma的乘积为1时，显示图像与真实场景是一种线性映射关系；
然而大多数情况下，两个gamma值的乘积并非1，通常稍大于1；光线明亮的室内约为1.125，电影院为1.5

帧率（framerate）

即frame per second，每秒钟视频的帧数，表征视频的流畅性，更高的帧率可以更清晰地记录高速运动物体的细节等；
通常的电影帧率24fps，电视帧率25fps；目前很多视频已经出现了29.97fps、30fps、50fps、60fps、120ps等；下面的视频是有png序列通过ffmpeg编码的fps=16的视频，并未感受到不连贯；

码率（bitrate）

单位内传输的数据量，单位kb/s、Mb/s；相同条件下码率越大，画质越高，视频体积越大；
一些码率控制相关的需要区分的概念：
CBR：Constant Bitrate——固定码率；所有视频内容从头至尾采用一致的码率进行编码；容易预估出文件体积；
VBR：Variable Bitrate——动态码率；根据视频内容的复杂程度采用不同的码率；高复杂度采用更高的码率，简单画面使用较低的码率；
ABR：Average Bitrate——平均码率；可以看做是CBR和VBR的一种折中，它将视频分为很短小段（比如50帧），每段视频采用固定的码率，而在内部又分别对高复杂度视频和低复杂度视频采用不同的码率；可以在提供较好质量的同时能够使文件体积可预测；

色域（colorSpace）

指的是人眼能够感知的所有颜色范围；而通常由于显示器的硬件能力限制，通常只能将一部分的颜色范围展示出来，因此出现了不同的色域标准；
常见的普通显示器采用的是sRGB，打印机采用的是Adobe RGB；NTSC色域是美国的标准电视广播传输的一套标准，在美国、墨西哥、加拿大、中国台湾等国家和地区使用；
sRGB ≈ 72% NTSC，Adobe RGB≈95% NTSC；
更宽的色域及更深的位深可以带来更好的色彩还原；
位深（bitdepth）
目前主流的仍为8bits，部分尝试10bits、12bits；
位深不仅可以描述灰阶数，也可以描述视频中可以使用的颜色数；也就是说，更高的位深一定程度上可以带来更高的亮度和更丰富的色彩体验，从而获得还原度更加真实的观看体验；

颜色模型（color model）

常见的颜色模型有RGB、CIE XYZ、HSL、YUV等

视频制式

基本分为美国标准的NTSC和欧洲标准的PAL制式，具体可以参考文献——What’s the Difference Between NTSC and PAL?
美国等小部分国家和地区的交流电频率为60HZ，对应的电视频率为29.97fps（Drop-frame Timecode, 保障彩色电视机在黑白信号接收器中正常播放；主要是彩色电视机引入了彩色副载波频率信号，这些信号在黑白电视上无法被解析，因此画面是静止的，所以降低频率以保证在黑白和彩色电视机上都能正常播放）、30fps（黑白电视）；其他多数国家都为50HZ，采用的是PAL制式，对应的电视频率为25；

关于为什么是29.97fps可以参考文献——Drop Frame vs. Non-Drop Frame and How It Affects Captions & Subtitles

隔行扫描与逐行扫描

我们经常看到一些视频是720p、1080p，这里的P到底指的是什么呢？
电视信号的传输方式分为逐行扫描（progressive）和隔行扫描（interlaced）
逐行扫描：从左到右、从上到下扫描和图像 —— 早期带宽成本很高；
隔行扫描：每帧图像分为奇数场和偶数场，两个场的扫描时间存在一定的时间差，利用人眼视觉暂留特性相互补足形成完整的画面

常见视频容器格式与编码格式

编码格式

编码格式决定了视频数据具体如何进行编码处理

编码格式	类型	描述	优缺点
HEVC/H.265	Lossy/Lossless	提供更高的压缩率，压缩时间相对H.264更长；提供更加丰富的编码方式、分辨率、直播流支持等；	提供更高的压缩率，压缩时间相对H.264更长
MPEG-4 AVC	Lossy/Lossless	也称为H.264、MPEG-4 Part10，是由ITU-T及MPEG共同推进的标准，是目前使用最广泛的一种编码格式；提供较好的压缩率和画质，主要应用于蓝光光盘以及Netflix、Hulu、Youtube等网络流；	相对于MPEG-4 Visual有较高的压缩率和较高的视频质量（针对Intra Prediction进行了改造）；
MPEG-4 Visual	Lossy	即MPEG-4 Part 2，由MPEG（运动图像专家组）提出，向下兼容H.263；是另一种较为通用的编码方式	也是一种较为通用的编码方式，但是压缩率不及AVC
VP8/VP9	Lossy/Lossless	由Google提出的两种编码方式；相对于HEVC（更好的图像质量），提供更加一致可靠的流	支持webm视频
AV1	Lossy/Lossless	开源、免费的一种编码格式，主要用于视频网络传输等，如HTML5 Video；可以看做是VP9的继承者，支持更高的压缩率；	the AV1 reference encoder achieved 34%, 46.2% and 50.3% higher data compression than libvpx-vp9, x264 high profile, and x264 main profile respectively.

编码器

编码器是编码方式的具体实现
x264、x265
openH264：与x264类似，但是支持Scalable Video Coding技术，SVC的码流除了正常的高质量视频流，还包含一些子视频流的集合——这些子集在时域、空域或者质量上提供了伸缩性，如更低的帧率、更低的分辨率、更低的质量（码流等），但是硬件支持程度不完善；纯软解码会造成较高的CPU占用；
vp8/vp9

容器格式

容器格式，又称封装格式；可以理解为是将多个多媒体数据流合成在一个文件中的一类计算机文档，一般包括视频流、音频流、metadata；

由于容器并不提供数据和元数据如何进行编码的，因此有时候会遇到解封装成功但是无法解码的情况；
不同的容器格式提供了不同的视频质量、文件大小、视频回放支持等；

元数据可以理解为“the data of data”，即音视频的一些描述信息，包括编码格式、码率、分辨率等信息；

容器格式	文件后缀	Owner	优缺点
MP4（MPEG-4 part14）	.mp4	MPEG	广泛支持的一种容器格式，支持h.264/h.265及所有版本的MPEG-4标准；能够保持视频质量的同时提供相对较小的文件体积；许多大型的流媒体服务都使用mp4，如YouTube/Vimeo等；
AVI	.avi	Microsoft Windows	支持很多编解码器，需要进行很多的不同文件的设置；文件体积较大，导致其不太适用于流媒体传输和下载；更适用于本地视频的存储；不支持B帧、不支持VFR（可变帧率）
FLV（Flash）	.flv	Adobe Inc.	以前使用较多的一种视频格式，由于较小的文件体积、广泛的浏览器插件支持及第三方flash播放器的支持存在了很多年；目前使用逐渐减少
MPEG transport stream(TS)	.ts	MPEG	主要用于广播系统如DVB、ATSC、IPTV等；
QuickTime File Format	.mov, .qt	Apple Inc.	提供非常高的视频质量，但文件体积也很大；通用性较差，某些播放器并不支持；
WebM	.webm	Google	由Google提出，支持透明视频；

不同场景下视频容器格式的选择：
一般应用场景可以分为

本地视频编辑：需要高质量的文件
网络分发：更小的文件体积、平滑的视频回放

视频编解码

以H.264为例：

基本概念

I帧/IDR

都是使用帧内预测的关键帧；IDR帧即 Instantaneous Decode Refresh frame，即解码到该帧视频时会立即刷新和重置缓存；两个IDR之间的视频可以单独寻址和解码出来，可以看做是一个独立的视频段；所有IDR后的视频不可以参考该IDR帧前的所有帧；

P帧

前向参考帧，压缩时参考前一帧的信息；

B帧

双向参考帧，编码时参考前后两帧的信息；

GOP

两个I帧之间的多帧图像，通常将一个场景中将场景变化较小的一组图像划分为一组，称为一个GOP
由于采用的压缩方式不同，它们占用的比特数也不同，一般I帧 > P帧 > B帧；当然压缩率的代价是压缩速率和性能，由于B帧需要双向数据作为参考，因此缓存的数据也更多，对硬件的要求等也越高；因此，部分视频只有I帧和P帧；

每个GOP中仅有一个I帧，GOP size为两个I帧之间的帧数；GOP一般使用2个数字描述——分别表示I/P之间的间隔及GOP size；如M=3，N=12，则对应的GOP为：
IBBPBBPBBPBB(I)

码率一定时，一定条件下提高GOP size，可以提升P、B帧的占比，因此可以获得较好的图像质量（P、B具有更好的压缩率）；
当然，P、B帧也具有更高的复杂度，过大的GOP size也会影响编码效率，同时影响seek定位操作的响应速度；

视频花屏、卡顿

花屏与卡顿

原因：GOP中的P帧丢失造成解码端发生错误，这时会造成花屏
避免：如果某个GOP中的P帧或I帧丢失，则不显示本GOP内的所有帧，然后再下一个GOP的I帧到来时刷新图像；由于丢失一个GOP，所以视频会暂时保留在上一个GOP画面，就造成了视频卡顿；

PPS

Picture Parameter Set，图像参数集，nal_unit_type等于8；多个NALU组成一个视频帧，该视频帧相关的元数据（metadata）保存在PPS中；
PPS通常独立保存在一个NAL unit中；
包含熵编码模式标识、切片数目（默认slice group=0标识该帧为一个slice group）等信息；

SPS

Sequence Parameter Set，序列参数集，nal_unit_type等于7；
多个PPS组成一个视频序列，该序列相关的原始数据保存在SPS中；
包含序列帧数、参考帧数目、码流的profile/level等信息

SEI

Supplymental Enhancement Information，辅助增强信息，包含了增强视频的一些辅助信息；比如直播答题中增加一些与视频信息同步的文本信息，或者字幕信息控制等用户自定义信息均可以放在SEI中；生成SEI中的方式包括编码时生成SEI及容器封装时写入SEI信息等；

PTS与DTS

根据I、B、P的关系，如果按照顺序进行传输时，序列为I->B->P；这时在解码端收到序列时由于B帧需要依赖于P帧的信息，这时候传输顺序和解码顺序不一致，B帧和P帧的解码和显示时间就变得不确定了，因此引入了PTS和DTS；如果没有B帧，那么传输顺序与解码顺序是一致的；
PTS即Presentation Time Stamp，显示时间戳，用于表示什么时候去显示该帧；
DTS即Decode Time Stamp，解码时间戳，用于表示什么时候去解码该帧；

帧分组与组内宏块查找

帧分组：将场景变化较小的一组图像划分为一组，称为一个GOP
组内宏块查找：将一组图中的相邻两个图进行逐行扫描比较；

运动估计与补偿

编码器从缓存区取出前两帧视频进行宏块扫描，如果发现前一帧中有物体，则会在第二帧的对应搜索窗口内进行搜索。如果找到该物体，那么通过比较这两帧图像可以得到运动物体相关的矢量（大小和方向），将两者相减得到的差值就是补偿数据，第二帧图像的完整数据可以根据前一帧图像的数据及补偿数据进行完全恢复；

宏块

是运动预测的基本单位，通常一张完整的帧可以分为多个宏块，宏块是选择特定预测类型的基准，整个图像可以使用不同的预测类型；H.264中宏块可以进一步划分为子块，能够提供更高的压缩率；

图像分割

slices：一幅图像可以分割为1或多个slices，每个slices是独立自给自足的；slices由一系列的宏块（macroblock）组成；设置slice的目的是其独立性可以避免预测误差的扩散和传输；每个slice内的宏块不会与其他slice中的宏块为参考，并且slice编码后会打包进一个NALU，所以传输时是独立的；
slice的类型： 0-P slice；1-B slice；2-I slice；3-SP slice；4-SI slice；
macroblock：是基本的语义和处理单元，是视频信息的主要承载者；每个slices中的macroblock是相互依赖的；macroblock可以被进一步分割；

编码的基本流程

编码的过程基本分为预测（时/空域：帧内、帧间）、变换（频域：DCT）、量化（模拟到离散，降采样）和熵编码（CABAC等）；

H.264的层级结构

根据官方文档，h.264主要有两部分构成——VCL & NAL；如下，是h.264的层级结构示意图；

VCL涉及到的包括：图像分割及交错处理、编码器结构、运动补偿预测、帧内预测、预测残差编码、去块效应滤波器等；VCL主要负责有效处理视频数据
VCL的新特性：

增强的运动补偿；
小区块使用变换编码
提升的去块效应滤波器
提升的熵编码

NALNAL Units 及 type；RTP负载及字节流格式；NAL主要是比特流的处理和封装，保证能够正确地进行网络传输和解码；

H.264的压缩方式

帧内预测

定义：主要处理空域的数据冗余，为一帧中的每个宏块找出最相近的预测模式，然后将预测模式与对应的残差信号保存用于解码（H.264提供9中帧内预测模式）；
理论基础：人眼对图象都有一个识别度，对低频的亮度很敏感，对高频的亮度不太敏感。所以基于一些研究，可以将一幅图像中人眼不敏感的数据去除掉。

帧间预测

主要处理时域上的数据冗余，主要是运动估计与运动补偿方式；

DCT

主要处理频域的数据冗余，一般对帧内预测和帧间预测后的残差信号进行DCT处理；DCT具有能量聚集的特性，声音、视频等信号的能量大都集中在DCT变换后的低频信号；将视频信号进行DCT变换，然后降低高频分量占比（音视频细节，人眼对高频分量不敏感）然后采用熵编码，可以有效提高压缩率；
DCT变换可以看做是DFT的一种特殊形式，首先看DFT变换公式：

实部为：

虚部为：

当x[n]为偶函数时，实部为偶函数，虚部为奇函数，所以Im[k]为0；此时DFT表示为：

所以DCT就是将输入信号x[n]限制为偶函数的DFT；

DCT变换的能量聚集效果如下所示：

CABAC

context-adaptive binary arithmetic coding，内容自适应二元算数编码，是H.264/AVC熵编码的一种；H.264/AVC标准定义了两种熵编码类型：CABAC和VLC(Variable-length Coding)；残差信号做完DCT后需要进一步使用CABAC进行无损压缩；

直播相关

直播产品的种类：

泛娱乐化直播：娱乐直播（花椒、映客）、游戏直播（斗鱼、虎牙）—— 更加注重流的质量，通常采用TCP协议
实时互动直播：音视频会议、教育直播等（声网、全时等）—— 更加注重实时性

直播协议对比

LL-HLS延时小于3秒，同时原生支持H5

CDN

内容分发网络；
应用： 解决因分布、带宽、服务器性能带来的访问延迟问题，适用于站点加速、点播、直播等场景。使用户可就近取得所需内容，解决 Internet网络拥挤的状况，提高用户访问网站的响应速度和成功率。

CDN是只对网站的某一个具体的域名加速。如果同一个网站有多个域名，则访客访问加入CDN的域名获得加速效果，访问未加入CDN的域名，或者直接访问IP地址，则无法获得CDN效果。

构成

边缘节点

用户从边缘节点获取数据

二级节点

主干网节点——主要用于缓存，减轻源站压力

源站

内容供应商将内容放到源站

分类

传统CDN网络 —— 过期拉取
音视频直播流CDN网络 —— 推拉结合；源节点直接push到主干接点，访问时从边缘节点或主干接点pull；

CDN网络结构

CDN网络结构如下所示，基于此简述用户访问CDN网络的过程；
多个CDN网络通过光纤等将不同网络的主干接点连接起来；

如果有个服务在联通，当一个电信用户用户访问该服务时，首先会通过DNS访问离其最近的边缘节点；
如果访问的服务不在该边缘节点，向上到该网络的主干接点进行查询；
主干接点首先会在缓存中查找，如果没有找到会判断服务是在电信还是联通；
判断该服务是联通的服务后，首先访问联通的主干接点，没有则继续向上查找到其源节点；

当用户非首次访问时则可以达到加速效果

架构

泛娱乐化直播

主要包括

共享端（主播端）
信令服务器 —— 包括创建房间、聊天、送礼物等信令；
流媒体云（CDN）
观众端

主要流程

共享端发送信令（可以是创建房间、聊天、送礼物等）至信令服务器通知创建房间，创建成功后会返回给共享端一个流媒体云地址；
共享端采集音视频数据形成rtmp流推送到CDN网络；
观众端想观看该房间时发送一个信令至信令服务器，信令服务器会将其加入到该主播的房间，并返回该主播直播的流媒体云地址；
观众端从对应地址拉取该直播流进行观看；

实时互动直播

自有网络——与传输协议相关（TCP协议）
节点服务器（信令服务器 + 媒体服务器）—— 负载均衡、容灾
控制中心——负责控制负载均衡等；控制中心与节点通过心跳保持通信——获取节点的CPU占用、网络状况、内存占用等；
内总线 —— 负责控制中心与节点服务器或者泛娱乐化模块通信；
媒体转换服务器——将RTP包转为RTMP包，融合实时互动直播网络与泛娱乐化直播网络
将转换后的数据流推送到CDN，供观众端观看

直播连麦

什么是QUIC协议

参考文献

Video[wikipedia]
Persistence of vision: how does animation work?
视觉暂留特性
24帧电影基于“视觉暂留”？一个持续百年的错觉。
人眼帧数是否不能高于 30 ，李安 120 帧的电影是否没有意义？
Gamma、Linear、sRGB 和Unity Color Space，你真懂了吗？
Color Model
What’s the Difference Between NTSC and PAL?
Drop Frame vs. Non-Drop Frame and How It Affects Captions & Subtitles
交错、反交错与IVTC —— 从入门到放弃
Comparison of video container formats
Container format (computing)
AV1
Video Formats, Codecs and Containers (Explained)
The difference between the I frame and IDR frame in H264
详解离散余弦变换（DCT）
流媒体传输协议（rtp/rtcp/rtsp/rtmp/mms/hls）
也许是史上最全的一次CDN详解
Live Streaming Protocol Comparison
Video Streaming Protocols: Which to Use for Professional Broadcasting
The In-Depth Guide on Video Streaming Protocols: A to Z

你可能感兴趣的:(视频编码,音视频,视频编解码)

华为云welink考试试题_华为内部开启WeLink项目，华为云是这样考虑的-通信/网络-与非网... weixin_39820437 华为云welink考试试题
协同办公市场竞争激烈华为云WeLink是华为旗下智能工作平台，它融合消息，邮件，会议、音视频、云空间、小程序等服务，可助力用户随时、随地、通过各类终端设备等实现协作办公。华为还宣布携手合作伙伴成立华为云WeLink生态联盟，金山办公、中软国际、致远互联、罗技、华为商旅、红圈营销、合思费控、Coremail论客、芯盾集团、视源股份、喜马拉雅等成为首批生态伙伴。IDC曾发布了《2018年下半年中国企业
WebRTC（九）：JitterBuffer 却道天凉_好个秋 WebRTC webrtc
JitterBufferJitter“Jitter”指的是连续到达的媒体包之间时间间隔的变化。在网络传输中，由于：网络拥塞路由路径变化队列排队不同链路带宽差异导致包之间的接收时间不一致，这就是网络“抖动”。作用**JitterBuffer（抖动缓冲区）**的作用是：缓冲网络传输过来的数据包重新排序乱序的包缓冲一定时间再输出实现稳定的音视频帧输出，避免播放中出现卡顿、跳帧、音频破音工作流程图网络接收
B站视频下载技术揭秘：从浏览器抓包到FFmpeg音视频合成 soonlyai 音视频 ffmpeg
摘要本文旨在深入探讨B站（哔哩哔哩）视频的实际加载与分发机制，并通过Python脚本实现一个功能性的视频下载器。我们将从使用浏览器开发者工具分析B站播放页的网络请求入手，定位获取视频流地址的关键API。在此基础上，本文将详细讲解如何利用Python的requests库模拟API请求、通过携带Cookie获取登录后才能访问的4K高清视频流，并最终调用ffmpeg工具将B站特有的音、视频分离流合并为完
《从0到1：C/C++音视频开发自学指南》空云风语机器视觉 Opencv QT c语言 c++音视频
开启自学之旅：为何选择C/C++音视频开发在当今数字化时代，音视频开发的应用场景极为广泛，深刻融入了我们生活与工作的方方面面。从火爆的直播行业，无论是电商直播中主播与观众的实时互动，还是游戏直播里精彩赛事的实时呈现；到备受欢迎的短视频平台，各种创意短视频的制作与分享；再到便捷的视频会议，让远程办公、在线教育成为可能，实现了跨地域的高效沟通与协作。这些丰富多样的应用场景，都离不开音视频开发技术的有力
抖音的视频怎么下载下来——下载狗解析工具 Java搬砖组长音视频
如果你想下载抖音视频，可以使用「下载狗解析工具」来获取抖音无水印高清视频。以下是详细的操作步骤，适用于电脑端和手机端。方法1：电脑端下载（无水印高清）步骤1：获取抖音视频链接打开抖音官网或手机APP，找到要下载的视频。点击视频右下角的「分享」按钮，选择「复制链接」。步骤2：使用「下载狗解析工具」解析在浏览器中打开「下载狗解析工具」官网（www.xiazaitool.com）。将复制的抖音链接粘贴到
调试HDMI音频能8通道播放声音 hxHardway Android/Linux 功能实现文档音视频 linux
一、使用场景我们是通过rk主控的hdmi接口播放音视频给到ite68051芯片解析出8声道数据，分别通过4路i2s的数据脚给给到fpga去解析调试步骤：1.根据相关手册配置hdmi输出，hdmi声卡注册，如下:hdmi0_sound:hdmi0-sound{ status="disabled"; compatible="rockchip,hdmi"; rockchip,mclk-
【GStreamer】减小延时的参数设置、从RTP中获取时间戳郭老二视频 GStreamer
1、问题描述在使用GStreamer实现RTSP转RTMP时，延时很大，2～5秒，这是为了应对网络抖动、丢包重传、音视频同步等问题，建立了一些缓冲区。2、解决方法在可以损失流畅度、画面质量的前提下，可以使用如下参数来减小延时1）rtspsrc参数：buffer-mode=auto：自动调整缓冲区大小drop-on-latency=true：缓冲区满时丢弃旧数据latency=0：最小化RTSP接收
C# WinForms局域网即时通讯系统设计与实现深刻如此
本文还有配套的精品资源，点击获取简介：本项目是一个使用C#WinForms技术开发的局域网内即时通讯工具，支持文字、文件传输和音视频通信。它旨在为学生毕业答辩提供一个本地网络通信平台，展示开发者在.NET环境下的网络编程和GUI设计能力。项目不仅要求掌握C#基础和WinForms控件开发，还需实现网络通信、多线程处理、数据安全等高级功能。通过项目开发，学生能深入理解软件开发的各个方面，提升软件工程
在使用 HTML5 的＜video＞标签嵌入视频时，有时会遇到无法播放 MP4 文件的问题蹦极的考拉 html5 音视频前端
原因分析：只能播放声音，却无法播放视频。这通常是由于视频编码格式不兼容导致的。虽然MP4是一种常见的视频格式，但它包含多种编码方式，并非所有编码方式都受HTML5支持。解决方案：确认视频编码格式：使用视频播放器或专门的工具查看视频文件的属性，确认其编码格式。HTML5支持H.264编码的MP4文件（MPEG-4），VP8编码的WebM文件和Theora编码的Ogg文件。转换视频编码格式：如果视频编
WebRTC（七）：媒体能力协商却道天凉_好个秋 WebRTC webrtc
目的在WebRTC中，每个浏览器或终端支持的音视频编解码器、分辨率、码率、帧率等可能不同。媒体能力协商的目的就是：确保双方能“听得懂”对方发的媒体流；明确谁发送、谁接收、怎么发送；保障连接的互操作性和兼容性。P2P的基本流程参与角色角色说明peerA发起连接的端（通常是主叫）peerB接收连接的端（通常是被叫）signal信令服务器，用于中转SDP和ICE信息，但不参与媒体传输stun/turnS
ESP FOURCC 编码介绍乐鑫科技 Espressif 乐鑫科技多媒体编码
FOURCC（FourCharacterCode，四字符编码）是一种在多媒体领域被广泛使用的标识符，常用于快速识别音视频编码格式、封装格式、像素格式等。乐鑫科技定义了一套完整的FOURCC编码标准，称为ESPFOURCC，该标准可在开源项目ESP-GMF中的esp_fourcc.h头文件中找到，涵盖了音视频编解码、图像、封装格式和各种像素格式。本文将深入介绍ESPFOURCC的背景意义、定义原则、
MX_Player_Pro_专业精简版AC3/DTS/EAC3 By.SOLDIER-就要应用网91apps.cn syx594
MX_Player_Pro1.32.8_专业精简版_AC3/DTS/EAC3MXPlayer是安卓市场功能最强大的视频播放器支持几乎所有的音视频文件，强力的硬件加速和多种字幕支持。优化说明：不需要Root或LuckyPatcher或GooglePlayModded；禁用/删除不需要的权限及服务；优化和压缩对齐的图形以及清理不必要的资源，以实现快速加载；从Android.manifest中删除了广告
请编写一个sip Android音视频客户端又可乐 android android studio ide
编写一个SIP客户端需要以下步骤：了解SIP协议:SIP(SessionInitiationProtocol)是一种通信协议，用于建立、维护和终止多媒体会话(如语音和视频通话)。选择开发工具:可以使用Java语言和AndroidStudio开发安卓应用程序。获取SIP栈:可以使用现有的SIP栈库，如pjsip，或开发自己的SIP栈。设计界面:可以使用Android的XML语言设计用户界面，包括呼叫
音视频及H264/H256编码相关原理 Everbrilliant89 音视频开发音视频视频编解码 H264编码 H265编码音视频编解码
一、音视频封装格式原理：我们播放的视频文件一般都是用一种封装格式封装起来的，封装格式的作用是什么呢？一般视频文件里不光有视频，还有音频，封装格式的作用就是把视频和音频打包起来。所以我们先要解封装格式，看有哪些视频流和哪些音频流，此时的音频流和视频流都还是压缩数据，不能直接用于显示的，这就需要解码。如FFmpeg视频文件就是一个容器(视频流（H264）音频流(aac))。1、视频文件封装格式：封装格
【音视频】PJSIP库——pjsua命令使用详解郭老二视频音视频
1、源码编译1）安装依赖库sudoaptinstalllibsrtp2-devsudoaptinstalllibopus-devalsa-toolslibalsaplayer-devffmpeglibalsa*pulseaudio-module-jacksudoaptinstalljackdlibjack-jackd2-devlibjack-devlibsdl2-devlibv4l-devliba
【音视频】SIP基础、搭建服务器和客户端郭老二视频音视频
1、概念SIP（SessionInitiationProtocol，会话初始协议）是一种用于创建、修改和终止实时通信会话（如语音、视频通话）的应用层协议。1.1架构SIP架构分为客户端和服务器端1）客户端：发起或接收会话请求，例如：手机上的VoIP应用、pjsua程序2）服务端：存储客户端注册的信息，比如IP、端口等注册服务器（RegistrarServer）：存储用户的当前位置信息（IP+端口）
Android Camera系列（八）：MediaCodec视频编码下-OpenGL ES离屏渲染如果可以003 Android Camera Android OpenGL ES Android音视频音视频 OpenGL ES MediaCodec android
所有随风而逝的都是属于昨天的，所有历经风雨留下来的才是面向未来的AndroidCamera系列（一）：SurfaceView+CameraAndroidCamera系列（二）：TextureView+CameraAndroidCamera系列（三）：GLSurfaceView+CameraAndroidCamera系列（四）：TextureView+OpenGLES+CameraAndroidCa
Android Camera系列（七）：MediaCodec视频编码中-OpenGL ES多线程渲染如果可以003 Android Camera Android音视频 Android OpenGL ES android OpenGL ES MediaCodec 硬编码
你做的再好，也还是有人指指点点；你即便一塌糊涂，也还是有人唱赞歌。所以不必掉进他人的眼神，你需要讨好的，仅仅是你自己。AndroidCamera系列（一）：SurfaceView+CameraAndroidCamera系列（二）：TextureView+CameraAndroidCamera系列（三）：GLSurfaceView+CameraAndroidCamera系列（四）：TextureVi
ffmpeg 带alpha透明层的视频编码 Ternence_Hsu ffmpeg alpha 透明层视频编码 png
png编码可以封装为mp4、mov等ffmpeg-fimage2-r25-iinput_%d.png-vffps=25-vcodecpngoutput.mov-yqtrle编码只能封装为mov，不可以封装为mp4ffmpeg-iinput.mov-vcodecqtrleoutput.mov输入流编码信息：Stream#0:0(eng):Video:qtrle(rle/0x20656C72),bgr
FFmpeg 的算法体系 lianghu666 音视频硬件 Linux ffmpeg 算法 linux
️一、FFmpeg核心算法体系与作用1.编解码算法编解码是FFmpeg的核心能力，通过libavcodec实现音视频的压缩与还原。视频编码算法帧间预测：通过运动估计（菱形搜索、全搜索法）减少时间冗余，支持P帧（前向预测）和B帧（双向预测）变换与量化：采用整数离散余弦变换（DCT）将空域信号转为频域，再通过量化舍弃高频信息（H.264/H.265使用）熵编码：对残差数据采用CABAC（上下文自适应二
ios苹果app应用程序录屏开发有哪些难点和注意点咕噜企业签名分发-大圣 ios
iOS苹果应用程序录屏开发的难点和注意点主要包括：难点：一、权限管理iOS录屏功能需要用户授权才能使用，开发者需要处理用户授权的逻辑，包括请求权限、处理用户拒绝授权的情况以及提供友好的提示信息等。二、视频编码和压缩录制屏幕上的内容会产生大量的数据，因此对生成的视频文件进行编码和压缩是必要的。开发者需要选择合适的视频编码器，并合理地设置视频质量和压缩参数，以保证生成的视频文件既有足够的清晰度，又不会
ZLMediaKit2023-10-15master分支编译版下载：实时音视频传输解决方案昌焘同
ZLMediaKit2023-10-15master分支编译版下载：实时音视频传输解决方案去发现同类优质开源项目:https://gitcode.com/项目介绍ZLMediaKit是一款开源的实时音视频传输框架，专为流媒体传输而设计。2023年10月15日基于master分支编译完成的版本，为广大开发者提供了Windows平台下的便捷使用体验。该版本集成最新的功能特性，无需复杂编译过程，下载即可
Permute 3.5 最好用的苹果电脑视频压缩转换工具 blank_t Permute Permute mac 视频压缩视频处理
类别：视频版本：3.5大小：19.2MBMB语言：简体中文标签：视频转换视频编辑兼容性：OSX10.11或更高版本更新：2020年07月23日软件介绍Permute3.5强大易用的视频格式转换已通过小编安装运行测试100%可以使用。Permute3.5是Mac系统最容易使用的视频格式转换器，它很容易使用，无需配置，你只需将文件拖放进界面窗口，对所有的媒体进行转换。支持丰富的音视频文件格式（甚至还支
Mac电脑-媒体文件格式转换-Permute 2401_88856700 媒体 mac macos 格式转换
Permute是一款功能强大的媒体文件格式转换工具。支持多种音视频和图像格式，包括但不限于MP4、AVI、MOV、MKV、MP3、WAV、FLAC、JPEG、PNG等。操作界面简洁明了，只需拖拽文件或点击添加按钮来选择需要转换的文件。转换设置区域，可自由选择输出格式、输出路径、输出参数等，实现个性化转换。原文地址：Permute媒体文件格式转换工具
XMOS将在CES 2025上展出多款由边缘AI驱动的创新音效、音频、识别和处理解决方案电子科技圈 XMOS 人工智能音视频嵌入式硬件科技物联网 mcu iot
全球智能物联网技术领导者暨匠心独到的半导体科技企业XMOS宣布：该公司将再次参加2025年国际消费电子展（CES2025），并将在本届CES上展出一系列由人工智能（AI）驱动的全新空间音效、语音捕获与降噪、音视频多模态AI处理等多种全新音频技术与应用解决方案。它们皆由XMOS在单一器件中集成了高性能AI、DSP、I/O和控制功能的xcore.ai系列多核控制器支持，将边缘AI技术与音频和话音媒介特
H.264/H.265 编码入门到实战：嵌入式安防新人快速掌握视频压缩核心技巧创视谷 ipc网络摄像头研发技术相关网络音视频 h.264 h.265 安防
目录H.264编码基础H.265编码基础GOP架构与关键帧码率控制策略帧率与分辨率调优帧率调优分辨率调优硬件支持与兼容性对比常见问题与排查典型安防场景配置建议H.264编码基础标准概述：H.264（MPEG-4AVC）是2003年推出的高清视频编码标准，采用混合编码结构（帧内+帧间压缩），在同等画质下比前代格式大幅提升了压缩效率。其兼容性好、硬件需求低，因而在网络视频传输、流媒体和视频监控等领域得
音视频面经_音视频知识解析：第三章FFMPEG编写视频解码 2301_79125642 java
小调查一次小调查，各位javaer除了用springboot写过项目，还用过啥框架写项目？有没有牛友来指点一二，真的好纠结本人位于湖南某民办二本(在湖南民办二本里算好的)，目前大三下，准备找工作干java后端，跟着b站的黑勇攀高峰6月12日举行的毕业典礼，一周的时间很快就过去了。回想起整个春招，机会确实很少，大概只有字节美团快手#和牛牛一起刷题打卡(51733)##和牛牛一起刷题打卡#简历求指导投
SmartMediaKit实战经验总结之高稳定、低延迟、强兼容音视频牛哥 RTSP播放器 RTMP播放器大牛直播SDK rtmp播放器 rtmp player 音视频 windows rtmp播放器 android rtmp播放器安卓rtsp播放器大牛直播SDK
在万物互联与数字化加速融合的今天，音视频实时通信技术正成为各行业发展的核心驱动力。从教育到工业、从安防到远程医疗，毫秒级低延迟的音视频交互体验已成为新一代实时系统的“生命线”。而在这个领域，视沃科技旗下的大牛直播SDK（SmartMediaKit），凭借全自研的超强流媒体内核、超低延迟表现和跨平台支持，成为行业标杆级的音视频基础设施提供者。全栈自研，跨平台高性能流媒体引擎大牛直播SDK始于2015
前端开发者必须要掌握的技术栈及学习建议，都是干货老猿阿浪前端学习前端
作为前端开发者，必须要掌握的技术栈非常的广泛，但总体脉络不变，以下是当前前端开发的核心技术分类和学习建议，按优先级和重要性排序如下（都是干货）：一、基础三件套（必学）HTML5语义化标签、表单验证、WebAccessibility（无障碍访问）Canvas/SVG、音视频嵌入CSS3盒模型、Flex/Grid布局、响应式设计（媒体查询）动画（Transition/Animation）、变量（CSS
鸿蒙有约｜对话申俊伟：在鸿蒙生态中，我选择做个“技术传播者” harmonyos
在新一轮操作系统演进的浪潮中，HarmonyOS正逐步走向主流，开发者的角色也从“适配者”转变为“共建者”。本期《鸿蒙有约》，我们专访了申俊伟（网名“轻口味”）——一位深耕移动端十年的音视频领域专家与活跃的技术博主。Q：欢迎加入“鸿蒙有约”！请您简单地介绍一下自己吧。A：大家好，我是申俊伟，网名轻口味，目前扎根北京，拥有十年移动端开发经验，深耕AI、音视频和即时通讯领域，在公司负责IM客户端方向。
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS

音视频基础知识

音频量化

音频量化基本概念

采样大小

采样率

声道数

音频量化过程

音频码率计算

音频压缩技术

音频编码过程

视频基础

定义

人眼的视觉特性

基本概念

视频的采集与展示流程

OETF

EOTF

Gamma校正与图像显示

gamma校正的意义：

帧率（framerate）

码率（bitrate）

色域（colorSpace）

颜色模型（color model）

视频制式

隔行扫描与逐行扫描

常见视频容器格式与编码格式

编码格式

编码器

容器格式

视频编解码

基本概念

I帧/IDR

P帧

B帧

GOP

视频花屏、卡顿

花屏与卡顿

PPS

SPS

SEI

PTS与DTS

帧分组与组内宏块查找

运动估计与补偿

宏块

图像分割

编码的基本流程

H.264的层级结构

H.264的压缩方式

帧内预测

帧间预测

DCT

CABAC

直播相关

相关协议

RTP与RTCP

RTMP（Real Time Messaging Protocol）

RTSP(Real Time Streaming Protocol)

HLS（HTTP Live Streaming）

直播协议对比

CDN

构成

边缘节点

二级节点

源站

分类

CDN网络结构

架构

泛娱乐化直播

主要包括

主要流程

实时互动直播

直播连麦

你可能感兴趣的:(视频编码,音视频,视频编解码)