knowledgebao

PS-TS-PES-ES流结构分析

相关链接：https://blog.csdn.net/knowledgebao/article/details/84776869

概念普及：

TS层(ts header+adaption+PAT/PMT)

ts header

adaption

PAT/PMT

pes层

es层

概念普及：

PS：是MPEG2的一种分装格式，目前可用于GB28181等协议中，PS格式包括：PS header，PS system header，PS system map，PES层，ES层，具体可以参考PS封包到rtp中，适用于没有误差产生的媒体存储，如DVD等存储介质；
TS：是ISOIEC 13818-1的标准，主要用于数字高清电视以及HLS直播协议等，TS层三个部分：ts header、adaptation field、payload以及一些表，比如PAT/PMT等。ts header固定4个字节；adaptation field可能存在也可能不存在，主要作用是给不足188字节的数据做填充；payload是pes数据。PAT/PMT跟在ts header之后，PAT表主要的作用就是指明了PMT表的PID值。PMT表主要的作用就是指明了音视频流的PID值。适用于有信道噪声产生的传输，目前TS流广泛应用于广播电视中，如机顶盒，HLS等。其中PAT和PMT是节目专用信息（Program Special Information， PSI）的一部分
PES：是Packetized Elementary Stream的简称，是将原始ES流打包后形成的，再将PES经过不同的打包方式可以组成MPEG program stream 和 MPEG transport stream，即PS流和TS流。也就是说TS和PS下边的PES封包是一致的。
ES: 层指的就是音视频编码后数据，比如h.264视频和aac音频等。

TS流和PS流的区别：TS流的包结构长度是固定的；PS流的包结构是可变长度的。这导致了TS流的抵抗传输误码的能力强于PS流（TS码流由于采用了固定长度的包结构，当传输误码破坏了某一TS包的同步信息时，接收机可在固定的位置检测它后面包中的同步信息，从而恢复同步，避免了信息丢失。而PS包由于长度是变化的，一旦某一 PS包的同步信息丢失，接收机无法确定下一包的同步位置，就会造成失步，导致严重的信息丢失。因此，在信道环境较为恶劣，传输误码较高时，一般采用TS码流；而在信道环境较好，传输误码较低时，一般采用PS码流。由于TS码流具有较强的抵抗传输误码的能力，因此目前在传输媒体中进行传输的MPEG-2码流基本上都采用了TS码流的包格。

所以关系如下表：

PS流	PS header	PS system header	PES层	ES层
ES流	TS header	(PAT/PMT...)adaptation field	PES层	ES层

这个只只介绍TS相关，其中PS相关，可以参考PS封包到rtp中

TS流背景介绍：

在介绍具体字段，参数这些头疼，烦人的东西之前，我觉得有必要先介绍下TS流的应用背景，有了这个概念，再去深入学习，将如虎添翼。TS流最经典的应用就是我们平时生活中的数字高清电视。我们看的电视码流就是TS封装格式的码流，电视码流发送过来后，就会由我们的机顶盒进行解封装，解码，然后传给电视机进行播放。这里就有一个问题，我们看电视，有很多的频道，节目，对应码流是怎么区分的呢？（TIPS，频道和节目的关系，比如我们有中央电视台综合频道，下属CCTV-1~CCTV14这些节目）TS流引入了PAT和PMT两张表格的概念来解决这个问题。

TS流是以每188字节为一包，我们可以称为ts packet。这个ts packet有可能是音视频数据，也有可能是表格。举例说明，TS流的包顺序为：PAT，PMT，DATA，DATA，，，，，，PAT，PMT，DATA，DATA，，，，，，每隔一段时间，发送一张PAT表，紧接着发送一张PMT表，接着发送DATA（音视频）数据。那么你可能要问了，有了这2张表格怎么区分频道，节目呢？PAT表格里面包含所有PMT表格的信息，一个PMT表格对应一个频道，比如中央电视台综合频道。而一个PMT里面包含所有节目的信息，比如CCTV1~CCTV14。在实际情况中我们是有很多频道的，所以PMT表格可不止一张，有可能是PAT，PMT，PMT，PMT，，，DATA，DATA，，，，PAT，PMT，PMT，，，DATA，DATA这样的形式。除了这个设定外，每个频道或节目都有自己的标识符（PID），这样当我们拿到一个DATA，解析出里面的PID，就知道是什么节目，并且也知道所属频道是什么了。我们看电视的时候，会收到所有节目的DATA，当我们正在看某个节目的时候，机顶盒会把这个节目的DATA单独过滤出来，其它的舍弃。

TS层三个部分：ts header、adaptation field、payload以及一些表，比如PAT/PMT等。ts header固定4个字节；adaptation field可能存在也可能不存在，主要作用是给不足188字节的数据做填充；payload是pes数据。PAT/PMT表跟在ts header之后，PAT表主要的作用就是指明了PMT表的PID值。PMT表主要的作用就是指明了音视频流的PID值。

TS层(ts header+adaption+PAT/PMT)

ts层 ts包大小固定为188字节，ts层分为三个部分：ts header、adaptation field、payload。ts header固定4个字节；adaptation field可能存在也可能不存在，主要作用是给不足188字节的数据做填充；payload是pes数据。

ts header

sync_byte	8b	同步字节，固定为0x47
transport_error_indicator	1b	传输错误指示符，表明在ts头的adapt域后由一个无用字节，通常都为0，这个字节算在adapt域长度内
payload_unit_start_indicator	1b	负载单元起始标示符，一个完整的数据包开始时标记为1
transport_priority	1b	传输优先级，0为低优先级，1为高优先级，通常取0
pid	13b	pid值
transport_scrambling_control	2b	传输加扰控制，00表示未加密
adaptation_field_control	2b	是否包含自适应区，‘00’保留；‘01’为无自适应域，仅含有效负载；‘10’为仅含自适应域，无有效负载；‘11’为同时带有自适应域和有效负载。
continuity_counter	4b	递增计数器，从0-f，起始值不一定取0，但必须是连续的

ts层的内容是通过PID值来标识的，主要内容包括：PAT表、PMT表、音频流、视频流。解析ts流要先找到PAT表，只要找到PAT就可以找到PMT，然后就可以找到音视频流了。PAT表的PID值固定为0。PAT表和PMT表需要定期插入ts流，因为用户随时可能加入ts流，这个间隔比较小，通常每隔几个视频帧就要加入PAT和PMT。PAT和PMT表是必须的，还可以加入其它表如SDT（业务描述表）等，不过hls流只要有PAT和PMT就可以播放了。

PAT表：他主要的作用就是指明了PMT表的PID值。
PMT表：他主要的作用就是指明了音视频流的PID值。
音频流/视频流：承载音视频内容。

adaption

adaptation_field_length	1B	自适应域长度，后面的字节数
flag	1B	取0x50表示包含PCR或0x40表示不包含PCR
PCR	5B	Program Clock Reference，节目时钟参考，用于恢复出与编码端一致的系统时序时钟STC（System Time Clock）。
stuffing_bytes	xB	填充字节，取值0xff

自适应区的长度要包含传输错误指示符标识的一个字节。pcr是节目时钟参考，pcr、dts、pts都是对同一个系统时钟的采样值，pcr是递增的，因此可以将其设置为dts值，音频数据不需要pcr。如果没有字段，ipad是可以播放的，但vlc无法播放。打包ts流时PAT和PMT表是没有adaptation field的，不够的长度直接补0xff即可。视频流和音频流都需要加adaptation field，通常加在一个帧的第一个ts包和最后一个ts包里，中间的ts包不加。

PCR关于同步说明：

PCR用来同步前端编码器和后端机顶盒的时钟，在TS的传输过程中，一般DTS和PCR差值会在一个合适的范围，这个差值就是要设置的视音频Buffer的大小，一般情况下视频DTS和PCR的差值在700ms~1200ms之间，音频差值在200ms-700ms之间，具体详见参考文档3.

PAT/PMT

table_id	8b	PAT表固定为0x00
section_syntax_indicator	1b	固定为1
zero	1b	固定为0
reserved	2b	固定为11
section_length	12b	后面数据的长度
transport_stream_id	16b	传输流ID，固定为0x0001
reserved	2b	固定为11
version_number	5b	版本号，固定为00000，如果PAT有变化则版本号加1
current_next_indicator	1b	固定为1，表示这个PAT表可以用，如果为0则要等待下一个PAT表
section_number	8b	固定为0x00
last_section_number	8b	固定为0x00
开始循环
program_number	16b	节目号为0x0000时表示这是NIT，节目号为0x0001时,表示这是PMT
reserved	3b	固定为111
PID	13b	节目号对应内容的PID值
结束循环
CRC32	32b	前面数据的CRC32校验码

PMT格式

table_id	8b	PMT表取值随意，0x02
section_syntax_indicator	1b	固定为1
zero	1b	固定为0
reserved	2b	固定为11
section_length	12b	后面数据的长度
program_number	16b	频道号码，表示当前的PMT关联到的频道，取值0x0001
reserved	2b	固定为11
version_number	5b	版本号，固定为00000，如果PAT有变化则版本号加1
current_next_indicator	1b	固定为1
section_number	8b	固定为0x00
last_section_number	8b	固定为0x00
reserved	3b	固定为111
PCR_PID	13b	PCR(节目参考时钟)所在TS分组的PID，指定为视频PID
reserved	4b	固定为1111
program_info_length	12b	节目描述信息，指定为0x000表示没有
开始循环
stream_type	8b	流类型，标志是Video还是Audio还是其他数据，h.264编码对应0x1b，aac编码对应0x0f，mp3编码对应0x03
reserved	3b	固定为111
elementary_PID	13b	与stream_type对应的PID
reserved	4b	固定为1111
ES_info_length	12b	描述信息，指定为0x000表示没有
结束循环
CRC32	32b	前面数据的CRC32校验码

pes层

pes层是在每一个视频/音频帧上加入了时间戳等信息，pes包内容很多，我们只留下最常用的。

pes start code	3B	开始码，固定为0x000001
stream id	1B	音频取值（0xc0-0xdf），通常为0xc0 视频取值（0xe0-0xef），通常为0xe0
pes packet length	2B	后面pes数据的长度，0表示长度不限制，只有视频数据长度会超过0xffff
flag	1B	通常取值0x80，表示数据不加密、无优先级、备份的数据
flag	1B	取值0x80表示只含有pts，取值0xc0表示含有pts和dts
pes data length	1B	后面数据的长度，取值5或10
pts	5B	33bit值
dts	5B	33bit值

pts是显示时间戳、dts是解码时间戳，视频数据两种时间戳都需要，音频数据的pts和dts相同，所以只需要pts。有pts和dts两种时间戳是B帧引起的，I帧和P帧的pts等于dts。如果一个视频没有B帧，则pts永远和dts相同。从文件中顺序读取视频帧，取出的帧顺序和dts顺序相同。dts算法比较简单，初始值 + 增量即可，pts计算比较复杂，需要在dts的基础上加偏移量。

音频的pes中只有pts（同dts），视频的I、P帧两种时间戳都要有，视频B帧只要pts（同dts）。打包pts和dts就需要知道视频帧类型，但是通过容器格式我们是无法判断帧类型的，必须解析h.264内容才可以获取帧类型。

举例说明：

I P B B B P

读取顺序： 1 2 3 4 5 6

dts顺序： 1 2 3 4 5 6

pts顺序： 1 5 3 2 4 6

点播视频dts算法：

dts = 初始值 + 90000 / video_frame_rate，初始值可以随便指定，但是最好不要取0，video_frame_rate就是帧率，比如23、30。

pts和dts是以timescale为单位的，1s = 90000 time scale , 一帧就应该是90000/video_frame_rate 个timescale。

用一帧的timescale除以采样频率就可以转换为一帧的播放时长

点播音频dts算法：

dts = 初始值 + (90000 * audio_samples_per_frame) / audio_sample_rate，audio_samples_per_frame这个值与编解码相关，aac取值1024，mp3取值1158，audio_sample_rate是采样率，比如24000、41000。AAC一帧解码出来是每声道1024个sample，也就是说一帧的时长为1024/sample_rate秒。所以每一帧时间戳依次0，1024/sample_rate，...，1024*n/sample_rate秒。

直播视频的dts和pts应该直接用直播数据流中的时间，不应该按公式计算。

es层

es层指的就是音视频数据，我们只介绍h.264视频。

h.264视频：

打包h.264数据我们必须给视频数据加上一个nalu（Network Abstraction Layer unit），nalu包括nalu header和nalu type，nalu header固定为0x00000001（帧开始）或0x000001（帧中）。h.264的数据是由slice组成的，slice的内容包括：视频、sps、pps等。nalu type决定了后面的h.264数据内容。nalu占8个字节，具体内容如下：

F	1b	forbidden_zero_bit，h.264规定必须取0
NRI	2b	nal_ref_idc，取值0~3，指示这个nalu的重要性，I帧、sps、pps通常取3，P帧通常取2，B帧通常取0
Type	5b	参考下表

nal_unit_type	说明
0	未使用
1	非IDR图像片，IDR指关键帧
2	片分区A
3	片分区B
4	片分区C
5	IDR图像片，即关键帧
6	补充增强信息单元(SEI)
7	SPS序列参数集
8	PPS图像参数集
9	分解符
10	序列结束
11	码流结束
12	填充
13~23	保留
24~31	未使用

nalType为1，5，6，7，8，9是最常用的，打包es层数据时pes头和es数据之间要加入一个type=9的nalu，关键帧slice前必须要加入type=7和type=8的nalu，而且是紧邻。

参考资料：

TS流格式小白入门解读
ts流格式详解
TS之PCR

有任何问题，请联系[email protected]

iOS性能调试完整流程实录：工具组合下的问题定位与修复实践(含keymob) 2501_91592143 http udp https websocket 网络安全网络协议 tcp/ip
iOS应用开发进入中后期时，调试工作往往从功能测试转向稳定性与性能问题的修复。而这类问题复杂度通常远高于业务Bug，因为它们更多涉及运行环境、线程调度、资源占用甚至平台兼容性。在一次维护阶段中，我们针对公司内某音视频相关App执行了一轮深入的性能审查。目标是清理潜在的资源泄漏、后台高功耗行为，以及定位用户反馈但无法稳定复现的间歇性崩溃。以下是我们构建的调试流程和实战操作方式，所有工具的使用都是按任
AWS之AI服务 qq_39036953 计算机科学 #云计算 #人工智能人工智能云计算 ai
目录一、AWSAI布局1.底层基础设施与芯片2.AI训练框架与平台3.大模型与应用层4.超级计算与网络与竞品对比AI服务1.机器学习平台2.预训练AI服务3.边缘与物联网AI4.数据与AI集成工具5.行业解决方案6.生成式AI前沿应用总结热门AI服务一、AWS客户使用最多的AI服务二、与微软Azure的竞品对比三、市场表现与客户选择音视频相关的AI服务1.语音识别与合成2.视频分析与处理3.实时音
Android 音频架构全解析：从 AudioTrack 到 AudioFlinger 居然是阿宋音视频 Android android 音视频架构
在开发音视频相关应用时，我们常会接触到MediaPlayer、SoundPool、AudioTrack、OpenSLES、AAudio、Oboe等名词，它们都与Android的音频播放息息相关。然而，真正理解它们之间的关系以及背后运行机制，才能写出高性能、低延迟的音频程序。本文将从整体架构入手，系统梳理Android的音频系统。一、Android音频架构分层概览Android音频系统可大致划分为以
实现一个通用的生产者消费者队列（c语言版本） voidreturn 通用生产者消费者队列音视频数据处理
背景：笔者之前一直从事嵌入式音视频相关的开发工作，对于音视频的数据的处理，生产者消费者队列必不可少，而如何实现一个高效稳定的生产者消费者队列则十分重要，不过按照笔者从业的经验，所看到的现象，不容乐观，很多知名大厂在这种基础组件的开发能力上十分堪忧。音视频数据处理的特点：音视频数据量大：音视频数据特别是视频数据，占据了计算机数据的很大一块，不信就看看每个人的硬盘里，去除电影，照片，mp3是不是很空荡
RTSP服务器连接教程强了一点运维部署服务器运维
一、软件安装1.1ffmpeg介绍FFmpeg是一个开源的音视频处理工具包，广泛应用于数字音视频的录制、转换、以及流媒体功能的实现。无论是技术开发者还是普通用户，FFmpeg都能帮助您轻松实现音视频相关的需求。FFmpeg主要由三个部分组成：ffmpeg.exe:负责音视频的格式转换与转码。ffplay.exe:提供简单的音视频播放功能。ffprobe.exe:用于分析多媒体码流，方便获取视频或音
【音视频学习笔记】- FFMPEG - 1.命令行参数解析及生效过程 Y&LOVE&G ffmpeg 音视频学习笔记
目录一、文章简介二、源码阅读2.1代码位置2.2主要功能及函数介绍2.2.1解析命令行参数及参数生效2.2.2解析命令行参数2.2.3处理命令行的全局参数2.2.4打开输入文件(输入参数生效)2.2.5打开输出文件(输出参数生效)音视频学习笔记系列主要介绍笔者在学习音视频过程中，学习了解到的音视频相关知识点，涉及内容包括但不限于音视频基础、音视频封装、传输协议、FFMPEG。本系列持续更新一、文章
音视频开发成长之路与音视频知识点总结 Linux服务器开发音视频开发 webrtc ffmpeg 音视频开发流媒体服务器开发 webrtc FFmpeg 嵌入式音视频开发
音视频涉及语音信号处理、数字图像处理、信息论、封装格式、编解码、流媒体协议、网络传输、渲染、算法等。在现实生活中，音视频发挥着越来越重要的作用，如视频会议、直播、短视频、播放器、语音聊天等。所以从事音视频开发是一件有意义的事情，机遇和挑战并存。本文将从：音视频开发基础、音视频高级成长、音视频工作方向、音视频开源库、音视频相关书籍，配套的学习资源等几个方面来进行介绍。那么我们该如何系统的学习音视频开
OpenGL C++视频中添加图片及文字水印播放并录制 Everbrilliant89 音视频开发 OpenGL相关 OpenGL 图片水印 OpenGL 视频图片文字水印 OpenGL 文字水印 OpenGL视频水印录制 OpenGL视频水印播放 GL视频中绘制图片文本水印视频水印录制
一.前言：GitHub地址：GitHub-wangyongyao1989/WyFFmpeg:音视频相关基础实现系列文章：1.OpenGLTextureC++预览Camera视频；2.OpenGLTextureC++CameraFilter滤镜;3.OpenGL自定义SurfaceViewTextureC++预览Camera视频;4.OpenGLTextureC++CameraFilter滤镜视频录
GL C++显示相机YUV视频数据使用帧缓冲FBO后期处理，实现滤镜功能。 Everbrilliant89 OpenGL相关音视频开发音视频 OpenGL图片水印 OpenGL文字水印 OpenGL帧缓冲 OpenGL离屏渲染（OSR）OpenGL FBO OpenGL图像合成
一.前言：GitHub地址：GitHub-wangyongyao1989/WyFFmpeg:音视频相关基础实现系列文章：1.OpenGLTextureC++预览Camera视频；2.OpenGLTextureC++CameraFilter滤镜;3.OpenGL自定义SurfaceViewTextureC++预览Camera视频;4.OpenGLTextureC++CameraFilter滤镜视频录
音视频知识图谱 2022.04 关键帧Keyframe
前些时间，我在知识星球上创建了一个音视频技术社群：关键帧的音视频开发圈，在这里群友们会一起做一些打卡任务。比如：周期性地整理音视频相关的面试题，汇集一份音视频面试题集锦，你可以看看《音视频面试题集锦2022.04》。再比如：循序渐进地归纳总结音视频技术知识，绘制一幅音视频知识图谱。下面是2022.04月知识图谱新增的内容节选：1）图谱路径：**采集/音频采集/声音三要素/响度******主观计量响
音视频相关文章总目录 cuijiecheng2018 FFmpeg源码分析音视频技术音视频
为了方便各位观看，本文置顶，以目录形式汇集我写过的大部分音视频专题文章。之后文章更新，本目录也会同步更新。写得不好和零零散散的文章就不放在这里了：=================================================================音视频入门基础：像素格式专题系列文章：音视频入门基础：像素格式专题（1）——RGB简介音视频入门基础：像素格式专题（2）——
视频基础学习一——色立体、三原色以及像素山河君音视频学习
文章目录前言一、什么是颜色1.色立体特征2.色立体模型二、三原色和色立体1.三原色(RGB)2.RGB颜色叠加三、像素和三原色总结前言本文的目的是为了梳理音视频基础相关的知识，有很多做流媒体、音视频相关的研发对于音视频的根本原理是不清楚的。博主也是查阅了相关的资料一点点进行梳理，从根本上一点点延申到音视频处理上。|版本声明：山河君，未经博主允许，禁止转载一、什么是颜色了解过视频的同学应该都知道，视
音视频知识图谱 2022.05 关键帧Keyframe
前些时间，我在知识星球上创建了一个音视频技术社群：关键帧的音视频开发圈，在这里群友们会一起做一些打卡任务。比如：周期性地整理音视频相关的面试题，汇集一份音视频面试题集锦，你可以看看这个合集：音视频面试题集锦。再比如：循序渐进地归纳总结音视频技术知识，绘制一幅音视频知识图谱，你可以看看这个合集：音视频知识图谱。下面是2022.05月知识图谱新增的内容节选：1）图谱路径：采集/视频采集/对焦策略手动对
基于Qt 视频播放器mp4/wav/avi/等等（进阶） Qt历险记 Qt 高级开发工程师 qt 音视频开发语言 c++QML
##Qt音视频相关Qt多媒体音频模拟按钮发音(音视频启动)基于Qt音乐播放器mp3（进阶）##项目工具工具名
那些年曾经看过的书——工作篇徐福记456 人生杂谈 android 音视频程序员的梦想
工作以后，主要是看一些与工作相关的书，比如Android相关：Android开发艺术探索、深入理解Android内核设计思想、Android系统源代码情景分析、精通Android多媒体开发、AndroidC++高级编程。音视频相关：FFmpeg从入门到精通、WebRTCNative开发实战、OpenGLES3.0编程指南、音视频开发进阶指南。语言相关：C++PrimerPlus、Java编程思想。
OpenCv + Qt5.12.2 文字识别何其不顾四月天 OpenCv opencv qt 计算机视觉
OpenCv+Qt5.12.2文字检测与文本识别前言好久没有进行一些相关的更新的了，去年一共更新了四篇，最近一直在做音视频相关的直播服务，又是重新学习积攒经验的一个过程。去年疫情也比较严重，等到解封，又一直很忙，最近又算有了一些时间，所以想着可以做一些更新了，又拿起了OpenCV,做一些相关更新了。其实代码相关的工作，在上一篇OpenCV-摄像头相关的完成之后已经做完了，只是一直没有写相关博客，这
杨婷：腾讯云在线教育解决方案分享腾讯云开发者在线教育服务器
本文来自腾讯云技术沙龙，本次沙龙主题为在线教育个性化教学技术实践演讲嘉宾：杨婷，腾讯高级产品经理。2010年重庆大学通信工程毕业，6年音视频相关产品从业经验。先后负责过视频云平台、视频CDN、直播点播、互动直播、视频会议及音视频互动类智能硬件终端产品，了解音视频产品与行业结合常见应用。首先为大家介绍一下培训机构的运营框架。首先是优质的教育内容，培训要有核心的内容。有了核心内容后，就要有在线教育平台
音视频协议解析(RTP/RTCP/RTSP/RTMP)——RTSP解析李铁山音视频网络协议
介绍我这个系列讲解音视频相关的协议，这部分内容比较多，我打算分成好几篇讲，感兴趣的读者可以关注一下。有了以上的基础，我就打算做一个音视频的网络服务器。如果您觉得读起来有点困难，可以先补一下计算机网络的知识，主要是TCP，UDP，HTTP相关的知识。讲解我们这篇文章讲解RTSP（Real-TimeStreamingProtocol）协议。这是一个应用层协议，位于RTP/RTCP协议之上。用于控制流媒
RTMP直播推流 doublesky_zhang
一.前言之前在老东家时，因为自己平时课外喜欢研究音视频相关的东西，刚好老大那一阵又忙，于是当时一个直播推流没有画面的问题就交给我来定位，但是那时候是基于老大的ffmpeg推流相关的代码去做修改，没有从头到尾的去自己弄一遍二.Demo中RTMP推流模块使用方法1.RTMP推流地址在doublesky_rtmp_push.mm的p_start_rtmp方法中设置为了跨平台，最新版本将rtmp推流模块改
视频基础知识【零声教育】音视频开发进阶音视频开发程序员音视频 ffmpeg c++c语言 qt
作为移动开发者，大多数时候会需要接触到音视频相关的开发，而其实严格意义上我也并不是专职的音视频开发工程师，只是在2016因为业务需要接触到音视频相关的领域，而开源的GSYVideoPlayer恰好火起来之后，为了解决系列问题成了“半桶水”的音视频开发工程师。在维护GSYVideoPlayer的这几年里，我发现很多开发者对于音视频领域相关的基本概念还是不清楚，所以我也经常可以收获这样的issue：“
音视频开发（二十四）：音视频基础知识程序员老舅音视频开发进阶音视频视频编解码实时音视频 webrtc 实时互动
目录视频播放器原理音频编码基础知识视频编码基础知识从这篇开始我们进入ffmpeg系列的学习实践，作为开篇，我们先来了解下音视频相关的基础知识。一、视频播放器原理雷神的这张图很清晰的说明了视频播放的流程：解封装—》音/视频解压缩—》音视频编码—》音视频裸数据PCM和YUV—》音视频同步处—》音频播放、视频渲染二、音频的基本知识对声音将模拟信号转为数字信号，要经过三个步骤：采样、量化、编码人耳能够听到
基于 Web 引擎技术的 Web 内容录制拉普拉斯妖1228 音视频 chrome web 视频处理 webrtc 音频编码解码
最近学习音视频相关技术看到一个很好的技术分享，实现了基于Chromium的web内容录制。现在分享出来大家一起学习一下。B站视频：声网AgoraWeb引擎高级架构师高纯：Web互动场景还原——基于Web引擎技术的原文链接：https://blog.csdn.net/agora_cloud/article/details/110913869原文内容：随着基于WebRTC技术的Web应用快速成长，记录
【FFmpeg】(一) 音视频相关基础知识以及FFmpeg介绍与编译 onestravel
【FFmpeg】(一)音视频相关基础知识以及FFmpeg介绍一、音视频相关基础知识1、视频播放器原理视频播放器就是将一个封装的格式数据进行解封装，得到对应的音频压缩数据和视频压缩数据，再进行相应的音视频解码，得到音频采样数据和视频采样数据，最后将音频采样数据和视频采样数据同时播放，达到音视频同步。封装格式数据通常有FLV、MKV、MP4、AVI、RMVB等等录音、录像的实质就是一个压缩采集到的图像
ffmpeg抽取音视频，格式转换，截取 mojovs ffmpeg
下面内容由ffmpeg官网的例程源码分析所得。由于fmpeg是c语言所写，并且这里以分析和提取ffmpeg工作流程为主，就没有对代码进行解耦合。音视频相关知识比较杂乱，单纯看代码，不是音视频的老手或者对音视频格式很熟悉，会对流中的一些操作感到困惑，如在视频头尾添加各种码，参数的设置和拷贝等，感觉在阅读代码时多参考相关文献，或者百度，不然很难掌握。官方例程源码链接http://www.ffmpeg.
Android音视频-初识FFmpeg 落叶挽歌 Android 音视频 android java
已经很久没有写过技术博客了，这段时间加入了新公司，主要时间花在熟悉新业务的技术上。而新的业务主要跟音视频相关，关于音视频的尝试在加入新公司之前，自己有做相关demo的尝试与学习，可以参看音视频相关学习demo。当然，那都是自己“想当然”学习的一些东西，虽然实际工作中并没有派上太大的用处，但让我对音视频相关的基础知识有了一定的概念，对后面的技术尝试做了铺垫。第一个技术挑战比较大的就是进行：视频抽帧，
音视频开发系列（16）技术解码 | SRT和RIST协议综述音视频开发老马音视频开发音视频视频编解码实时音视频 c++webrtc
概要近些年来，互联网行业出现了几波和音视频相关的热潮：VR、短视频、直播等。除了VR因技术成熟度问题，还在蓄势待发，短视频和直播持续热度不减，以各种方式进入新的行业应用领域。视频直播方向，RTMP仍是最流行的上行传输协议，但RTMP的局限性也越来越凸显：RTMP的容器格式FLV，存在不支持新的codec、不支持多音轨、时间戳精度过低等等缺陷；RTMP基于TCP做传输，TCP的公平、可靠传输设计并不
基于 Web 引擎技术的 Web 内容录制拉普拉斯妖kk
最近学习音视频相关技术看到一个很好的技术分享，实现了基于Chromium的web内容录制。现在分享出来大家一起学习一下。B站视频：声网AgoraWeb引擎高级架构师高纯：Web互动场景还原——基于Web引擎技术的原文链接：https://blog.csdn.net/agora_cloud/article/details/110913869原文内容：随着基于WebRTC技术的Web应用快速成长，记录
[OpenGL]未来视觉5-抖音滤镜 weixin_34406061 java c/c++移动开发
大家好，我系苍王。以下是我这个系列的相关文章，有兴趣可以参考一下，可以给个喜欢或者关注我的文章。OpenGL和音视频相关的文章，将会在[OpenGL]未来视觉-MagicCamera3实用开源库当中给大家呈现里面会记录我编写这个库的一些经历和经验。提到抖音特效，相信很多人都会看过这篇文章当一个Android开发玩抖音玩疯了之后(二)里面提供了六种抖音特效的编写和实现，是使用java代码来实现的，其
Android 编译IJKPlayer源码 HeartCircle android jni GSYVideoPlayer IJKPlayer
1.背景目前在做音视频相关的工作，在项目中用到了播放相关的问题，使用的框架是GSYVideoPlayer，使用它的原因是可以很方便的切换播放器内核，系统内核、IJKPlayer内核亦或是exo2Player内核，视频播放的格式不统一，使用这种方式能够更大程度的方便开发工作。为什么要重新编译IJK播放器源码呢？这次是需要做android9.0的适配，播放的视频格式是rtsp，使用的内核是系统内核（M
如何像抖音直播一样，从 App 直播间到桌面画中画实现画面无缝切换？丨有问有答关键帧Keyframe
前一些时间，我在知识星球上创建了一个音视频技术社群：关键帧的音视频开发圈，不少朋友加入并在里面咨询一些音视频相关的技术问题，其中不乏一些开发中普遍遇到的问题，这里我会挑一些放出来供大家参考。如果你也有音视频技术问题想咨询，或者符合下面的情况：在校大学生→学习音视频开发iOS/Android客户端开发→转入音视频领域直播/短视频业务开发→深入音视频底层SDK开发音视频SDK开发→提升技能，解决优化瓶
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那

PS-TS-PES-ES流结构分析

概念普及：

TS层(ts header+adaption+PAT/PMT)

ts header

adaption

PAT/PMT

pes层

es层

你可能感兴趣的:(音视频相关)