费城之鹰

音视频基础1：H264、H265、MPEG-4、VP8、VP9编码基础知识

这里写自定义目录标题

个人认知，程序员职业发展出路
编码器发展史
编码原理
H264
H265

个人认知，程序员职业发展出路

随着5G时代的到来，音视频成功走上风口，程序员如何发展，其实不管是入门级选手还是30岁，35岁中年危机的IT开发者，异或是更年长的IT开发者，都会有自己的职业发展路线。总结来说，目前大部分人的职业路线，职业出路，或者说职业遇到瓶颈以后解决方案可以总结为一下几种，程序员是天天解决问题，天天给各种问题解决方案的人，对于自己的职业当然也得给出最好的解决方案：

出路1： 转行；最简单粗暴的，从写代码的工作变换到开个杂货铺，开个烧烤摊，或者考个公务员事业单位。完全走上一个新的领域新的行业，但是这也是一种出路，没有对错，只有适合还是不适合。
出路2: 继续深入专业领域；这个就有点厉害了，当然也是有难度的，在自身的领域达到专家级别，对自己的领域有比其他人更多更深的研究和见解，这个时候，你的年纪其实是你的优势，随着技术的进一步深入，进一步积累，你会更值钱。但是你的成绩从不及格提升到及格是很容易的，从60份到80分也是比较容易的，提升到90分也可以做到，但是当你要做到从95分到96分的提升就很艰难了，需要很多的耐心、思考，等等，人和人之间的差距也许就是那0.1分，这就是为什么很多人做不到纵向深入的原因。
出路3： 相关领域转行，比如管理岗，技术管理岗，销售管理岗。都是以技术为基础继续向相关领域拓展。技术深入属于纵向拓展，相关岗位转岗就属于横向拓展了。

目前大部分的人都会有这3种考虑，觉得绞尽脑汁也就这3种选择和出路了，但是在我看来还有一种，追随风口。
出路4，追随互联网技术风口。
现在的互联网技术更新速度非常的快，阿里有一句话非常牛逼，就算是一头猪到了风口也可以飞上天。现在互联网技术发展这块，风口技术每年都有，有的技术可以维持三到五年的风口期，这段时间进行野蛮式增长、爆发，之后就进入一个相对理性、成熟、稳定增长和变化的环节了，这就趋于稳定了。
我看来的出路就是，用敏锐的触觉去发现每一次的风口技术，去抓风口技术，用最快的速度去学习风口技术，赶上这一波红利，做一个当下技术红牛没问题吧，甚至成功创业也不是不可能。

说的有点热血了，总结一句就是说，还有一个出路，需要你有快速反应能力，快速学习知识，学习技术，整合资源，学习当下最有发展前景，即将爆发的技术。
比如5G相关的产业。
也许你只需要学好0-1或者0-10，0-60就可以了，不必那么深入，因为走的就是快速路线，快枪讲究的就是速度。

说的太多有点跑题了，回归正题，音视频，移动音视频，随着5G的到来，音视频必然会带上风口，我个人认为在这个上风口之前具备一定的音视频开发技术，到了风口收割一波红利，没得说，美滋滋。但是音视频开发门槛较高，国内资源较少，这也是难点。

但是，难点也是卖点，烂大街的东西当然便宜了。

闲话就说这么多，今天主要总结一下几种编解码器的基础知识，他们的背景知识。

---------------------------------------------------------先洗这么点，明天继续更。2021-1-4.

编码器发展史

Android中创建编码器

MediaCodec.createEncoderByType("video/av");  //创建H264编码器
MediaCodec.createEncoderByType("video/hevc");  //创建H265编码器

为什么会有这么多种编码器？看看他们的发展史的。
ITU-T这个组织是专门做音视频的组织，还有一个组织ISO，这个组织是专门做各种标准规范的。
ITU-T是最先研发了音视频通话的，最先研究出了H261，后来发布H262,H263，指导后来的H视频编解码器，这是ITU-T的H26x系列。
两个组织互相竞争，
ISO也研发了MPEG-1、MPEG-2、MPEG-3、MPEG-4,对应H26x系列。
两个组织竞争了相近20年，两个组织两个标准，最后再1998年双方合作，在第一版H264的基础上双方进行共同研发，发布了后来的更成熟的H264，作为后来的结晶，这一结晶在ITU-T组织中依然称为H264，但是在ISO组织中称为MPEG4-avc，这只是在不同组织中的称呼名字。
但是在实际代码中创建的时候，都是传入，首先是video表示一个视频标签，然后传入ISO组织的名称“avc”表示H264编解码器，H265就是“video/hevc”。

随着社会的进步，技术的发展，生活中使用的显示器，越来越大，视频画面也变大，广泛的出现了4K、8K视频，这对于H264来说已经存在明显不足了，所以两个组织又一起合作研发了H265.

H265编解码技术在ITU-T组织中称为H265，在ISO组织中称为HEVC。

H265在H264的基础上研发的，可以达到更高压缩的同时实现画面更清晰。
H264可以实现把4M的数组压缩到80k-90k，
同样的画质和同样的码率，H.265比H2.64 占用的存储空间要少理论50%；

封装格式
mp4、flv、rmvb、avi等称为封装格式。
封装格式内部包含视频轨（H264、H265编码器编码之后的后缀是h264、h265的视频编码文件）、音频轨（后缀是.aac .mp3的音频编码文件）、字幕轨以及视频宽高等编解码信息。
编解码格式
H264、H265、VP8、VP9等称为编码格式。

其他参与者，其他编解码器
Google后来推出了VP8、VP9的编解码器，VP8,VP9分别和H264、H265做对应竞争。
Microsoft推出了VC-1。
国产自主标准：AVS/AVS+/AVS2，只是仅仅用于机顶盒，广播电视，其他领域并没有用到。但是现在的广播电视也已经废弃了AVS标准了用了其他更优良的标准。
视频的组成
可以通过FFmpeg命令把视频文件进行拆分，把一个mp4封装格式的视频文件可以抽取其中的h264视频流文件，也可以抽取其中的aac音频流文件。
视频编码文件、音频编码文件、编解码信息包括视频宽高等共同组成了封装视频文件。

编码原理

视频是如何进行编码的呢

H261在音视频领域的地位相当于冯诺依曼计算机模型对计算机领域的影响。

编码的本质就是压缩，而且是有损压缩，损失掉人耳可以听的音波频率范围之外的频率的声音。图像编码也是有损编码。
图像编码首先是将画面打乱划分称为宏块，经过心愿编码器划分宏块。
在H.264中的宏块大小是固定的16x16，在H.265中宏块的大小是可变的，最小8x8最大64x64。

对于这样一个渐变色的色块，记录哪些信息可以保存这个渐变色块呢？
首先是宽高；
其次，是起止点颜色，终止点颜色；
最后，一条颜色渐变的变化趋势方向。
这样，有这3个数据就可以还原出这张渐变图了，也就是可以唯一确定这张渐变图了。
比起来存储这张图片里的所有像素点的像素值，存储的数据就小的多了。
图片编码思路

摄像头采集到的原始视频数据是YUV格式的视频数据，然后这个YUV的数据传输给信源编码器，信源编码器的作用就是将视频的每一帧打乱成宏块，

划分好宏块后，计算宏块的像素值，计算一副图像中每个宏块的像素值，

计算宏块像素值的时候，也类似于上面的存储一张渐变图的方式，存储横向宽的第一排像素值，存储第一列的纵向颜色值，然后再记录一个预测方向，这个宏块的显示内容基本上就可以确定了。
这样，虽然不会完全把这张图片的内容保存下来，但是基本上可以把这张图片的绝大多数的内容还原出来。这也就是为什么说是有损压缩了。

原本，完全保存一张图片，比如宽高都是16像素的图片，完整保存需要16X16个int值也就是256字节，但是经过这样横向保存16字节纵向保存16字节然后保存一个预测方向，基本上只需要16+16-1=31个字节就可以保存这张图片了。

H264有8个预测方向+1个平均值，一共9个预测。

可以看出，其他条件不变的情况下，宏块越大，视频文件越小。

所有宏块都处理完，就可以拼接成一张图，就是由宏块的拼接成的一张图片了。

然后，就是划分子块：
H265对比较平坦的图像使用16X16的大小的宏块，但是为了更高的压缩率，还可以在16X16的宏块上划分出更小的子块，子块的大小可以是8X16,16X8,8X8,4X8,8X4,4X4，非常的灵活。
子块就是在16X16的标准宏块内进一步划分出更小的宏块。

这样再经过帧内压缩，可以得到更高效的数据。

可以看到H264压缩后的像素颗粒更少了。更大成都的压缩了。
宏块划分好后，就可以对H265编码器缓冲中的所有图片进行分组了。

下一步就是：帧分组：

对于视频数据主要有两类数据冗余，一类是时间上的数据冗余，一类是空间上的数据冗余。其中时间上的数据冗余是最大的，先说说视频数据时间冗余问题。
为什么说时间上的冗余是最大的呢？假设摄像机每秒抓取30帧，这30帧的数据大部分情况下都是相关的，也有可能不止30帧的数据，可能几十上百帧的数据都是关联特别密切的。
对于这些关联特别密切的帧，其实只需要保存一帧的数据，其他帧都可以通过这一帧在按某种规则预测出来，所以说视频数据在时间上的冗余是最多的。
为了达到相关帧通过预测的方法来压缩数据，就需要将视频帧进行分组。那么如何判定某些帧关系密切，可以划分为一组呢？
举个例子，打台球为例：

H265编码器会按顺序，每次取出两幅相邻帧进行宏块比较，计算两帧的相似度，如下：

可以使用VideoEye分析视频的每一帧以及各种数据。

为什么宏块越小压缩程度越低，如果是4x4宏块，减掉的原本图像的内容就越少，和原本内容相同数据就越多，宏块越大，和原图相同数据肯定就越少了。大宏块压缩肯定会丢失更多的画面细节数据，小宏块压缩，就能够保存更多的图像细节数据，图像肯定更清晰。
像微信中的发送视频，如果不是发送的原图，微信肯定进行了压缩，它压缩时牺牲视频宽高和帧率来达到的压缩，和现在视频逐帧从YUV原始数据编码压缩时不同的。

H264

H265是基于H264的，H265是在H264的基础上发展起来的。
什么是H264：
定义： 对摄像头采集的每一帧视频需要进行编码，由于视频中存在空间和时间的冗余，需要用算法来取出这些冗余。H264是专门去除这些冗余的算法，我们把这种算法称为H264编码。
H264是新一代的编码标准，以高压缩高质量和支持多种网络的流媒体传输著称。
应用大多数看到的视频，如rmvb, avi, mp4, flv 大豆是由H264进行编码，当然也会有不同的其他编码器，如mpeg4, vp9等这些比较冷门的编码器进行编码。
无论是H264 mpeg4 vp9 都是基于宏块的方式进行编码，原理都是一样的，只不过实现的算法不一致罢了。

H265

相对于H264，总结来说，在增加视频压缩率的同时，视频画面质量反而增加了，更高清了。
H264 H265 对比

在H265的压缩算法中，在像素趋于一致的地方，就采用64X64的宏块大小，在画面复杂的地方采用4X4这样的小宏块，也就是说，细节的地方H265表现更好。就是因为宏块比较小，更能够还原对应的数据，画面更清晰。
H264里有8+1个预测方向，但是在H265里面有35个预测方向。
H265块划分结构

H265中的编码过程
首先宏块会划分成64X64的大小，如果宏块内像素变化比较大，就会将该64X64的宏块继续往小划分，比如划分成4个子块，会遍历每一个子块，这个时候就会形成一个树，一个四叉树，每个子块是32X32的，对每个子块再进行进一步像素计算，如果子块内颜色趋于一致那就不再继续划分，如果子块内像素变化较大，那就继续划分，最小可以划分成4X4的大小，也就是极限情况下会出现一个64叉树。
YUV数据经过信源编码器会打乱成很多个宏块；
然后会再经过视频符合编码器；
视频符合编码器主要做的就是方向预测以及基本参考数据保存，总结来说就是结构化数据；
然后再经过传输缓冲器，会先缓存B帧数据。

捕获到的第一帧是I帧，I帧内部存储了所有了宏块数据。
第二帧和第一帧相差不大，也就是说第一帧中的宏块，第二帧中还是存在很多的，这些相同的宏块就不需要再重新进行编码了。
这样看来，视频播放的本质，就是宏块的运动，由于宏块的运动，导致用户看到的视频画面发生了改变。

那么，在第二帧就不需要保存所有的宏块了，只需要保存运动矢量+残差数据就可以了。这就是 P帧。

B帧不仅要参考I帧还要参考P帧才能确定自己的运动矢量，B帧里面只保存运动矢量，不需要保存宏块数据。

所以，I帧最大，P帧次之，B帧最小；
如果一个视频文件中I帧越多，视频文件肯定越大。
与I帧相似程度极高，达到95%以上编码成B帧；相似程度70%以上编码成P帧。如何编码不需要程序员来实现，已经由x264这个工具实现了。

所以，首先会生成一个I帧，保存所有宏块的数据，进行编码；然后第二帧生成B帧，把B帧与I帧对比，相同宏块去掉替换成运动矢量，第三帧B帧；再然后第四帧，信源编码器认为应该生成P帧，视频符合编码器会取出P帧里和I帧相同的宏块，再把对应的宏块转成运动矢量，
P帧，B帧都会和I帧做对比，去掉相同宏块，替换成运动矢量，再进行保存。
所以，码流中，首先输出I帧，然后并不是输出B帧，而是把B帧存在了传输缓冲器中，生成P帧以后把P帧输出到码流，这个时候才开始输出B帧，并不是直接从传输缓冲器直接输出B帧，而是从传输缓冲器中缓冲的B帧交给新源编码器、然后再交给视频符合编码器，或者直接从传输缓冲器交给视频符合编码器，把B帧与I帧比较，去掉重复宏块，生成B帧的运动矢量，把B帧输出到码流。
是这样的顺序。

所以，码流中，I帧之后一定是P帧。只有P帧输出之后，才能输出B帧。
视频流是一串流，可以通过十六进制分析工具分析264文件，或者用抓包工具，可以看到里面就是一串流数据，那在这一串流数据中怎么找到I帧，B帧，P帧呢？
这个时候H264设计了一个分隔符，0x0000 0001。

一个视频的帧数，就可以通过记录有多少分隔符，就可以知道有多少帧数据。
问题又来了，如果只知道分隔符，是知道了帧与帧之间的分隔，知道了一帧的数据，但是并不知道它是什么帧，所以264在设计的时候，在分隔符之后又增加了两位来表示帧类型，比如0x 0000 0001 65表示I帧。

那把I帧和P帧拿到之后能够解码出画面呢？
答案是不能。因为还需要解码参数。
解码参数就是sps,pps里面存储的信息。
码流中是按照I帧，P帧，B帧。。。。这样的顺序传输过来的，但是实际上画面是I帧，B帧，B帧，P帧，这样的顺序。所以，解码时候，首先解码I帧渲染出画面，然后解码P帧，但是P帧的画面并不能立刻播放出来，而是需要去解码B帧，B帧画面出来之后才播放P帧画面出来。这是怎么保证这个顺序的呢？码流中有一个pts参数，这是一个按照帧播放顺序递增的数据。
也就是说I帧传输过来，解析出来，就播放了，然后P帧传输过来也给它解析出来了，但是得让P帧等一等，按视频顺序播放了B帧之后再把P帧播放出来。

新的问题来了，首先生成了I帧，然后相似程度极高的第二帧画面，第三帧画面。。。相似程度都在95%以上，都生成了B帧，直到相似程度低于95%生成P帧。问题是，B帧是什么时候输出到H264码流中的？
生成了B帧不会立刻输出到码流中，因为B帧非常小，会缓存在传输缓冲器中，直到有P帧生成传输到码流之后才会从传输缓冲区拿出所有缓存的B帧，传输到码流。

视频倒放特效是怎么实现的呢？
其实就是，首先按照正序解码出来，然后倒序重新进行编码，编码出新的文件，编码比较耗时，所以选择了倒序播放会需要等待一小会儿。

I帧保存了所有宏块的数据。
所以，文件的大小和宏块大小有关系，也和I帧数量有关系。

短视频、电影中I帧是比较少的；
直播中I帧是相对比较多的；
但是直播中I帧变多就会导致视频流变大，直播中对尽可能的低带宽小数据量传输也是迫切的，所以，增多I帧以后还是需要优化，怎么优化，降低帧率，普通视频的帧率在30帧左右，但是直播的帧率一般在10-15帧。这样就保证了直播的流畅性又保证了直播视频秒开。

GOP
两个I帧之间的帧就是GOP。两个I帧之间的序列，在一个图像序列中只有一个I帧。

所有的视频文件的第一帧永远是I帧。不可能是P帧也不可能是B帧。
变换了场景之后，肯定会产生一个I帧。

短视频的GOP一般都比较大，在200-800之间，但是直播的GOP都比较小。

可以通过雷霄华的分析工具进行分析运动矢量：

《从0到1：C/C++音视频开发自学指南》空云风语机器视觉 Opencv QT c语言 c++音视频
开启自学之旅：为何选择C/C++音视频开发在当今数字化时代，音视频开发的应用场景极为广泛，深刻融入了我们生活与工作的方方面面。从火爆的直播行业，无论是电商直播中主播与观众的实时互动，还是游戏直播里精彩赛事的实时呈现；到备受欢迎的短视频平台，各种创意短视频的制作与分享；再到便捷的视频会议，让远程办公、在线教育成为可能，实现了跨地域的高效沟通与协作。这些丰富多样的应用场景，都离不开音视频开发技术的有力
在使用 HTML5 的＜video＞标签嵌入视频时，有时会遇到无法播放 MP4 文件的问题蹦极的考拉 html5 音视频前端
原因分析：只能播放声音，却无法播放视频。这通常是由于视频编码格式不兼容导致的。虽然MP4是一种常见的视频格式，但它包含多种编码方式，并非所有编码方式都受HTML5支持。解决方案：确认视频编码格式：使用视频播放器或专门的工具查看视频文件的属性，确认其编码格式。HTML5支持H.264编码的MP4文件（MPEG-4），VP8编码的WebM文件和Theora编码的Ogg文件。转换视频编码格式：如果视频编
GitHub 趋势日报 (2025年06月18日) qianmoQ GitHub 项目趋势日报 (2025年)github
由TrendForge系统生成|https://trendforge.devlive.org/本日报中的项目描述已自动翻译为中文今日获星趋势图今日获星趋势图1759jan991fluentui-system-icons549ragflow522anthropic-cookbook452automatisch265data-engineer-handbook194frankenphp171DeepE
音视频及H264/H256编码相关原理 Everbrilliant89 音视频开发音视频视频编解码 H264编码 H265编码音视频编解码
一、音视频封装格式原理：我们播放的视频文件一般都是用一种封装格式封装起来的，封装格式的作用是什么呢？一般视频文件里不光有视频，还有音频，封装格式的作用就是把视频和音频打包起来。所以我们先要解封装格式，看有哪些视频流和哪些音频流，此时的音频流和视频流都还是压缩数据，不能直接用于显示的，这就需要解码。如FFmpeg视频文件就是一个容器(视频流（H264）音频流(aac))。1、视频文件封装格式：封装格
音视频基础概念扫盲 Charlotte_jc 音视频
音视频概念相关参考地址ffmpeg视频压缩视频尺寸（视频分辨率/帧大小）视频分辨率，常见的分辨率有4096×2160,2560x1440,1920*1080,1280*720视频编码视频编码方式就是指通过特定的压缩技术，将某个视频格式的文件转换成另一种视频格式文件的方式。常见的编码格式有：H264,VP8，AVS,RMVB，WMV，QuickTime音频编码音频编码方式指通过特定的压缩技术对音频数
【TroubleShoot】Windows10视频文件没有预览图的解决办法 tealcwu windows 音视频 h.264 vp9
【问题描述】Windows文件夹中，有一部分的MP4视频在文件以图标显示的时候，是可以直接看到预览图的，但有一部分没法预览，只能显示为统一的文件类型图标。【解决方法】检查发现，两类MP4都是使用H264格式，用VLCMediaPlayer等专门的播放器都能播放，但使用Windows自带的WindowsMediaPlayer，可以预览的就可以正常播放，不能预览的就不能播放，而且播放器会停止响应。由此
某腾X视频下载器2.1 摆渡搜不到你音视频 python
importreimportosimporttimefrombs4importBeautifulSoupfromDrissionPageimportChromiumPage,ChromiumOptionsimportsubprocess#编码和清晰度映射表codec_mapping={'f321004':('H264','1080'),'f321003':('H264','720'),'f3210
利用WireShark分析H264码流阿基米东 wireshark h264
背景：最近在参与一个ARM平台的音视频传输的项目，同事说已经是高清视频了，但是显示模糊，显然不能达到高清要求，于是就想抓包分析一下。Step1：执行如下命令，在ARM平台上用tcpdump抓包并保存为test.cap。tcpdump–ieth0–nn–wtest.cap然后启动我们的多媒体通信程序，抓取几秒的数据即可。Step2：用WireShark工具打开test.cap文件。Step3：右键点
Wireshark使用教程（含安装包和安装教程）光电的一只菜鸡嵌入式 wireshark 测试工具网络
Wireshark使用入门教程0.资源下载以及软件安装1.Wireshark中无法显示网卡列表2.Wireshark抓取H264过程0.资源下载以及软件安装参考blog:抓包神器wireshark安装保姆级教程压缩包下载：Wireshark安装包1.Wireshark中无法显示网卡列表 Wireshark中无法显示网卡列表的解决方法：Wireshark中无法显示网卡列表的解决方法2.Wi
ffmpeg获取rtsp h265_手把手搭建RTSP流媒体服务器我係乜乜乜 ffmpeg获取rtsp h265
0.引言本文主要讲解如何搭建RTSP流媒体服务器的过程，使用开源项目ZLMediaKit。通过这个开源项目，推RTSP流到服务器，然后拉流端可以拉取RTSP、RTMP等流。ZLMediaKit码云链接：https://gitee.com/xia-chu/ZLMediaKitZLMediaKit的github链接：https://github.com/xiongziliang/ZLMediaKitZ
FFmpeg 解码视频流实现yuv播放书弋江山 ffmpeg c C++IOS ffmpeg h264 codec yuv 解码
参考文章雷神文章FFMPEG–裸码流解码AVCodec最简单的基于FFmpeg的libswscale的示例（YUV转RGB）视频流测试端口初始化解码器相关变量-(void)initDecoder{if(decodeFrame){return;}intcodec_id=AV_CODEC_ID_H264;pCodec=avcodec_find_decoder(codec_id);if(!pCodec)
FFMPEG命令行——【音视频开发学习笔记2】MAC OS 王七的眼睛被门夹了 ffmpeg 音视频学习
目录1、ffmpeg/ffplay/ffprobe区别2、ffmpeg命令查看帮助文档3、ffplay命令查看帮助文档4、ffprobe命令查看帮助文档5、ffmpeg音视频处理流程6、ffmpeg命令分类查询7、查看具体分类所支持的参数8、ffplay播放控制9、ffplay命令-主要选项10、ffplay命令-高级选项11、在MacOS上使用ffmpeg进行视频录制——录制的是桌面12、在Ma
USB虚拟化工具之：虚拟UVC摄像头，提供下载测试链接（支持win7，win10等系统）驱动开发007 驱动开发计算机外设云计算数码相机 usb虚拟化 usb重定向
//6.UVC帧格式comboFrameFormat=newQComboBox(this);comboFrameFormat->addItems({"MJPEG","YUV420P","NV12","H264","H265"});支持"MJPEG","YUV420P","NV12","H264","H265"5种帧格式。MJPEG兼容性较好，支持4K，支持windows自带相机，微信，抖音直播伴侣
录制mp4 AI算法网奇 python基础 opencv python 计算机视觉
目录单线程保存mp4多线程保存mp4rtspffmpeg录制mp4单线程保存mp4importcv2importimageiocv2.namedWindow('photo',0)#0窗口大小可以任意拖动，1自适应cv2.resizeWindow('photo',1280,720)url="rtsp://admin:[email protected]/h264/ch1/main/av_str
视频编码实战生椰_李点点 ffmpeg 音视频
FFmpeg流程从本地读取YUV数据编码为h264格式的数据，然后再存⼊到本地，编码后的数据有带startcode。与FFmpeg示例⾳频编码的流程基本⼀致。函数说明：avcodec_find_encoder_by_name：根据指定的编码器名称查找注册的编码器。avcodec_alloc_context3：为AVCodecContext分配内存。avcodec_open2：打开编解码器。avco
linux编译安装srs iummature linux 运维服务器
下载编译运行gitclonehttps://github.com/ossrs/srs.gitcdsrs/trunk./configure--h265=on make需要安装yuminstall-ypatchyuminstall-yunzipyuminstall-ytcl编译完成后即可启动SRS#启动./objs/srs-cconf/srs.conf#查看日志tail-n30-f./objs/srs
编解码器不支持OpenCV：FFmpeg：tag 0x34363268/‘；h264‘；潮易 opencv ffmpeg 人工智能
在Python中处理视频时，我们经常会遇到解码器不支持OpenCV的问题。这通常是由于你的系统上没有安装或配置正确的FFmpeg版本导致的。解决这个问题的一种方法是检查你的系统中是否已经安装了FFmpeg，以及它是否位于系统的PATH环境变量中。如果FFmpeg未正确安装，或者不在PATH中，那么Python的cv2库可能无法找到它。如果你的系统上已安装了FFmpeg，但是仍然出现上述错误，那么可
编译opencv,及其依赖ffmpeg, 以支持h264,h265 northeastsqure opencv ffmpeg h265 h264
ubuntu,更改自：https://trac.ffmpeg.org/wiki/CompilationGuide/Ubuntu警告：ffmpeg一定要编译为动态库，非静态库1.编译ffmpegsudoapt-getupdate-qq&&sudoapt-get-yinstall\autoconf\automake\build-essential\cmake\git-core\libass-dev\l
蝌蚪窝html5 video not,html - HTML5 Video does not play in any browser - Stack Overflow 远方之巅蝌蚪窝html5 video not
IhaveavideowiththefollowinginformationItisMP4videowithH264codecHowever,usingthefollowingcode:Yourbrowserdoesnotsupportthevideotag.ThevideodoesnotplayandlookslikethiswhenIrenderitRenderedVideoIhavechec
Error! DLL amfrt64.dll failed to open wangzhpwang python ffmpeg
Intel集显，win10下ffmpeg报DLLamfrt64.dllfailedtoopen解决办法创建：C:\Users\用户1\.matplotlib\matplotlibrc设置：animation.codec:h264_qsv#Codectouseforwritingmoviefigure.dpi:300figure.figsize:7,4.5axes.labelsize:18legen
嵌入式音视频开发学习（视频编码原理及RV1126 VENC模块） Les maths 音视频学习
视频编码原理(一)1.视频为什么要编码？在我们做音视频产品的时候，经常会把音视频数据进行网络传输，而此时音视频数据就需要进行编码(所谓编码就是指压缩)。因为在网络传输的时候，网络带宽有限，若此时网络传输的时候还用原始数据进行传输的时候，则会对网络带宽造成极大的负担。比方说一个分辨率为1280*720帧率为30帧的视频，按照YUV420格式的计算，它每秒传输的数据量就是1280*720*30*3/2
树莓派4b配置csi摄像头 2401_89317718 opencv
安装好最新系统后，接好csi摄像头，不要看网上那些教程去改config.txt文件，直接跑指令测试：libcamera-hello--qt-preview拍照：libcamera-jpeg-otest.jpg--qt-preview录像：libcamera-vid-t10000-otest.h264--qt-preview直接跑指令就能成像改文件后反而成像不了opencv也用不了
什么是抖动以及如何使用抖动缓冲区来减少抖动？腾讯云音视频实时音视频抖动 WebRtc
您是否经历过视频通话或观看直播时的不稳定、缓冲、质量下降或音视频不同步等令人沮丧的情况？您可能不得不反复刷新页面，或者感到失望而退出应用程序。这些问题实际上可能是由网络抖动引起的。作为专业的音视频开发人员，我们必须理解抖动的原因并找到解决方案，以便为用户提供高质量的音视频通话服务和直播体验。什么是抖动首先，让我们了解数据包是什么。在捕获音视频数据后，发送方将这些数据编码并封装成一系列小的数据包，然
iOS视频编码详细步骤（视频编码器，基于 VideoToolbox，支持硬件编码 H264/H265） Unlimitedz app开发 ios 音视频
iOS视频编码详细步骤流程1.视频采集阶段视频采集所使用的代码和之前的相同，所以不再过多进行赘述初始化配置：通过VideoCaptureConfig设置分辨率1920x1080、帧率30fps、像素格式kCVPixelFormatType_420YpCbCr8BiPlanarFullRange设置摄像头位置（默认前置）和镜像模式授权与初始化：检查并请求相机权限创建AVCaptureSession会
FFmpeg 4.3 H265 二十二，将C++线程加入到代码 hunandede ffmpeg
零：为什么要加入C++前面我们实现的代码都是在主线程中完成了一个mp4文件的解封装，解码，（音频/视频重采样），编码，封装。在当前项目中，我们要使用显示多路H265监控录放，因此，一定要用到C++线程。不从项目，仅仅从程序的角度来说，不管是解封装，解码，（音频/视频重采样），编码，封装。这些都是需要花费时间来做的事情，花费时间的事情都需要放置在子线程中做。因此，这节课就按照工程思维来加入C++线程
RV1126笔记一：ffmpeg+rtmp leona_nuaa 笔记 ffmpeg
一、介绍移植FFMPEG主要是为了实现RTMP推流功能、RTMP拉流功能和SRT推流功能，主要分为3个小项目：1、单路/多路RTMP推流2、单路/多路RTMP拉流3、SRT推流项目主要涉及多个知识点，x264，x265,srt等，RV1126可以直接采用硬件编码方式和解码方式采集H264和H265，我们只需要把数据和音频通过RTMP等协议推出去和拉取显示，操作为内网操作，在本地部署RTMP服务器来
HarmonyOS 5.0 低时延音视频开发
大家好，我是V哥。在HarmonyOS5.0的开发中，支持低时延音视频开发，为了确保语法正确，V哥以下代码符合HarmonyOSNEXTAPI14的规范。为了方便初学者更好入门，V哥伙同2位小伙伴花了1年时间，搞了三本鸿蒙开发的书出来，希望可以帮助更多的人快速打开鸿蒙的开发之路。要实现低时延音视频开发，咱们需要了解三个技术点：基于AVSession的跨设备媒体控制实时RTC传输的抗弱网方案硬件编解
各种音视频编解码学习详解 h264 ，mpeg4 ，aac 等所有音视频格式 wishfly 视频 ffmpeg
编解码学习笔记（一）：基本概念媒体业务是网络的主要业务之间。尤其移动互联网业务的兴起，在运营商和应用开发商中，媒体业务份量极重，其中媒体的编解码服务涉及需求分析、应用开发、释放license收费等等。最近因为项目的关系，需要理清媒体的codec，比较搞的是，在豆丁网上看运营商的规范标准，同一运营商同样的业务在不同文档中不同的要求，而且有些要求就我看来应当是历史的延续，也就是现在已经很少采用了。所以
ffmpeg 多路同时解码_ffmpeg入门教程阿兹猫 ffmpeg 多路同时解码
@[TOC]##首先推荐几本必参考的书《FFmpeg从入门到精通》，命令行居多《FFmpeg基础库编程开发》，各种标准发展历史及原理居多《音视频开发进阶指南基于Android与iOS平台的实践》##视频播放器原理此处摘抄部分为CSDN博主「雷霄骅」的原创文章，遵循CC4.0BY-SA版权协议，转载请附上原文出处链接及本声明。原文链接：[[总结]视音频编解码技术零基础学习方法_雷霄骅(leixiao
FFmpeg--音频解码：音频格式aac 八月的雨季997 音视频 aac ffmpeg
文章目录AAC组成函数分析读aac帧写aac帧aac的head参数设置运行结果AAC组成AAC音频格式：是⼀种由MPEG-4标准定义的有损⾳频压缩格式ADTS:是AAC音频的传输流格式AAC音频文件的每一帧由ADTSHeader和AACAudioData组成每⼀帧的ADTS的头⽂件都包含了⾳频的采样率，声道，帧⻓度等信息等，⼀般情况下ADTS的头信息都是7个字节，分为2部分：adts_fixed_
xml解析小猪猪08 xml
1、DOM解析的步奏准备工作： 1.创建DocumentBuilderFactory的对象 2.创建DocumentBuilder对象 3.通过DocumentBuilder对象的parse(String fileName)方法解析xml文件 4.通过Document的getElem
每个开发人员都需要了解的一个SQL技巧 brotherlamp linux linux视频 linux教程 linux自学 linux资料
对于数据过滤而言CHECK约束已经算是相当不错了。然而它仍存在一些缺陷，比如说它们是应用到表上面的，但有的时候你可能希望指定一条约束，而它只在特定条件下才生效。使用SQL标准的WITH CHECK OPTION子句就能完成这点，至少Oracle和SQL Server都实现了这个功能。下面是实现方式： CREATE TABLE books ( id &
Quartz——CronTrigger触发器 eksliang quartz CronTrigger
转载请出自出处：http://eksliang.iteye.com/blog/2208295 一.概述 CronTrigger 能够提供比 SimpleTrigger 更有具体实际意义的调度方案，调度规则基于 Cron 表达式，CronTrigger 支持日历相关的重复时间间隔（比如每月第一个周一执行），而不是简单的周期时间间隔。二.Cron表达式介绍 1）Cron表达式规则表 Quartz
Informatica基础 18289753290 Informatica Monitor manager workflow Designer
1. 1）PowerCenter Designer：设计开发环境，定义源及目标数据结构；设计转换规则，生成ETL映射。 2）Workflow Manager：合理地实现复杂的ETL工作流，基于时间，事件的作业调度 3）Workflow Monitor：监控Workflow和Session运行情况，生成日志和报告 4）Repository Manager：
linux下为程序创建启动和关闭的的sh文件，scrapyd为例酷的飞上天空 scrapy
对于一些未提供service管理的程序每次启动和关闭都要加上全部路径，想到可以做一个简单的启动和关闭控制的文件下面以scrapy启动server为例，文件名为run.sh： #端口号，根据此端口号确定PID PORT=6800 #启动命令所在目录 HOME='/home/jmscra/scrapy/' #查询出监听了PORT端口
人--自私与无私永夜-极光
今天上毛概课,老师提出一个问题--人是自私的还是无私的,根源是什么? 从客观的角度来看,人有自私的行为,也有无私的
Ubuntu安装NS-3 环境脚本随便小屋 ubuntu
将附件下载下来之后解压，将解压后的文件ns3environment.sh复制到下载目录下（其实放在哪里都可以，就是为了和我下面的命令相统一）。输入命令： sudo ./ns3environment.sh >>result 这样系统就自动安装ns3的环境，运行的结果在result文件中，如果提示 com
创业的简单感受 aijuans 创业的简单感受
2009年11月9日我进入a公司实习，2012年4月26日，我离开a公司，开始自己的创业之旅。今天是2012年5月30日，我忽然很想谈谈自己创业一个月的感受。当初离开边锋时，我就对自己说：“自己选择的路，就是跪着也要把他走完”，我也做好了心理准备，准备迎接一次次的困难。我这次走出来，不管成败
如何经营自己的独立人脉 aoyouzi 如何经营自己的独立人脉
独立人脉不是父母、亲戚的人脉，而是自己主动投入构造的人脉圈。“放长线，钓大鱼”，先行投入才能产生后续产出。现在几乎做所有的事情都需要人脉。以银行柜员为例，需要拉储户，而其本质就是社会人脉，就是社交！很多人都说，人脉我不行，因为我爸不行、我妈不行、我姨不行、我舅不行……我谁谁谁都不行，怎么能建立人脉？我这里说的人脉，是你的独立人脉。以一个普通的银行柜员
JSP基础百合不是茶 jsp 注释隐式对象
1,JSP语句的声明 <%! 声明 %> 　　声明：这个就是提供java代码声明变量、方法等的场所。表达式 <%= 表达式 %> 　　这个相当于赋值，可以在页面上显示表达式的结果，程序代码段/小型指令　<% 程序代码片段 %> 2,JSP的注释
web.xml之session-config、mime-mapping bijian1013 java web.xml servlet session-config mime-mapping
session-config 1.定义： <session-config> <session-timeout>20</session-timeout> </session-config> 2.作用：用于定义整个WEB站点session的有效期限，单位是分钟。 mime-mapping 1.定义： <mime-m
互联网开放平台（1） Bill_chen 互联网 qq 新浪微博百度腾讯
现在各互联网公司都推出了自己的开放平台供用户创造自己的应用，互联网的开放技术欣欣向荣，自己总结如下： 1.淘宝开放平台(TOP) 网址：http://open.taobao.com/ 依赖淘宝强大的电子商务数据，将淘宝内部业务数据作为API开放出去，同时将外部ISV的应用引入进来。目前TOP的三条主线： TOP访问网站：open.taobao.com ISV后台：my.open.ta
【MongoDB学习笔记九】MongoDB索引 bit1129 mongodb
索引可以在任意列上建立索引索引的构造和使用与传统关系型数据库几乎一样,适用于Oracle的索引优化技巧也适用于Mongodb 使用索引可以加快查询,但同时会降低修改,插入等的性能内嵌文档照样可以建立使用索引测试数据 var p1 = { "name":"Jack", "age&q
JDBC常用API之外的总结白糖_ jdbc
做JAVA的人玩JDBC肯定已经很熟练了，像DriverManager、Connection、ResultSet、Statement这些基本类大家肯定很常用啦，我不赘述那些诸如注册JDBC驱动、创建连接、获取数据集的API了，在这我介绍一些写框架时常用的API，大家共同学习吧。 ResultSetMetaData获取ResultSet对象的元数据信息
apache VelocityEngine使用记录 bozch VelocityEngine
VelocityEngine是一个模板引擎，能够基于模板生成指定的文件代码。使用方法如下： VelocityEngine engine = new VelocityEngine();// 定义模板引擎 Properties properties = new Properties();// 模板引擎属
编程之美-快速找出故障机器 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; public class TheLostID { /*编程之美假设一个机器仅存储一个标号为ID的记录，假设机器总量在10亿以下且ID是小于10亿的整数，假设每份数据保存两个备份，这样就有两个机器存储了同样的数据。 1.假设在某个时间得到一个数据文件ID的列表，是
关于Java中redirect与forward的区别 chenbowen00 java servlet
在Servlet中两种实现： forward方式：request.getRequestDispatcher(“/somePage.jsp”).forward(request, response); redirect方式：response.sendRedirect(“/somePage.jsp”); forward是服务器内部重定向，程序收到请求后重新定向到另一个程序，客户机并不知
[信号与系统]人体最关键的两个信号节点 comsci 系统
如果把人体看做是一个带生物磁场的导体,那么这个导体有两个很重要的节点,第一个在头部,中医的名称叫做百汇穴, 另外一个节点在腰部,中医的名称叫做命门如果要保护自己的脑部磁场不受到外界有害信号的攻击,最简单的
oracle 存储过程执行权限 daizj oracle 存储过程权限执行者调用者
在数据库系统中存储过程是必不可少的利器，存储过程是预先编译好的为实现一个复杂功能的一段Sql语句集合。它的优点我就不多说了，说一下我碰到的问题吧。我在项目开发的过程中需要用存储过程来实现一个功能，其中涉及到判断一张表是否已经建立，没有建立就由存储过程来建立这张表。 CREATE OR REPLACE PROCEDURE TestProc IS fla
为mysql数据库建立索引 dengkane mysql 性能索引
前些时候，一位颇高级的程序员居然问我什么叫做索引，令我感到十分的惊奇，我想这绝不会是沧海一粟，因为有成千上万的开发者（可能大部分是使用MySQL的）都没有受过有关数据库的正规培训，尽管他们都为客户做过一些开发，但却对如何为数据库建立适当的索引所知较少，因此我起了写一篇相关文章的念头。最普通的情况，是为出现在where子句的字段建一个索引。为方便讲述，我们先建立一个如下的表。
学习C语言常见误区如何看懂一个程序如何掌握一个程序以及几个小题目示例 dcj3sjt126com c 算法
如果看懂一个程序，分三步 1、流程 2、每个语句的功能 3、试数如何学习一些小算法的程序尝试自己去编程解决它，大部分人都自己无法解决如果解决不了就看答案关键是把答案看懂，这个是要花很大的精力，也是我们学习的重点看懂之后尝试自己去修改程序，并且知道修改之后程序的不同输出结果的含义照着答案去敲调试错误
centos6.3安装php5.4报错 dcj3sjt126com centos6
报错内容如下: Resolving Dependencies --> Running transaction check ---> Package php54w.x86_64 0:5.4.38-1.w6 will be installed --> Processing Dependency: php54w-common(x86-64) = 5.4.38-1.w6 for
JSONP请求 flyer0126 jsonp
使用jsonp不能发起POST请求。 It is not possible to make a JSONP POST request. JSONP works by creating a <script> tag that executes Javascript from a different domain; it is not pos
Spring Security（03）——核心类简介 234390216 Authentication
核心类简介目录 1.1 Authentication 1.2 SecurityContextHolder 1.3 AuthenticationManager和AuthenticationProvider 1.3.1 &nb
在CentOS上部署JAVA服务 java--hhf java jdk centos Java服务
本文将介绍如何在CentOS上运行Java Web服务，其中将包括如何搭建JAVA运行环境、如何开启端口号、如何使得服务在命令执行窗口关闭后依旧运行第一步：卸载旧Linux自带的JDK ①查看本机JDK版本 java -version 结果如下 java version "1.6.0"
oracle、sqlserver、mysql常用函数对比[to_char、to_number、to_date] ldzyz007 oracle mysql SQL Server
oracle &n
记Protocol Oriented Programming in Swift of WWDC 2015 ningandjin protocol WWDC 2015 Swift2.0
其实最先朋友让我就这个题目写篇文章的时候，我是拒绝的，因为觉得苹果就是在炒冷饭，把已经流行了数十年的OOP中的“面向接口编程”还拿来讲，看完整个Session之后呢，虽然还是觉得在炒冷饭，但是毕竟还是加了蛋的，有些东西还是值得说说的。通常谈到面向接口编程，其主要作用是把系统设计和具体实现分离开，让系统的每个部分都可以在不影响别的部分的情况下，改变自身的具体实现。接口的设计就反映了系统
搭建 CentOS 6 服务器(15) - Keepalived、HAProxy、LVS rensanning keepalived
（一）Keepalived （1）安装 # cd /usr/local/src # wget http://www.keepalived.org/software/keepalived-1.2.15.tar.gz # tar zxvf keepalived-1.2.15.tar.gz # cd keepalived-1.2.15 # ./configure # make &a
ORACLE数据库SCN和时间的互相转换 tomcat_oracle oracle sql
SCN（System Change Number 简称 SCN）是当Oracle数据库更新后，由DBMS自动维护去累积递增的一个数字，可以理解成ORACLE数据库的时间戳，从ORACLE 10G开始，提供了函数可以实现SCN和时间进行相互转换；　　用途：在进行数据库的还原和利用数据库的闪回功能时，进行SCN和时间的转换就变的非常必要了；　　操作方法：　　1、通过dbms_f
Spring MVC 方法注解拦截器 xp9802 spring mvc
应用场景，在方法级别对本次调用进行鉴权，如api接口中有个用户唯一标示accessToken,对于有accessToken的每次请求可以在方法加一个拦截器，获得本次请求的用户，存放到request或者session域。 python中，之前在python flask中可以使用装饰器来对方法进行预处理，进行权限处理先看一个实例,使用@access_required拦截： ?