一叶知秋dong

H264编码参数漫谈

/*本文来源[Adobe Devnet]，原本是分析录制f4v文件(flash player video)时， H264编码参数的设置*/

H.264编码参数

虽然H.264的编解码器来自不同的供应商，但是他们都使用同样的编码技术以及相似的比较有代表性的编码参数。在这里，我讨论的是最常见的h.264编码选项。

了解概况和级别

图1 编码技术纵览（来自：Wikipedia）

正如你猜想的，越高级别的编码方式使用的编码算法就越先进，并且因此会生产出质量更好的文件。为了凸显这种差异，我使用同样的源文件并设置了同样的编码参数。左边的文件采用Main方式，而右面的使用Baseline. 在图1中的表格里我们可以很容易查出，Main方式是支持B-切片技术的（也叫做B-帧），并且也支持高质量CABAC编码，我将在文章的后面部分做详细讲解正如你所看到的，这样做有助于Main方式实现比Baseline更高质量的视频。

图2.使用Main方式编码的视频（左边）比使用Baseline方式编码的视频（右边）质量要好得多。

所以，Main以及High方式比Baseline产出的视频质量更高；我们有什么收获呢？收获就是，因为你使用了更加先进的编码技术，这个文件变得更加难解压，并且也许在老一点的电脑上播放的会很缓慢，并且不平滑。

这个观察说明一个目前H.264编码参数的典型的需要权衡的问题，较高的文件质量带来的问题是文件很难被解压，另一方面，使用高质量的参数编码，会花费更多的时间。在某些罕见情况下，你决定在流中包含B-帧编码，等同于同时触发了两个问题，增加了解码难度和编码时间。

回到方式上来：在高的标准下，可以编码方式将看成是厂商和视频生产者共同遵守的适应点。手机生产商A需要生产一款能够播放h.264视频的手机，但同时需要控制成本，发热量和尺寸。于是，狡诈的首席工程师通过搜索，发现了功能足以播放用Baseline层级方式生产出的h.264视频的最佳处理器。如果你是一个被找来要为这样一款设备生产视频的视频制作人员，你会知道如果你采用Baseline方式编码，这个视频将是可以被正常播放的。

因此，当生产h.264视频时，通常我们会使用目标播放平台所能支持的最高层级的方法来生产视频，因为这样可以在任何给定的码率下提供最好的视频质量。如果生产用于移动设备的视频，那么这就特指的是Baseline方式了，不过还是查看一下设备的相关文档确认为佳。如果是生产用于工作在Window或者Macintosh操作系统的电脑上的Flash player的视频，那么指得就是High方式了。

这听起来又明了又好，但是要明白一点：虽然使用Baseline方式编码可以确保在你的移动设备上平滑的播放，但是使用High方式生产在电脑上播放的视频文件并不能提供这样的保证。因为High模式下生产的h264视频，最高支持像素分辨率可以达到4096 x 2048，码率可以达到720Mbps。只有很少的桌面电脑是可以进行完整帧频的播放的，更少的是在以每秒30帧的帧频进行播放流。

因此，为生产移动设备使用的视频全在于你使用什么方式，而生产电脑使用的视频则全在于你怎样进行视频属性配置。这里，关键点是在于，是以VP6，还是Windows Media的计算方式解码。只要你用其他两种编码器以同样的分辨率和同样的码率生成h.264视频，在同一类型的电脑上播放都是没有问题的。（关于 H.264,VP6和VC-1更详细的比较统计，请阅读StreamingMedia.com 上我的另外一篇文章《Hi-Def视频产品解码的真相》）

一般情况下，这意味着，只要你以640 × 480的分辨率和较低的码率生成SD视频，应该可以在2003年之后生产的电脑上很好的播放如果你以720p或者更高的分辨率生产，产出的流将不能在这些电脑中的任何一台上平滑的播放。你应该为这些观看者提供一个SD流来替代过高参数的流。

关于H.264的标准呢？如果生产用于移动设备的有限的屏幕分辨率和带宽的视频，你应该选择正确标准，这也是厂商应该指定的标准。然而，由于Flash Player可以处理任何一种支持的标准下，任意一种方法生产的视频，所以在你为Flash Player生产在个人电脑上播放的视频时无需有任何担心。

平均信息量编码

当你选择了Main或者High方式，一些编码工具将给你两个关于平均信息量编码模式的选项。（见图3）

CAVLC ：基于上下文的自适应可变长编码
CABAC ：基于上下文的自适应二进制算术编码

这两个选项中，CAVLC是低质量的，易于解码的选项，CABAC是高质量的，难于解码的选项。

图3 . 对平均信息量编码的选择： CABAC和CAVLC

虽然结果是取决于源文件质量的，但通常来说CABAC被认为比CAVLC效率高5%-15%。这意味着，CABAC应该在码率低5-15%，的情况下，提供同等的，或者更高的视频质量。在我自己做的测试中，CABAC产出的视频质量要明显的好于CAVLC，虽然只是在高清晰视频编码测试中，采用非常低的码率的情况下。如图4显示，左边的是用CABAC 生产的720p文件，右面的是用CAVLC产出的文件，同样都是800k码率。图4显示出，16：9的720p视频被抽取了一些帧现在800 kbps码率的画面质量是相当低了；相比之下，YouTube采用2m码率进行h.264编码，几乎是这里的2.5倍。

图4 . 采用CABAC 编码的720p文件（左边）， CAVLC编码（右边）

虽然任何一个的画面质量都不是值得称赞的，但是左边的画面上的芭蕾舞演员的面部和其他细节明显地要清晰一些。结论就是，CABAC会提供更加的画面质量，无论是多么细微的差异。现在问题变成是，这样做究竟会给解码和播放增加多少难度呢？

答案是，不会很大。我在我的办公室里用两台运算能力都不是很强的多核cup电脑进行测试，一台是使用酷睿2处理器的惠普笔记本电脑，另一台是基于个人电脑配置的苹果台式机。正如你在表格2里面看到的，CABAC文件，在惠普的笔记本上增加了不到1%的CPU负载，在苹果机上增加了不到2%的负载。鉴于更佳的视频质量和细小的CPU负载差异，我建议，只要CABAC是可用的我都会选用它。

电脑	CABAC	CAVLC	区别
惠普Compaq 8710w 移动工作站 - 酷睿2 双核	31.1%	30.5%	0.6%
苹果PowerMac G5 2.7GHz 双核	35.5	33.7	1.8%

表2.播放采用CABAC 和CAVLC并使用h.264编码的视频文件的CPU消耗量对比。

I， P和B帧

这是一个常见的前言知识画面，帧与帧之间的切换的变化是很小的，编码的质量要高于动态的，运动式的视频。那是因为H.264像所有高质量的运动编码方式一样，目的是充分利用视频帧与帧之间的冗余帧。越高的帧冗余，将带来给定码率下越高的质量。

为了利用这种冗余， H.264流包含了三种类型的帧（见图5）

I-帧：也成为关键帧，I-帧完全自我指涉的，并且不使用任何其他帧的信息。它在三种帧中占最大的比例，并且具有最高的质量，但是压缩效率是最低的。
P -帧：P -帧是所谓的“预示”帧。当创建了一个P-帧时，编码器可以向后查看I-帧或者P-帧中冗余的图片信息。P-帧比I-帧效率高，但是没有B-帧的效率高。
B-帧：B-帧是双向预测帧，从图五你可以看到，这意味着当我们创建B-帧，编码器可以同时向前和向后查找冗余的图片信息。这使得B-帧在三种帧中具备最佳的效率。注意，B-帧在使用Baseline方式生产视频的时候是不可用的。

图5.H.264编码流中的 I，P，和B-帧

现在你知道了每种类型的帧的功能，我将会告诉你如何更优化的使用它们。

使用I-帧工作

尽管I-帧的压缩效率是最低的，但是它们同时也提供了两种不可取代的功能。首先，所有的h.264视频文件的播放都开始于I-帧，因为它是唯一在编码期间不依赖于其他帧的帧类型。

由于几乎所有的视频流都可以进行交互式的播放，当观看者在视频不同的片段之间推动滑块时，你应该在视频中包含规则的I-帧来确保灵活的播放控制。这在使用Flash Media Server发布的流，以及使用分布渐进式下载发布的流中，是可行的。虽然这没有什么所谓的魔法数字，我通常每隔10秒使用一个I-帧，意味着在生产每秒播放30帧的视频时，每隔300帧有一个I-帧。（24fps和 15fps分别为每隔240帧，和每隔150帧一个I-帧）

I-帧的另外一个功能是帮助在场景切换时重置画面质量试想，从一个场景到另外一个切换时图像急剧变化。如果新场景的第一个帧是一个I-帧，这是最好的状况了，对于随之而来的P-帧和B-帧能查找到冗余的信息来说，这是一个绝佳的起始点。因为这个原因，许多编码工具都提供了一个特性叫做“场景变化监测”或者“自然关键帧”，你应该永远都开始这些功能。

图6显示了在Flash Media Encoding Server中I-帧的相关控制你可以看到场景变化检测是默认被启用的，并且视频编码序列的大小为300，即300帧。如果这样说的话可能理解起来会更简单：“I-帧，间隔”，不过，这已经足够显而易见了。

图6.Flash Media Encoding Server中 I-帧相关控制

IDR 帧

具体说来，视频编码序列指的是“图片组”，或者简称为GOP,它是组成H.264流的组成部分，每个H.264流都是由很多个静态的GOP组成的。每个GOP都是由一个I-帧开始的，并包含了所有的帧，但是并不包含下一个I-帧。通过选择视频编码序列为300，你是在告诉 Flash Media Encoding Server创建一个包含300帧的GOP，或者基本等同于说每隔300帧一个I-帧。

我在向你进一步描述B-图片的数量设置时，同时也就已经在向你描述平均信息量编码模式了；但是我想解释的是最小IDR间隔，和IDR频率。首先我要定义IDR帧的意义。简单的说，H.264规格使用两种类型的I-帧：普通I-帧和IDR帧。对于IDR帧来说，在IDR帧之后的所有帧都不能引用任何IDR帧之前的帧的内容，与此相反，对于普通的I-帧来说，位于其之后的B-和P-帧可以引用位于普通I-帧之前的I-帧。

从随机存取的视频流中，播放器永远可以从一个IDR帧播放，因为在它之后没有任何帧引用之前的帧。但是，不能在一个没有IDR帧的视频中从任意点开始播放，因为后面的帧总是会引用前面的帧。

由于在你的视频中插入关键帧是使互动播放成为可能的一个关键原因，我使用了默认的设置值1，这使得每一个关键帧都成为了一个IDR帧。如果你设置这个值为0，只有第一个I-帧会成为IDR帧，这使得文件不能支持随机访问。设置这个值为2会使得每一个第二位置的I-帧变成IDR帧，当设置为3时使得每一个第三位置的I-帧变成IDR帧。再说一次，我只使用默认的设置值1.

最小的 IDR间隔定义了一组图片中的最小帧数量。虽然你已经设置了视频编码序列为300，你也选择了开启场景切换监测，使得编码器在场景切换时插入一个I帧。在一个非常动感的包含一连串动态变化的MTV 中，这将会导致非常频繁的I帧出现，这可能会降低整个视频的质量。对于这种类型的视频，你可以尝试将最小IDR间隔增加到30-60帧，现在看看这个是不是提高了视频质量吧。但是，对于大多数影片，默认的间隔1提供给编码器频繁插入I-帧的必要的灵活性，高度活跃的部分，例如开启或关闭logo. 出于这个原因，我也在默认的控制设置中将这个值设置为1。

使用B-帧工作

B-帧是效率最高的帧，因为他们可以同时进行双向的冗余帧搜索。虽然不同的编码器之间的控制和控制命名不同，但是最常见的B帧相关空是是简单的B-帧数量设置，或者像图片6中所示的“B-图片”。注意图片6中的数字实际上指得是I-帧和P-帧之间的连续帧。

使用在图6中所示的值2，你将会创建一组这样的图片组：IBBPBBPBBPBB ... 就这样一直排列300帧。如果B-图片的数量设置为3，编码器将会在每一个I-帧个P-帧之间插入三个B-帧。虽然没有神奇的数字，我通常使用两个顺序的B-帧。

插入多少个B-帧可以提高你视频的质量呢？图7说明了这个问题。作为背景，这是一系列高运动率的滑板动作的结尾帧，同时也包含很重要的细节描写，特别是在栅栏后面的选手。这种结合了高运动率和高细节描绘的情况是不多见的，使得对这进行编码变得非常难。正如你看到的图片，采用B-帧保存的文件明显比不使用B-帧保存的文件细节表现要好。总之，B-帧确实提高了质量。

图7.使用（左）和不使用（右）B-帧编码的文件对比

在解码方面有什么性能上的损失么？我做了一个跨平台的电池测试，尤其针对那些老化的，低性能的电脑，测量在播放使用Baseline方式生产的视频（不采用B-帧），以及使用High方式生产的视频（采用B-帧）是的CPU负载量。我看到最大的差距是10%，这并不足以动摇我建议你，除了在为移动设备生产视频时使用Baseline方式，其他的时候就都使用High方式进行编码吧。

高级B-帧选项

图8 .其他B帧相关的选项

B-帧自适应设置(use adaptive B-frame placement)：允许编码器覆盖已经编码过的B-图片数量以提高质量，例如，当它监测到场景变化或者最后而来的帧是I-帧时。我总是启用此设置。

参考B-图片(reference B-pictures)：让编码器使用B帧作为P帧的引用帧，当开始锥形B-帧编码时，编码器使用B-帧作为其他B帧的引用帧。我通常不开启这个选项，因为质量的差别是微不足道的，这些选项可能会使视频在某些环境下的播放变得不稳定。

参考帧数量(reference frames)，是编码器在编码时可以搜索的冗余帧的数量，它会影响编码时间和解码难度；在使用B-帧和P-帧进行编码时，如果你将这个值设置为10，编码器将会一直搜索冗余帧信息直到第10个帧上，这增加了搜索时间。此外，如果编码器在10帧之内发现了冗余资源，每一帧都必须在解码和回放时被存放在内存中，从而提高了解码的难度。

直观的说，对于大多数视频，绝大多数的冗余资源在离帧最近的位置被编码。这就是说，只要设置这个值超过4或者5，就会增加编码时间，同时带来的价值并不大。我通常使用的值是4.

切片数量(number of slece per picture)，虽然不是与B帧相关的技术，考虑到每张图片的切片数量，可以是1，2，或者4，以设置为4为例，编码器将每一帧划分为4个区域，并且只在其他帧指定的区域内搜索冗余信息。这可以加速在多核处理器电脑上的编码速度，因为编码器可以指定不同的内核作为指定的编码区域。然而，由于冗余信息可能已经转移到了帧之间的不同区域----平移或倾斜移动----多切片编码可能会丢失一些信息，因而降低视频的整体质量。

与此相反，默认值1的情况下，编码器将每一个帧作为一个完整的区域，并整体的搜寻潜在的引用帧。因为这样做并不利于多核CPU分担这个任务，所以这种设置导致的结果是很慢，但同时也是视频质量最高的。除非你真的那么着急，否则我建议你将这个值设置为默认值1.

其他编码参数

一旦你越过了I-和B-帧的相关控制，H.264提供了一系列额外的编码参数，我将在稍后进行讲述。目前的这些设置，我估计还有90-95%的选项会影响h.264视频质量。而我们本节讨论的设置，仅仅能改变其中的5%，这意味着大多数用户可以接受默认的值并且没有注意到其中的任何差别。不过，如果你想要尝试探求H.264的终极质量，你可以使用如图9所示的控制设置。

图9.Flash Media Encoding Server提供的其他H.264编码参数

首先是搜索形状，它可以是16 × 16或8 × 8 。后者（ 8 × 8 ）是高品质的选择，而编码时间较长。接下来的三个“快速”选项允许您在允许的质量损耗范围内进行高速编码。本人通常禁用这些选项。

在单帧中再次分派位数据的自适应量化模式和先进的量化强度设置，使用三个选择标准中的一个：亮度，对比度，或复杂性。我只会在实验时使用这些设置，这使得视频区域中有明显的块状显示。不幸的是，这个操作的内容相当的书面化，这使得它无法提供一般的关于使用价值的技术咨询意见。

无论是码率失真的优化，还是Hadamard变换设置都可以提高视频质量，但是编码时间会变得更长，我通常两者都选。最后，亚像素运动估算模式定义了搜索冗余资源的粒度：1/4像素代表最高的品质，但却是最慢的编码，全像素代表最快的但是质量最低的编码。在我的低急躁环境下，我总是用1、4。

理论应用到工作中去

现在您已经知道了H.265是如何工作的了，下面，我将简单的演示如何使用Adobe提供的工具制作H.264视频。

Adobe Media Encoder

这是Creative Suite 4中的一个引人注目的增强Flash视频编码的工具。现在有个独立操作和批处理编码功能。因此，您可以通过格式弹出菜单中选择不同格式存取H.264编码。如果是为Flash Player生成编码，那么您应该选择FLV或F4V选项，这将会为 Flash Player 生成VP6和 H.264滤镜。

特别的，您选择一个预设（preset ）的编码，这个编码器使用了一个格式，也可以是其他格式。或者，您可以在格式选项卡上选择您的编码，如选择：FLV for VP6或F4V for H.264（见图10）。

图10.选择编码 VP6（FLV选项）或H.264（F4V选项）

Adobe Media Encoder中，最简单的工作方式是选择一个预设编码，它们有相同的大小或比目标分辨率达。这将确保合适的配置和正确的级别选择。

所有的预设都是在Adobe Premiere Pro 的默认配置文件中的，不是高级的。（All presets accessible through Adobe Premiere Pro default to the Main Profile, rather than High.）虽然任何质量上的差异可能是微小的，我们一般在进行编码之前将这个设定为高质量（见图11）。除了这一点，我唯一修改的一点是高级设置（Advanced Setting）中的 Set Key Frame Distance选项，我总是选中它，并且设定它的值为300。

图11.在Adobe Media Encoder中选择H.264编码参数

Flash Media Encoding Server

Flash Media Encoding Server的可控性要比Adobe Media Encoder要广阔的多，但是你还是要以同样的方式开始：选择您的容器格式和预设（见图12）。

图12. 在 Flash Media Encoding Server选择一个容器格式和预设

Flash Media Server 和 Flash Player 都可以播放流文件或回访任何H.264文件，实际上可以是任何格式，所以F4V或MP4容器都可以。如果你想使一个文件在 QuickTime Player 和 Flash Player里都能播放，你可以选择MP4；否则，使用F4V。选择一个预设，它使用与目标相同的或比目标更高的分辨率，以确保使用了合适的配置和级别。

图13 是H.264在Flash Media Encoding Server 中相关的参数。左边是预设的默认值。右边是我的设定值。红色的星号是预设的建议值，但是并不是必要的。

图13.修改H.264编码参数：默认值（左边），建议值（右边）

正如我之前讨论的，我将扩展GOP尺寸为300，并使用合适的 B-frame设定以提供最大灵活性的编码器。将参考帧从2提高到4可能略微提高编码时的质量和编码的复杂性，同时禁用快速内部（fast inter）和内部决策（intra decisions）可能再次提高质量，也增加了一些编码时间。

总的来说，我的建议值应该产生最优的质量，虽然这超出了编码时间。如果吞吐量是关键，那么我将做出以下改变：

使用参考帧（reference frames）的默认值2。
打开所有“fast”的编码选项
使用16 × 16的搜索模式（Search shape）

· 设定运动估算子像素模式（Motion estimation subpixel mode）为全像素（Full pixel）

如果你的机器是多核的，您可以使用2个或4个时间片（slice）

如果您这样做，那么你可以比较一下两种参数的选则，看看是否快速编码参数会产生质量上的显著不同。

在音频方面，我将使用默认值，且只改变目标比特率和适合我目标的通道。H.264编码参数我也使用了默认值，比如时间戳和序列结束码，这些在Flash Media Encoding Server 中都提供。

pyhon+ffmpeg 常用音视频处理命令不再游移 ffmpeg 音视频 python
FFmpeg是多媒体领域的万能工具。只要涉及音视频领域的处理，基本上没有它做不了的事情！通俗点讲，从视频录制、视频编辑再到播放，它都能做！前段时间做了个短视频自动化脚本项目，需要自动处理音视频（包括一些合成、拼接、转场、调色等等），当时做的时候找各种命令还是很痛苦的，因此对用到的所有处理命令做了个汇总，方便以后使用。目录一、获取音频时长二、获取视频信息三、获取视频时长四、多个视频合并五、视频提取视
音视频知识图谱 2022.04 关键帧Keyframe
前些时间，我在知识星球上创建了一个音视频技术社群：关键帧的音视频开发圈，在这里群友们会一起做一些打卡任务。比如：周期性地整理音视频相关的面试题，汇集一份音视频面试题集锦，你可以看看《音视频面试题集锦2022.04》。再比如：循序渐进地归纳总结音视频技术知识，绘制一幅音视频知识图谱。下面是2022.04月知识图谱新增的内容节选：1）图谱路径：**采集/音频采集/声音三要素/响度******主观计量响
【物联网技术大作业】设计一个智能家居的应用场景 Dream_Chaser～期末复习智能家居物联网技术期末大作业
前言：本人的物联网技术的期末大作业，希望对你有帮助。目录大作业设计题（1）智能家居的概述。（2）介绍智能家居应用。要求至少5个方面的应用，包括每个应用所采用的设备，性能，功能。（3）画出智能家居应用图，并设计使用。大作业设计题设计一个智能家居的应用场景。要求：（1）智能家居的概述。答：智能家居，又称为智能住宅或家庭自动化，是指运用综合布线、网络通信、安全防范、自动控制及音视频等技术，将家居设施集成
抖音视频搬运如何才能不违规？抖音搬运视频违规有什么后果？氧惠导师
在抖音平台中搬运短视频的人非常多，经常能看到一些视频，别的平台中也会出现，但是又会有所不一样，其实是进行了二次编辑，那么抖音搬运视频怎么做才不会违规呢?➤推荐网购薅羊毛app“氧惠”，一个领隐藏优惠券+现金返利的平台。氧惠只提供领券返利链接，下单全程都在淘宝、京东、拼多多等原平台，更支持抖音、快手电商、外卖红包返利等。（应用市场搜“氧惠”下载，邀请码:521521，全网优惠上氧惠！）➤由于信息差的
WebRTC之LiveKit的基础入门使用（入门必看） tabzzz 前端 webrtc web3 typescript
LiveKit本文主要是讲解在Next13+中如何使用LiveKit来实现简单的音视频通话，想了解更多的还是要去官方文档去掌握更复杂、高级的使用方法。什么是LiveKitLiveKit是一个开源的实时通信平台，基于WebRTC，主要用于构建高质量的音视频通话、实时数据传输和互动应用。LiveKit除了方便以外的大优势就是它提供了丰富的API和SDK，支持多种平台，包括Web、iOS、Android
FFmpeg安装与使用教程 vvvae1234 ffmpeg
FFmpeg是一个强大且灵活的命令行工具，用于处理音频和视频文件。无论是视频格式转换、音频提取还是视频编辑，FFmpeg都能够轻松完成。掌握FFmpeg，将为你的视频处理工作提供极大的便利。在本教程中，我们将详细介绍FFmpeg的安装和使用，包括一些实用的操作案例，帮助你更好地理解如何使用这个强大的工具。2.FFmpeg简介2.1什么是FFmpegFFmpeg是一个开源的音视频处理库，提供了丰富的
Android平台轻量级RTSP服务模块技术接入说明音视频牛哥大牛直播SDK 轻量级RTSP服务 android 音视频轻量级RTSP服务 Android RTSP服务 Android RTSP服务器安卓RTSP服务器大牛直播SDK
技术背景为满足内网无纸化/电子教室等内网超低延迟需求，避免让用户配置单独的服务器，大牛直播SDK在推送端发布了轻量级RTSP服务SDK。轻量级RTSP服务解决的核心痛点是避免用户或者开发者单独部署RTSP或者RTMP服务，实现本地的音视频数据（如摄像头、麦克风），编码后，汇聚到内置RTSP服务，对外提供可供拉流的RTSPURL，轻量级RTSP服务，适用于内网环境下，对并发要求不高的场景，支持H.2
音视频入门基础：WAV专题（11）——FFmpeg源码中计算WAV音频文件每个packet的pts_time、dts_time的实现 cuijiecheng2018 FFmpeg源码分析音视频技术音视频 ffmpeg
=================================================================音视频入门基础：WAV专题系列文章：音视频入门基础：WAV专题（1）——使用FFmpeg命令生成WAV音频文件音视频入门基础：WAV专题（2）——WAV格式简介音视频入门基础：WAV专题（3）——FFmpeg源码中，判断某文件是否为WAV音频文件的实现音视频入门基础：W
移动应用-音视频播放绚烂的萤火移动开发 android 音视频
一.音频1.Mediaplayer设置数据源的三种方式:应用自带的音频,SD卡中的音频、网络音频MediaPlayerplayer＝newMediaPlayer();player=Mediaplayer.create(this,R.raw.XX);player＝MediaPlayer.setDatasource("SD卡路径/网络路径");设置按钮并添加监听事件,实现音乐的播放、暂停2.Sound
2023-06-02《青楼文学与中国文化》陶慕宁64 每天坚持
20230602四点三十一《青楼文学与中国文化》陶慕宁64今天早上起床的闹钟我并没有听见，是我老婆把我叫醒了，昨天晚上睡得挺好，很快就睡觉了，早上有点不想起床，被老婆叫起来了。按说昨天我应该是听完了陶慕宁老师讲的课，但是我的听课记录上显示我没有听完，还是感觉喜马拉雅手机版记录的比较详细，但是喜马拉雅电脑版上的记录没有那么详细，感觉这些音视频软件应该更精准的记录一个人的听课位置，对于我们这些学习的人
神奇酷炫的下拉菜单紫藤11
下拉菜单目前公司的销售报表上，用有这个功能，真心方便，感谢小哈录制的抖音视频，但操作更简单。一、基本用法直接按住Alt+↓即可快速生成,注意：想要实现这样的功能前提是已经输入部分内容二、进阶用法1.提示信息2.出错警告3.圈释无效信息第一次作用圈释无效信息的功能三、动态下拉列表选取数据→定义名称→数据验证→序列→输入=名称四、快速录入当前时间=now（）数据验证设置单元格格式五、借贷只能一方输入选
01-Flink安装部署及入门案例（仅供学习），音视频时代你还不会NDK开发小猪佩琪962 2024年程序员学习 flink 学习大数据
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新大数据全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵
千万级规模高性能、高并发的网络架构经验分享搬砖养女人网络架构经验分享
主题：INTO100沙龙时间：2015年11月21日下午地点：梦想加联合办公空间分享人：卫向军（毕业于北京邮电大学，现任微博平台架构师，先后在微软、金山云、新浪微博从事技术研发工作，专注于系统架构设计、音视频通讯系统、分布式文件系统和数据挖掘等领域。）架构以及我理解中架构的本质在开始谈我对架构本质的理解之前，先谈谈对今天技术沙龙主题的个人见解，千万级规模的网站感觉数量级是非常大的，对这个数量级我们
2023-07-25《优势教养》127 每天坚持
20230725四点三十五星期二《优势教养》127昨天晚上睡得早，我八点五十多就到家了，催着孩子们睡觉，孩子们睡的就早，我在水里边洗了一会，拉了几下单杠，顺着老路回来了，昨天温度比较低，感觉能听进去音视频。昨天下午没有怎么睡着，晚上也感觉没有精神。昨天下午老婆带着儿女去收拾牙，我在家没事，也没有写文章，昨天上午去姐家看她家修水，耽误昨天的两千字的电子日记也没有完成，昨天的作业打卡还没有设计好，昨天
音视频编解码技术（二）：AAC 音频编码技术音视频开发老马音视频开发流媒体服务器 Android音视频开发视频编解码音视频网络协议实时音视频网络
一、AAC编码概述AAC是高级音频编码（AdvancedAudioCoding）的缩写，出现于1997年，最初是基于MPEG-2的音频编码技术，目的是取代MP3格式。2000年，MPEG-4标准出台，AAC重新集成了其它技术包括SBR或PS特性，目前AAC可以定义为⼀种由MPEG-4标准定义的有损音频压缩格式二、AAC编码规格简述AAC共有9种规格，以适应不同的场合的需要：MPEG-2AACLC低
ffplay音视频同步分析攻城狮百里音视频音视频 C++ffplay
ffplay默认也是采用的这种同步策略。主流程ffplay中将视频同步到音频的主要方案是，如果视频播放过快，则重复播放上一帧，以等待音频；如果视频播放过慢，则丢帧追赶音频。这一部分的逻辑实现在视频输出函数video_refresh中，分析代码前，我们先来回顾下这个函数的流程图：在这个流程中，“计算上一帧显示时长”这一步骤至关重要。先来看下代码：staticvoidvideo_refresh(voi
音视频入门基础：WAV专题（5）——FFmpeg源码中解码WAV Header的实现 cuijiecheng2018 FFmpeg源码分析音视频技术音视频 ffmpeg
=================================================================音视频入门基础：WAV专题系列文章：音视频入门基础：WAV专题（1）——使用FFmpeg命令生成WAV音频文件音视频入门基础：WAV专题（2）——WAV格式简介音视频入门基础：WAV专题（3）——FFmpeg源码中，判断某文件是否为WAV音频文件的实现音视频入门基础：W
OpenHarmony 5.0 纯血鸿蒙系统 ejinxian harmonyos 华为
OpenHarmony-v5.0-Beta1版本已于2024-06-20发布。OpenHarmony5.0Beta1版本标准系统能力持续完善，ArkUI完善了组件通过CAPI调用的能力；应用框架细化了生命周期管理能力，完善了应用拉起、跳转的能力；分布式软总线连接能力和规格进一步增强；媒体完善了框架能力、视频编解码能力、音视频的应用能力，媒体库丰富了使用场景，提供更好的使用体验。OpenHarmon
即时通讯项目 NingDream816 即时通讯项目网络 redis 数据库服务器缓存设计模式
即时通讯项目需求分析功能约束可行解更优解高性能接入层优化存储层优化消息时序一致性高可用需求分析功能添加好友聊天会话列表单聊AB群聊多设备登录消息漫游消息已读，查看已读/未读列表视频通话(学音视频技术时补上)语音通话约束DAU(DailyActiveUsers，日活跃用户数量)10亿假设每人平均每天发100条消息，1000Mli*100/86400=12MliQPS(Queriespersecond
MediaStream 的媒体流对象 (stream) 和流媒体轨道 (track) 详解 Wu Youlu 前端
navigator.mediaDevices.getUserMedia和MediaStream是实时音视频处理的重要API。通过这些API，可以从摄像头、麦克风或其他设备捕获音视频流，应用于视频通话、录制等场景。本文将介绍navigator.mediaDevices.getUserMedia的参数配置、MediaStream的传参、属性和方法，配合详细的代码示例，特别是如何动态添加和移除音视频轨道
ffmpeg一些基本用法 980205 ffmpeg 流媒体
来源：ffmpeg一些基本用法|王石头的博客(iwangsen.com)音视频操作，几乎绕不开ffmpeg，因为市面上绝大多数音视频播放软件、转码软件，内核都是它。它非常的强大，轻松几条命令就可以顺利完成你想做的工作我来汇总一些经常使用的命令首先在cmd窗口进入到ffmpeg目录里面最简单的视频格式转换ffmpeg-iD:\Media\IMG_0873.MOV-ccopyD:\Media\outp
走自己的路，随自己的心减读
“走自己的路，让别人去说吧”，就是一种人生态度。别人去说，是在浪费他自己的时间，而你只管活好自己的生活。被大家熟知的超级演说家总冠军刘媛媛曾经在她的抖音视频中说：“不喜欢我的人，为啥不是你改是我改，你让别人改，别人不改，然后你就会很痛苦。”最后一句“你不喜欢我，你自己改吧。”未尝不是一种只随我心的人生态度。还记得那位今年在《脱口秀大会》上爆火的北大女生李雪琴吗？她看起一脸“丧”劲儿，凭着自己的智慧
抖音视频去水印，获取无水印原视频的方法及过程分析。附上代码截图，很简单，主要是分析过程废了些时间。 liqizheng_ 笔记 php
抖音视频去水印获取原视频地址的方法及过程分析。附上代码截图，很简单，主要是分析过程废了些时间.前言：抖音视频自己保存的都带有抖音的logo和视频片尾，让一些做自媒体和搬运工的朋友感到不爽，想要搬运还有水印，于是网上出现好多视频无水印解析的网站，包括微信小程序和公众号都在做，引流也确实可以，但是大部分都是调用的其它网站提供的解析接口，往往一些还要付费，或者不稳定各种问题。，因为他们都不是从最原始的代
抖音视频怎么去水印保存到手机上 Java搬砖组长音视频
抖音已经成为人们日常消遣的主要平台之一。无论是搞笑的视频、感人的短片，还是充满创意的短视频，抖音总能给人带来无限的欢乐与惊喜。有时候我们可能会想要将喜欢的视频保存到手机上，方便离线观看或与朋友分享，但这些视频通常会带有抖音的水印。这篇文章将向大家介绍如何去除抖音视频的水印并保存到手机上。1.使用第三方工具网站去水印许多第三方应用程序和网站可以帮助用户去除抖音视频的水印。例如，“视频解析器（www.
FFmpeg任意文件读取漏洞分析音视频开发老马 ffmpeg
背景介绍FFmpeg是一套目前非常流行的可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序。它提供了录制、转换以及流化音视频的完整解决方案。目前有非常多的视音频软件或是视频网站、手机APP都采用了这个库，但是这个库历史上曝出的漏洞也非常之多。这次的漏洞是利用了ffmpeg可以处理HLS播放列表的功能，在AVI文件中的GAB2字幕块中嵌入了一个HLS文件，然后提供给ffmpeg进行转
rk3588音视频硬件编解码介绍三十度角阳光的问候音视频
目录ffmpegrk3588系列芯片编程方法最终的输出结果ffmpeg示例程序ffmpeg音视频处理中通常是用ffmpeg进行软件音视频编解码aac/h264编码，但其运行速度过慢消耗cpu占用率。因此需要寻找音视频硬件编解码方法。rk3588系列芯片自带音视频硬件编解码框架ffmedia或者mpp，其内部原理是配合内部硬件rga内存，把音视频数据读入内部rga内存中进行Mpp硬件编解码计算，包括
OpenglEs之EGL环境搭建 FlyerGo Opengl 音视频 c++opengl
前言前面我们发布了一系列的入门教程，例如C++系列的指针扫盲、多线程的使用等，JNI入门系列，ffmpeg入门系列等，有感兴趣的童鞋们可以关注往回自行查阅。今天我们的主题依然是音视频开发的范畴，做过音视频开发的都知道Opengl也是音视频开发中的一项重要技能，特别是涉及到视频录制、特效处理、画质渲染细分功能。因此后续笔者打算再出一系列的OpenglES的学习笔记，希望能与大家共同温故知新。因为前面
FFmpeg的入门实践系列七(滤镜) 星海逐愿 ffmpeg ffmpeg
欢迎诸位来阅读在下的博文~在这里，在下会不定期发表一些浅薄的知识和经验，望诸位能与在下多多交流，共同努力文章目录前期博客一、滤镜过滤器filter的简介FFmpeg编程的四大结构体1.滤镜AVFilter2.滤镜图AVFilterGraph3.滤镜实例AVFilterContext4.滤镜输入输出参数AVFilterInOut二、使用滤镜加工音视频前期博客FFmpeg的入门实践系列一(环境搭建)F
Linux 编译 qtav,QtAV 1.3.3 发布，跨平台音视频播放库丶本心灬 Linux 编译 qtav
QtAV1.3.3发布-支持调用NVIDIA的cuvid库进行CUDA硬解。支持平台：windows,linux。(是linux上第一个支持cuda硬解的么？)。有些视频播放会抖动，目前原因还不清楚。4k硬解画面貌似有点花，效果不如lavfilters好。-OpenGL和OpenGLES2支持16-bit的YUV渲染，包括9,10,12,14,16bit的little/bigendian的yuv。
ffmpeg命令详解 weixin_42178492 java 基础工作相关经验集锦
ffmpeg命令详解(转)FFmpeg是一套可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序。采用LGPL或GPL许可证。它提供了录制、转换以及流化音视频的完整解决方案。它包含了非常先进的音频/视频编解码库libavcodec，为了保证高可移植性和编解码质量，libavcodec里很多code都是从头开发的。[百度百科]ffmpeg使用语法ffmpeg使用语法：ffmpeg[[o
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring

H264编码参数漫谈

你可能感兴趣的:(音视频)