乔木辛

【音视频基础】H264

介绍

H264是基于运动补偿的视频编码标准。所谓编码我的理解就是对数据进行压缩便于网络传输。而视频编码就是依据图像帧的像素块之间的相似性对图像进行压缩。

相关概念

H264结构中，一幅图像编码后的数据叫一帧，一帧由一个或多个Slice片组成，一片由一个或多个MB宏块组成，一个宏块由16*16的yuv数据组成。宏块是H264编码的基本单位。

帧类型

H264定义了三种帧，I帧，P帧，B帧。

I帧：关键帧，帧内压缩

将全帧图像进行压缩编码传输，解码时只用本身的数据就能重构完整图像。
I帧是一个GOP帧组的第一帧，也是唯一I帧。
描述了图像背景和运动主体的详情，不需要参考运动矢量。
因为是全帧压缩，所以数据量较大，但解码压力小。

P帧：前向预测编码帧，帧间压缩

采用运动补偿的方法传输本帧与前面的I帧或P帧的差值和运动矢量，所以解码时也需要参考帧的数据才能重构完整图像。
只向前参考最靠近的I帧或P帧。
由于是参考帧，所以可能造成解码错误的扩散。
由于是传输插值，所以压缩比较高，解码压力较小。

B帧：双向差别帧，帧间压缩

传输本帧与前面的I帧或P帧和后面的P帧的差值和运动矢量，同理解码时也要参考前后的帧来预测。
压缩比最高，因为反应了两个参考帧间运动主体的变化，所以预测比较准确。
不是参考帧（其他帧不会参考B帧进行编码），不会造成解码错误的扩撒。

GOP图像组

group of picture 两个I帧之间的所有帧为一个GOP。

H264对关联度高的视频帧进行分组，其算法是在相邻几幅图像画面中，一般有差别的像素只有10%以内的点,亮度差值变化不超过2%，而色度差值的变化只有1%以内，我们认为这样的图可以分到一组GOP。

IDR帧：立即刷新图像

IDR帧都是I帧，但I帧不一定是IDR帧。当解码器遇到IDR帧就会清空参考队列，将已解码的数据全部输出或抛弃，开始解码新的序列。

而普通的I帧不会清理参考队列，也就是说IDR可以阻断误差的累计，而普通I帧不行。

PTS. DTS：

PTS（Presentation Time Stamp）：PTS 主要用于度量解码后的视频帧什么时候被显示出来

DTS（Decode Time Stamp）：DTS 主要是标识内存中的 bit 流什么时候开始送入解码器中进行解码

DTS 主要用户视频的解码，在解码阶段使用。PTS主要用于视频的同步和输出，在显示的时候使用。

由于B帧的存在，要参考前后帧，所以在有B帧的情况下 DTS!=PTS。没有B帧则两者相等。

Vega获取的信息截图：

压缩技术：

https://zhuanlan.zhihu.com/p/31056455

视频图像被送到H264编码器中，编码器给每一个图像划分宏块。H264默认使用16*16大小作为一个宏块。但为了更高的压缩率，还可以将宏块划分为8*16､ 16*8､ 8*8､ 4*8､ 8*4､ 4*4大小的子块。

对划分好的宏块计算宏块的像素值。最终一幅图中每个宏块都处理完后如下图：

处理时间冗余（帧间预测压缩）：

运动估计与运动补偿：

运动估计：当前帧的某个区域(A)在参考帧中寻找一个合适的匹配区域(B)。

运动补偿：找到区域A和区域B的不同。

这运动矢量就是炮二的区域移动到炮五的区域，移动后产生一个预测帧。预测帧和当前帧并不完全一样，他们的区别就是残差。此时的残差则是炮二位置的棋格，以及炮五边框的颜色变化。

预测性编码的产出就是这些运动矢量和残差，通过这个例子我们能看到这些产出数据是远远小于一个完整帧的数据量的。

处理空间冗余（帧内压缩）：

https://www.cnblogs.com/charybdis/p/6049108.html

对于一幅图像，相邻的两个像素的亮度和色度是比较接近的，所以在保存一个像素时不需要将这个像素的全部信息保存，只需要保存这个像素与其参考像素的插值即可。

使用上一个像素X’做参考像素，经过帧内预测获得当前像素X的预测像素Xp，X减去Xp就获得了差值d。

在解码的时候，同样利用X’获得预测像素Xp，Xp加上插值d，就可以获取原始值X。

同时这个X可以作为下一个像素的X’从而成为一个完整的循环。

当然在H264中，因为以像素为单位太小，所以以宏块为单位（16*16像素、4*4像素）进行计算。

上述遗漏的问题，预测值Xp怎么来的？Xp是通过X’利用某个公式计算的。在白皮书中 4*4 有9种预测模式，16*16有4种预测模式。

第一列所有的像素都用A像素值，第二列所有的像素都用B像素值，依次类推。
第一行所有的像素都用I像素值，依次类推。
16个像素等于ABCDIJKL这个八个像素的平均值。

a = (A+2B+C+2)/4，这里+2是为了四舍五入。b和e = (B+2C+D)/4。c、f、i=(C+2D+E+2)/4，d、g、j、m=(D+2E+F+2)/4。h、k、n=(E+2F+G+2)/4。l、o=(F+2G+H+2)/4。p=(G+2H+H+2)/4=(G+3H+2)/4
1. 1. 1. 8都是通过与3类似的算法计算得到。

如何在这9种算法种选择，当然是希望误差越小越好，所以也有对应的算法去计算误差。例如：SAD，SATD等。

同时因为选择了不同的算法，所以解码器也需要知道每个宏块具体使用哪种算法。所以有1bit用于保存是由与上一个一样，如果不一样则用4bit保存具体选择哪个算法。

X’真的与原始X完全一样么？

理论上上讲按前面的算法应该是一样的，但因为差值传到解码器的过程种经过了量化、变换、反变换和反量化，有了精度算是，因此X’真的与原始X无法完全一致。

H264编解码流程：

H264分层结构

H264的主要目标是为了有高视频压缩比和良好的网络亲和性。

为了这两个目的H264将系统架构划分了两个层面 VCL 和 NAL。

VCL：Video Coding Layer，视频编码层

对核心算法引擎、块、宏块及片的语法级别的定义，负责有效表示视频数据的内容，最终输出编码完的数据SODB（数据比特串）

NAL：Network Abstraction Layer，网络提取层

定义了片级以上的语法级别（如序列参数集和图像参数集），负责以网络所要求的恰当方式去格式化数据并提供头信息，以保证数据适合各种信道和存储介质上的传输。

『NAL』就是为了包装『VCL』以达到更好网络传输效果。NAL层将 SODB 打包成 RBSP（原始字节序列负荷） 然后加上NAL header 组成一个NALU。

RBSP（Raw Byte Sequence Payload，原始字节序列载荷）：

PBSP就是在SODB后添加了trailing bits，即一个bit 1和若干个bit 0，以便字节对齐。

传统的视频码流仅有VCL视频编码层，而H264可以根据不同应用增加不同的NAL header，用来适应不同的网络应用环境，减少码流的传输错误。VCL数据在传输前先被映射到NAL单元中。

EBSP：（Encapsulated Byte Sequence Payload, 扩展字节序列载荷）

H264规定，当检测到当检测到0x000000时，也可以表示当前NALU的结束。

那这样就会产生一个问题，就是如果在NALU的内部，出现了0x000001或0x000000时该怎么办？

在编码时，每遇到两个字节连续为0（0x0000），就插入一个字节的0x03。解码时将0x03去掉。

H264码流结构(Annex-B格式)

ps：H264有两种封装：⼀种是annexb模式，传统模式，有startcode。⼀种是mp4模式，⼀般mp4，mkv都是mp4模式，没有startcode，SPS和PPS以及其它信息被封装在container中，每⼀个frame前⾯4个字节是这个frame的⻓度很多解码器只⽀持annexb这种模式。

H264码流是一个个连续的NALU，一个NALU包含 [NALU Header][NALU Payload (RBSP)] 三部分。

StartCode：是一个NALU单元开始。

主要是为了将相邻两个NALU划分开，让他们有一个界线，方便解码。必须是 0x00 00 00 01 或者0x00 00 01。

那么玩意数据中间正好有个 0x00 00 00 01 或者 0x00 00 01 怎么办？见上述EBSP。

并且h264有个防止竞争的机制，在编码一个NAL时，如果出现有连续两个0x00字节，就在连续两个0x00后面插入一个0x03（解码的时候这个0x03会被丢弃）。

NAL header：定义了RBSP单元的类型

由 1字节（8位）组成。禁止位（1位）、重要性指示位（2位）、NALU类型（5位）。

nal_unit_type取值说明：

SPS 和 PPS

https://zhuanlan.zhihu.com/p/27896239

从上图可知SPS和PPS是一个NALU的类型。

实际网络传输编码好的数据流的时候会出现丢包，而如果丢包数据为图像头等关键信息的时候甚至会导致后续解码失败。在H264之前，为了应对图像头关键信息被丢失的做法是在很多包（也有说法是每一个包）都会携带图像头关键信息（冗余做灾备的思想）。但是，在H264种，为了提高网络传输鲁棒性，重新设计出SPS和PPS。

SPS（序列参数集）：SPS中保存了一组编码视频序列(Coded Video Sequence)的全局参数。因此该类型保存的是和编码序列相关的参数。

https://yinwenjie.blog.csdn.net/article/details/52771030

PPS（图像参数集）：PPS中保存了整体图像相关的参数。

https://yinwenjie.blog.csdn.net/article/details/52877689

根据Vega分析，IDR帧中就包含了SPS，PPS和IDR本身的NALU。

SEI：补充增强信息

Access Unit分隔符：Access Unit：是一个或者多个 NALU 的集合，代表了一个完整的帧。

H264码流整体结构：

Level

通过 Vega 分析，不同的 H264 文件有不用的 Profile 和 level。

计算支持1080P(1920*1080)的最低级别：

一个宏块大小16*16.。ceil是向上取整

水平宏块数（PicWidthInMbs）= ceil(视频宽度 / 16) = ceil(1080 / 16) = ceil(67.5) = 68

垂直宏块数（FrameHeightInMbs）= ceil(视频宽度 / 16) = ceil(1920 / 16) = ceil(120) = 120

每帧宏块数（Macroblocks per frame）= 水平宏块数 * 垂直宏块数 = 68 * 120 = 8160

查询上面的级别详表可知，支持每帧8160个宏块的最低级别是4。

级别4 允许的每秒最大宏块数是 245,760 。所以 245760 / 8160 =30.1，即最高支持每秒30.1帧。当然级别更高支持的帧数也更多。

MaxDpbMbs

表中最后一列为 MaxDpbMbs 最大解码缓冲区宏块数。也就是解码时参考缓冲区中的宏块数。

DpbMbs = ref（参考帧数） * PicWidthInMbs（水平宏块数） * FrameHeightInMbs（垂直宏块数）
我们可以根据 MaxDpbMbs 倒推出最大参考帧数。

公式为：max_ref = min(floor(MaxDpbMbs / (PicWidthInMbs * FrameHeightInMbs)), 16)。floor是向下取整。

以1080P + Level 4 为例：

min(floor(32,768 / (68*120)),16) = 4 注：后面的16 是因为参考帧数组大只能为16

所以1080P的视频在 Level 4 级别下，最高支持 4 个参考帧。

反推可知，在解码时参考帧的帧数并不只是前1帧，而是前多帧。同理编码时当前帧的参考帧也不只是前一帧，而是前多帧。

这也就应证了I帧和IDR帧的区别。虽然应证了，但还是存在疑问，既然I帧已经可以独立编码解码了，那么为什么在编码解码的时候还要参考I帧之前的帧？

你可能感兴趣的:(音视频基础,音视频,H264)

华为云welink考试试题_华为内部开启WeLink项目，华为云是这样考虑的-通信/网络-与非网... weixin_39820437 华为云welink考试试题
协同办公市场竞争激烈华为云WeLink是华为旗下智能工作平台，它融合消息，邮件，会议、音视频、云空间、小程序等服务，可助力用户随时、随地、通过各类终端设备等实现协作办公。华为还宣布携手合作伙伴成立华为云WeLink生态联盟，金山办公、中软国际、致远互联、罗技、华为商旅、红圈营销、合思费控、Coremail论客、芯盾集团、视源股份、喜马拉雅等成为首批生态伙伴。IDC曾发布了《2018年下半年中国企业
WebRTC（九）：JitterBuffer 却道天凉_好个秋 WebRTC webrtc
JitterBufferJitter“Jitter”指的是连续到达的媒体包之间时间间隔的变化。在网络传输中，由于：网络拥塞路由路径变化队列排队不同链路带宽差异导致包之间的接收时间不一致，这就是网络“抖动”。作用**JitterBuffer（抖动缓冲区）**的作用是：缓冲网络传输过来的数据包重新排序乱序的包缓冲一定时间再输出实现稳定的音视频帧输出，避免播放中出现卡顿、跳帧、音频破音工作流程图网络接收
B站视频下载技术揭秘：从浏览器抓包到FFmpeg音视频合成 soonlyai 音视频 ffmpeg
摘要本文旨在深入探讨B站（哔哩哔哩）视频的实际加载与分发机制，并通过Python脚本实现一个功能性的视频下载器。我们将从使用浏览器开发者工具分析B站播放页的网络请求入手，定位获取视频流地址的关键API。在此基础上，本文将详细讲解如何利用Python的requests库模拟API请求、通过携带Cookie获取登录后才能访问的4K高清视频流，并最终调用ffmpeg工具将B站特有的音、视频分离流合并为完
《从0到1：C/C++音视频开发自学指南》空云风语机器视觉 Opencv QT c语言 c++音视频
开启自学之旅：为何选择C/C++音视频开发在当今数字化时代，音视频开发的应用场景极为广泛，深刻融入了我们生活与工作的方方面面。从火爆的直播行业，无论是电商直播中主播与观众的实时互动，还是游戏直播里精彩赛事的实时呈现；到备受欢迎的短视频平台，各种创意短视频的制作与分享；再到便捷的视频会议，让远程办公、在线教育成为可能，实现了跨地域的高效沟通与协作。这些丰富多样的应用场景，都离不开音视频开发技术的有力
抖音的视频怎么下载下来——下载狗解析工具 Java搬砖组长音视频
如果你想下载抖音视频，可以使用「下载狗解析工具」来获取抖音无水印高清视频。以下是详细的操作步骤，适用于电脑端和手机端。方法1：电脑端下载（无水印高清）步骤1：获取抖音视频链接打开抖音官网或手机APP，找到要下载的视频。点击视频右下角的「分享」按钮，选择「复制链接」。步骤2：使用「下载狗解析工具」解析在浏览器中打开「下载狗解析工具」官网（www.xiazaitool.com）。将复制的抖音链接粘贴到
调试HDMI音频能8通道播放声音 hxHardway Android/Linux 功能实现文档音视频 linux
一、使用场景我们是通过rk主控的hdmi接口播放音视频给到ite68051芯片解析出8声道数据，分别通过4路i2s的数据脚给给到fpga去解析调试步骤：1.根据相关手册配置hdmi输出，hdmi声卡注册，如下:hdmi0_sound:hdmi0-sound{ status="disabled"; compatible="rockchip,hdmi"; rockchip,mclk-
【GStreamer】减小延时的参数设置、从RTP中获取时间戳郭老二视频 GStreamer
1、问题描述在使用GStreamer实现RTSP转RTMP时，延时很大，2～5秒，这是为了应对网络抖动、丢包重传、音视频同步等问题，建立了一些缓冲区。2、解决方法在可以损失流畅度、画面质量的前提下，可以使用如下参数来减小延时1）rtspsrc参数：buffer-mode=auto：自动调整缓冲区大小drop-on-latency=true：缓冲区满时丢弃旧数据latency=0：最小化RTSP接收
C# WinForms局域网即时通讯系统设计与实现深刻如此
本文还有配套的精品资源，点击获取简介：本项目是一个使用C#WinForms技术开发的局域网内即时通讯工具，支持文字、文件传输和音视频通信。它旨在为学生毕业答辩提供一个本地网络通信平台，展示开发者在.NET环境下的网络编程和GUI设计能力。项目不仅要求掌握C#基础和WinForms控件开发，还需实现网络通信、多线程处理、数据安全等高级功能。通过项目开发，学生能深入理解软件开发的各个方面，提升软件工程
WebRTC（七）：媒体能力协商却道天凉_好个秋 WebRTC webrtc
目的在WebRTC中，每个浏览器或终端支持的音视频编解码器、分辨率、码率、帧率等可能不同。媒体能力协商的目的就是：确保双方能“听得懂”对方发的媒体流；明确谁发送、谁接收、怎么发送；保障连接的互操作性和兼容性。P2P的基本流程参与角色角色说明peerA发起连接的端（通常是主叫）peerB接收连接的端（通常是被叫）signal信令服务器，用于中转SDP和ICE信息，但不参与媒体传输stun/turnS
ESP FOURCC 编码介绍乐鑫科技 Espressif 乐鑫科技多媒体编码
FOURCC（FourCharacterCode，四字符编码）是一种在多媒体领域被广泛使用的标识符，常用于快速识别音视频编码格式、封装格式、像素格式等。乐鑫科技定义了一套完整的FOURCC编码标准，称为ESPFOURCC，该标准可在开源项目ESP-GMF中的esp_fourcc.h头文件中找到，涵盖了音视频编解码、图像、封装格式和各种像素格式。本文将深入介绍ESPFOURCC的背景意义、定义原则、
MX_Player_Pro_专业精简版AC3/DTS/EAC3 By.SOLDIER-就要应用网91apps.cn syx594
MX_Player_Pro1.32.8_专业精简版_AC3/DTS/EAC3MXPlayer是安卓市场功能最强大的视频播放器支持几乎所有的音视频文件，强力的硬件加速和多种字幕支持。优化说明：不需要Root或LuckyPatcher或GooglePlayModded；禁用/删除不需要的权限及服务；优化和压缩对齐的图形以及清理不必要的资源，以实现快速加载；从Android.manifest中删除了广告
请编写一个sip Android音视频客户端又可乐 android android studio ide
编写一个SIP客户端需要以下步骤：了解SIP协议:SIP(SessionInitiationProtocol)是一种通信协议，用于建立、维护和终止多媒体会话(如语音和视频通话)。选择开发工具:可以使用Java语言和AndroidStudio开发安卓应用程序。获取SIP栈:可以使用现有的SIP栈库，如pjsip，或开发自己的SIP栈。设计界面:可以使用Android的XML语言设计用户界面，包括呼叫
音视频及H264/H256编码相关原理 Everbrilliant89 音视频开发音视频视频编解码 H264编码 H265编码音视频编解码
一、音视频封装格式原理：我们播放的视频文件一般都是用一种封装格式封装起来的，封装格式的作用是什么呢？一般视频文件里不光有视频，还有音频，封装格式的作用就是把视频和音频打包起来。所以我们先要解封装格式，看有哪些视频流和哪些音频流，此时的音频流和视频流都还是压缩数据，不能直接用于显示的，这就需要解码。如FFmpeg视频文件就是一个容器(视频流（H264）音频流(aac))。1、视频文件封装格式：封装格
【音视频】PJSIP库——pjsua命令使用详解郭老二视频音视频
1、源码编译1）安装依赖库sudoaptinstalllibsrtp2-devsudoaptinstalllibopus-devalsa-toolslibalsaplayer-devffmpeglibalsa*pulseaudio-module-jacksudoaptinstalljackdlibjack-jackd2-devlibjack-devlibsdl2-devlibv4l-devliba
【音视频】SIP基础、搭建服务器和客户端郭老二视频音视频
1、概念SIP（SessionInitiationProtocol，会话初始协议）是一种用于创建、修改和终止实时通信会话（如语音、视频通话）的应用层协议。1.1架构SIP架构分为客户端和服务器端1）客户端：发起或接收会话请求，例如：手机上的VoIP应用、pjsua程序2）服务端：存储客户端注册的信息，比如IP、端口等注册服务器（RegistrarServer）：存储用户的当前位置信息（IP+端口）
FFmpeg 的算法体系 lianghu666 音视频硬件 Linux ffmpeg 算法 linux
️一、FFmpeg核心算法体系与作用1.编解码算法编解码是FFmpeg的核心能力，通过libavcodec实现音视频的压缩与还原。视频编码算法帧间预测：通过运动估计（菱形搜索、全搜索法）减少时间冗余，支持P帧（前向预测）和B帧（双向预测）变换与量化：采用整数离散余弦变换（DCT）将空域信号转为频域，再通过量化舍弃高频信息（H.264/H.265使用）熵编码：对残差数据采用CABAC（上下文自适应二
ZLMediaKit2023-10-15master分支编译版下载：实时音视频传输解决方案昌焘同
ZLMediaKit2023-10-15master分支编译版下载：实时音视频传输解决方案去发现同类优质开源项目:https://gitcode.com/项目介绍ZLMediaKit是一款开源的实时音视频传输框架，专为流媒体传输而设计。2023年10月15日基于master分支编译完成的版本，为广大开发者提供了Windows平台下的便捷使用体验。该版本集成最新的功能特性，无需复杂编译过程，下载即可
Permute 3.5 最好用的苹果电脑视频压缩转换工具 blank_t Permute Permute mac 视频压缩视频处理
类别：视频版本：3.5大小：19.2MBMB语言：简体中文标签：视频转换视频编辑兼容性：OSX10.11或更高版本更新：2020年07月23日软件介绍Permute3.5强大易用的视频格式转换已通过小编安装运行测试100%可以使用。Permute3.5是Mac系统最容易使用的视频格式转换器，它很容易使用，无需配置，你只需将文件拖放进界面窗口，对所有的媒体进行转换。支持丰富的音视频文件格式（甚至还支
Mac电脑-媒体文件格式转换-Permute 2401_88856700 媒体 mac macos 格式转换
Permute是一款功能强大的媒体文件格式转换工具。支持多种音视频和图像格式，包括但不限于MP4、AVI、MOV、MKV、MP3、WAV、FLAC、JPEG、PNG等。操作界面简洁明了，只需拖拽文件或点击添加按钮来选择需要转换的文件。转换设置区域，可自由选择输出格式、输出路径、输出参数等，实现个性化转换。原文地址：Permute媒体文件格式转换工具
XMOS将在CES 2025上展出多款由边缘AI驱动的创新音效、音频、识别和处理解决方案电子科技圈 XMOS 人工智能音视频嵌入式硬件科技物联网 mcu iot
全球智能物联网技术领导者暨匠心独到的半导体科技企业XMOS宣布：该公司将再次参加2025年国际消费电子展（CES2025），并将在本届CES上展出一系列由人工智能（AI）驱动的全新空间音效、语音捕获与降噪、音视频多模态AI处理等多种全新音频技术与应用解决方案。它们皆由XMOS在单一器件中集成了高性能AI、DSP、I/O和控制功能的xcore.ai系列多核控制器支持，将边缘AI技术与音频和话音媒介特
音视频面经_音视频知识解析：第三章FFMPEG编写视频解码 2301_79125642 java
小调查一次小调查，各位javaer除了用springboot写过项目，还用过啥框架写项目？有没有牛友来指点一二，真的好纠结本人位于湖南某民办二本(在湖南民办二本里算好的)，目前大三下，准备找工作干java后端，跟着b站的黑勇攀高峰6月12日举行的毕业典礼，一周的时间很快就过去了。回想起整个春招，机会确实很少，大概只有字节美团快手#和牛牛一起刷题打卡(51733)##和牛牛一起刷题打卡#简历求指导投
SmartMediaKit实战经验总结之高稳定、低延迟、强兼容音视频牛哥 RTSP播放器 RTMP播放器大牛直播SDK rtmp播放器 rtmp player 音视频 windows rtmp播放器 android rtmp播放器安卓rtsp播放器大牛直播SDK
在万物互联与数字化加速融合的今天，音视频实时通信技术正成为各行业发展的核心驱动力。从教育到工业、从安防到远程医疗，毫秒级低延迟的音视频交互体验已成为新一代实时系统的“生命线”。而在这个领域，视沃科技旗下的大牛直播SDK（SmartMediaKit），凭借全自研的超强流媒体内核、超低延迟表现和跨平台支持，成为行业标杆级的音视频基础设施提供者。全栈自研，跨平台高性能流媒体引擎大牛直播SDK始于2015
前端开发者必须要掌握的技术栈及学习建议，都是干货老猿阿浪前端学习前端
作为前端开发者，必须要掌握的技术栈非常的广泛，但总体脉络不变，以下是当前前端开发的核心技术分类和学习建议，按优先级和重要性排序如下（都是干货）：一、基础三件套（必学）HTML5语义化标签、表单验证、WebAccessibility（无障碍访问）Canvas/SVG、音视频嵌入CSS3盒模型、Flex/Grid布局、响应式设计（媒体查询）动画（Transition/Animation）、变量（CSS
鸿蒙有约｜对话申俊伟：在鸿蒙生态中，我选择做个“技术传播者” harmonyos
在新一轮操作系统演进的浪潮中，HarmonyOS正逐步走向主流，开发者的角色也从“适配者”转变为“共建者”。本期《鸿蒙有约》，我们专访了申俊伟（网名“轻口味”）——一位深耕移动端十年的音视频领域专家与活跃的技术博主。Q：欢迎加入“鸿蒙有约”！请您简单地介绍一下自己吧。A：大家好，我是申俊伟，网名轻口味，目前扎根北京，拥有十年移动端开发经验，深耕AI、音视频和即时通讯领域，在公司负责IM客户端方向。
宝塔安装nginx-http-flv-module，音视频直播，第二篇两个人的幸福online nginx http 音视频
1，先安装环境安装nginx先卸载原有nigixnigix大于等于1.2.6cd/www/server#进入宝塔目录yuminstallgit-ygitclonehttps://gitee.com/winshining/nginx-http-flv-module.git使用源码安装nigix在自定义模块区域点击「添加」，填写以下参数：模块名称：http_flv描述：http_flv参数：--add
每日推荐：MKVToolNix(音视频混流神器) 真实有料音视频服务器 windows 运维 notion 嵌入式硬件
相信不少朋友都遇到过这样的烦恼：下载了一个MP4文件，结果音频和视频是分离的。想重新合成一个正常播放的视频，用格式工厂这类工具时不是处理失败，就是速度慢得令人崩溃，简直把人逼疯！正当我几乎要放弃时，忽然想起了一款老牌工具——MKVToolNix没想到一试之下，立刻惊为天人：混流几乎秒完成，速度快到飞起！什么是MKVToolNix？MKVToolNix是一款专注于MKV（Matroska）格式处理的
双缓冲区技巧：提升性能的利器 Jay_515 嵌入式单片机 C语言
双缓冲区技术是解决生产者-消费者速度不匹配问题的经典方案，在图形渲染、音视频处理等领域广泛应用什么是双缓冲区？双缓冲区是一种数据缓冲技术，它使用两个缓冲区（BufferA和BufferB）来解决生产者和消费者速度不匹配的问题。核心思想是：生产者向一个缓冲区（后台缓冲区）写入数据消费者从另一个缓冲区（前台缓冲区）读取数据当生产者完成写入后，切换缓冲区角色，使得消费者可以读取新数据为什么需要双缓冲区？
音视频的前端知识
1基本对象1.1DOCUMENT定义：浏览器内置的全局对象（window.document），提供访问和操作HTML文档的接口。核心功能：查找和选择HTML元素（如div、input）。修改元素的内容、属性和样式。创建新元素并添加到文档中。监听用户事件（如点击、滚动）1.查找和选择HTML元素//通过ID获取元素（返回单个元素）constelementById=document.getElemen
在Windows 10环境下，使用Visual Studio 2019搭建WebRTC编译环境 FdviAutoit windows visual studio webrtc
WebRTC是一种开源项目，旨在为Web浏览器和移动应用提供实时通信功能，例如音视频通话和数据传输。在这篇文章中，我将向您介绍如何在Windows10环境下使用VisualStudio2019搭建WebRTC编译环境。以下是详细的步骤：步骤1：安装依赖项在开始之前，我们需要安装一些依赖项。请按照以下步骤进行操作：1.1安装Python2.7WebRTC依赖于Python2.7，请确保已在您的计算机
iOS性能调试完整流程实录：工具组合下的问题定位与修复实践(含keymob) 2501_91592143 http udp https websocket 网络安全网络协议 tcp/ip
iOS应用开发进入中后期时，调试工作往往从功能测试转向稳定性与性能问题的修复。而这类问题复杂度通常远高于业务Bug，因为它们更多涉及运行环境、线程调度、资源占用甚至平台兼容性。在一次维护阶段中，我们针对公司内某音视频相关App执行了一轮深入的性能审查。目标是清理潜在的资源泄漏、后台高功耗行为，以及定位用户反馈但无法稳定复现的间歇性崩溃。以下是我们构建的调试流程和实战操作方式，所有工具的使用都是按任
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他