夏之七

H264编码原理及NALU介绍

一、简述

流媒体编解码流程大致如图1所示：

【流媒体编解码流程图1】

视频数据编解码层格式包含有：H264，H265，MPEG4等。

本文我们主要对H264编码原理进行整理，并对NALU做简要介绍。

二、H264编解码

2.1、H264简介

参考来源：H264百度百科

H.264从1999年开始到2003年形成草案，最后在2007年定稿有待核实。在ITU的标准里称为H.264，在MPEG的标准里是MPEG-4的一个组成部分（MPEG-4 Part 10），又叫Advanced Video Codec，因此H.264也常常称为MPEG-4或直接叫AVC。

比如下面使用 MediaInfo工具查看flv音视频文件的信息，可以看到video格式为AVC，其实也就是H264格式。

【flv音视频文件基本信息图2】

2.2、H264编解码原理

参考来源：H264 编解码协议详解，深入浅出理解视频编码H264结构，h264编解码结构框图

1、H264概述

问题：为什么要对音视频文件进行H264编解码？

因为，在音视频传输过程中，视频文件的传输是个极大的问题；一段分辨率为1920 * 1080，每个像素点为RGB占用3个字节，帧率是25的视频，对于传输带宽的要求是：1920 * 1080 * 3 * 25/1024/1024=148.315MB/s，换成bps则意味着视频每秒带宽为1186.523Mbps，这样的速率对于网络存储是不可接受的。因此视频压缩和编码技术应运而生。

对于视频文件来说，视频由单张图片帧所组成，比如每秒25帧，但是图片帧的像素块之间存在相似性，因此视频帧图像可以进行图像压缩；H264采用了16 * 16的分块大小对，视频帧图像进行相似比较和压缩编码。如下图所示：

【图像切分图3】

压缩编码可以分为内部压缩和外部压缩。

1）内部压缩
内部压缩指的是一帧图片的内部压缩。当H264对图片进行 16 * 16 分块后，会对每个小块内的图像进行分析，如果2个小块图像比较相近，那么住需要存储一张即可，无需存储重复图块。这样可以有效压缩图片的存储大小。

比如下面一张图片，划分的A、B小块图像分析后是基本一样的，那么只需要存储A即可，B不需要进行存储。

【内部压缩图4】

2）外部压缩
外部压缩指的是图片间的图像压缩。在每帧图片划分成16 * 16 小块的图像进行分析基础上，比图片间的数据，如果两张图片比较相近，对相同的图像模块只需存储一份，对不同的部分再做存储。避免了重复数据的存储，极大改善了图片压缩空间。

比如下面两张图片，除了E小块不同之外，其他都一样，那么存储图1数据后，图2片只需要存储与图片1不同的数据即可。

【外部压缩图5】

2、H264中的 I帧、P帧和B帧
H264 使用帧内压缩和帧间压缩的方式提高编码压缩率；H264采用了独特的 I帧，P帧和B帧策略来实现，连续帧之间的压缩。

【H264 IBP帧排序图6】

1）I 帧 （帧内编码帧 intra picture）
I 帧通常是每个 GOP（MPEG 所使用的一种视频压缩技术）的第一个帧，经过适度地压缩，做为随机访问的参考点，可以当成图象。I帧表示关键帧，解码时只需要本帧数据就可以完成。I帧可以看成是一个图像经过压缩后的产物。自身可以通过视频解压算法解压成一张单独的完整的图片。

I帧特点：

是一个全帧压缩编码帧。它将全帧图像信息进行JPEG压缩编码及传输。
解码时仅用 I帧的数据就可重构完整图像。
I帧描述了图像背景和运动主体的详情。
I帧不需要参考其他画面而生成。
I帧是P帧和B帧的参考帧（I帧质量直接影响到同组以后各帧的质量）。
I帧是帧组GOP的基础帧（如果为IDR则为第一帧），在一组中只有一个IDR帧，一个或多个I帧（包括IDR帧）。
I帧不需要考虑运动矢量。
I帧所占数据的信息量比较大。

2）P帧（前向预测编码帧 predictive-frame）
通过充分将低于图像序列中前面已编码帧的时间冗余信息来压缩传输数据量的编码图像，也叫预测帧。
P帧表示这一帧跟之前的一个关键帧（或P帧）的差别，解码时需要用之前缓存的画面叠加上本帧定义的差别，生成最终画面。
需要参考其前面的一个I frame 或者P frame来生成一张完整的图片。

P帧的预测和重构：
P帧是以 I帧为参考帧，在I帧中找出P帧“某点”的预测值和运动矢量，取预测差值和运动矢量一起传送。在接收端根据运动矢量从I帧中找出P帧“某点”的预测值并与差值相加得到P帧“某点”样值，从而得到完整的P帧。

P帧特点：

P帧是I帧后面相隔1~2帧的编码帧。
P帧采用运动补偿的方法传送它与前面的I帧或P帧的差值及运动矢量（预测误差）。
解码时必须将 I帧的预测值与预测误差求和后才能重构完整的P帧图像。
P帧属于向前预测的帧间编码。它只参考前面最靠近它的I帧或P帧。
P帧可以是其后面P帧的参考帧，也可以是其前后的B帧的参考帧。
由于P帧是参考帧，它可能造成解码错误的扩散。
由于是差值传送，P帧的压缩比较高。

3）B 帧 （双向预测帧 bi-directional interpolated prediction frame）
既考虑与源图像序列前面已编码帧，也顾及源图像序列后面已编码帧之间的时间冗余信息来压缩传输数据量的编码图像,也叫双向预测帧。B帧要参考其前一个I或者P帧及其后面的一个P帧来生成一张完整的图片。

B帧是双向差别帧，B帧记录的是本帧与前后帧的差别。要解码B帧，不仅要取得之前的缓存画面，还要解码之后的画面，通过前后画面与本帧的叠加取得最终画面。

B帧的预测和重构：
B帧以前面的 I帧或P帧为参考帧，找出B帧“某点”的预测值和两个运动矢量，并取预测差值和运动矢量传送。接收端根据运行矢量在两个参考帧中找出预测值并与差值求和，得到B帧“某点”样值，从而可得到完整的B帧。

B帧特点：

B帧是由前面的I帧或P帧和后面的P帧来进行预测的。
B帧传送的是它与前面的I帧或P帧之间的预测误差及运动矢量。
B帧是双向预测编码帧。
B帧压缩比最高，因为它只反映参考帧间运动主体的变化情况，预测比较准确。
B帧不是参考帧，不会造成解码错误导致的扩散。

压缩率比较：B帧 > P 帧 > I 帧

3、H264编码结构解析
H264除了实现对视频的压缩处理外，为了方便网络传输，还提供了对应的视频编码和分片策略。类似网络数据帧封装成IP帧，在H264中将其称为组（GOP，group of picture）、片（slice）、宏块（Macroblock），它们一起组成了H264的码流分层结构。H264将其组织成为序列(GOP)、图片(pictrue)、片(Slice)、宏块(Macroblock)、子块(subblock)五个层次。

【H264结构组织图7】

H264将视频分为连续的帧进行传输，在连续的帧之间使用 I帧、P帧和B帧。同时对于帧内而言，将图像分块为片、宏块和字块进行分片传输；通过这个过程实现对视频文件的压缩包装。

IDR（Instantaneous Decoding Refresh，即时解码刷新）
一个序列的第一个图像叫做IDR图像（立即刷新图像），IDR图像都是 I 帧图像。（I帧图像不一定是IDR图像）
I 帧和IDR帧都使用帧内预测。I 帧不用参考任何帧，但是之后的P帧和B帧是有可能参考这个I帧之前的帧。但 IDR不允许这样做。

比如原始图像帧序为： IDR1 B2 B3 P4 B5 B6 P7 B8 B9 I10
解码顺序：

IDR1 P4 B2 B3 P7 B5 B6 I10 B8 B9 P13 B11 B12 P16 B14 B15 这里的B8可以跨过I10去参考P7
IDR1 P4 B2 B3 P7 B5 B6 IDR8 P11 B9 B10 P14 B11 B12 这里的B9就只能参照IDR8和P11，不可以参考IDR8前面的帧

IDR帧的核心作用是为了解码的重同步，当解码器解码到 IDR 图像时，立即将参考帧列清空，将已解码的数据全部输出或抛弃，重新查找参数集，开始一个新的序列。这样做的好处是，如果前一个序列出现重大失误，在这里可以获得重新同步的机会。IDR图下之后的图像永远不会使用 IDR帧之前的图像的数据来解码。

下图为一个 H264 码流的示例（从码流帧分析可以看出来B帧不能被当作参考帧）

【H264 码流的示例图8】

GOP （图像组）主要用作形容一个IDR帧到下一个IDR帧之间的间隔了多少个帧。

比如说GOP为120，如果是720 p60的话，就是2s一次 I帧。

在码率不变的前提下，GOP值越大，P、B帧的数量越多，平均每个I、P、B帧占用的字节数越多，也更容易获取较好的图像质量。

Reference（参考周期）指两个P帧之间的距离。一个I帧所占用的字节数大于一个P帧，一个P帧所占用的字节数大于一个B帧。Reference越大，B帧的数量越多，同理也更容易获得较好的图像质量。

不过通过提高GOP值来提高图像质量是有限度的，因为：

在遇到场景切换时，H264编码器会自动强制插入一个 I帧，此时实际的GOP值被缩短了。
在一个GOP中，P、B帧是由 I帧预测得到，当 I帧的图像质量比较差时，会影响到一个GOP中后续P、B帧的图像质量，直到下一个GOP开始才得以回复，因此GOP值不宜设置过大。
由于P、B帧的复杂度大于I帧，所以过多的P、B帧会影响编码效率，使编码效率降低。
过长的GOP还会影响Seek操作的响应速度，由于P、B帧是由前面的I或P帧预测得到的，所以Seek操作需要直接定位，解码某一个P或B帧时，需要先解码得到本GOP内的I帧及之前的N个预测帧才可以，GOP值越大，需要解码的预测帧就越多，seek响应的时间也越长。

做直播时，一般不用B帧，因为B帧需要占用较大的缓存，并且容易出现延迟。因为B帧要参考其前一个I或者P帧及其后面的一个P帧来生成一张完整的图片，因此在编码的时候B帧要等到P帧才能发送出去。

比如：收到的I、B、P帧的序列为（后面数值表示收到时间，单位 ms）：I0 B40 B80 B120 P160，P帧是160ms的时候才收到，这样B40帧从收到到发出就会延迟 160-40=120ms。

三、NALU介绍

【NALU示意图8】

SPS：序列参数集，SPS中保存了一组编码视频序列(Coded video sequence)的全局参数。
PPS：图像参数集，对应的是一个序列中某一幅图像或者某一幅图像的参数。
I帧：帧内编码帧，可独立解码生成完整的图片。
P帧: 前向预测编码帧，需要参考其前面的一个I 或者B 来生成一张完整的图片。
B帧: 双向预测内插编码帧，则要参考其前面个I或者P帧及其后面的一个P帧来生成一张完整的图片。

注意：
1）从上图我们可以知道，一张图片可以有多个NALU。
2）对解码器来说，需要先收到SPS和PPS进行初始化，否则解码器无法解出正常的帧数据。
3）发I帧之前，至少要发送一次SPS和PPS，因此如果在实际应用中遇到H264无法解码的时候，检查SPS和PPS是否有接收到并正常初始化。

NALU结构
H264原始码流（裸流）是由一个接一个NALU组成，功能分为两层：VCL（视频编码层）和NAL（网络提取层）：

VCL：包括核心压缩引擎和块，宏块和片的语法级别定义，设计目标是尽可能地独立于网络进行高效的编码。
NAL：负责将VCL产生的比特字符串适配到各种各样的网络和多元环境，覆盖所有片级以上的语法级别。

在VCL进行数据传输或存储之前，这些编码的VCL数据，被映射或封装进NAL单元。
NALU=一组对应视频编码的NALU头部信息+一个原始字节序列负荷（RBSP，RawByte Sequence Payload）

【NALU结构单元的主体结构图9】

一个原始的H264 NALU单元通常由 [StartCode] [NALU Header] [NALU Payload] 三部分组成，其中Start Code用于表示这是一个NALU单元的开始，必须是“00 00 00 01” 或 “00 00 01”，除此之外基本相当于一个NAL header+RBSP。

对于FFmpeg解复用，MP4，flv等文件读取出来的packet不带Start code，TS文件读取出来的packet带StartCode，因此在对MP4、flv文件解码封装的的时候，需要添加上Startcode，否则会出现生成文件损坏导致无法播放问题。

NALU解析
每个NAL单元是一个一定语法元素的可变长字节字符串，包括包含一个字节的头信息（用来表示数据类型），以及若干整数字节的负荷数据。

NALU头信息（占一个字节大小）：
【NALU头信息图10】

字节位参数说明：

T：负荷数据类型，占 5bit。
nal_unit_type：这个NALU单元的类型，1～12由H.264使用，24～31由H.264以外的应用使用。
R：指示位，占2bit。
nal_ref_idc.：取00~11，似乎指示这个NALU的重要性，如00的NALU解码器可以丢弃它而不影响图像的回放，0～3，取值越大，表示当前NAL越重要，需要优先受到保护。如果当前NAL是属于参考帧的片，或是序列参数集，或是图像参数集这些重要的单位时，本句法元素必需大于0。
F：禁止位，占1bit。
forbidden_zero_bit：在 H.264 规范中规定了这⼀位必须为 0。

H.264标准指出，当数据流是储存在介质上时，在每个NALU 前添加起始码：0x000001 或 0x00000001，用来指示一个NALU 的起始和终止位置：

在码流中检测起始码，作为一个NALU的起始标识，当检测到下一个起始码时，当前NALU结束。
3字节的0x000001只有一种场合下使用，就是一个完整的帧被编为多个slice（片）的时候，包含这些slice的NALU 使用3字节起始码。其余场合都是4字节0x00000001的。

例子：
０x00 00 00 01 67 …
０x00 00 00 01 68 …
０x00 00 00 01 65 …

0x67：二进制 0110 0111 ，nal_unit_type：0 0111=7（十进制）

【nal_unit_type数值对应表1】

四、H264 annexb模式

H264有两种封装模式：annexb模式和mp4模式。

annexb模式，属于传统模式，有startcode；SPS和PPS是在ES中。
mp4模式：mp4 mkv都是mp4模式，没有startcode，SPS和PPS以及其它信息被封装在container中，每一个frame前面4个字节是这个frame的长度。

很多解码器只支持annexb这种模式，因此需要将mp4做转换：在ffmpeg中用h264_mp4toannexb_filter可以做转换。
转换源码：

const AVBitStreamFilter *bsfilter = av_bsf_get_by_name("h264_mp4toannexb");
AVBSFContext *bsf_ctx = NULL;
// 2 初始化过滤器上下文
av_bsf_alloc(bsfilter, &bsf_ctx); //AVBSFContext;
// 3 添加解码器属性
avcodec_parameters_copy(bsf_ctx->par_in, ifmt_ctx->streams[videoindex]->codecpar);
av_bsf_init(bsf_ctx);

拦截器和过滤器的区别 MaxBruce 工作专栏拦截器过滤器
拦截器和过滤器的区别①拦截器是基于java的反射机制的，而过滤器是基于函数回调。②拦截器不依赖与servlet容器，过滤器依赖与servlet容器。③拦截器只能对action请求起作用，而过滤器则可以对几乎所有的请求起作用。④拦截器可以访问action上下文、值栈里的对象，而过滤器不能访问。⑤在action的生命周期中，拦截器可以多次被调用，而过滤器只能在容器初始化时被调用一次。⑥拦截器可以获取I
《UE5_C++多人TPS完整教程》学习笔记40 ——《P41 装备（武器）姿势（Equipped Pose）》 SHOTJEE #ue5 游戏 c++
本文为B站系列教学视频《UE5_C++多人TPS完整教程》——《P41装备（武器）姿势（EquippedPose）》的学习笔记，该系列教学视频为计算机工程师、程序员、游戏开发者、作家（Engineer,Programmer,GameDeveloper,Author）StephenUlibarri发布在Udemy上的课程《UnrealEngine5C++MultiplayerShooter》的中文字
Spring Framework 5.0新增的WebClient svygh123 编程 spring Java学习 spring log4j java WebClient
SpringFramework5.0引入了WebClient，这是一个新的非阻塞、响应式Web客户端API，旨在为构建响应式微服务提供更好的支持。WebClient是基于ProjectReactor的响应式流API构建的，它可以高效地处理大量的并发请求，非常适合现代微服务架构。WebClient的主要特性响应式：WebClient基于非阻塞I/O，可以处理大量的并发请求而不会阻塞线程。类型安全：A
【模型部署】如何在Linux中通过脚本文件部署模型满怀1015 人工智能 linux 网络人工只能模型部署
在Linux中，你可以将部署命令保存为可执行脚本文件，并通过终端直接调用。以下是几种常见且实用的方法：方法1：Shell脚本（推荐）步骤创建一个.sh文件（例如start_vllm.sh）：#!/bin/bashCUDA_VISIBLE_DEVICES=7\python-mvllm.entrypoints.openai.api_server\--served-model-nameQwen2-7B-
Golang基础笔记八之函数后端go函数闭包
本文首发于公众号：Hunter后端原文链接：Golang基础笔记八之函数本篇笔记介绍Golang里函数相关的内容，以下是本篇笔记目录：函数的定义语法函数返回值可变参数函数匿名函数闭包1、函数的定义语法函数的定义格式如下：func函数名(参数列表)(返回值列表){函数体}比如下面是一个两数相加返回其和的函数：funcadd(a,bint)int{ returna+b}调用的话，直接传参调用即可：s
IT 行业深度洞察：从技术革命到产业重构的全景图谱 XQR.小白重构
摘要本文系统梳理IT行业的发展脉络，深入剖析云计算、人工智能、大数据、物联网等核心技术的演进逻辑与协同效应，揭示IT产业在数字化转型浪潮中的生态重构与价值创造。通过典型案例分析与数据支撑，探讨行业面临的技术挑战、伦理困境与全球化竞争格局，展望IT技术如何持续驱动社会变革与产业升级。全文结合2025年最新技术动态与市场趋势，为从业者、投资者与研究者提供兼具理论深度与实践指导的行业参考。目录摘要一、I
baigeiRSA--攻防世界 KD杜小帅密码学-RSA系列密码学 python 网络安全
下载看到附件：importlibnumfromCrypto.Utilimportnumberfromsecretimportflagsize=128e=65537p=number.getPrime(size)q=number.getPrime(size)n=p*qm=libnum.s2n(flag)c=pow(m,e,n)print('n=%d'%n)print('c=%d'%c)n=885030
Redis为什么是单线程 hqxstudying java redis
Redis被设计为单线程模型，这一决策并非偶然，而是基于其核心场景和技术特性的深度优化结果。以下从多个角度详细解释其原因：一、Redis的核心优势与单线程的契合性Redis作为内存数据库，其核心优势是超高的读写性能（每秒可达数万至数十万操作）。而内存操作本身的速度极快（微秒级），此时性能瓶颈往往不在于CPU，而在于网络I/O和内存访问效率。单线程模型恰好能避免多线程带来的额外开销，从而最大化内存操
Arduino DS18B20编译错误解决方法木子欢儿
DS18B20.cpp:Inmemberfunction'uint8_tDS18B20::getResolution()':DS18B20.cpp:101:1:error:controlreachesendofnon-voidfunction[-Werror=return-type]101|}|^cc1plus.exe:somewarningsbeingtreatedaserrorsexitsta
Caddy非80443端口反向代理+FRP内网穿透-一个服务器安装了frps，占用了80、443端口，怎么继续使用80、443端口建站呢？木子欢儿服务器数据库 linux 运维
问题：一个服务器安装了frps，占用了80、443端口，怎么继续使用80、443端口建站呢？一个解决办法安装Caddy-Dockerdockerrun-d--namecaddy-p8080:80-p8443:443\-v/etc/caddy/Caddyfile:/etc/caddy/Caddyfile\-v/var/www:/usr/share/caddy\caddy配置FRPserverAddr
《捞女游戏/Lao Nu You Xi》 Build.18925720简体中文版下载解压就能运行 2501_92499299 游戏
最近这个国产游戏炸了——《捞女游戏》！上线不到24小时就冲上销量榜前五，好评率96%，评论区直接炸锅【PC】《捞女游戏/LaoNuYouXi》Build.18925720简体中文版下载链接「捞女游戏」，复制整段内容，打开最新版「夸克APP」即可获取。畅享原画，免费5倍速播放，支持AI字幕和投屏，更有网盘TV版。链接：https://pan.quark.cn/s/d3b4296b548d最新版，解压
Codeforces Round 1034 (Div. 3) G解题思路拉长时间线数据结构与算法算法数据结构 c++
链接Problem-G-Codeforces题目大意给定n,m,q分别为数组大小，数组的每个数非负且小于m，要进行q次操作操作分为两种：1.令a[i]=x(永久性)2.输入一个k，对于每个a[i]都可进行任意次操作a[i]=(a[i]+k)%m，对数组进行操作，判断能否增厚变成一个非严格递增数组题目思路对样例进行分析可以发现对于每个a[i]可以分为g=gcd（m，k）类，可以为每一类标号，号码为a
Swift 小技巧：用单边区间优雅处理模糊范围狼_夏天 Swift Tips swift 开发语言 ios
进入正题之前先科普一下Swift区间的知识。Swift中的区间有两种类型：闭区间和半开区间。闭区间：用a...b表示，包含a和b。半开区间：用a..=0&&number=2.0&&score=3.5&&score<=5.0{print("好评")}else{print("评分超出范围")}3.用单边区间优雅处理letscore=4.2guard(0.0...5.0).contains(score)
时空屏障崩塌：14:28深圳AI-BioFab平行宇宙保卫战全纪实 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《时空屏障崩塌：14:28深圳AI-BioFab平行宇宙保卫战全纪实》副标题：抗癌疫苗冷链门关闭前3秒遭量子生物武器袭击，中国科学家启动长城时空盾改写人类文明存续方程2025年7月2日14:28:57光明科学城虫洞警报第184支疫苗即将注入液氮罐的刹那，B3层量子钟突现重影！14:28/15:4
生命制造的读秒革命：全球首个AI-BioFab工厂72小时全息记录 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《生命制造的读秒革命：全球首个AI-BioFab工厂72小时全息记录》副标题：2025年7月2日14：04深圳现场——癌症疫苗定制最后3分钟如何改写万亿生物经济规则光明科学城2025年7月2日电（记者直击）负三层B区微流控平台红光闪烁，液态机械臂正将第9,217管CRISPR编辑液注入芯片。量子
合成生物学奇点：AI驱动CRISPR超进化工厂2025投产纪实 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《合成生物学奇点：AI驱动CRISPR超进化工厂2025投产纪实》副标题：全球首座AI-BioFab落地深圳，蛋白质设计周期从3年压缩至11天，生物制造成本暴跌90%一、生物制造范式的历史性颠覆▶︎传统生物工程的三大世纪困局graphTDA[缓慢的试错循环]-->B[单基因改造耗时≥6个月]C[
千亿参数大模型轻量化实战：手机端LLM推理加速300%方案
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《千亿参数大模型轻量化实战：手机端LLM推理加速300%方案》副标题：2025实测骁龙8Gen4+FP4稀疏量化技术，70B模型推理延迟低至127ms，重构移动端AI天花板封面图：[高通骁龙8Gen4芯片显微照片与Llama3-70B手机端运行界面对比图，右上角标注「实测延迟：127ms/tok
【硬核拆解】英伟达Blackwell芯片架构如何重构AI算力边界？ HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站一、Blackwell诞生的算力危机（2025现状）graphTDA[2025年AI算力需求]-->B[千亿参数模型训练能耗>20GWh]A-->C[10万亿参数模型涌现]A-->D[传统架构内存墙：数据搬运耗能占68%]行业拐点事件：2025年3月：OpenAI宣布训练125万亿参数MoE模型
wpf打包一个独立的库 null_null999 windows
https://www.google.com/search?q=wpf+%E6%89%93%E5%8C%85%E4%B8%80%E4%B8%AA%E7%8B%AC%E7%AB%8B%E5%BA%93&newwindow=1&sca_esv=32f9ae821a1b1a5d&sxsrf=AE3TifNo_KqCzke3ZkSz6zdxZGXDQv6lWA%3A1751356705342&ei=IZV
长尾形分布论文速览【80-119】木木阳 Long-tailed 人工智能
为便于理解和应用，以下将30篇关于长尾分布的研究文献按主题进行分类整理。每一大类包含相应的工作，帮助我们从整体上把握各方向的研究进展。1.长尾半监督学习与伪标签优化Paper90:Uncertainty-awareSamplingforLong-tailedSemi-supervisedLearning提出了一种动态阈值选择方法（UDTS），能有效改善尾部分类性能，适用于不平衡类别的半监督学习。P
H264码流介绍及 FFmpeg解封装得到H264码流方法冰冰的coco 音视频 ffmpeg
参考文章音视频H264编解码协议-知乎视频H264编码详解（上）-知乎H.264媒体流AnnexB和AVCC格式分析-CSDNH264之NALU解析-知乎H264帧,SPS,PPS概念-知乎H.264流媒体协议格式中的AnnexB格式和AVCC格式深度解析-CSDNH264简介H.264从1999年开始，到2003年形成草案，最后在2007年定稿有待核实。在ITU的标准⾥称为H.264，在MPEG
QT中翻译文件生成步骤小小码农Come on Qt qt
1、配置工具环境变量设置path：D:\Qt\Qt5.15\5.15.2\msvc2019_64\binD:\Qt\Qt5.15\5.15.2\msvc2019\bin主要使用工具：lupdate、linguist、lrelease都在如上路径的bin目录下2、提取翻译字符串(lupdate)用来生成/更新.ts翻译文件进入目录D:\Code\ds-cmifinaldetect\plugins\p
男模Python 函数命名以及鸡兔同笼函数 pythonyuanke python 开发语言
那么问你一个问题，现在是不是所有的函数都是def开头的？如果def就是函数的名字，那么python怎么区分该调用哪一个函数？名字都一样啊那也就是def后面的是函数名字?def后面，括号前面参数列表，这里的参数指的是形式参数，就是括号里面的部分这里只有一个形式参数，所以没有逗号，如果有多个形式参数，那么用逗号分隔参考我们在world.py里面写的几个函数，比如defadd(a,b)你说一下它的名字和
从0开始的Linux基础定偶 linux 服务器数据库
一、Linux文件系统核心特性层级式倒置树结构，以根目录/为起点统一资源管理方式（文件=目录=设备=socket等）关键目录说明/bin系统基础命令/boot引导程序/dev设备文件/etc配置文件/home用户家目录/lib系统库文件/proc运行时信息/usr应用安装目录/var动态数据/mnt临时挂载点/media外设挂载点/sbin管理员命令二、目录操作指令核心指令集指令功能常用选项示例p
数据结构：递归：汉诺塔问题（Tower of Hanoi） 95号闪电麦坤数据结构数据结构
目录问题描述第一性原理分析代码实现第一步：明确函数要干什么第二步：写好递归的“结束条件”第三步：写递归步骤递归调用树问题描述有三个柱子（A,B,C），上面有n个大小不等的圆盘，最开始所有圆盘按从大到小顺序堆在柱子A上。目标：将所有圆盘移动到柱子C，移动时要满足：一次只能移动一个盘子；任何时刻小盘子不能压在大盘子上。❓核心问题：如何将n个盘子从A移动到C，同时只用B做辅助，且不违反约束？第一性原理分
【分析学】从有限开覆盖定理出发 -- 实数系完备性 BlackPercy 分析学数学高等数学
目录有限开覆盖定理实数系完备性定理确界定理单调有界定理闭区间套定理聚点定理柯西收敛定理有限开覆盖定理开覆盖定义：设{Ui}i∈I\{U_i\}_{i\inI}{Ui}i∈I是一个开覆盖，即[a,b]⊆⋃i∈IUi[a,b]\subseteq\bigcup_{i\inI}U_i[a,b]⊆⋃i∈IUi,称⋃i∈IUi\bigcup_{i\inI}U_i⋃i∈IUi为闭区间[a,b][a,b][a,b
提示技术系列——主动提示 AIGC包拥它提示技术人工智能 prompt python langchain
什么是提示技术？提示技术是实现提示工程目标的具体技术手段，是提示工程中的“工具库”。什么又是提示工程？提示工程是指通过设计、优化和迭代输入到大语言模型（LLM）的提示（Prompt），系统性提升模型输出质量（如相关性、准确性、可控性）的实践领域。它是一个覆盖全流程的方法论，包括：明确目标任务（如生成教学内容、问答、翻译）；设计提示结构（如指令、上下文、示例）；选择模型与参数（如温度、top_p）；
SmartDV推出先进的H.264和H.265视频编码器和解码器IP 电子科技圈 h.264 h.265 音视频
向全球市场提供灵活、高度可配置、可定制的半导体设计知识产权（IP）和验证IP（VIP）的开发商SmartDV™Technologies近日宣布：公司现已提供即刻可用的H.264和H.265视频编码器和解码器IP解决方案。针对每一种技术，SmartDV都提供了所有三种配置的IP产品，包括H.264的基本配置（Baseline）、主流配置（Main）和高性能配置（High）版本，以及H.265的主流（
输入hadoop version时，解决Cannot execute /home/hadoop/libexec/hadoop-config.sh.的方法有奇妙能力吗 ubuntu hadoop hdfs linux 大数据分布式
在ubuntu用hadoopversion遇到了一个错误：Cannotexecute/home/hadoop/hadoop2.8/libexec/hadoop-config.sh.解决方法：在/etc/profile中找到了这个HADOOP_HOME全局变量，将其删除运行source/etc/profile输入vim.bashrc命令，在最后一行输入unsetHADOOP_HOMEsource.b
将h.264视频流封装成flv格式文件（二.开始动手） darkdragonking flv 264 flv h.264 rtmp c++windows
前面写了flv文件的解析，有h264裸流的话就开始封装吧。网上大多数都是用ffmeg库来做这个工作的，哎，学习资料少学不会，还是自己动手吧。封装前要先了解下h.264格式，只需要知道一点点就可以了，我看了h.264官方文档，我靠，3百多页，还全是中文，什么，是中文？既然是中文的我就勉强看下吧，我靠，看起来还很复杂的，果断不看了，不需要，也没时间，我又不做解码，这东西具体步骤资料又少，基本都是那一两
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round