郭老二

【H.265】H.265(HEVC)编码过程和名词解释

一、H.265(HEVC)编码过程

和H.264一样，H.265编码由帧内预测、帧间预测、量化、线性变换等步骤。过程大致如下；

1、分块

一帧画面首先被切分成多个互不重叠的块状区域，称为编码单元（H.264称为宏块），分别传输给编码器。

2、帧内预测

图像序列的第一个画面（以及每一个可被拖放的帧）只使用帧内预测编码（只使用同一帧中其它区域进行预测，不依赖其他帧）。

3、帧间预测

其它帧中的块大多数使用帧间预测编码，过程包括选择预测模式、参考图像的运动数据和生成每个块的运动矢量（MV）。编码器通过旁路传输预测模式信息和运动矢量（MV），计算运动补偿，进而重建帧间预测数据。

4、压缩输出

帧内或帧间的预测结果和实际画面之间的残差数据经过空间-线性变换、采样、量化、熵编码后和预测信息一起输出。

HEVC融入了许多关键技术以提高性能，例如基于四叉树划分编码单元，预测方向更精细的帧内预测技术，采用运动合并技术和先进运动矢量预测模式的帧间预测技术，高精度运动补偿技术，用于改善重构图像质量的去方块滤波和像素自适应补偿技术等。

二、名词解释

1、编码树单元（CTU）和编码树块（CTB）：

H.264标准中的核心编码层是宏块，包含一个16×16的亮度块采样，对于一般的yuv420而言，会伴随两个8×8的色度块采样。类似结构在HEVC中被称作CTU，但它的大小是可以由编码器设定的，并且可以超越16×16。CTU由一个亮度CTB、几个色度CTB和一些关联的语法元素组成。亮度CTB的可选大小有16×16、32×32、64×64，更大的块会有更好的压缩率。HEVC还支持使用树结构和四叉树将CTB切分为更小的块。

2、编码单元（CU）和编码块（CB）：

CTU中的四叉树确定了亮度和色度CB的大小和位置，四叉树的根节点与CTU关联。亮度CB最大可以支持到亮度CTB的大小。把CTU切成亮度和色度CB的过程是一体的。一个亮度CB、两个色度CB和关联的语法元素构成一个CU。一个CTB可以只包含一个CU，也可以包含好几个CU，每一个CU都有一个分区关联的预测单元（PU）和一个变换树单元（TU）。

3、预测单元（PU）和预测块（PB）：

PU是预测的基本单元，规定了编码单元的所有预测模式，其最大单元与当前的CU大小相同。HEVC中对于skip模式，帧内模式和帧间模式，PU分割大小是不同的。
某帧图像采用帧内预测还是帧间预测是在CU层面决策的。PU分区结构的根也在CU层。根据预测决策的结果，亮度和色度CB进一步拆分为亮度和色度PB。HEVC支持从4×4到64×64大小的PB。

如上图所示，对于skip模式，PU的大小是2N2N。而帧内预测模式PU的大小可以为2N2N和NN，其中，当且仅当CU的大小为88时，帧内PU才可以取N*N。

帧间预测PU分割模式共有8种，主要分为两类：对称分割和非对称分割。其中，2N2N，2NN，N2N和NN为4种对称模式，2NnU，2NnD，nL2N和nR2N为4种非对称模式，U、D、L和R分别表示上下左右，且非对称划分形式只用于大小为3232和1616的CU中，对称划分形式的NN只用于大小为88的CU中。例如，2NnU和2NnD分别以上下1:3和3:1划分，nL2N和nR2N分别以左右1:3和3:1划分。

4、变换单元（TU）和变换块（TB）：

TU是变换和量化的基本单元，变换树是由变换单元组成的四叉树。从CU大小开始，变换单元以迭代方式四等分，是否划分成四个子块根据语法元素split_transform_flag标定。根据迭代划分的深度不同，其大小可以是3232，1616，88和44中的一个。在序列参数集中可以设定变换单元的最大/最小值。
预测残差使用块变换编码。TU树结构的根在CU层面。亮度CB的残差可能和亮度TB完全一样，或者进一步切分为更小的亮度TB。色度TB也是一样的。4×4、8×8、16×16、32×32的TB都各自定义了近似DCT变换的基本整型方法。对于4×4的亮度帧内预测的残差变换，还有一个DCT变换表衍生的整型变换供选择。

如上图所示，TU的最大划分深度为3，其大小可以大于PU但不能超过CU。当PU为正方形时，TU采用正方形变换，且当PU为长方形时，TU采用长方形变换，其大小可以是328，832，164和416中的一个。

5、运动矢量：

标准中采用了基于邻近PB和参考帧数据来预测方向的高级运动矢量预测（AMVP）。MV编码还可以使用一种允许继承邻近PB的MV的合并模式。此外，HEVC中还包含有一个增强版的H.264/AVC直接运动预测。

6、运动补偿：

MV使用四分之一采样预测。分级采样的插值使用7阶或8阶的滤波器（H.264/AVC中插值使用二分之一采样的6阶滤波器和四分之一采样的线性插值）。和H.264/AVC一样，HEVC也使用多参考帧。每一个PB可以根据单向或者双向预测传送一个或者两个运动矢量。同H.264/AVC一样，预测信号上可以附加采样和偏移以声明预测权重。

7、帧内预测：

不使用帧间预测时，就只能基于邻近的块来做空间上的帧内预测。HEVC的帧内预测支持33个方向模式（H.264/AVC中是8个）。HEVC还设计了增强的二维变换和可选的DC预测模式。需要由预先解码出的邻近PB计算得出最优的帧内预测模式。

如上图所示，HEVC采用35种帧内预测模式，其中包括DC模式、33种角度模式和Planar模式。HEVC对帧内预测模式的选择过程更细致，不同大小的PU对应不同的预测模式。这使得帧内预测更加精确，且能减少空间冗余。帧内预测具体过程如下：

1> 首先遍历所有的预测模式，计算各个模式下预测的SAD（定义？）并由小到大排序。
2> SAD最小的一组预测模式作为该预测模式的子集。
3> 确定预测子集后，判断该PU左和上已经编码像素块的方向是否在子集内，若不在则将该模式加入子集。
4> 最后对子集中的所有预测模式进行率失真优化（RDO）。

8、量化控制：

和H.264/AVC一样，HEVC也使用URQ（一致量化还原）。由于HEVC引入了更多的变换块，所以量化参数矩阵也随之增多。

9、熵编码：

HEVC使用CABAC来做熵编码，去掉了基于上下文的自适应可变长编码（CAVLC）。和H.264/AVC中的CABAC相比，得益于新引入的并行处理架构，速度、压缩率和内存占用等方面均得到了大幅改善。

如上图所示，HEVC的CABAC熵编码流程与H.264基本类似。主要包括：二进制化，文本模型选择，概率估计和二进制算术编码，但HEVC在概率估计精确度和自适应速度加快等方面进行了改进。

10、内置环路滤波器：

和H.264/AVC一样，HEVC的帧间预测循环中也内置去除块效应的滤波器。相比H.264/AVC，HEVC的设计更重视简化决策和滤波器的流程，并且为并行处理而优化。

11、采样自适应偏移（SAO）：

帧间预测循环的去块效应滤波器之后引入了一个非线性的幅值映射的流程。主要目的是通过编码器端的直方图分析产出一些参数以增强解码器端的幅值信号还原。
SAO是以LCU为单元，对每个LCU经过去方块滤波后的重建像素进行自适应补偿，从而减小重建图像的失真。SAO分为两类：边带补偿（BO）和边界补偿（EO）。

如上图所示，BO首先将亮度等级（0-255）分成32个条带，然后统计一个LCU内的像素分别落入每个条带的数目。对32个条带，每四个为一组，其左边界标记为起始位置。计算出连续4个条带应该补偿的值，对LCU中的像素进行补偿，最后进行RDO，选择RDO最小的4连续条带进行补偿。

如上图所示，EO主要是对图像的轮廓进行补偿，其补偿方向主要分为四类，其中每一类又可以分成图17中的四种情况。统计出每种情况下的补偿值，按照像素所属类型以LCU为单位基于像素进行补偿。

12、参数集结构：

能被多个区块共享的解码信息包含在参数集中。这个结构负责保证把必不可少的解码信息传输到解码端。它由H.264/AVC中的图像序列参数集扩展而来，在HEVC中被称为VPS。

13、NAL语法单元：

每个语法结构都会被放进一个叫做NAL（网络抽象层，一般一帧图像为一个NAL）中的逻辑上的数据包中。这个包的包头中有两个字节表明了它装载的是什么用途的数据（用于判断是否需要重传）。

14、片：

可以不依赖同帧中的其它数据独立进行预测、残差重建、熵编码的部分被称为“片”。片可以是一个帧也可以只是一个帧中的一部分。片的主要作用之一是在丢包时同步用。在包式传输中一个片可以包含的数据量是被严格限制的，在这个限制内调整片内包含的CTU数量可以有效地最小化包传输产生的额外开销。

15、增强信息（SEI）和视频可用性信息（VUI）：

SEI和VUI用于存储视频元数据，比如说时间戳、使用的色彩空间、3D填充的方式等等。

16、并行块（Tile）

HEVC定义了一个可选的方式，可以把一帧图像分割成并行块。并行块的主要目的是在增强并行处理的能力同时又不引入新的错误扩散。并行块是一些在一帧图像内使用一些共有的信息编码而成，但可以独立解码的区域。一般的做法是将图像切割成包含大体相同数量CTU的并行块。并行块的引入使得简单粗粒度的并行化处理成为可能，线程之间将不再需要考虑复杂的同步和锁。

17、错峰并行处理（WPP）

主要用于熵编码。当WPP开启时，片先被分成数个CTU行。第一行正常处理，第二行在第一行处理完2个CTU后开始处理，第三行在第二行处理完2个CTU后开始处理。每一行相对前一行都有2个CTU的延迟。WPP提供了一种在适当的层级上（比如说片）并行化的方式。WPP可以提供比并行块更好的压缩效率，而且不会引入块效应。

18、依赖更小片（Dependent slice segments）

这个设计允许数据与错峰并行处理或者并行块关联起来，在碎片化的包传输网络中，相对于一次编码一整片而言，这种做法可以更快进入解码流程，从而降低延迟。与错峰并行处理一起使用用时，它也需要类似错峰的机制。这项设计尤为适合低延迟要求下的并行处理。

19、帧间预测

HEVC帧间预测提出了运动合并技术、先进运动矢量预测等新工具来提高编码效率。帧间预测模式分为skip模式、运动合并技术（merge模式）、先进运动矢量预测技术（AMVP）。其中，skip模式是merge中的一种特殊模式，其区别在于传输时不需要传残差信息和MV信息。下面对帧间预测模式分别进行介绍。

merge模式

merge模式采用相邻PU块的运动信息估计当前PU块的运动信息，编码器从时空域相邻PU块构成的参考列表中选择出最优的运动信息，并将其传到解码端。

AMVP技术

AMVP技术和merge模式预测过程部分相似，也是利用空域和时域相邻块的运动信息预测当前PU块的运动信息。AMVP技术利用周围信息估计当前编码块运动信息的过程和merge模式相同，包括候选列表的构建过程和最优运动矢量的选择过程，只是候选数目不同，

如上图所示，AMVP候选列表构建流程中空域的5个位置和merge模式下空域的5个位置完全相同，但最终选择的是两个最优位置，其中一个来自上边块，另一个来自左边块。而时域运动矢量的选取是利用两个不同预测方向的时域相邻预测单元的运动矢量作为测量值，并选取最优的一个作为时域运动矢量。当时域和空域候选子集选取完成后，首先去除重复的运动矢量，其次检查运动矢量的总数是否为2，若大于2则保留前两个即去除索引值大于1的，若小于2则添加零运动矢量。

20、去方块滤波

HEVC的去方块滤波与H.264类似，但由于HEVC中TU的大小可以大于PU，因此不能像H.264选择块边界，而是从TU和PU中选择较小的边界进行滤波。而且为了降低负责读，其不对4*4块边界进行滤波。

如上图所示，边界滤波分为三种情况：不进行滤波，弱滤波和强滤波。且滤波类型由边界强度BS，阈值β和tc决定。

参考博客：
HEVC标准概览-很概括很详细
HEVC视频编码技术

基于 LibreTV 代码库开发安卓应用的全面技术策略与实施指南
1.LibreTVWeb平台解构分析为了基于现有LibreTV项目成功构建一个原生安卓应用，首先必须对其现有Web平台的架构、核心逻辑及数据流进行一次彻底的技术解构。尽管自动化工具未能成功解析其部分源代码，但通过对其文件结构、命名规范以及行业内成熟的Web应用模式进行专家级推断分析，我们仍能精确地描绘出其内部工作机制。1.1.架构概览与技术栈推断LireTV是一个轻量级的视频聚合平台，其架构采用了
Android实现低延时RTSP实时播放的指南一曲歌长安
本文还有配套的精品资源，点击获取简介：在Android平台上实现低延迟的RTSP实时视频播放是一个技术挑战。本简介描述了如何使用ijkplayer这一第三方库来集成RTSP流媒体播放功能，降低延迟，并通过一系列关键步骤和优化策略来确保在不同网络环境下保持流畅的播放体验。1.RTSP协议简介与重要性实时流协议（RTSP）是一种网络控制协议，旨在控制流媒体服务器之间的多媒体会话。它允许客户端发出请求来
基于uniapp小程序的诗词学习系统附带文章源码部署视频讲解等
文章目录前言详细视频演示具体实现截图核心技术介绍小程序框架Uniapp前端框架Vue持久层框架MyBaits为什么选择我代码参考数据库参考测试用例参考源码获取前言博主介绍：✌CSDN特邀作者、资深全栈开发程序员，曾在互联网大厂担任高级职位、码云/掘金/华为云/阿里云/InfoQ/StackOverflow/github等平台优质作者、专注于Java、小程序、前端、python等技术领域毕业项目实战
二、OpenCV的第一个程序
文章目录一、第一个程序：显示图片1.1cv::imread1.2cv::namedWindow1.3cv::imshow二、第二个程序：视频2.1cv::VideoCapture三、加入了滑动条的基本浏览窗口一、第一个程序：显示图片示例：一个简单的加载并显示图像的OpenCV程序#include#include"./opencv2/opencv.hpp"intmain(){cv::Matimage
NV133NV137美光固态闪存NV147NV148 18922804861 数据库
NV133NV137美光固态闪存NV147NV148美光固态闪存技术矩阵深度解析：NV133至NV148的全面较量一、性能参数：数据高速公路的“车速”比拼读写速度：从“乡间小道”到“高铁动脉”美光NV系列固态闪存的核心竞争力在于其读写速度的跃升。以NV158为例，其顺序读取速度可达数千MB/s，加载大型文件（如4K视频、3D建模文件）时，体验如同“在数据高速路上一路绿灯飞驰”。相比之下，传统机械硬
学生选课系统(11457) codercode2022 visual studio code spring boot 开发语言 matlab java laravel objective-c
有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码+SQL脚本）配套文档（LW+PPT+开题报告）远程调试控屏包运行三、技术介绍Java语言SSM框架SpringBoot框架Vue框架JSP页面Mysql数据库IDEA/Eclipse开发有需要的同学，源代码和配套文档领取，加文章最下方的名片哦!
基于Elasticsearch的短视频平台个性化推荐系统设计与实现亲爱的非洲野猪 elasticsearch 音视频推荐算法
在当今内容爆炸的时代，个性化推荐系统已成为短视频平台的核心竞争力之一。本文将详细介绍如何利用Elasticsearch（ES）构建一个高效、可扩展的短视频个性化推荐系统。一、系统架构概述我们的推荐系统将采用混合推荐策略，结合协同过滤、内容相似度和热度推荐等多种方法。Elasticsearch作为核心搜索引擎和数据存储，将承担以下职责：用户画像存储与查询视频内容索引与检索实时行为日志分析推荐结果计算
GitHub每周最火火火项目（6.30-7.6） FutureUniant Github周推 github microsoft 人工智能 ai 计算机视觉
1.NanniCoder/MediaCrawler项目名称：MediaCrawler项目介绍：该项目采用Python语言开发，专注于多平台媒体内容的爬取工作。从用途来看，它能够精准抓取小红书笔记、抖音视频、快手视频、B站视频、微博帖子、百度贴吧帖子及评论、知乎问答文章等各类媒体平台的内容。在使用场景方面，对于新媒体运营者而言，可借助它批量采集行业内多平台的热门内容、竞品动态，为自身内容创作、运营策
FFmpeg、WebAssembly 和 WebGL 在 Web 端的结合应用醉方休 ffmpeg wasm webgl
FFmpeg、WebAssembly和WebGL在Web端的结合应用这三个技术组合可以创建强大的浏览器端多媒体处理解决方案，下面我将详细介绍它们如何协同工作。1.FFmpeg与WebAssemblyFFmpeg.wasm项目概念：将FFmpeg编译为WebAssembly在浏览器中运行特点：完全在浏览器中执行视频/音频处理无需服务器转码保护用户隐私（数据不离客户端）基本使用示例import{cre
FFmpeg 详解醉方休 ffmpeg wasm webgl
FFmpeg详解FFmpeg是一个强大的跨平台多媒体处理工具集，可以用于录制、转换、编辑和流式传输音频和视频内容。以下是FFmpeg的全面解析：一、FFmpeg核心组件ffmpeg-主要的多媒体转换工具ffplay-简单的媒体播放器ffprobe-媒体文件分析工具libavcodec-编解码器库libavformat-多媒体容器格式库libavutil-实用工具库libswscale-图像缩放和色
LaTex 写演示文稿 - Beamer 入门之彩色文本框 joefsong LaTeX 学习笔记 latex
Beamer入门之彩色文本框创建彩色文本框tcolorbox宏包使用技巧及文本框简元素介绍更改彩色文本框外观样式预定义样式标题字体字号标题颜色位置字体位置标题框位置正文边框边框形状方法一：边框变直角方法二：标题框下移边框颜色边框外观附录代码及拓展：本节内容给大家分享如何绘制彩色表格，大致的效果如下：该节的内容主要包括（链接可跳至B站视频链接）：创建简单彩色文本框更改彩色文本框样式最终效果如下：创建
LaTex 写演示文稿 - Beamer 入门之彩色表格 joefsong LaTeX 学习笔记 latex
Beamer入门之彩色表格背景颜色单元格插入斜线更改行、列及单元格颜色更改列的背景颜色更改行的背景颜色定义单元格背景颜色实现合并单元格解决单元格合并后字体显示不全问题解决列表横线覆盖字体问题定义表格字体颜色更改表格线形和颜色本节内容给大家分享如何绘制彩色表格，大致的效果如下：该节的内容主要包括（链接可跳至B站视频链接）：更改表格背景颜色，包括行、列和单元格修改合并单元格后的单元格的颜色表格内字体及
modbus 学习笔记手lu代码哥 stm32学习 modbus 嵌入式 stm32
modbus学习笔记学习资料链接modbus协议讲解及stm32实现视频讲解链接SSCOM串口助手下载链接RS485通信及MODBUS通信协议MCU作主机基于MODBUS协议读取温湿度传感器数据并显示OLED知识点记录一个寄存器两个字节0x0000~0x65535通信地址（ID号取值范围）：1~247指定地址0的指令是广播指令，所有收到指令的从机设备都会运行，不过不回应指令当我们接受当前帧的数据包
Badoo×亚矩云手机：社交约会革命的“云端心跳加速剂“ 云云321 智能手机网络游戏大数据矩阵
——当全球最大陌生人社交平台遇上云端算力，破解"颜值即正义"困局，重塑真实、高效、安全的下一代社交体验作为月活超4亿的全球陌生人社交巨头，Badoo以"附近的人+动态分享"模式，帮助用户跨越地理与社交圈层建立连接。然而，随着Z世代对"真实社交、深度互动、隐私安全"的需求爆发，Badoo正面临三大核心挑战：颜值内卷与虚假人设：过度依赖照片/视频的展示方式，导致"照骗"泛滥，用户匹配后见面破灭率高达6
使用 C++/OpenCV 和 MFCC 构建双重认证智能门禁系统
使用C++/OpenCV和MFCC构建双重认证智能门禁系统引言随着物联网和人工智能技术的发展，智能门禁系统在安防领域的应用越来越广泛。相比于传统的钥匙、门禁卡或密码，生物识别技术（如人脸识别、指纹识别、虹膜识别等）提供了更高的安全性与便利性。然而，单一的生物识别方式在某些场景下可能存在安全隐患。例如，人脸识别可能被高清照片或视频欺骗（称为“欺骗攻击”），在光照、姿态变化剧烈时识别率也可能下降。为了
协同过滤算法：挖掘用户偏好，精准推荐商品 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
1.背景介绍协同过滤（CollaborativeFiltering，CF）作为推荐系统中的重要技术，其核心思想是利用用户和物品间的行为数据，挖掘用户隐性偏好，从而实现精准推荐。自20世纪90年代提出以来，协同过滤算法已经在电子商务、社交媒体、音乐视频等多个领域中广泛应用，取得了显著的推荐效果。协同过滤算法主要分为基于用户的协同过滤和基于物品的协同过滤两种。基于用户的协同过滤通过比较用户间的相似性，
利用C#开发USB摄像头驱动及图像捕获应用详解威哥说编程 c#单片机开发语言
一、项目背景与挑战USB摄像头在工业、安防、视频会议等领域应用广泛。通过C#开发USB摄像头驱动及图像捕获应用，能够灵活地控制设备，实现定制化功能。但由于硬件驱动开发复杂且受限于操作系统，C#开发USB摄像头驱动面临以下挑战：Windows不支持用C#编写内核驱动，需结合WinUSB或现有驱动USB设备通讯协议复杂，多为厂商定制高性能实时图像采集要求较高本文重点讲述：如何基于WinUSB与C#实现
nacos+nginx动态配置大文件上传限制
前言今天还要跟大家分享的一个点就是微服务网关gateway用webflux响应式不用servlet后，引发的一个忽略点差点在演示的时候炸锅，也不多讲废话，说说现象，说说处理就了事。一、上传超过20MB的视频报错配置在nacos里，读取配置用的@value注解发布新配置，拦截不生效用了nginx就是这么个现象，其实大概也知道原因。二、初步分析原因首先这是小弟写的，我不想动。其次可以理解是培养试验小弟
[代码随想录算法训练营 Day09 字符串 Part2] yancyss 算法 python 开发语言
Day09文章目录Day09字符串6.实现strStr（力扣28）7.重复的子字符串（力扣459）字符串今天两道KMP：KMP功能，在一个字符串中找到是否出现另一个字符串本篇会再更新~6.实现strStr（力扣28）题目描述：找出字符串中第一个匹配项的下标heystack干草堆，needle针，大海捞针~思路：KMP算法B站一个讲的很好的视频整体思路：假设有主串n和模式串m，在暴力算法当中，每当主
5个提升Facebook & Instagram视频广告效果的黄金法则推广小赵 facebook 经验分享
想要让你的社交平台视频广告脱颖而出？掌握这5个关键策略，轻松提升广告转化率！1.打造高吸引力视频内容黄金3秒法则开场必须炸裂！使用视觉冲击力强的元素（炫酷动态文字、高饱和色彩、网红/KOL出镜）或制造悬念（例如："90%的人都不知道的面料秘密..."）切忌慢热开场，前3秒就要亮出核心卖点产品优势可视化善用对比手法展示差异化（如：普通面料VS我们的高端RayonJacquard）多角度呈现使用场景（
【python实用小脚本-126】基于 Python 的 Google Meet 和 Zoom 自动化工具：实现会议自动化加入
引言在远程工作和在线学习日益普及的今天，GoogleMeet和Zoom成为了最常用的视频会议工具。然而，频繁地手动加入会议可能会浪费时间和精力。本文将介绍一个基于Python的自动化工具，能够自动加入GoogleMeet和Zoom会议。该工具主要利用了Python的schedule、webbrowser、pyautogui和pyperclip库，结合了任务调度、网页自动化和屏幕操作技术，为用户提供
【Unity开发】Unity实现glb模型上传到场景中使用功能龚子亦 Unity unity 游戏引擎
一、效果展示点击按钮上传glb格式的模型，进行后续移动、旋转和缩放操作，上传的模型会出现在原点（0,0,0）位置演示视频：Unity实现glb模型上传到场景中使用功能二、环境要求需要下载安装用于加载glb模型的插件，下载好后直接拖入项目中进行使用下载链接：https://github.com/Siccity/GLTFUtility/releases三、实现完整代码usingUnityEngine;
CVPR 2024 图像、视频处理总汇（视频字幕、图像超分辨率、图像分类和压缩等）点云SLAM 图形图像处理深度学习计算机视觉图像处理视频处理 3DGS CVPR2024
1、Image/VideoCaptioning(图像/视频字幕)VisualFactChecker:EnablingHigh-FidelityDetailedCaptionGenerationPolos:MultimodalMetricLearningfromHumanFeedbackforImageCaptioning⭐codeprojectPanda-70M:Captioning70MVide
嵌入式学习之Linux入门篇笔记——8，Linux帮助手册讲解玄奕子嵌入式学习之Linux入门篇 linux 学习笔记 ubuntu
配套视频学习链接：http://【【北京迅为】嵌入式学习之Linux入门篇】https://www.bilibili.com/video/BV1M7411m7wT/?p=4&share_source=copy_web&vd_source=a0ef2c4953d33a9260910aaea45eaec81.Linux帮助手册使用man命令打开，使用手册一共有九页。（按Q退出帮助手册）1.可执行的程序
Java IO相关技术小结 William一直在路上 java
JavaIO（输入/输出）相关技术一、JavaIO基础概念数据流方向输入流（InputStream/Reader）：从数据源（文件、网络、内存）读取数据到程序。输出流（OutputStream/Writer）：从程序写入数据到目标位置。数据类型字节流（ByteStream）：以字节为单位处理数据（InputStream/OutputStream），适用于二进制文件（图片、视频）。字符流（Chara
Python 爬虫实战：淘宝直播间实时数据抓取（弹幕分析 + 流量监控）西攻城狮北 python 爬虫开发语言
一、引言随着电商直播的迅猛发展，淘宝直播已成为品牌推广和商品销售的重要阵地。通过爬取淘宝直播间的实时数据，包括弹幕互动和流量信息，可以帮助商家深入了解用户行为、优化直播策略，同时为市场分析和商业决策提供数据支持。本文将深入探讨如何利用Python爬虫技术实现对淘宝直播间实时数据的抓取，并进行弹幕分析和流量监控。二、项目背景与目标2.1项目背景淘宝直播作为电商领域的重要流量入口，通过实时视频与用户互
ffmpeg将avi转为mp4 & ffmpeg将png转jpg & ffmpeg修改图片视频的尺寸 & ffmpeg旋转视频 & ffmpeg命令大全 computer_vision_chen 嵌入式人工智能 ffmpeg
文章目录图片操作对一个3840x1920的图片的高进行上下填充，形成3840x2160将一个图片宽缩放为640，高等比例缩放png转jpg命令png_to_jpg_2025_6_3.py将图片顺时针旋转90度命令rotate_90_2025_6_3.py视频操作ffmpeg水平翻转，垂直翻转，顺时针旋转180度ffmpeg去掉一个视频的音频将视频尺寸转为640x360（wxh）将视频尺寸转为640
python+uniapp基于微信小程序的河湟文化宣传系统nodejs+java
文章目录具体实现截图本项目![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/338cd998d059411aba7287118b685203.png)源码获取详细视频演示：文章底部获取博主联系方式！！！！本系统开发思路进度安排及各阶段主要任务java类核心代码部分展示主要参考文献：源码获取/详细视频演示##项目介绍摘要随着互联网技术的飞速发展和移动互联网的
python := 海象运算符 challenge-linge it it
参考视频教程:**体系课-Go+Python双语言混合开发盯紧技术先机抓紧高薪机遇**最近在做算法题越来越发现python写法真的挺好用的记下来map(lambdax:sum(x))中lambda代表匿名函数re.findall(r’0+|1+’,s)是正则表达式:=海象运算符转背景：python3.8正式版最近更新了，其中PEP572中的海象运算符获得正式python版本的支持.我看了官网的文档
MinIO 常见功能详解及 Spring Cloud 集成代码展示 csdn_tom_168 分布式文件存储系统 spring cloud spring MinIO
MinIO常见功能详解及SpringCloud集成代码展示MinIO是一个高性能的分布式对象存储系统，兼容AmazonS3API。以下是核心功能详解及SpringCloud集成方案：一、MinIO核心功能详解1.基础功能对象存储：存储任意类型文件（文档、图片、视频等）S3兼容：完全兼容AmazonS3API多租户：支持多个独立租户空间版本控制：保留对象历史版本2.高级特性功能描述数据加密客户端/服
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http