视频压缩：H.264、VC-1 及其他高级编解码技术的系统考虑

作者：Jeremiah Golston，TI 首席技术官 [email protected]
Ajit Rao 博士，TI 技术应用工程师 [email protected]

2006 年 4 月加州旧金山嵌入式系统会资料

1. 前言

数字视频产品需求近些年出现猛增。主流应用包括视频通信、安全监控与工业自动化，而最热门的要算娱乐应用，如 DVD、HDTV、卫星电视、高清 (HD) 机顶盒、因特网视频流、数码相机与 HD 摄像机、视频光盘库 (video jukebox)、高端显示器（LCD、等离子显示器、DLP）以及个人摄像机等。众多精彩的新应用目前也处于设计或前期部署中，例如针对家庭与手持设备及地面／卫星标准（DVB-T、DVB-H、DMB）的高清 DVD（蓝光／HD-DVD）和数字视频广播、高清视频电话、数码相机以及 IP 机顶盒。由于手持终端计算能力的提高以及电池技术与高速无线连接的发展，最终产品的移动性与集成性也在不断提高。

视频压缩是所有令人振奋的、新型视频产品的重要动力。压缩－解压（编解码）算法可以实现数字视频的存储与传输。典型的编解码器要么采用行业标准，如 MPEG2、MPEG4、H.264/AVC 与 AVS，要么采用专有算法，如 On2、Real Video、Nancy与Windows Media Video (WMV) 等。WMV 是个例外——它最初是微软公司的专有算法，而现在则以 VC-1 的新名称在业界实现了标准化。编解码技术在过去十年中不断改进。最新的编解码技术（H.264/AVC 与 VC-1）代表着第三代视频压缩技术。这两种编解码技术利用如可编程 DSP 与ASIC 等低成本 IC 的处理能力，都能够达到极高的压缩比。不过，为具体应用选择正确的编解码器并优化其实时处理仍然是一项巨大的挑战。最佳的设计必须权衡压缩效率及可用的计算能力。此外，如何在计算能力有限的情况下获得最佳压缩效率也是一门大学问。

在本文中，我们首先概述视频编码的主要概念，同时介绍传统压缩标准。然后我们重点介绍其中包括 H.264/AVC、WMV9/VC-1与AVS 等在内的最新编解码技术的功能，此外，还将深入探讨压缩能力与复杂性之间的权衡。最后，讨论市场中可能会影响主流视频编解码器未来的实时处理与主要趋势。

2. 视频压缩挑战

数字视频的主要挑战在于原始或未压缩的视频需要存储或传输大量数据。例如，标准清晰度的 NTSC 视频的数字化一般是每秒 30 帧速率，采用 4:2:2 YcrCb 及 720´480，其要求超过 165Mbps 的数据速率。保存 90 分钟的视频需要 110GB 空间，或者说超过标准 DVD-R 存储容量的 25 倍。即使是视频流应用中常用的低分辨率视频（如：CIF：352x288 4:2:0、30 帧/秒）也需要超过 36.5Mbps 的数据速率，这是 ADSL 或 3G 无线等宽带网络速度的许多倍。目前的宽带网可提供 1～10Mbps 的持续传输能力。显然数字视频的存储或传输需要采用压缩技术。

视频压缩的目的是对数字视频进行编码——在保持视频质量的同时占用尽可能少的空间。编解码技术理论依据为信息理论的数学原理。不过，开发实用的编解码技术需要艺术性的精心考虑。

3. 压缩权衡

在选择数字视频系统的编解码技术时需要考虑诸多因素。主要因素包括应用的视频质量要求、传输通道或存储介质所处的环境（速度、时延、错误特征）以及源内容的格式。同样重要的还有预期分辨率、目标比特率、色彩深度、每秒帧数以及内容和显示是逐行扫描还是隔行扫描。压缩通常需要在应用的视频质量要求与其他需求之间做出取舍。首先，用途是存储还是单播、多播、双向通信或广播？对于存储应用，到底有多少可用的存储容量以及存储时间需要多久？对于存储之外的应用，最高比特率是多少？对于双向视频通信，时延容差或容许的端到端系统延迟是多少？如果不是双向通信，内容需要在脱机状态提前完成编码还是需要实时编码？网络或存储介质的容错能力如何？根据基本目标应用，不同压缩标准以不同方式处理这些问题的权衡。

如 H.264/AVC 或 WMV9/VC-1等能够实现较高压缩比的新算法需要更高的处理能力，这会影响编解码器件的成本、系统功耗以及系统内存。

4. 标准化机构

在视频编解码技术定义方面有两大标准机构。国际电信联盟 (ITU) 致力于电信应用，已经开发了用于低比特率视频电话的 H.26x 标准，其中包括 H.261、H.262、H.263 与 H.264；国际标准化组织 (ISO) 主要针对消费类应用，已经针对运动图像压缩定义了 MPEG 标准。MPEG 标准包括 MPEG1、MPEG2 与 MPEG4。图 1 说明了视频编解码标准的发展历程。

MPEG 与 ISO 根据基本目标应用往往做出稍有不同的取舍。有时它们也会开展合作，如：联合视频小组 (JVT)，该小组定义了 H.264 编解码技术，这种技术在 MPEG 系列中又被称为 MPEG4-Part 10 或 MPEG4 高级视频编解码 (AVC)。我们在本文中将这种联合标准称为 H.264/AVC。同样，H.262 对应 MPEG2，而 H.263 基本规范类 (Baseline Profile) 技术在原理方面与 MPEG4 简单类 (Simple Profile) 编解码技术存在较多重复。

标准对编解码技术的普及至关重要。出于规模经济原因，用户根据可承受的标准寻找相应产品。由于能够保障厂商之间的互操作性，业界乐意在标准方面进行投资。而由于自己的内容可以获得较长的生命周期及广泛的需求，内容提供商也对标准青睐有加。尽管几乎所有视频标准都是针对少数特定应用的，但是在能够适用的情况下，它们在其他应用中也能发挥优势。

视频压缩：H.264、VC-1 及其他高级编解码技术的系统考虑
图1：ITU 与MPEG 标准的发展历程[10]

为了实现更好的压缩及获得新的市场机遇，ITU 与 MPEG 一直在不断发展压缩技术和开发新标准。中国最近开发了一种称为 AVS 的国家视频编码标准，我们在后面也会做一介绍。目前正在开发的标准包括 ITU/MPEG 联合可扩展视频编码 (Joint Scalable Video Coding)（对 H264/ AVC 的修订）和MPEG 多视角视频编码 (Multi-view Video Coding)。另外，为了满足新的应用需求，现有标准也在不断发展。例如，H.264 最近定义了一种称为高精度拓展 (Fidelity Range Extensions) 的新模式，以满足新的市场需求，如专业数字编辑、HD-DVD 与无损编码等。

除了 ITU 与 ISO 开发的行业标准以外，还出现了几种专用于因特网流媒体应用、广受欢迎的专有解决方案，其中包括 Real Networks Real Video (RV10)、Microsoft Windows Media Video 9 (WMV9) 系列、ON2 VP6 以及 Nancy。由于这些格式在内容中得到了广泛应用，因此专有编解码技术可以成为业界标准。2003 年 9 月，微软公司向电影与电视工程师学会 (SMPTE) 提议在该机构的支持下实现 WMV9 位流与语法的标准化。该提议得到了采纳，现在 WMV9 已经被 SMPTE 作为 VC-1 实现标准化。

5. 视频编码原理

我们感兴趣的所有视频标准都采用基于模块的处理方式。每个宏模块一般包含 4 个 8´8 的光度块和 2 个 8´8 的色度块（4:2:0 色度格式）。视频编码基于运动补偿预测（MC）原理，变换与量化及熵编码。图 2 说明的是一种典型的、基于运动补偿的视频编解码技术。在运动补偿中，通过预测与最新编码的（“参考”）视频帧处于同一区域的视频帧中各宏模块的像素来实现压缩。例如，背景区域通常在各帧之间保持不变，因此不需要在每个帧中重新传输。运动估计 (ME) 是确定当前帧——即与它最相似的参考帧的 16´16 区域中每个 MB 的过程。ME 通常是视频压缩中最消耗性能的功能。有关当前帧中各模块最相似区域相对位置的信息（“运动矢量”）被发送至解码器。

MC 之后的残差部分分为 8´8 的模块，各模块综合利用变换编码、量化编码与可变长度编码技术进行编码。变换编码（如：离散余弦变换或 DCT）利用残差信号中的空间冗余。量化编码可以消除感知冗余 (perceptual redundancy) 并且降低编码残差信号所需要的数据量。可变长度编码利用残差系数的统计性质。通过 MC 进行的冗余消除过程在解码器中以相反过程进行，来自参考帧的预测数据与编码后的残差数据结合在一起产生对原始视频帧的再现。
视频压缩：H.264、VC-1 及其他高级编解码技术的系统考虑

图2：标准运动补偿视频编码

在视频编解码器中，单个帧可以采用三个模式中的一个进行编码 —— 即 I、P 或 B 帧模式（见图 3）。几个称为 Intra (I) 的帧单独编码，无需参考任何其他帧（无运动补偿）。某些帧可以利用 MC 编码，以前一个帧为参考（前向预测）。这些帧称为预测帧 (P)。

B 帧或双向预测帧通过之前的帧以及当前帧的后续帧进行预测。B 帧的优势是能够匹配堵塞在采用前向预测的上一帧中的背景区域。双向预测通过平衡前向及后向预测可以降低噪声。在编码器中采用这种功能会要求更多处理量，因为必须同时针对前向及后向预测执行 ME，而这会明显使运动估计计算需求加倍。为了保存两个参考帧，编码器与解码器都需要更多内存。B 帧工具需要更复杂的数据流，因为相对采集及显示顺序而言，帧不按顺序解码。这个特点会增加时延，因此不适合实时性较高的应用。B 帧不用于预测，因此可以针对某些应用进行取舍。例如，在低帧速应用中可以跳过它们而不会影响随后 I 与 P 帧的解码。

视频压缩：H.264、VC-1 及其他高级编解码技术的系统考虑
图3：I、P 与 B 帧间预测图示

6. 传统视频编码标准

H.261

ITU 编制的 H.261[2] 标准是第一个主流视频压缩标准。它主要针对双工视频会议应用，是为支持 40kpbs～2Mbps 的 ISDN 网络而设计的。H.261 支持 352´288 (CIF) 及 176´144 (QCIF) 分辨率，色度分辨率二次采样为 4:2:0。由于可视电话需要同步实时编解码，因此复杂性设计得较低。由于主要用于对延迟敏感的双向视频，因此 H.261 仅允许采用 I 与 P 帧，而不允许 B 帧。

H.261 采用基于块的 DCT 进行残差信号的变换编码。DCT 把像素的每个 8´8 块映射到频域，产生 64 个频率成分（第一个系数称为 DC，其他的称为 AC）。为了量化 DCT 系数，H.261 在所有 AC 系数中采用固定的线性量化。量化后的系数进行行程编码，其可以按非零系数描述量化的频率，后面跟随一串零系数，在最后一个非零值之后以块代码结束。最后，可变长度编码 (Huffman) 将运行级别对 (run-level pair) 转换成可变长度编码 (VLC)，其比特长度已针对典型概率分布进行过优化。

基于标准块的编码最终产生模块化视频。H.261 标准利用环路滤波避免这种现象。在模块边缘采用的简单 2D FIR 滤波器用于平滑参考帧中的量化效应。必须同时在编码器及解码器中精确地对每个比特应用上述滤波。

MPEG-1

MPEG-1[3] 是 ISO 开发的第一个视频压缩算法。主要应用是数字媒体上动态图像与音频的存储与检索，如速率为 1.15Mbps、采用 SIF 分辨率（352´240 – 29.97fps 或者 352´288 – 25 fps）的VCD。MPEG-1 与 H.261 相似，不过编码器一般需要更高的性能，以便支持电影内容的较高运动性而不是典型的可视电话功能。

与 H.261 相比，MPEG1 允许采用 B 帧。另外它还采用自适应感知量化，也就是说，对每个频段采用单独的量化比例因子（或等步长），以便优化人们的视觉感受。MPEG-1 仅支持逐行视频，因此新标准——MPEG2 已经开始做出努力，同时支持分辨率及比特率更高的逐行与隔行视频。

MPEG-2/H.262

MPEG-2[4] 专门针对数字电视而开发，很快成为了迄今最成功的视频压缩标准。MPEG-2 既能够满足标准逐行视频的需求（其中视频序列由一系列按一定时间间隔采集的帧构成），又能够满足电视领域常用的隔行视频的需求。隔行视频交替采集及显示图像中两组交替的像素（每组称为一个场）。这种方式尤其适合电视显示器的物理特性。MPEG2 支持标准的电视分辨率，其中包括：针对美国和日本采用的 NTSC 制式隔行 720´480 分辨率，每秒 60 场，以及欧洲和其他国家采用的PAL 制式的 720´576 分辨率，每秒 50 场。

MPEG-2 建立在 MPEG-1 基础之上，并具备扩展功能，能支持隔行视频及更宽的运动补偿范围。由于高分辨率视频是非常重要的应用，因此 MPEG-2 支持的搜索范围远远大于 MPEG-1。与之前的标准相比，它显著提高了运动估计的性能要求，并充分利用更宽搜索范围与更高分辨率优势的编码器需要比 H.261 和 MPEG-1 高得多的处理能力。MPEG2 中的隔行编码工具包含优化运动补偿的能力，同时支持基于场和基于帧的预测，而且同时支持基于场和基于帧的 DCT/IDCT。MPEG-2 在 30:1 左右的压缩比时运行良好。MPEG-2 在 4-8Mbps 时达到的质量适合消费类视频应用，因此它很快在许多应用中得到普及，如：数字卫星电视、数字有线电视、DVD 以及后来的高清电视等。

另外，MPEG-2 增加了分级视频编码工具，以支持多层视频编码，即：时域分级、空域分级、SNR 分级以及数据分割。尽管 MPEG-2 中针对分级视频应用定义了相关类别 (profile)，不过支持单层编码的主类 (Main Profile) 是当今大众市场中得到广泛应用的唯一 MPEG-2 类。MPEG-2 通常称为 MPEG-2 主类。

MPEG-2 解码最初对于通用处理器及 DSP 具有很高的处理要求。优化的固定功能 MPEG-2 解码器开发已问世，由于使用量较高，成本已逐渐降低。MPEG2 证明低成本芯片解决方案的供应是视频编解码标准成功和普及的关键。

H.263

H.263[5] 在 H.261 之后得到开发，主要是为了以更低的比特率实现更高的质量。其主要目标之一是基于普通 28.8Kbps 电话调制解调器的视频。目标分辨率是 SQCIF (128´96)～CIF (352´288)。其基本原理与 H.261 大同小异。

H.263 的运动矢量在两个方向上允许是 ½ 的倍数（“半像素”），参考图像以数字方式内插到更高的分辨率。这种方法可以提高 MC 精度及压缩比。MV 可采用更大的范围。为不同方案提供许多新的选项，包括：

4个运动矢量——每个块采用一个运动矢量，而非整个 MB 采用单个运动矢量。
3D VLC：Huffman 编码——将块结束 (EOB) 指示符与每个运行级别对结合在一起。这种功能主要用于低比特率，这时大多时候只有一、两个编码系数。

尽管存在这些功能，但是仍然很难在普通电话线上实现理想的视频质量，而且目前基于标准调制解调器的可视电话仍然是一个难题。不过，由于 H.263 一般情况下可提供优于 H.261 的效率，它成为了电视会议首选的算法，但是，为了兼容旧系统，仍然需要支持 H.261。H.263 逐渐发展成为了 H.263+，其增加了可选的附件，为提高压缩并实现分组网的鲁棒性提供支持。H.263 及其附件构成了 MPEG-4 中许多编码工具的核心。

MPEG-4

MPEG-4[6] 由 ISO 提出，以延续 MPEG-2 的成功。一些早期的目标包括：提高容错能力以支持无线网、对低比特率应用进行更好的支持、实现各种新工具以支持图形对象及视频之间的融合。大部分图形功能并未在产品中受到重视，相关实施主要集中在改善低比特率压缩及提高容错性上。.

MPEG-4 简化类 (SP) 以H.263为基础，为改善压缩增加了新的工具，包括：

无限制的运动矢量：支持对象部分超出帧边界时的预测。
可变块大小运动补偿：可以在 16´16 或 8´8 粒度下进行运动补偿。
上下文自适应帧内 DCT DC/AC 预测：可以通过当前块的左右相邻块预测 DC/AC DCT 系数。
扩展量化 AC 系数的动态范围，支持高清视频：从 H.263 的 [-127:127] 到 [-2047, 2047]。

增加了容错功能，以支持丢包情况下的恢复，包括：

片断重同步 (Slice Resynchronization)：在图像内建立片断 (slice)，以便在出现错误后更快速的进行重新同步。与 MPEG-2 数据包大小不同，MPEG4 数据包大小与用于描述 MB 的比特数量脱离了联系。因此，不管每个 MB 的信息量多少，都可以在位流中按相同间隔进行重新同步。
数据分割：这种模式允许利用唯一的运动边界标记将视频数据包中的数据分割成运动部分和 DCT 数据部分。这样就可以实现对运动矢量数据更严格的检查。如果出现错误，我们可以更清楚地了解错误之处，从而避免在发现错误情况下抛弃所有运动数据。
可逆 VLC：VLC 编码表允许后向及前向解码。在遇到错误时，可以在下一个slice进行同步，或者开始编码并且返回到出现错误之处。
新预测 (NEWPRED)：主要用于在实时应用中实现快速错误恢复，这些应用中的解码器在出现丢包情况下采用逆向通道向解码器请求补充信息。

MPEG-4 高级简化类 (ASP) 以简化类为基础，增加了与 MPEG-2 类似的 B 帧及隔行工具（用于Level 4 及以上级别）。另外它还增加了四分之一像素运动补偿及用于全局运动补偿的选项。MPEG-4 高级简化类比简化类的处理性能要求更高，而且复杂性与编码效率都高于 MPEG-2。

MPEG-4 最初用于因特网数据流，例如，已经被 Apple 的 QuickTime 播放器采用。MPEG-4 简化类目前在移动数据流中得到广泛应用。MPEG-4 ASP 是已经流行的专有 DivX 编解码器的基石。

工具与压缩增益

当我们查看 H.261、MPEG1、MPEG2 与 H.263 视频编解码技术中引入的功能时，明显可以发现几种基本技巧提供了大部分压缩增益。图 4 说明这些技巧及其相关效果。与 4 个运动矢量以及四分之一像素运动补偿等工具相比，运动补偿（整数像素与半像素）的效果显然更为突出。

视频压缩：H.264、VC-1 及其他高级编解码技术的系统考虑

图4：基本技巧的效果：1) 无MC；2) 增加 Skip 模式构成 CR 编码器；3) 仅允许零 MV；4) 允许整数像素MC；5) 允许半像素 MC；6) 允许4-MV；7) 允许四分之一像素MC。如欲了解有关详细说明，敬请参见[7]。

7. H.264/ MPEG4-AVC

视频编码技术在过去几年最重要的发展之一是由 ITU 和 ISO/IEC 的联合视频小组 (JVT) 开发了 H.264/MPEG-4 AVC[8] 标准。在发展过程中，业界为这种新标准取了许多不同的名称。ITU 在 1997 年开始利用重要的新编码工具处理 H.26L（长期），结果令人鼓舞，于是 ISO 决定联手 ITU 组建 JVT 并采用一个通用的标准。因此，大家有时会听到有人将这项标准称为 JVT，尽管它并非正式名称。ITU 在 2003 年 5 月批准了新的 H.264 标准。ISO 在 2003 年 10 月以 MPEG-4 Part 10、高级视频编码或 AVC 的名称批准了该标准。

H.264/AVC 在压缩效率方面取得了巨大突破，一般情况下达到 MPEG-2 及 MPEG-4 简化类压缩效率的大约 2 倍。在 JVT 进行的正式测试中 [9]，H.264 在 85 个测试案例中有 78％的案例实现 1.5 倍以上的编码效率提高，77％的案例中达到 2 倍以上，部分案例甚至高达 4 倍。H.264 实现的改进创造了新的市场机遇，如：

600Kbps 的 VHS 品质视频。可以通过 ADSL 线路实现视频点播。
高清晰电影无需新的激光头即可适应普通 DVD。

H.264 标准化时支持三个类别：基本类、主类及扩展类。后来一项称为高保真范围扩展 (FRExt) 的修订引入了称为高级类的 4 个附加类。在初期主要是基本类和主类引起了大家的兴趣。基本类降低了计算及系统内存需求，而且针对低时延进行了优化。由于 B 帧的内在时延以及 CABAC 的计算复杂性，因此它不包括这两者。基本类非常适合可视电话应用以及其他需要低成本实时编码的应用。

主类提供的压缩效率最高，但其要求的处理能力也比基本类高许多，因此使其难以用于低成本实时编码和低时延应用。广播与内容存储应用对主类最感兴趣，它们是为了尽可能以最低的比特率获得最高的视频质量。

尽管 H.264 采用与旧标准相同的主要编码功能，不过它还具有许多与旧标准不同的新功能，它们一起实现了编码效率的提高。图 5 的编码器框图总结了其主要差别，概述如下：

帧内预测与编码：H.264 采用空域帧内预测技术来预测相邻块邻近像素的 Intra-MB 中的像素。它对预测残差信号和预测模式进行编码，而不是编码块中的实际像素。这样可以显著提高帧内编码效率。

帧间预测与编码：H.264 中的帧间编码采用了旧标准的主要功能，同时也增加了灵活性及可操作性，包括适用于多种功能的几种块大小选项，如：运动补偿、四分之一像素运动补偿、多参考帧、通用 (generalized) 双向预测和自适应环路去块。

可变矢量块大小：允许采用不同块大小执行运动补偿。可以为小至 4´4 的块传输单个运动矢量，因此在双向预测情况下可以为单个 MB 传输多达 32 个运动矢量。另外还支持 16´8、8´16、8´8、8´4 和 4´8 的块大小。降低块大小可以提高运动细节的处理能力，因而提高主观质量感受，包括消除较大的块化失真。

视频压缩：H.264、VC-1 及其他高级编解码技术的系统考虑
图5：H.264 框图与功能[10]

四分之一像素运动估计：通过允许半像素和四分之一像素运动矢量分辨率可以改善运动补偿。

多参考帧预测：16 个不同的参考帧可以用于帧间编码，从而可以改善视频质量的主观感受并提高编码效率。提供多个参考帧还有助于提高 H.264 位流的容错能力。值得注意的是，这种特性会增加编码器与解码器的内存需求，因为必须在内存中保存多个参考帧。

自适应环路去块滤波器：H.264 采用一种自适应解块滤波器，它会在预测回路内对水平和垂直区块边缘进行处理，用于消除块预测误差造成的失真。这种滤波通常是基于 4´4 块边界为运算基础，其中边界各边的 3 个像素可通过 4 级滤波器进行更新。

整数变换：采用 DCT 的早期标准必须为逆变换的固点实施来定义舍入误差的容差范围。编码器与解码器之间的 IDCT 精度失配造成的漂移是质量损失的根源。H.264 利用整数 4´4 空域变换解决了这一问题——这种变换是 DCT 的近似值。4´4 的小区块还有助于减少阻塞与振铃失真。

量化与变换系数扫描：变换系数通过标量量化方式得到量化，不产生加大的死区。与之前的标准类似，每个 MB 都可选择不同的量化步长，不过步长以大约 12.5％的复合速率增加，而不是固定递增。同时，更精细的量化步长还可以用于色度成分，尤其是在粗劣量化光度系数的情况下。

熵编码：与根据所涉及的数据类型提供多个静态 VLC 表的先前标准不同，H.264 针对变换系数采用上下文自适应 VLC，同时针对所有其他符号采用统一的 VLC (Universal VLC) 方法。主类还支持新的上下文自适应二进制算术编码器 (CABAC)。CAVLC 优于以前的 VLC 实施，不过成本却比VLC高。

CABAC利用编码器和译码器的机率模型来处理所有语法元素 (syntax elements)，包括：变换系数和运动矢量。为了提高算术编码的编码效率，基本概率模型通过一种称为上下文建模的方法对视频帧内不断变换的统计进行适应。上下文建模分析提供编码符号的条件概率估计值。只要利用适当的上下文模型，就能根据待编码符号周围的已编码符号，在不同的概率模型间进行切换，进而充份利用符号间的冗余性。每个语法元素都可以保持不同的模型（例如，运动矢量和变换系数具有不同的模型）。相较于 VLC 熵编码方法 (UVLC/CAVLC)，CABAC 能多节省 10 ％ bit速率。

加权预测：它利用前向和后向预测的加权总和建立对双向内插宏模块的预测，这样可以提高场景变化时的编码效率，尤其是在衰落情况下。

保真度范围扩展

2004 年 7 月，H.264 标准增加了称为保真度范围扩展 (FRExt) [11]的新修订。这次扩展在H.264 中添加了一整套工具，而且允许采用附加的色域、视频格式和位深度。另外还增加了对无损帧间编码与立体显示视频的支持。FRExt 修订版在 H.264 中引入了 4 种新类，即：

High Profile (HP)：用于标准 4:2:0 色度采样，每分量 8 位彩色。此类引入了新的工具 —— 随后详述。
High 10 Profile (Hi10P)：用于更高清晰度视频显示的标准 4:2:0 色度采样，10 位彩色。
High 4:2:2 10 bit color profile (H422P)：用于源编辑功能，如：a 混合。
High 4:4:4 12 bit color profile (H444P)：最高品质的源编辑与色彩保真度，支持视频区域的无损编码以及与新的整数色域变换（从 RGB 到 YUV 及黑色）。

在新的应用领域中，H.264 HP 对广播与 DVD 尤为有利。某些试验显示出 H.264 HP 的性能比MPEG2 提高了 3 倍。下面介绍 H.264 HP 中引入的主要附加工具。

自适应残差块大小与整数 8´8 变换：用于变换编码的残差块可以在 8´8 与 4´4 之间切换。引入了用于 8´8 块的新 16 位整数变换。较小的块仍然可以采用以前的 4´4 变换。

8´8 亮度帧内预测：增加了 8 种模式，除之前的 16´16 和 4´4 块以外，使亮度内部宏模块还能够对 8´8 块进行帧内预测。

量化加权：用于量化 8´8 变换系数的新量化加权矩阵。

单色：支持黑／白视频编码。

8. Windows Media Video 9 / VC-1

Windows Media 是提供网上音乐与视频预订服务与视频流的主要格式。微软公司于 2002 年推出了 Windows Media Video 9 系列编解码器，实现了视频压缩效率的显著提高。WMV9 另外还作为 VC-1 在 SMPTE 中实现了标准化[12]。

与 H.264 类似，它包含许多高级编码工具，不过种类有所不同。除了支持半象素双线性插值之外，WMV9 的 ME 还允许 ¼ 象素双立方插值（采用 4 抽头近似双立方滤波器）。另外它还包含与 H.264 类似的环内去块滤波器，不过滤波器和决策细节不同。其他部分功能包括：

多个VLC 表：WMV9 主类包含多套针对不同类型内容进行优化的 VLC 表。这些表可以在帧级切换，以适应输入视频的特征。

DCT/IDCT 变换切换：WMV9 支持多种 DCT 块大小，包括：8´8、8´4、4´8 和 4´4。其采用专用的 16 位整数变换与逆变换。

量化：采用一般基于步长的量化和死区量化。死区量化可以在低比特率时实现显著节省。

另一个有趣的功能是能够在涉及衰落的情况下采用明确的衰落补偿。它可以提高这些情况下运动补偿的质量。

WMV9/VC-1 在性能方面与 MPEG-2 和 MPEG-4 简化类相比有显著提高，相对于 H.264，其知觉质量感受也非常优秀[13]。不过，在提供相似压缩效率情况下，WMV9/VC-1 与 H.264 主类相比复杂性要求较低。WMV9 广泛应用于个人电脑环境，而且已经成为互联网消费设备中的重要技术。WMV9/VC-1 在好莱坞和独立制片业正日益受宠，多部电影的发行开始采用WMV9/VC-1 进行编码，以实现 PC DVD 上的高清晰播放。此外，WMV9 已经作为新兴的 HD-DVD 格式压缩选项实现了标准化。

9. AVS

2002 年，中国信息产业部成立的音视频技术标准 (AVS) 工作组宣布准备针对移动多媒体、广播、DVD等应用编写一份国家标准。该视频标准称为 AVS [14]，由两个相关部分组成 — 针对移动视频应用的 AVS-M 和针对广播与 DVD 的 AVS1.0。AVS 标准与 H.264 相似。

AVS1.0 同时支持隔行和逐行扫描模式。AVS 中 P 帧可以利用 2 帧的前向参考帧，同时允许 B 帧采用前后各一个帧。在隔行模式下，4 个场可以用作参考。可以仅在帧级执行隔行模式中的帧／场编码，这一点与 H.264 不同，其中允许此选项的 MB 级自适应。AVS 具有与 H.264相似的环路滤波器，可以在帧级关闭。另外，B 帧还无需环路滤波器。帧内预测是以 8´8 块为单位进行。MC 允许对亮度块进行 1／4 象素补偿。ME 的块大小可以是 16´16、16´8、8´16 或 8´8。变换方式是基于 16 位的 8´8 整数变换（与 WMV9 相似）。VLC 是基于上下文自适应 2D 运行／级别编码。采用 4 个不同的 Exp-Golomb 编码。用于每个已量化系数的编码自适应到相同 8´8 块中前面的符号。由于 Exp-Golomb 表是参数化的表，因此表较小。用于逐行视频序列的 AVS 1.0 的视频质量在相同比特率时稍逊于 H.264 主类。

AVS-M 主要针对移动视频应用，与 H.264 基本规范存在交叉。它仅支持逐行视频、I 与 P 帧，不支持 B 帧。主要 AVS-M 编码工具包括基于 4´4 块的帧内预测、1／４象素运动补偿、整数变换与量化、上下文自适应 VLC 以及高度简化的环路滤波器。与 H.264 基本规范相似，AVS-M 中的运动矢量块大小降至 4´4，因此 MB 可拥有多达 16 个运动矢量。采用多帧预测，但仅支持 2 个参考帧。此外，AVS-M 中还定义了 H.264 HRD／SEI 消息的子集。AVS-M的编码频率约为 0.3dB，在相同设置下稍逊于 H.264 基本规范，而解码器的复杂性却降低了大约
20％。

10. 各编解码器的功能与工具对比

表1概述我们介绍的视频标准采用的主要压缩功能与工具。

功能	H.261	MPEG1	MPEG2	H.263	MPEG4	H.264	WMV9/ VC-1	AVS
图像编码类型	I、P	I、P、B	I、P、B	I、P、B	I、P、B	I、P、B	I、P、B	I、P、B
熵编码	VLC	VLC	VLC	VLC、SAC	VLC	UVLC、CAVLC、CABAC	多表 VLC	自适应 VLC
MV 分辨率	整数象素	半象素	半象素	半象素	¼ 象素	¼ 象素	¼ 象素	¼ 象素
变换	8´8 DCT	8´8 DCT	8´8 DCT	8´8 DCT	8´8 DCT	4´4 与 8´8 整数	8´8、8´4、 4´8、 4´4 整数 DCT	8x8 整数
矢量块大小	16´16	16´16	16´16、16´8	8´8或16´16	8´8、16´16	16´16、16´8、 8´16、 8´8、8´4、4´8、4´4	16´16、16´8、8´8, 4´4（色度）	16´16、16´8、8´16、8´8、8´4、4´8、4´4
空域帧内预测	无	无	无	无	无	有	无	有
支持的格式	逐行	逐行	逐行／隔行	逐行	逐行／隔行	逐行／隔行	逐行／隔行	逐行／隔行
预测模式	帧	帧	场／帧	帧	场／帧	场／帧	场／帧	场／帧
去块滤波器	环内	无	后期	附件 J 环内	后期	环内	环内	环内

表1：标准编解码器中的主要压缩功能

11. 市场趋势与应用

视频压缩正在市场中催生数量日益增长的数字视频产品。采用数字视频压缩技术的终端设备范围广泛，从电池驱动的便携设备到高性能基础设备。表 2 概述部分应用、主要需求、采用的典型视频编解码器及其在这些应用中的发展趋势。

应用	需求	采用的编解码器	发展趋势
安全／监控	多路编码	Motion JPEG、H.263	MPEG4-SP、H.264
可视电话、视频会议	低延迟、低比特率	H.261、H.263	H.264-BP
因特网数据流	低速率、多种格式的解码器、权限管理	WMV、Real Video、 MPEG-4 (QuickTime, DivX)
DVD	高质量、随机访问、低成本	MPEG2-MP	H.264、WMV9、AVS
数字地面电视	高质量	MPEG2	MPEG2、H.264、AVS
卫星电视	高质量	MPEG2	H.264-HP
手持终端数字视频	低功耗、低比特率、容错性	WMV9、H,264
个人视频记录器	高质量、低压缩、随机访问	MPEG2	WMV9、H.264
数码摄像机	低功率、高质量、低比特率	传统 DV 标准	MPEG2、MPEG4
移动数据流	低复杂性解码、容错性	MPEG4-SP	RV、H,.264-BP、WMV9、AVS-M

表2：标准应用采用的典型编解码器与发展趋势

12. 实时实现

数字视频的最佳处理器解决方案取决于具体的目标应用。TI 拥有可支持多种标准并满足主要设计及系统约束需求的各种 DSP。TI 的解决方案范围广泛，其中包括低功耗 c5000 DSP 与移动OMAP 应用处理器、高性能 c6000 DSP 与视频优化的高性能 DM64x 和 DM644x 数字媒体处理器。目前倍受关注的处理器之一是未面世的 DM6446，我们将在本节中进行介绍。

德州仪器 (TI) 的 DM 系列处理器专门针对高端视频系统的需求而设计。该系列的最新处理器是功能强大的 DM6446[15]，其采用了 TI 的达芬奇 (DaVinci) 技术[16]。DM6446 的双内核架构兼具 DSP 和 RISC 技术优势，集成了时钟频率达 594MHz 的 c64x+ DSP 内核与 ARM926EJ-S内核。新一代 c64x+ DSP 是 TMS320C6000™ DSP 平台中性能最高的定点 DSP，并建立在 TI 开发的第二代高性能高级 VLIW 架构的增强版之上。c64x+ 与前代 C6000 DSP 平台代码兼容。DM644x 等可编程数字媒体处理器可以支持所有的现有业界标准以及采用单个可编程数字媒体处理器的专有视频格式。DM6446 还具有片上内存，包括一个 2 级高速缓存和众多具有视频专用功能的外设。DM6446 还包含一种视频／影像协处理器 (VICP)，用于减轻相关算法（如：JPEG、H.264、MPEG4 与 VC-1）的 DSP 内核繁重的视频与影像处理负担，从而使更多的 DSP MIPS 能够用于视频后处理或者其他并行运行等功能。

表 3说明 DM6446 在各种标准下保持 D1 (720´480) 分辨率大约所需要的频率。

视频编解码标准	编码器	解码器
H.263 / MPEG4-SP	250MHz	100MHz
H.264 — 基本类	410MHz	300MHz
H.264 — 主类	590MHz	450MHz
WMV9/VC-1	360MHz	360MHz

表3：单片TI DM6446 平台处理 D 1 30fps（720´480）、YUV 4:2:0 性能所需要频率典型值。解码器性能数据是针对最差情况下的比特流。解码器性能随所采用功能组合的变化而变化。上述例子中假定为高品质的编码。DM6446 上的c64x+ 可达到594MHz 的时钟频率。

请注意：所显示的编码频率数据是根据现有／计划实施而得出的典型测试数据。另外，编码器负载随目标应用不同而存在显著差异。压缩标准规定需要的语法与可用的工具，不过许多算法结果取决于具体实施情况。主要变量包括：比特率控制算法、单通道与多通道编码、I/B/P 帧比率、运动搜索范围、运动搜索算法、以及选用的个别工具与模式。这种灵活性允许我们在计算负载和改进质量之间做出不同取舍。显然所有编码器都可以采用或高或低的频率实现不同的视频质量水平。

13. 结论

越来越多的视频压缩标准可以针对具体最终应用提供越来越高的压缩效率和越来越丰富的工具。另外，向网络化连接发展的趋势意味着许多产品越来越需要支持多种标准。多种标准和专有算法的流行也使我们难以选择单个标准，尤其是在硬件决策经常超前于产品部署的情况下。不仅如此，每个视频编码算法都提供丰富的工具与功能选择，以平衡压缩效率的复杂性。工具和功能的选择是与特定应用和用例息息相关的重复过程。由于必须支持的编解码器数量的增多以及针对具体解决方案和应用而对编解码器进行优化的选择范围更为广泛，因此在数字视频系统中采用灵活的媒体处理器是大势所趋。DM6446 等数字媒体处理器可充分满足性能处理需求同时架构灵活，从而能够快速把新标准实施推向市场，其中包括：H.264、AVS 与 WMV9。我们可以在标准定义阶段实施算法并且保持软件算法与工具的更新，从而紧随标准大大小小的修改并且满足应用不断变化的质量需求。

14. 参考文献

J. R. Jain 与A. K. Jain，《位移测量及其在帧间图像编码中的应用》，IEEE Trans. Commun.，COM-29 卷，第 12 期，1799～1808 页，1981 年 12 月。
ITU-T建议 H.261:1993，《用于 px64Kbps 音频／视频业务的视频编解码技术》。
ISO/IEC 11172-2:1993，《1.5Mbps 数字存储媒体的动态图像及相关音频的编码 – 第2部分：视频》。
ISO/IEC 13818-2:1995，《动态图像及相关音频信息的通用编码：音频》。
ITU-T 建议 H.263:1998，《低速率通信的视频编码》。
ISO/IEC 14496-2:2001，《信息技术 —— 音频／视频对象的通用编码 —— 第2部分：视频》。
G. Sullivan与T. Wiegand，“视频压缩 —— 从概念到 H.264/AVC 标准”，《IEEE 学报》93 卷第 1 期，2005 年 1 月。
ISO/IEC 14496-10:2003，《信息技术 —— 音频／视频对象的编码 —— 第 10 部分：高级视频编码》。
《AVC 正式检验测试报告》（ISO/IEC 14496-10 | ITU-T Rec. H.264），ISO/IEC JTC1/SC29/WG11，MPEG-2003/N6231，2003 年 12 月，Waikoloa 。
《UB 视频公司的 H.264 白皮书》， http://www.ubvideo.com/。
ITU-T 与 ISO/IEC 联合视频小组：《H.264/AVC 保真度范围扩展修订草案》，Doc. JVT-L047，2004 年 9 月。
《SMPTE 421M、SMPTE 电视标准草案：VC-1 压缩视频比特流格式与解码过程》。
Srinivasan, S.、(John) Hsu, P.、Holcomb, T.、Mukerjee, K.、Regunathan, S.L.、Lin, B.、Liang, J.、Lee, M.-C.、Ribas-Corbera, J.，“Windows Media Video 9：概述与应用”，《信号处理：图像通信》，19 卷，第 9 期，2004 年 10 月 1 日，851～875 页。
L. Fan、S. Ma、F. Wu：“AVS 视频标准概述”，《ICME 2004 年学报》，423-426 页。
《TMS320DM6446 数字媒体片上系统》，网址 http://www.ti.com/。
Bill Witowsky、Gene Frantz, 《用于数字视频的达芬奇技术》，网址 http://www.ti.com/

原文链接：http://focus.ti.com.cn/cn/general/docs/gencontent.tsp?contentId=34908

你可能感兴趣的:(压缩)

buuctf-misc-二维码1 mlws1900 ctf buuctfmisc servlet jar java
显而易见的二维码题目，解压得到一个二维码解码获取内容secretishere我以为到这就结束了，flag{}加上就ok，结果发现失败用winhex打开看一下发现里面存在一个4numbers.txt用软件分离出来发现要密码，写着4numbers，应该就是纯数字密码爆破利用工具进行压缩包密码爆破密码为7639解压获得flagCTF{vjpw_wnoei}提交时候要改成flag{vjpw_wnoei}
springboot3集成minio
1.说明注意：本代码是在若依springboot3版本上实现的，如果你不是在若依上面实现，需要将所有用到若依的相关代码修改后才能运行文件管理文件上传：支持单文件上传，可指定存储桶和路径，支持自动按日期目录存储文件下载：支持文件直接下载，自动处理文件名编码文件预览：支持图片、文档等文件的在线预览功能文件删除：支持单文件删除和批量删除文件重命名：支持文件重命名操作图片处理：支持图片压缩和格式转换(We
基于YOLOv5的监控摄像头遮挡检测系统：从数据集到UI界面的完整实现芯作者 D2:YOLO YOLO 神经网络
实时守护监控设备安全，智能识别遮挡攻击的AI解决方案一、问题背景与系统价值在安防监控领域，摄像头遮挡是常见的恶意攻击手段——统计显示35%的安防失效源于摄像头被遮挡。传统方案依赖人工巡查，效率低下且响应延迟。本文将带你构建完整的AI遮挡检测系统，核心创新点：双模检测机制：YOLOv5目标检测+背景建模异常分析轻量化部署：模型量化压缩至1.8MB动态学习：运行时自动更新异常样本库二、系统架构设计[视
《三生原理》如何优化注意力机制？
AI辅助创作：《三生原理》通过融合《周易》哲学的数理模型，对注意力机制进行了多维度优化，主要体现在动态计算重构、位置编码革新与训练效率提升三方面，具体路径如下：‌一、动态筛网替代传统注意力计算‌‌三级筛网分层过滤‌‌初级筛网‌：基于素数参数化公式（p=3(2n+1)+2(2n+m+1)）预判无效特征交互，压缩注意力计算范围，减少多头冗余计算45%。‌中级判据‌：引入五行属性权重动态分配机制，依据模
c# 利用 GZipStream 压缩解压缩文件（所有类型的文档) 山海上的风 c#
c#利用GZipStream压缩解压缩文件（所有类型的文档)usingSystem;usingSystem.Collections.Generic;usingSystem.IO;usingSystem.IO.Compression;usingSystem.Linq;usingSystem.Text;usingSystem.Threading.Tasks;namespaceGZipStream_压缩
nvidia-container-runtime离线包安装说明：快速部署NVIDIA容器环境盛罡城Rachel
nvidia-container-runtime离线包安装说明：快速部署NVIDIA容器环境【下载地址】nvidia-container-runtime离线包安装说明此项目为无网络环境下的用户提供了nvidia-container-runtime的离线安装包，极大简化了安装流程。通过简单的解压缩和rpm包安装，用户可以快速完成环境配置。安装完成后，仅需重启Docker容器即可生效。项目特别适合网络
5、旋转与自适应布局：iOS应用开发的关键 c7d8e9 8 SDK入门 iOS开发自适应布局旋转处理
旋转与自适应布局：iOS应用开发的关键1.旋转和自适应布局的重要性iPhone和iPad是令人惊叹的工程杰作。苹果的工程师们找到了各种方法，将最大功能压缩进一个小巧的包装里。其中一个例子就是这些设备可以以纵向（高而窄）或横向（短而宽）模式使用，而且这种方向可以在运行时通过简单旋转设备来改变。你可以在iOS的网页浏览器MobileSafari中看到这种被称为自动旋转的行为示例。像许多iOS应用程序一
【半夜爬起来学python】零基础学习Pygame|第一期|知识点+小球反弹游戏案例奈樱. python(pygame)pygame 学习游戏 pip
一.安装PygamePygame是跨平台Python模块，很多编译器不会向用户提供该模块，需要我们自己安装。安装步骤：打开Pygame官网：www.pygame.org点击PYGAME2.6.0-25JUN,2024下载好之后，解压压缩包，安装路径最好放在c盘里Administrator文件里在菜单栏点击搜索，输入cmd，找到“命令提示符”输入命令pipinstallpygame运行的时候会发现命
【重构推荐系统】国产大模型驱动的电商个性化推荐完整实战：架构设计、推理优化与在线部署闭环观熵国产大模型部署实战全流程指南重构人工智能 Agent 智能体落地方案
个人简介作者简介：全栈研发，具备端到端系统落地能力，专注大模型的压缩部署、多模态理解与Agent架构设计。热爱“结构”与“秩序”，相信复杂系统背后总有简洁可控的可能。我叫观熵。不是在控熵，就是在观测熵的流动个人主页：观熵个人邮箱：[email protected]座右铭：愿科技之光，不止照亮智能，也照亮人心！专栏导航观熵系列专栏导航：AI前沿探索：从大模型进化、多模态交互、AIGC内容生成，到
LeetCode--38.外观数列 dying_man leetcode 算法
前言：之前我不是说，我后续可能会讲一下递归吗，现在它来了，这道题会用到回溯的方法，并且比较纯粹哦解题思路：1.获取信息：（下面这些信息差不多是力扣上面的题目信息了，所以我这一环节在这次题解中的意义不大）外观数列是一个数位字符串序列，由递归公式定义：countAndSay(1)="1"countAndSay(n)是countAndSay(n-1)的行程长度编码。行程长度编码（RLE）是一种字符串压缩
TDengine 3.3.5.0 新功能 —— 查看库文件占用空间、压缩率 TDengine （老段） TDengine 产品设计数据库时序数据库物联网 tdengine 涛思数据 iot
1.背景TDengine之前版本一直没有通过SQL命令查看数据库占用的磁盘空间大小，从3.3.5.0开始，增加了这个方便且实用的小功能，这里详细介绍下。2.SQL基本语法selectexprfrominformation_schema.ins_disk_usage[wherecondtion]行为说明：查看各个vgroup的各个组件磁盘占用情况，并且可以通过查询语句计算压缩率等。示例：taos>s
【lua】Linux上安装lua和luarocks包管理工具果壳~ lua linux 开发语言
目录安装lua安装luarocksluarocks其他命令安装lua首先打开lua官网https://lua.org点击download就可以看到安装脚本新建一个目录将压缩包下载到这个目录里curl-L-R-Ohttps://www.lua.org/ftp/lua-5.4.8.tar.gztarzxflua-5.4.8.tar.gzcdlua-5.4.8makealltest#最后还得加上make
Three.js + Vue 处理glb文件过大问题（DRACOLoader加载压缩glb） printf_824 vue 与 three javascript vue.js 前端
起因，three.jsediter导出的glb文件过于庞大，导致部署后文件加载过久解决方法：第一步（得有个blender），压缩：导出时把压缩勾选上这时候我们会得到一个glb文件，但与three.jsediter导出不同的的是，这个文件引入代码中会报如下错误这个警告表明在使用THREE.GLTFLoader时，没有提供DRACOLoader实例。DRACOLoader是用于加载Draco压缩格式的
2024年BCSP-X小高组基础知识题目（模拟题）天秀信奥编程培训 #BCXP-X模拟题北京BCSP-X试题讲解专栏 BCSP-X c++算法数据结构
一、单项选择计算机的核心部件是什么（）？A.显示器B.键盘C.中央处理器（CPU)D.鼠标将十进制小数9.375转换为二进制小数，其正确的二进制表示是（）。A.1001.11B.1011.11C.1001.011D.1011.011假设有一个内存显示为96MB的文件夹，里面存储的都是分辨率为1024×2048的24位图像，请问理论上存储了（）张图像？(不考虑图像技术压缩对内存的优化)A.16张B.
如何使用 ligpng 库进行图片解码应用开发openwrt linux sdd20x平台 ruihuan_2000 SSD20X openwrt linux 嵌入式 c++
文章目录前言一、libpng是什么？二、使用步骤1.引入库及头文件2.解码过程总结前言如何使用libpng库进行图片解码应用开发。一、libpng是什么？libpng是一个开源的、跨平台的图像处理库，用于处理和支持PNG（PortableNetworkGraphics）图像格式。PNG是一种无损压缩的图像格式，广泛用于互联网上的图像传输和存储。libpng提供了一系列的API和函数，使开发者可以在
批量图片压缩工具 - 高效图片优化解决方案空中湖图像处理 python
批量图片压缩工具-高效图片优化解决方案软件简介批量图片压缩工具是一款专为需要处理大量图片的用户设计的实用工具。它能够帮助您快速压缩JPG、PNG、GIF等多种格式的图片文件，在保持良好视觉质量的同时显著减小文件体积。点击查看软件展示页面主要功能1.多格式支持支持JPG/JPEG、PNG、GIF等多种常见图片格式自动识别文件类型并采用最优压缩算法2.批量处理可一次性选择多个文件或整个文件夹进行压缩支
DPDK之（七）—— support for vhost-user学习笔记何进哥哥 DPDK vhost DPDK
转地址：http://www.lai18.com/content/1851237.htmlX86体系早期没有在硬件设计上对虚拟化提供支持，因此虚拟化完全通过软件实现。一个典型的做法是通过优先级压缩（RingCompression)和二进制代码翻译（BinaryTranslation)相结合，VMM在特权级ring0,Guest操作系统在非特权级ring1,Guest应用程序在ring3。由于Gue
如何将高分辨率照片从 iPhone 发送到Android /iPhone Coolmuster iOS 安卓 iPhone iphone android ios
iPhone的相机功能强大，能拍摄出高分辨率的照片。分享这些照片时，可能会遇到压缩或文件大小限制的问题。本文将介绍几种方法，帮助您轻松地将高质量照片从iPhone发送到Android设备或另一台iPhone。第1部分：您可以发送高分辨率的iPhone图片吗？答案是肯定的。选择合适的发送方法和平台，就能确保从iPhone发送的高分辨率照片保持原始质量。第2部分：如何将高分辨率照片从iPhone发送到
AI重塑IT行业：从效率工具到认知杠杆的人机协同进化之路 AI_DL_CODE 人工智能之深度学习人工智能 IT行业变革人机协同 AI伦理软件开发网络安全职业转型
摘要：本文系统阐述AI技术对IT行业的革命性影响，揭示其作为"认知杠杆"而非"职业终结者"的本质。通过分析AI在软件开发、网络安全、数据决策等领域的应用实践，量化展示AI对编程效率（代码生成30%-50%）、测试周期（压缩40%）、故障修复时间（MTTR降低75%）等关键指标的提升。同时深入剖析人类在创新设计、伦理判断等维度的不可替代性，构建"AI处理确定性任务+人类主导价值创造"的双螺旋协作模型
HTTP请求与前端资源未优化的系统性风险与高性能优化方案编程实战派-李工《Java 前端性能优化 HTTP请求管理 GZIP压缩浏览器缓存策略 CDN加速实践全栈性能优化 Webpack配置技巧
目录前言一、未合并静态资源：HTTP请求的隐形杀手1.1多文件拆分的代价1.2合并策略与工具链实践二、未启用GZIP压缩：传输流量的浪费2.1文本资源的压缩潜力2.2服务端配置与压缩算法选择三、未配置浏览器缓存：重复请求的根源3.1缓存失效的性能损耗3.2Cache-Control策略分级应用四、CDN加速：全局性能优化的关键4.1静态资源分发的地理优化4.2实施CDN的最佳实践五、系统化提升网站
Redis 内存压缩原理 zxfBdd 数据库
Redis无疑是一个大量消耗内存的数据库，因此Redis引入了一些设计巧妙的数据结构进行内存压缩来减轻负担。ziplist、quicklist以及intset是其中最常用最重要的压缩存储结构。了解编码类型#Redis对外提供了string,list,hash,set,zset等数据类型，每种数据类型可能存在多种不同的底层实现，这些底层数据结构被称为编码(encoding)。以list类型为例，其经
深度学习学习指南努力的Lorre 深度学习人工智能
本帖子将以本书的逻辑和顺序做一个梳理：CS基础->AI算法->模型压缩->异构计算->AI框架->AI编译器《DeepLearningSystems》(https://deeplearningsystems.ai/)CS基础推荐书单所需的编程语言(C/C++、Python)就不多讲了，数据结构算法也是大学基础课程，不多赘述。对于操作系统需要多了解，推荐多看一看《深入理解计算机系统》(传说中的面试圣
LLM模型的一些思考巴基海贼王 nlp
对通用LLM模型进行Fine-tuning操作（SFT，supervisedfinetuning），带来的影响往往是有害的？从表象看，使用领域数据对LLM做Fine-tuning，通常会造成灾难性的“灾难遗忘”问题。简单点儿说，SFT在赋予对领域知识理解能力的同时，由于修正模型参数，导致模型遗忘之前学会的某些知识。目前的“智能=压缩”的理论是否正确？LLM的压缩能力是否可以拆解成单个神经元的“压缩
GIF&DDE qq_39573780 红外图像处理计算机视觉算法
红外图像动态范围压缩GIF&DDE本文主要介绍了一种高动态范围图像转化为8位可视图像的方法，根据论文[[1]][id]总结实现算法流程图1：算法流程图步骤：使用导向滤波将图像分为基础层和细节层，基础层表示图像的整体结构信息，细节层表示图像的细节纹理信息。对基础层使用直方图投影操作，将图像的动态范围从[0,65535]映射到[0，255]对细节层使用增益掩膜进行增强对基础层和细节层加权求和得到输出图
Java如何导出word(根据模板生成),通过word转成pdf,放压缩包 R-sz java word pdf
com.deepoovepoi-tl1.10.0-betaorg.apache.poipoi4.1.2org.apache.poipoi-ooxml4.1.2org.apache.poipoi-scratchpad4.1.2com.documents4jdocuments4j-local1.0.3com.documents4jdocuments4j-transformer-msoffice-wor
DeepSeek在软件开发中的应用（四）：智能代码审查与质量守护革命软考和人工智能学堂 #DeepSeek快速入门 Python开发经验 #深度学习 elasticsearch 大数据搜索引擎
引言：从人工审查到AI赋能"每个PullRequest都是潜在的技术债"——传统代码审查消耗30%的研发时间却只能发现60%的问题。DeepSeek正在重塑这一核心流程，本文将展示如何通过智能审查将缺陷发现率提升至92%，同时将审查时间压缩80%。一、DeepSeek审查引擎核心技术1.多维度代码分析矩阵分析维度检测能力技术实现代码坏味道发现重复代码/过深嵌套等25种模式模式匹配+机器学习安全漏洞
java压缩包解压之后怎么安装_解压之后压缩包可以删除吗网站推广优化yetaoaiueo java 服务器 linux windows 开发语言
java压缩包解压之后怎么安装：Java是一种广泛使用的编程语言，它可以在不同的操作系统上运行。在安装Java之前，您首先需要将Java的安装包解压缩。接下来，我将为您提供关于如何解压缩Java安装包和安装Java的详细步骤。java压缩包的解压缩Java安装包步骤如下：1.下载Java安装包：您需要从Oracle官方网站下载Java的安装包。根据您的操作系统和Java版本的要求，选择适合您的安装
php tp5生成word和压缩包韩淼燃面试php后端 php tp5生成word和压缩包
大模型·知识蒸馏·学习笔记小先生00101 笔记人工智能神经网络机器学习自然语言处理深度学习语言模型
第一部分：核心概念入门1.1什么是知识蒸馏？核心问题:深度学习模型（如大型神经网络）虽然性能强大，但其巨大的参数量和计算需求使其难以部署到手机、嵌入式设备等资源受限的平台。核心思想:知识蒸馏是一种模型压缩和优化的技术，其灵感来源于“教师-学生”范式。我们先训练一个复杂但性能强大的“教师模型”，然后利用这个教师模型来指导一个轻量级的“学生模型”进行学习。生动的比喻(Hinton,2015):这个过程
conda环境的创建与离线环境迁移 GaussWitten 实习笔记 conda python linux ubuntu
目录简述conda虚拟环境的创建conda环境的打包压缩与离线迁移安装whl文件与解压缩简述最近在一家芯片厂前端实习，组里做npu，然后leader给了个任务要装一个npu的simulator用来跑网络测性能，问题是该simulator给出了长长的pip依赖包，然后由于保密原因还必须在离线服务器上装，上传包都需要审批（难崩）。由于之前装conda环境都是直接简单的pipinstall和condai
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen