yuan892173701

JPEG文件编/解码详解

JPEG（Joint Photographic Experts Group）是联合图像专家小组的英文缩写。它由国际电话与电报咨询委员会CCITT（The International Telegraph and Telephone Consultative Committee）与国际标准化组织ISO于1986年联合成立的一个小组，负责制定静态数字图像的编码标准。

小组一直致力于标准化工作，开发研制出连续色调、多级灰度、静止图像的数字图像压缩编码方法，即JPEG算法。JPEG算法被确定为国际通用标准，其适用范围广泛，除用于静态图像编码外，还推广到电视图像序列的帧内图像压缩。而用JPEG算法压缩出来的静态图片文件称为JPEG文件，扩展名通常为*.jpg、*.jpe*.jpeg。

JPEG专家组开发了两种基本的压缩算法、两种数据编码方法、四种编码模式。具体如下：

压缩算法：

有损的离散余弦变换（Discrete Cosine Transform，DCT）；
无损的预测技术压缩。

数据编码方法：

哈夫曼编码；
算术编码；

编码模式：

基于DCT顺序模式：编/解码通过一次扫描完成；
基于DCT递进模式：编/解码需要多次扫描完成，扫描效果从粗糙到精细，逐级递进；
无损模式：基于DPCM，保证解码后完全精确恢复到原图像采样值；
层次模式：图像在多个空间多种分辨率进行编码，可以根据需要只对低分辨率数据作解码，放弃高分辨率信息。

在实际应用中，JPEG图像使用的是离散余弦变换、哈夫曼编码、顺序模式。

JPEG压缩编码算法的主要计算步骤如下：

(0) 8*8分块。

(1) 正向离散余弦变换(FDCT)。

(2) 量化(quantization)。

(3) Z字形编码(zigzag scan)。

(4) 使用差分脉冲编码调制(DPCM)对直流系数(DC)进行编码。

(5) 使用行程长度编码(RLE)对交流系数(AC)进行编码。

(6) 熵编码。

笔者在实践过程中查阅了大量的资料，发现大多数书籍资料和网上资料都是从编码角度分析JPEG的编/解码方式，并且都只是介绍编码过程中的主要方法。所以，本文从解码角度详细分析JPEG的编/解码过程，并且加入许多笔者实践过程中遇到的问题和解决方法，希望从另一个角度说明问题，以更好帮助读者结合其他资料解决问题。

不过，介绍解码过程之前，首先要了解JPEG文件中数据的存储格式。

一、JPEG文件格式介绍

JPEG文件使用的数据存储方式有多种。最常用的格式称为JPEG文件交换格式（JPEG File Interchange Format，JFIF）。而JPEG文件大体上可以分成两个部分：标记码(Tag)和压缩数据。

标记码由两个字节构成，其前一个字节是固定值0xFF，后一个字节则根据不同意义有不同数值。在每个标记码之前还可以添加数目不限的无意义的0xFF填充，也就说连续的多个0xFF可以被理解为一个0xFF，并表示一个标记码的开始。而在一个完整的两字节的标记码后，就是该标记码对应的压缩数据流，记录了关于文件的诸种信息。

常用的标记有SOI、APP0、DQT、SOF0、DHT、DRI、SOS、EOI。

注意，SOI等都是标记的名称。在文件中，标记码是以标记代码形式出现。例如SOI的标记代码为0xFFD8，即在JPEG文件中的如果出现数据0xFFD8，则表示此处为一个SOI标记。

本文附录列出一张完整的JPEG定义的标记表，供读者查阅。这里仅列出几个常用标记的标记代码、占用字节长度和表示的意义。

SOI，Start of Image，图像开始

标记代码 2字节固定值0xFFD8

APP0，Application，应用程序保留标记0

标记代码 2字节固定值0xFFE0

包含9个具体字段：
① 数据长度 2字节     ①~⑨9个字段的总长度   即不包括标记代码，但包括本字段
② 标识符 5字节固定值0x4A46494600，即字符串“JFIF0”
  ③ 版本号 2字节一般是0x0102，表示JFIF的版本号1.2 , 可能会有其他数值代表其他版本
  ④ X和Y的密度单位 1字节     只有三个值可选   0：无单位；1：点数/英寸；2：点数/厘米
  ⑤ X方向像素密度 2字节     取值范围未知
  ⑥ Y方向像素密度 2字节     取值范围未知
  ⑦ 缩略图水平像素数目 1字节     取值范围未知
  ⑧ 缩略图垂直像素数目 1字节     取值范围未知
  ⑨ 缩略图RGB位图长度可能是3的倍数,缩略图RGB位图数据

本标记段可以包含图像的一个微缩版本，存为24位的RGB像素。如果没有微缩图像（这种情况更常见），则字段⑦“缩略图水平像素数目”和字段⑧“缩略图垂直像素数目”的值均为0。

APPn，Application，应用程序保留标记n，其中n=1～15(任选)

标记代码 2字节固定值0xFFE1~0xFFF

包含2个具体字段：
① 数据长度 2字节 ①~②2个字段的总长度,即不包括标记代码，但包括本字段
② 详细信息数据长度-2字节内容不定

例如，Adobe Photoshop生成的JPEG图像中就用了APP1和APP13两个标记段分别存储了一幅图像的副本。

DQT，Define Quantization Table，定义量化表

标记代码 2字节固定值0xFFDB

包含9个具体字段：
① 数据长度 2字节字段①和多个字段②的总长度,即不包括标记代码，但包括本字段
② 量化表数据长度-2字节

(a)精度及量化表ID 1字节高4位：精度，只有两个可选值 0：8位；1：16位
低4位：量化表ID，取值范围为0～3

(b)表项 (64×(精度+1))字节 , 例如8位精度的量化表, 其表项长度为64×（0+1）=64字节

本标记段中，字段②可以重复出现，表示多个量化表，但最多只能出现4次。

SOF0，Start of Frame，帧图像开始

标记代码 2字节固定值0xFFC0

包含9个具体字段：
  ① 数据长度 2字节     ①~⑥六个字段的总长度,即不包括标记代码，但包括本字段
  ② 精度 1字节     每个数据样本的位数,通常是8位，一般软件都不支持 12位和16位
  ③ 图像高度 2字节     图像高度（单位：像素），如果不支持 DNL 就必须 >0
  ④ 图像宽度 2字节     图像宽度（单位：像素），如果不支持 DNL 就必须 >0
  ⑤ 颜色分量数 1字节     只有3个数值可选,1：灰度图；3：YCrCb或YIQ；4：CMYK,而JFIF中使用YCrCb，故这里颜色分量数恒为3
  ⑥颜色分量信息颜色分量数×3字节（通常为9字节）

(a)颜色分量ID 1字节

(b)水平/垂直采样因子 1字节高4位：水平采样因子,低4位：垂直采样因子（曾经看到某资料把这两者调转了）

(c)量化表 1字节当前分量使用的量化表的ID

本标记段中，字段⑥应该重复出现，有多少个颜色分量（字段⑤），就出现多少次（一般为3次）。

DHT，Difine Huffman Table，定义哈夫曼表

标记代码 2字节固定值0xFFC4

包含2个具体字段：
①数据长度 2字节字段①和多个字段②的总长度,即不包括标记代码，但包括本字段
② 哈夫曼表数据长度-2字节

(a)表ID和表类型 1字节高4位：类型，只有两个值可选 0：DC直流；1：AC交流,低4位：哈夫曼表ID，
注意，DC表和AC表分开编码

(b)不同位数的码字数量 16字节

(c)编码内容 16个不同位数的码字数量之和（字节）

本标记段中，字段②可以重复出现（一般4次），也可以致出现1次。例如，Adobe Photoshop 生成的JPEG图片文件中只有1个DHT标记段，里边包含了4个哈夫曼表；而Macromedia Fireworks生成的JPEG图片文件则有4个DHT标记段，每个DHT标记段只有一个哈夫曼表。

DRI，Define Restart Interval，定义差分编码累计复位的间隔

标记代码 2字节固定值0xFFDD

包含2个具体字段：
①数据长度 2字节固定值0x0004，①~②两个字段的总长度,即不包括标记代码，但包括本字段
②MCU块的单元中的重新开始间隔 2字节设其值为n，则表示每n个MCU块就有一个
RSTn标记。第一个标记是RST0，第二个是
RST1等，RST7后再从RST0重复。

如果没有本标记段，或间隔值为0时，就表示不存在重开始间隔和标记RST

SOS，Start of Scan，扫描开始 12字节

标记代码 2字节固定值0xFFDA

包含2个具体字段：
①数据长度 2字节 ①~④两个字段的总长度,即不包括标记代码，但包括本字段
②颜色分量数 1字节应该和SOF中的字段⑤的值相同，即：1：灰度图是；3： YCrCb或YIQ；4：CMYK。

而JFIF中使用YCrCb，故这里颜色分量数恒为3
③颜色分量信息
(a) 颜色分量ID 1字节
(b) 直流/交流系数表号 1字节高4位：直流分量使用的哈夫曼树编号,低4位：交流分量使用的哈夫曼树编号

④ 压缩图像数据
(a)谱选择开始 1字节固定值0x00
(b)谱选择结束 1字节固定值0x3F
(c)谱选择 1字节在基本JPEG中总为00

本标记段中，字段③应该重复出现，有多少个颜色分量（字段②），就出现多少次（一般为3次）。本段结束后，紧接着就是真正的图像信息了。图像信息直至遇到一个标记代码就自动结束，一般就是以EOI标记表示结束。

EOI，End of Image，图像结束 2字节

标记代码 2字节固定值0xFFD9

这里补充说明一下，由于在JPEG文件中0xFF具有标志性的意思，所以在压缩数据流(真正的图像信息)中出现0xFF，就需要作特别处理。具体方法是，在数据0xFF后添加一个没有意义的0x00。换句话说，如果在图像数据流中遇到0xFF，应该检测其紧接着的字符，如果是

1）0x00，则表示0xFF是图像流的组成部分，需要进行译码；

2）0xD9，则与0xFF组成标记EOI，则图像流结束，同时图像文件结束；

3）0xD0~0xD7,则组成RSTn标记，则要忽视整个RSTn标记，即不对当前0xFF和紧接的0xDn两个字节进行译码，并按RST标记的规则调整译码变量；

3）0xFF，则忽视当前0xFF，对后一个0xFF再作判断；

4）其他数值，则忽视当前0xFF，并保留紧接的此数值用于译码。

二、 JPEG解码过程详解

下面来详细讲述JPEG文件的解码过程。

1．读入文件的相关信息

按照上述的JPEG文件数据存储方式，把要解码的文件的相关信息一一读出，为接下来的解码工作做好准备。参考方法是，设计一系列的结构体对应各个标记，并存储标记内表示的信息。其中图像长宽、多个量化表和哈夫曼表、水平/垂直采样因子等多项信息比较重要。以下给出读取过程中的两个问题。

1）整个文件的大体结构

JFIF格式的JPEG文件(*.jpg)的一般顺序为：

SOI(0xFFD8)

APP0(0xFFE0)

[APPn(0xFFEn)]可选

DQT(0xFFDB)

SOF0(0xFFC0)

DHT(0xFFC4)

SOS(0xFFDA)

压缩数据

EOI(0xFFD9)

2）字的高低位问题

JPEG文件格式中，一个字（16位）的存储使用的是 Motorola 格式, 而不是 Intel 格式。也就是说, 一个字的高字节（高8位）在数据流的前面, 低字节（低8位）在数据流的后面，与平时习惯的Intel格式不一样。.

3）读出哈夫曼表数据

a）理论说明

在标记段DHT内，包含了一个或者多个的哈夫曼表。对于单一个哈夫曼表，应该包括了三部分：

l 哈夫曼表ID和表类型
这个字节的值为一般只有四个0x00、0x01、0x10、0x11。
0x00表示DC直流0号表；
0x01表示DC直流1号表；
0x10表示AC交流0号表；
0x11表示AC交流1号表。

l 不同位数的码字数量

JPEG文件的哈夫曼编码只能是1~16位。这个字段的16个字节分别表示1~16位的编码码字在哈夫曼树中的个数。

l 编码内容

这个字段记录了哈夫曼树中各个叶子结点的权。所以，上一字段（不同位数的码字数量）的16个数值之和就应该是本字段的长度，也就是哈夫曼树中叶子结点个数。

b）举例说明

以下面一段哈夫曼表数据举例说明（数据全部以16进制表示）：

11 00 02 02 00 05 01 06 01 00 00 00 00 00 00 00 00
00 01 11 02 21 03 31 41 12 51 61 71 81 91 22 13 32

红色部分（第1字节）为哈夫曼表ID和表类型，其值0x11表示此部分数据描述的是AC交流1号表。

蓝色部分（2~17字节）为不同位数的码字的数量。这16个数值实际意义为：没有1位和4位的哈夫曼码字；2位和3位的码字各有2个；5位码字有5个；6位和8位码字各有1个；7位码字各有6个；没有9位或以上的码字。

绿色部分（18~34字节）为编码内容。由蓝色部分数据知道，此哈夫曼树有0+2+2+0+5+1+6+1=17个叶子结点，即本字段应该有17个字节。这段数据表示17个叶子结点按从小到大排列，其权值依次为0、1、11、2、21、3、31、41……

4）建立哈夫曼树

a）理论说明

在读出哈夫曼表的数据后，就要建立哈夫曼树。具体方法为：

1）第一个码字必定为0。
如果第一个码字位数为1，则码字为0；
如果第一个码字位数为2，则码字为00；
如此类推。

2）从第二个码字开始，
如果它和它前面的码字位数相同，则当前码字为它前面的码字加1；
如果它的位数比它前面的码字位数大，则当前码字是前面的码字加1后再在后边添若干个0，直至满足位数长度为止。

b）举例说明

继续以上边的例子说明问题。

n 由于没有1位的码字，所以第一个码字的位数为2，即码字为00；

n 由于2位的码字有两个，所以第二个码字位数仍为2，即码字为00+1=01；

n 第三个码字为3位，比第二个码字长1位，所以第三个码字为：01+1=10，然后再添1个“0”，得100；

n ……

如此类推，最后得到这个哈夫曼树如下：

序号	码字长度	码字	权值
1	2	00	0x00
2	2	01	0x01
3	3	100	0x11
4	3	101	0x02
5	5	11000	0x21
6	5	11001	0x03
7	5	11010	0x31
8	5	11011	0x41
9	5	11100	0x12
10	6	111010	0x51
11	7	1110110	0x61
12	7	1110111	0x71
13	7	1111000	0x81
14	7	1111001	0x91
15	7	1111010	0x22
16	7	1111011	0x13
17	8	11111000	0x32

特别注意的是，如果中间有某个位数的码字缺失，例如没有4位码字，则应该在3位码字加1后，添加“00”补足5位，形成下一个5位码字。

在准备好所有的图片信息后，就可以对图片数据进行解码了。

2．初步了解图像数据流的结构

1）理论说明

分析图像数据流的结构，笔者准备以一个从宏观到微观的顺序为读者详细剖析，即：

数据流à最小编码单元à数据单元与颜色分量。

a) 在图片像素数据流中，信息可以被分为一段接一段的最小编码单元（Minimum Coded Unit，MCU）数据流。所谓MCU，是图像中一个正方矩阵像素的数据。

矩阵的大小是这样确定的：

查阅标记SOF0，可以得到图像不同颜色分量的采样因子，即Y、Cr、Cb三个分量各自的水平采样因子和垂直采样因子。大多图片的采样因子为4：1：1或1：1：1。其中，4：1：1即（2*2）：（1*1）：（1*1））；1：1：1即（1*1）：（1*1）：（1*1）。记三个分量中水平采样因子最大值为Hmax，垂直采样因子最大值为Vmax，那么单个MCU矩阵的宽就是Hmax*8像素，高就是Vmax*8像素。

如果，整幅图像的宽度和高度不是MCU宽度和高度的整数倍，那么编码时会用某些数值填充进去，保证解码过程中MCU的完整性（解码完成后，可直接忽视图像宽度和高度外的数据）。

在数据流中，MCU的排列方法是从左到右，从上到下。

b) 每个MCU又分为若干个数据单元。数据单元的大小必定为8*8，所以每个MCU的数据单元个数为Hmax*Vmax。

另外JPEG的压缩方法与BMP文件有所不同，它不是把每个像素的颜色分量连续存储在一起的，而是把图片分成Y，Cr，Cb三张子图，然后分别压缩。而三个颜色分量的采样密度（即采样因子）可能一样（例如1：1：1）也可能不一样（例如4：1：1）。

每个MCU内部，数据的顺序是Y、Cr、Cb。如果一个颜色分量有多个数据单元，则顺序是从左到右，从上到下。

2）举例说明

下面通过一幅32*35的图像，对上面两个问题列出两种采样因子的具体说明。

图 1 整张完整的图像（4：1：1）图 2 将图像的MCU1放大

图1及图3中灰色部分为实际图像大小（32px*35px）；粗虚线表示各个MCU的分界；细虚线表示MCU内部数据单元的分界。

a）采样因子为4：1：1

此时，Hmax=max（2，1，1）=2，Vmax=max（2，1，1）=2。所以，MCU的宽为Hmax*8=16像素，高为Vmax*8=16像素。图像实际的宽刚好是2个MCU，但高则稍稍大于2个MCU的高度，所以要补足3行MCU。

在数据流中，MCU的顺序是MCU1àMCU2àMCU3àMCU4àMCU5àMCU6。

每个MCU又分为Hmax*Vmax=2*2=4个数据单元。由于采样因子是4：1：1，即（2*2）：（1*1）：（1*1），所以Y分量的水平和垂直方向都是每2个像素采样2次；Cr分量和Cb分量的水平和垂直方向都是每2个像素采样1次。因此，在一个MCU来里边，Y分量有256个采样点，即4个完整的数据单元；Cr分量和Cb分量各自只有64个采样点。

如果以MCU1说明MCU数据的次序，则依次为Y₁、Y₂、Y₅、Y₆、Cr₁₂₅₆、Cb₁₂₅₆。图2中全部256个点均是Y的采样点，红色部分为Cr分量和Cr分量的采样点。

换句话说，对于整张图片来说，数据流的数据依次是：
[Y₁、Y₂、Y₅、Y₆、Cr₁₂₅₆、Cb₁₂₅₆] 、[Y₃、Y₄、Y₇、Y₈、Cr₃₄₇₈、Cb₃₄₇₈] 、[Y₉、Y₁₀、Y₁₃、Y₁₄、Cr_9101314、Cb_9101314]、……

图 3 整张完整的图像（1：1：1）

b）采样因子为1：1：1

如图3。Hmax=max（1，1，1）=1，Vmax=max（1，1，1）=2。所以，MCU的宽为Hmax*8=8像素，高为Vmax*8=8像素。图像实际的宽刚好是4个MCU，但高则稍稍大于4个MCU的高度，所以要补足5行MCU。

在数据流中，MCU的顺序是：
MCU1àMCU2àMCU3àMCU4à ………… àMCU18àMCU19àMCU20。

每个MCU又分为Hmax*Vmax=1*1=1个数据单元，也就是一个数据单元就是一个MCU。由于采样因子是1：1：1，即（1*1）：（1*1）：（1*1），所以Y分量、Cr分量和Cb分量的水平和垂直方向都是每1个像素采样1次，也就是图象的每一个像素都是采样点。因此，在一个MCU来里边，Y分量、Cr分量和Cb分量各自有64个采样点。有

因此，对于整张图片来说，数据流的数据依次是：
[Y₁、Cr₁、Cb₁]、[Y₂、Cr₂、Cb₂] 、[Y₃、Cr₃、Cb₃] 、………… [Y₁₉、Cr₁₉、Cb₁₉]、[Y₂₀、Cr20、Cb₂₀]。

3．颜色分量单元的内部解码

1）理论说明

“颜色分量单元”是笔者为说明问题而建立的概念，指的是MCU中某个颜色分量中的一个8*8数据块，例如上面提到的Y₁、Cr₁、Cb₁都是一个颜色分量单元。

图像数据流是以位（bit）为单位存储信息的。并且内部的数据都是在编码时通过正向离散余弦变换（FDCT）进行时空域向频率域变换而得到的结果，所以对于每个颜色分量单元都应该由两部分组成：1个直流分量和63个交流分量。

解码的过程其实就是哈夫曼树的查找过程。

首先查阅标记段SOS中的颜色分量信息，可以得出各个颜色分量对应使用的直流分量和交流分量使用的哈夫曼树编号。一般来说，
Y分量：直流分量：直流0号哈夫曼树，交流分量：交流0号哈夫曼树；

Cr分量：直流分量：直流1号哈夫曼树，交流分量：交流1号哈夫曼树；

Cb分量：直流分量：直流1号哈夫曼树，交流分量：交流1号哈夫曼树。

颜色分量单元内部综合运用了RLE行程编码和哈夫曼编码来压缩数据。每个像素的数据流由两部分构成：编码和数值，并且两者基本以互相隔开方式出现（除非该编码的权值为零）。具体读入单个颜色分量单元的步骤如下：

a）从此颜色分量单元数据流的起点开始一位一位的读入，直到读入的编码与该分量直流哈夫曼树的某个码字（叶子结点）一致，然后用直流哈夫曼树查得该码字对应的权值。权值（共8位）表示该直流分量数值的二进制位数，也就是接下来需要读入的位数。

b）继续读入位数据，直到读入的编码与该分量交流哈夫曼树的某个码字（叶子结点）一致，然后用交流哈夫曼树查得该码字对应的权值。权值的高4位表示当前数值前面有多少个连续的零，低4位表示该交流分量数值的二进制位数，也就是接下来需要读入的位数。

c）不断重复步骤b，直到满足交流分量数据结束的条件。而结束条件有两个，只要满足其中一个即可：

①当读入码字的权值为零，表示往后的交流变量全部为零；

②已经读入63个交流分量。

d）各个数值的译码是按下表进行的：

实际数值	编码长度	编码
0	0	-
-1,1	1	0,1
-3,-2,2,3	2	00,01,10,11
-7,-6,-5,-4,4,5,6,7	3	000,001,010,011,100,101,110,111
-15,……,-8,8,……,15	4	0000,……,0111,1000,……,1111
-31,……,-16,16,……,31	5	00000,……,01111,10000,……,11111
-63,……,-32,32,……,63	6	……
-127,……,-64,64,……,127	7	……
-255,……,-128,128,……,255	8	……
-511,……,-256,256,……,511	9	……
-1023,……,-512,512,……,1023	10	……
-2047,……,-1024,1024,……,2047	11	……
-4095,……,-2048,2048,……,4095	12	……
-8191,……,-4096,4096,……,8191	13	……
-16383,……,-8192,8192,……,16383	14	……
-32767,……,-16384,16384,……,32767	15	……

2）举例说明

下面举例说明以上几点。某个颜色分量单元数据如下：

D3 5E 6E 4D 35 f5 8A

若以二进制表示，则为：

1101 0011 0101 1110 0110 1110 0100 1101 0011 0101 1111 0101 1000 1010

假设该颜色分量单元对应以下直流哈夫曼树和交流哈夫曼树，则可将各个以位为单位的数据流拆分如下：

110 1001101 01 1 11001 101 11001 001 101 00 11010 1 1111010 11 00 01010

直流哈夫曼树交流哈夫曼树

序号	码字长度	码字	权值
1	2	00	0x00
2	2	01	0x01
3	2	10	0x02
4	3	110	0x07
5	4	1110	0x1e
6	5	11110	0x2e

序号	码字长度	码字	权值
1	2	00	0x00
2	2	01	0x01
3	3	100	0x11
4	3	101	0x02
5	5	11000	0x21
6	5	11001	0x03
7	5	11010	0x31
8	5	11011	0x41
9	5	11100	0x12
10	6	111010	0x51
11	7	1110110	0x61
12	7	1110111	0x71
13	7	1111000	0x81
14	7	1111001	0x91
15	7	1111010	0x22
16	7	1111011	0x13
17	8	11111000	0x32

详细说明一下：

读入数据流并对照直流哈夫曼树，第一个哈夫曼编码为110，其权值为6，所以往后读入6位数据“1001101”，译码成数值为77。因为每个颜色分量单元只有一个直流分量，所以下一个就是第一个交流分量了。

继续读入数据流并对照交流哈夫曼树，得哈夫曼编码为01，其权值为1，所以它的前面没有零，并往后读如1位数据“1”，译码成数值为1。如此往复，最后读到哈夫曼编码“00”，其权值为0，所以满足交流变量结束条件（最后剩余的“01010”对本颜色分量单元来说是冗余的，它可能属于下一个颜色分量单元）。

实际上，这段数据译码为：

77，（0，1），（0，5），（0，-6），（0，-3），（5，1），（2，3）

因此，把它置于1个8*8的矩阵中应为：

77	1	5	-6	-3	0
0	0	1	0	0	3
0	0	0	0	0	0
0	0	0	0	0	0
0	0	0	0	0	0
0	0	0	0	0	0
0	0	0	0	0	0
0	0	0	0	0	0

4．直流系数的差分编码

把所有的颜色分量单元按颜色分量（Y、Cr、Cb）分类。每一种颜色分量内，相邻的两个颜色分量单元的直流变量是以差分来编码的。也就是说，通过步骤3解码出来的直流变量数值只是当前颜色分量单元的实际直流变量减去前一个颜色分量单元的实际直流变量。也就是说，当前直流变量要通过前一个颜色分量单元的实际（非解码）直流分量来校正：

DCn=DCn-1+Diff

其中Diff为差分校正变量，也就是直接解码出来的直流系数。但如果当前颜色分量单元是第一个单元，则解码出来的直流数值就是真正的直流变量。

再次提醒的是，3个颜色分量的直流变量是分开进行差分编码的。也就是说，为1张图片解码时应设置3个独立的直流校正变量。另一个问题是，当数据流中出现标记RSTn，则3个颜色分量的直流差分校正变量Diff都需要重新复位到0。

5．反量化

不同的颜色分量使用不同的量化表，这个可以从标记段SOF中的颜色分量信息字段查得。一般是Y分量使用量化表0，而Cr、Cb两个分量共同使用量化表1。

反量化的过程比较简单。只需要对8*8的颜色分量单元的64个值逐一乘以对应的量化表内位置相同的值则可。图像内全部的颜色分量单元都要进行反量化。

6．反Zig-zag编码

如果将反量化后的每个8*8颜色分量单元的每个元素编号，如下图4，那么各反Zig-zag编码的过程就是把矩阵元素按图5重新排列。

图 4 将颜色分量单元元素编码图 5 反Zig-zag编码

关于量化和反Zig-zag编码的先后顺序，笔者查阅的几份资料有不同的见解。经过实践试验，解码的过程中，是应该直接用文件提供的量化表反量化矩阵数据，再将其反Zig-zag编码才能正确解码。

7．隔行的正负纠正

这个问题比较特别，因为在笔者认真阅读的几份资料中都没有提及此问题。而是笔者通过对已知图像进行JPEG编码压缩，然后和该图的JPEG文件数据对比发现的问题。具体原因不明。

实际上，就是必须对每个颜色分量单元的奇数行（每个颜色分量单元有8行，假设把它按0、1、……、6、7编出行号），即1、3、5、7行，进行取相反数操作（正的变负，负的变正）。

8．反离散余弦变换

之前提到，文件中的数据是在编码时通过正向离散余弦变换（FDCT）进行时空域向频率域变换而得到的结果，所以现在解码就必须将其反向离散余弦变换（IDCT），就是把颜色分量单元矩阵中的频率域数值向时空域转换。并且，原来的频率域的矩阵大小为8*8，则经过反向离散余弦变换后，时空域的矩阵仍然是8*8。

设正负纠正后的频率域矩阵为F[u][v]，而反向离散余弦变换后的矩阵为f[i][j]，其中0≤u,v,i,j≤7。具体使用的公式如下：

，其中

C（u）= （当u=0），C（u）=1（当u≠0）；

C（v）= （当v=0），C（u）=1（当v≠0）；

另外补充一下正向离散余弦变换的公式，用于编码：

9．YCrCb向RGB转换

要在屏幕上显示图像，就必须以RGB模式表示图像的颜色。所以，解码时需要把YCrCb模式向RGB模式转换。

正如前面提到，并不是每种颜色分量的采样因子都一样，所以转换时需要注意。如果采样因子是1：1：1，则每一个像素点的3个颜色分量都被采样，所以没有问题。但4：1：1的采样因子就不一样了。由“初步了解图像数据流的结构”一节中对4：1：1的采样因子的分析，可以知道一个MCU里有4个Y分量单元，而Cr分量和Cb分量各自只有1个分量单元。以图2为例，仅有的一个Cr分量单元（红色的64个采样点）应该平铺用于4个Y分量单元，即左上角16个值用于Y1，右上角16个值用于Y2，左下角16个值用于Y5，右下角16个值用于Y6。换句话说，一个Cr采样点服务于4个Y采样点。对于Cb分量，道理一样。

另外，由于离散余弦变化要求定义域的对称，所以在编码时把RGB的数值范围从[0，255]统一减去128偏移成[-128，127]。因此解码时必须为每个分量加上128。具体公式如下：

R=Y +1.402*Cb +128;

G=Y-0.34414*Cr -0.71414*Cb +128;

B=Y +1.772*Cb +128;

还有一个问题，通过变换得出的R、G、B值可能超出了其定义域，所以要作出检查。如果大于255，则截断为255；如果小于0，则截断为0。

下面补充RGB模式向YCrCb模式的公式：

Y =0.299*R +0.587*G +0.114*B ;

Cr= -0.1687*R - 0.3313*G +0.5*B +128;

Cb=0.5 *R - 0.4187*G - 0.0813*B+128;

至此，每个MCU的解码已经完成。而每一个MCU如何组成一幅完整的图像，请参考“初步了解图像数据流的结构”分析。

参考文献

[1] 李才伟，中山大学计算机系多媒体课程教学课件．

[2] 张益贞，Visual C++实现MPEG/JPEG编解码技术．北京：人民邮电出版社

[3] CCIT，Information Technology-digital Compression and Conding of Continuous-ton Still Images-requirements and Guidelines．http://www.wotsit.org/download.asp?f=itu-1150PDF （访问日期：2007-1-1）

[4] 公子御风，JFIF文件格式即JPEG文件交换格式(JPEG File Interchonge Format)．http://cat1226.bokee.com/4574350.html （访问日期：2006-12-29）

[5] 云风，JPEG 简易文档 V2.11．http://rtornados.bokee.com/2442419.html （访问日期：2006-12-30）

附录：JPEG定义的标记

标记名	标记代码	说明
帧开始标记，Start of Frame，非层次哈夫曼编码
SOF0	0xFFC0	基线离散余弦变换
SOF1	0xFFC1	扩展顺序离散余弦变换
SOF2	0xFFC2	递进离散余弦变换
SOF3	0xFFC3	空间顺序无损
帧开始标记，Start of Frame，层次哈夫曼编码
SOF5	0xFFC5	差分离散余弦变换
SOF6	0xFFC6	差分层次离散余弦变换
SOF7	0xFFC7	差分空间无损
帧开始标记，Start of Frame，非层次算术编码
JPEG	0xFFC8	为JPEG扩展保留
SOF9	0xFFC9	扩展顺序离散余弦变换
SOF10	0xFFCA	递进离散余弦变换
SOF11	0xFFCB	空间顺序无损
帧开始标记，Start of Frame，层次算术编码
SOF13	0xFFCD	差分离散余弦变换
SOF14	0xFFCE	差分层次离散余弦变换
SOF15	0xFFCF	差分空间无损
其他标记
DHT	0xFFC4	定义哈夫曼树表
DAC	0xFFCC	定义算术编码表
RST0	OxFFD0	差分编码累计复位，共8个
……	……
RST7	OxFFD7
SOI	OxFFD8	图像开始
EOI	OxFFD9	图像结束
SOS	0xFFDA	开始扫描，图像数据开始
DQT	0xFFDB	定义量化表
DNL	0xFFDC	定义线数
DRI	0xFFDD	定义差分编码累计复位的间隔
DHP	0xFFDE	定义层次级数
EXP	0xFFDF	展开参考图像
APP0	0xFFE0	为应用程序保留，共15个
……	……
APP15	0xFFEE
JPG0	0xFFF0	为JPEG扩展保留，共14个
……	……
JPG13	0xFFFD
COM	0xFFFE	注释
TEM	0xFF01	算术编码中作临时之用
RES	0xFF02	保留，共189个
……	……
RES	0xFFBF

你可能感兴趣的:(jpeg)

利用python实现图片格式之间的相互转换难得北窗高卧 python 开发语言
一、概要图片一般有多种格式，常见的图片格式包括：JPEG（.jpg或.jpeg）：一种广泛使用的有损压缩格式，适用于摄影图像和网页上的图片。PNG（.png）：一种无损压缩格式，支持透明度和更好的图像质量，常用于图标、图形和需要透明背景的图片。该图片是4通道的，外加一个透明通道。如截屏GIF（.gif）：一种支持动画和透明度的格式，常用于简单的动画和图标。BMP（.bmp）：一种无损格式，存储图像
ffmpeg批量将tif文件转成jpeg格式 winfredzhang 图像工具 ffmpeg tif jpeg 转换
1、cmd2、切换到安装ffmpeg的路径。3、输入命令：ffmpeg-start_number001-i"D:\ocr\%03d.tif"-start_number001-pix_fmtyuv420p-qscale:v1"D:\ocr\%03d.jpg"结果。
Python(PyTorch)和MATLAB及Rust和C++结构相似度指数测量导图亚图跨际 Python 交叉知识算法量化检查图像压缩质量低分辨率多光谱峰值信噪比端到端优化图像压缩手术机器人三维实景实时可微分渲染重建三维可视化
要点量化检查图像压缩质量低分辨率多光谱和高分辨率图像实现超分辨率分析图像质量图像索引/多尺度结构相似度指数和光谱角映射器及视觉信息保真度多种指标峰值信噪比和结构相似度指数测量结构相似性图像分类PNG和JPEG图像相似性近似算法图像压缩，视频压缩、端到端优化图像压缩、神经图像压缩、GPU变速图像压缩手术机器人深度估计算法重建三维可视化推理图像超分辨率算法模型三维实景实时可微分渲染算法MATLAB结构
获取image信息布丶Ding
NSData*data=UIImageJPEGRepresentation(image,1.0);CGImageSourceRefref=CGImageSourceCreateWithData((__bridgeCFDataRef)data,NULL);CFDictionaryRefdicRef=CGImageSourceCopyPropertiesAtIndex(ref,0,NULL);NSDi
C生万物函数的讲解与剖析【内附众多案例详解】 2401_84170337 c语言 java 开发语言
printf("交换前：a=%d,b=%d\n",a,b);swap(a,b);printf("交换后：a=%d,b=%d\n",a,b);return0;}*来看一下运行结果。可以看到两个数并没有发生交换![在这里插入图片描述](https://img-blog.csdnimg.cn/04248dabca704086bbe930d12efb1d0a.jpeg#pic_center)*那有小伙伴就
VOC数据集转换为CoCo数据集（亲测有效）情书学长人工智能学习笔记图像处理
#VOC数据集格式VOC格式的数据集分为3部分，Annotations、ImageSets、JPEGImages。（一）Annotations：存放数据标注的xml文件，格式如下：CUMID_train0001.pngC:\Users\86182\Desktop\CUMID_train\0001.pngUnknown2040136830MachineUnspecified0011933491451
Python数据获取——图片数据提取，2024年最新2024Python开发社招面试总结+解答分享 2401_84182318 2024年程序员学习 python 面试开发语言
一、利用exifread提取图片的EXIF信息=====================================================================================exifread介绍：EXIF信息，是可交换图像文件的缩写，是专门为数码相机的照片设定的，可以记录数码照片的属性信息和拍摄数据。EXIF可以附加于JPEG、TIFF、RIFF等文件之中
风日携友游东湖曾慕青衫
离骚.jpeg携手东湖去，斜风照面吹。城楼旗烈烈，楚市舍离离。盛势庄王驾，高卬屈子碑。冲天飞羽翼，香草美人思。
vue3中动态引入本地图片的两种方法 morenhaodan 前端 javascript vue.js
方法一推荐简单好用方法二constgetImg=index=>{constmodules=import.meta.glob('@/assets/nncs2/**/*.{png,svg,jpg,jpeg}',{eager:true})consturl=`/src/assets/nncs2/jiantou${index+1}.png`//console.log(modules)if(modules[u
常见图片格式区别 _耀北图形渲染
1.JPEG/JPG(JointPhotographicExpertsGroup)•特点：有损压缩•优点：•支持24位颜色（约1600万色），适合照片、复杂颜色渐变的图像。•压缩率高，文件体积小，适合网页使用。•缺点：•有损压缩会降低图像质量，尤其在多次保存时图像质量逐步下降。•不支持透明背景。•适用场景：照片、网页图片、社交媒体。2.PNG(PortableNetworkGraphics)•特点
使用Python将多张图片转换为动态GIF图像 FLK_9090 python 开发语言 pillow
在本文中，我们将学习如何使用Python编写代码，将多张静态图片转换为一个动态的GIF图像。无论你的图片格式是JPEG（.jpg）还是PNG（.png），我们都将使用Python中的PIL库来实现这一功能。通过本文的学习，你将了解如何利用Python编写简洁、高效的代码来处理图像，并创建出生动的动画效果。介绍动态GIF图像是一种在网络上广泛使用的图像格式，它可以将一系列静态图片串联起来，形成连续的
深入解析`node-html-to-image`的`main.ts`源码：实现HTML到图片的转换软考鸭 nodeHtmlToImage html 前端 nodeHtmlToImage
引言node-html-to-image是一个强大的Node.js库，它允许开发者将HTML内容转换为图片。本文将深入解析该库的main.ts文件，揭示其内部工作原理，并帮助开发者更好地理解和使用该库。项目背景与功能概述node-html-to-image的主要功能是将HTML字符串或文件渲染为图片。它支持多种输出格式（如PNG、JPEG等），并提供了一系列配置选项，如图片质量、透明度等。该库利用
Aspose.PDF功能演示：使用Java将图像转换为PDF Lee-Shyllen Aspose 文档开发文档格式转换 aspose 文档管理文档开发图像转PDF
PDF已成为在Internet上共享文档的通用格式。因此，各种其他文件格式在交换之前都将转换为PDF。流行的转换之一是将图像转换为PDF，其中可能包括PNG转换为PDF，JPEG转换为PDF，BMP转换为PDF等。因此，本文介绍如何使用Java将图像转换为PDF。将图像转换为PDFAspose.PDFforJava是一种流行的PDF操作API，可让您创建和处理PDF文件。此外，它还允许您使用Jav
《绘画学》理论介绍韩妙第
《绘画学》作者：韩妙第图片来自网络https://c-ssl.duitang.com/uploads/item/201606/17/20160617192140_JQLs5.jpeg日期：2022年08月17日《绘画学》理论介绍作者：韩妙第日期：2022年08月17日一．媒体性绘画作品就是一个媒体。通过这一个媒体，观众可以看到由绘画者用心描绘、编造的视觉性形象、故事以及内容。并且通过画面中的图景将
生活即早教 | 《跟早教专家学儿童潜能开发》 c0996d1a7c50
828e5815ad364c7081c96ae81cf302f9.jpeg看了彭小六的《洋葱阅读法》之后，总觉得阅读应该有个明确的目标。提出问题，在书中寻求答案，解决问题。读大J的新书，我却没有那么功利，就想一个字一个字，慢慢地读。有的章节，会给我很大的启发；而有的，已经不再适合这个年龄的多多，跳过也罢。对于早教，我一直觉得自己没做好。北上一年来，管着多多的吃喝拉撒和治疗，就有点儿力不从心了。妈妈
图片倒影 child_cool
A87C5877-1A82-4ED8-A48C-382C39708A6A.png方法一将图片添加到两个相同的layer上对要倒影的结果layer进行180度旋转使用渐变图层进行颜色处理letballoon=UIImage(named:"1.jpeg")lettopLayer=CALayer()topLayer.bounds=CGRect(x:0.0,y:0.0,width:balloon?.siz
正面管教•又一次的碰壁&觉醒若濛书_正面管教
父母的焦虑.jpeg【今日分享】爱娃联盟华丽老师摘自《父母的挑战》[美]鲁道夫·德雷克斯父母之爱会促使你高估孩子的优点，而对孩子未来的焦虑又会导致你放大他的缺点。这两个过程可能是并行不悖的。在某一时刻你的孩子看上去完美无缺，但是转瞬之间他又变得一无是处，前途堪忧。【实践分享】我们家姐姐今年9月升入大班。进入9月开始，幼儿园老师经常把孩子们一天的表现，主要从积极主动和课间活动表现（比如早操或跳绳等）
《跃迁》君琰77
WechatIMG36.jpeg如何利用规律和趋势，放大个人努力。01利用规律互联网时代，新知识、新技术扑面而来，如何跟上时代的快速发展，作为个体，我们需要升级心智、洞察趋势、聪明地勤奋，实现自我的跨越式成长。02在高价值区，做正确的事机会多意味着竞争大，想成为高手，就需具备深思熟虑后做选择的战略能力——要找到那些“更少但是更好”的事，用20%的投入获取80%的收益。03站位比努力更重要利用头部效
TROS DataFlow - USB Camera & mipi Sensor - rtsp WuChao_JMUer 地平线RDK X3系列板卡 RDK X3 ROS2
TROSDataFlow-USBCamera&mipiSensor-rtsp使用TROS的功能，通过USB或者mipi摄像头得到MJPEG数据，推理YOLOv5节点，得到目标检测结果，通过ros_rtsp将nv12数据变成标准的H264/H265码流推出。DataFlow示意图mipiUSBH264/H265推流展示编译ros_rtsp_server系统版本2.1.0,sudoaptupdate有
手搓python图片格式转换png jpg jpeg ico bmp 互转我不喜欢这个世界 python
importcustomtkinterasctkimportimageiofromtkinterimportfiledialog,messageboximportosdefconvert_image(input_path,output_path):"""Convertanimagefrominput_pathtotheformatspecifiedbyoutput_path."""image=im
砍柴写作营｜如何收集素材？文杰读书
喝咖啡读书.jpeg作者/文杰砍柴书院&写作营今日是写作营正式开课第5次会议，丹尼尔李老师分享如何收集素材？我是一名素食主义者，平时都是自己做饭，懂得一个美食的成败80%离不开食材的好坏，写作和美食也是一样。好的素材对一篇文章的影响力巨大，在个人知识储备不够的情况下，如何通过大量收集好的素材来丰满你的作品，显得格外重要。-01-顶端编辑选择素材的标准收集能用第一手素材，尽量不要用第二手素材；第一手
Python(C)图像压缩导图亚图跨际 Python C/C++交叉知识傅里叶压缩制作树结构象限量化模型有损压缩压缩解压缩算法矩阵分解
要点傅里叶和小波变换主成分分析彩色图压缩制作不同尺寸图像K均值和生成式对抗网络压缩无损压缩算法压缩和解压缩算法离散小波变换压缩树结构象限算法压缩矩阵分解有损压缩算法量化模型有损压缩算法JPEG压缩解压缩算法Python图像压缩图像压缩可以是有损的，也可以是无损的。无损压缩是档案用途的首选，通常用于医学成像、技术图纸、剪贴画或漫画。有损压缩方法，尤其是在低比特率下使用时，会产生压缩伪影。有损方法特别
安卓开发中的Glide库的使用我要最优解 android glide
Glide是一个功能强大的Android图片加载库，它支持加载多种类型的图片格式。以下是Glide可以处理的一些常见图片类型：JPEG:支持加载JPEG格式的图片。PNG:支持加载PNG格式的图片，包括具有透明背景的图片。GIF:支持加载GIF动画，并能够播放动画或将其作为静态帧显示。WebP:支持加载Google的WebP格式图片，包括无损和有损压缩的变体。Bitmap:可以直接加载Androi
QT界面优化，一些功能实现 fulmoon qt 开发语言
文本框焦点：ui->name->setFocus();背景色设置：setPalette(QPalette(Qt::white));//设置窗口为白色背景setAutoFillBackground(true);label标签插入图片，按比例缩放：QImageImage;Image.load(":/image1/panada.jpeg");QPixmappixmap=QPixmap::fromImag
Springboot 图片 Jonathan Star spring boot 后端 java
Springboot图片因为server.servlet.context-path:/api所以url是这个的时候http://127.0.0.1:9100/api/staticfiles/image/dd56a59d-da84-441a-8dac-1d97f9e42090.jpeg配置代码的前面的/api是不要写的packagecom.gk.study.config;importorg.spri
CMake构建学习笔记8-OpenSceneGraph库的构建 charlee44 CMake C++学习 CMake C++构建 OpenSceneGraph
1.概论在连续构建了zlib、libpng、libjpeg、libtiff、giflib以及freetype这几个库之后，接下来我们就要来一个大的，构建OpenSceneGraph这样大型库。OpenSceneGraph（简称OSG）是一个高性能、跨平台的三维图形应用程序框架，广泛应用于科学可视化、模拟仿真、游戏开发等领域。理论上来说，上述几个库不是OSG的必须依赖库，但是将它们作为依赖库构建，O
CMake构建学习笔记6-giflib库的构建 charlee44 CMake C++学习 CMake c++giflib c
前面构建的zlib、libpng、libjpeg和libtiff都提供了CMakeList.txt文件，因此都可以通过CMake进行构建。不过有的依赖库是并没有CMakeList.txt文件，也就是官方没有提供CMake的构建方式，例如本篇要说的GIFLIB。GIFLIB是一个开源的C库，用于处理GIF（图形交换格式）图像文件。GIFLIB是个典型的基于Linux环境的开源库，使用Makefile
鸿蒙（API 12 Beta3版）【使用ImageSource完成图片解码】图片开发指导移动开发技术栈鸿蒙开发 harmonyos openharmony 媒体 ArkTS 图片解码鸿蒙
图片解码指将所支持格式的存档图片解码成统一的[PixelMap]，以便在应用或系统中进行图片显示或[图片处理]。当前支持的存档图片格式包括JPEG、PNG、GIF、WebP、BMP、SVG、ICO、DNG。开发步骤全局导入Image模块。import{image}from'@kit.ImageKit';获取图片。方法一：获取沙箱路径。具体请参考[获取应用文件路径]应用沙箱的介绍及如何向应用沙箱推送
关于努力——看《奇葩说》有感倩姐姐的圈圈儿
今天晚上听奇葩说，辩题是“ta真的很努力，这句话是不是好话”，双方的辩论很精彩，都说得好有道理的样子。不过我个人还是觉得，被人夸赞努力是件很开心的事情，至少我的努力被别人看到了。愉悦.jpeg什么是努力？度娘说：努力就是尽量的使出自己的力气来做事。努力指用尽力气去做事情，后来指一种做事情的积极态度。比如说努力工作，努力学习。从字面意思上看，努力一定是要尽自己的最大能力去做事，不是随随便便开始结束就
鸿蒙（API 12 Beta3版）【使用Image完成图片解码】图片开发指导依赖JS对象移动开发技术栈鸿蒙开发 harmonyos openharmony 媒体鸿蒙图片依赖解码
图片解码指将所支持格式的存档图片解码成统一的[PixelMap]，以便在应用或系统中进行图片显示或[图片处理]。当前支持的存档图片格式包括JPEG、PNG、GIF、WebP、BMP、SVG、ICO、DNG。开发步骤添加依赖在进行应用开发之前，开发者需要打开native工程的src/main/cpp/CMakeLists.txt，在target_link_libraries依赖中添加libace_n
HttpClient 4.3与4.3版本以下版本比较 spjich java httpclient
网上利用java发送http请求的代码很多，一搜一大把，有的利用的是java.net.*下的HttpURLConnection，有的用httpclient，而且发送的代码也分门别类。今天我们主要来说的是利用httpclient发送请求。 httpclient又可分为 httpclient3.x httpclient4.x到httpclient4.3以下 httpclient4.3
Essential Studio Enterprise Edition 2015 v1新功能体验 Axiba .net
概述：Essential Studio已全线升级至2015 v1版本了！新版本为JavaScript和ASP.NET MVC添加了新的文件资源管理器控件，还有其他一些控件功能升级，精彩不容错过，让我们一起来看看吧！ syncfusion公司是世界领先的Windows开发组件提供商，该公司正式对外发布Essential Studio Enterprise Edition 2015 v1版本。新版本
[宇宙与天文]微波背景辐射值与地球温度 comsci 背景
宇宙这个庞大,无边无际的空间是否存在某种确定的,变化的温度呢? 如果宇宙微波背景辐射值是表示宇宙空间温度的参数之一,那么测量这些数值,并观测周围的恒星能量输出值,我们是否获得地球的长期气候变化的情况呢? &nbs
lvs-server 男人50 server
#!/bin/bash # # LVS script for VS/DR # #./etc/rc.d/init.d/functions # VIP=10.10.6.252 RIP1=10.10.6.101 RIP2=10.10.6.13 PORT=80 case $1 in start) /sbin/ifconfig eth2:0 $VIP broadca
java的WebCollector爬虫框架 oloz 爬虫
WebCollector主页： https://github.com/CrawlScript/WebCollector 下载：webcollector-版本号-bin.zip将解压后文件夹中的所有jar包添加到工程既可。接下来看demo package org.spider.myspider; import cn.edu.hfut.dmic.webcollector.cra
jQuery append 与 after 的区别小猪猪08
1、after函数定义和用法： after() 方法在被选元素后插入指定的内容。语法： $(selector).after(content) 实例： <html> <head> <script type="text/javascript" src="/jquery/jquery.js"></scr
mysql知识充电香水浓 mysql
索引索引是在存储引擎中实现的，因此每种存储引擎的索引都不一定完全相同，并且每种存储引擎也不一定支持所有索引类型。根据存储引擎定义每个表的最大索引数和最大索引长度。所有存储引擎支持每个表至少16个索引，总索引长度至少为256字节。大多数存储引擎有更高的限制。MYSQL中索引的存储类型有两种：BTREE和HASH，具体和表的存储引擎相关； MYISAM和InnoDB存储引擎
我的架构经验系列文章索引 agevs 架构
下面是一些个人架构上的总结，本来想只在公司内部进行共享的，因此内容写的口语化一点，也没什么图示，所有内容没有查任何资料是脑子里面的东西吐出来的因此可能会不准确不全，希望抛砖引玉，大家互相讨论。要注意，我这些文章是一个总体的架构经验不针对具体的语言和平台，因此也不一定是适用所有的语言和平台的。（内容是前几天写的，现附上索引）前端架构 http://www.
Android so lib库远程http下载和动态注册 aijuans andorid
一、背景在开发Android应用程序的实现，有时候需要引入第三方so lib库，但第三方so库比较大，例如开源第三方播放组件ffmpeg库, 如果直接打包的apk包里面, 整个应用程序会大很多.经过查阅资料和实验，发现通过远程下载so文件，然后再动态注册so文件时可行的。主要需要解决下载so文件存放位置以及文件读写权限问题。二、主要
linux中svn配置出错 conf/svnserve.conf:12: Option expected 解决方法 baalwolf option
在客户端访问subversion版本库时出现这个错误： svnserve.conf:12: Option expected 为什么会出现这个错误呢，就是因为subversion读取配置文件svnserve.conf时，无法识别有前置空格的配置文件，如### This file controls the configuration of the svnserve daemon, if you##
MongoDB的连接池和连接管理 BigCat2013 mongodb
在关系型数据库中，我们总是需要关闭使用的数据库连接，不然大量的创建连接会导致资源的浪费甚至于数据库宕机。这篇文章主要想解释一下mongoDB的连接池以及连接管理机制，如果正对此有疑惑的朋友可以看一下。通常我们习惯于new 一个connection并且通常在finally语句中调用connection的close()方法将其关闭。正巧，mongoDB中当我们new一个Mongo的时候，会发现它也
AngularJS使用Socket.IO bijian1013 JavaScript AngularJS Socket.IO
目前，web应用普遍被要求是实时web应用，即服务端的数据更新之后，应用能立即更新。以前使用的技术（例如polling）存在一些局限性，而且有时我们需要在客户端打开一个socket，然后进行通信。 Socket.IO(http://socket.io/)是一个非常优秀的库，它可以帮你实
[Maven学习笔记四]Maven依赖特性 bit1129 maven
三个模块为了说明问题，以用户登陆小web应用为例。通常一个web应用分为三个模块，模型和数据持久化层user-core, 业务逻辑层user-service以及web展现层user-web， user-service依赖于user-core user-web依赖于user-core和user-service 依赖作用范围 Maven的dependency定义
【Akka一】Akka入门 bit1129 akka
什么是Akka Message-Driven Runtime is the Foundation to Reactive Applications In Akka, your business logic is driven through message-based communication patterns that are independent of physical locatio
zabbix_api之perl语言写法 ronin47 zabbix_api之perl
zabbix_api网上比较多的写法是python或curl。上次我用java－－http://bossr.iteye.com/blog/2195679，这次用perl。for example: #!/usr/bin/perl use 5.010 ; use strict ; use warnings ; use JSON :: RPC :: Client ; use
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ brotherlamp linux运维工程师 linux运维工程师教程 linux运维工程师视频 linux运维工程师资料 linux运维工程师自学
比优衣库跟牛掰的视频流出了，兄弟连Linux运维工程师课堂实录，更加刺激，更加实在！ ----------------------------------------------------- 兄弟连Linux运维工程师课堂实录-计算机基础-1-课程体系介绍1 链接：http://pan.baidu.com/s/1i3GQtGL 密码：bl65 兄弟连Lin
bitmap求哈密顿距离-给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y( bylijinnan java
import java.util.Random; /** * 题目： * 给定N（1<=N<=100000）个五维的点A(x1,x2,x3,x4,x5)，求两个点X(x1,x2,x3,x4,x5)和Y(y1,y2,y3,y4,y5)， * 使得他们的哈密顿距离（d=|x1-y1| + |x2-y2| + |x3-y3| + |x4-y4| + |x5-y5|）最大
map的三种遍历方法 chicony map
package com.test; import java.util.Collection; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Set; public class TestMap { public static v
Linux安装mysql的一些坑 chenchao051 linux
1、mysql不建议在root用户下运行 2、出现服务启动不了，111错误，注意要用chown来赋予权限，我在root用户下装的mysql，我就把usr/share/mysql/mysql.server复制到/etc/init.d/mysqld, (同时把my-huge.cnf复制/etc/my.cnf) chown -R cc /etc/init.d/mysql
Sublime Text 3 配置 daizj 配置 Sublime Text
Sublime Text 3 配置解释(默认){// 设置主题文件“color_scheme”: “Packages/Color Scheme – Default/Monokai.tmTheme”,// 设置字体和大小“font_face”: “Consolas”,“font_size”: 12,// 字体选项：no_bold不显示粗体字，no_italic不显示斜体字，no_antialias和
MySQL server has gone away 问题的解决方法 dcj3sjt126com SQL Server
MySQL server has gone away 问题解决方法，需要的朋友可以参考下。应用程序（比如PHP）长时间的执行批量的MYSQL语句。执行一个SQL，但SQL语句过大或者语句中含有BLOB或者longblob字段。比如，图片数据的处理。都容易引起MySQL server has gone away。今天遇到类似的情景，MySQL只是冷冷的说：MySQL server h
javascript/dom:固定居中效果 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&
使用 Spring 2.5 注释驱动的 IoC 功能 e200702084 spring bean 配置管理 IOC Office
使用 Spring 2.5 注释驱动的 IoC 功能 developerWorks 文档选项将打印机的版面设置成横向打印模式打印本页将此页作为电子邮件发送将此页作为电子邮件发送级别：初级陈雄华 ([email protected]), 技术总监, 宝宝淘网络科技有限公司 2008 年 2 月 28 日 &nb
MongoDB常用操作命令 geeksun mongodb
1. 基本操作 db.AddUser(username,password) 添加用户 db.auth(usrename,password) 设置数据库连接验证 db.cloneDataBase(fromhost)
php写守护进程（Daemon） hongtoushizi PHP
转载自： http://blog.csdn.net/tengzhaorong/article/details/9764655 守护进程（Daemon）是运行在后台的一种特殊进程。它独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。守护进程是一种很有用的进程。php也可以实现守护进程的功能。 1、基本概念 &nbs
spring整合mybatis,关于注入Dao对象出错问题 jonsvien DAO spring bean mybatis prototype
今天在公司测试功能时发现一问题：先进行代码说明： 1，controller配置了Scope="prototype"（表明每一次请求都是原子型） @resource/@autowired service对象都可以（两种注解都可以）。 2，service 配置了Scope="prototype"（表明每一次请求都是原子型）
对象关系行为模式之标识映射 home198979 PHP 架构企业应用对象关系标识映射
HELLO!架构一、概念 identity Map:通过在映射中保存每个已经加载的对象，确保每个对象只加载一次，当要访问对象的时候，通过映射来查找它们。其实在数据源架构模式之数据映射器代码中有提及到标识映射，Mapper类的getFromMap方法就是实现标识映射的实现。二、为什么要使用标识映射？在数据源架构模式之数据映射器中 //c
Linux下hosts文件详解 pda158 linux
　1、主机名：　　无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。　　公网：IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。　　局域网：每台机器都有一个主机名，用于主机与主机之间的便于区分，就可以为每台机器设置主机
nginx配置文件粗解 spjich java nginx
#运行用户#user nobody;#启动进程,通常设置成和cpu的数量相等worker_processes 2;#全局错误日志及PID文件#error_log logs/error.log;#error_log logs/error.log notice;#error_log logs/error.log inf
数学函数 w54653520 java
public class S { // 传入两个整数，进行比较，返回两个数中的最大值的方法。 public int get( int num1, int nu

77	1	5	-6	-3	0
0	0	1	0	0	3
0	0	0	0	0	0
0	0	0	0	0	0
0	0	0	0	0	0
0	0	0	0	0	0
0	0	0	0	0	0
0	0	0	0	0	0

77	1	5	-6	-3	0
0	0	1	0	0	3
0	0	0	0	0	0
0	0	0	0	0	0
0	0	0	0	0	0
0	0	0	0	0	0
0	0	0	0	0	0
0	0	0	0	0	0

77	1	5	-6	-3	0
0	0	1	0	0	3
0	0	0	0	0	0
0	0	0	0	0	0
0	0	0	0	0	0
0	0	0	0	0	0
0	0	0	0	0	0
0	0	0	0	0	0