Slice of Life

实验五 JPEG解码

JPEG压缩编码原理简介

一般来说JPEG有两种基本压缩方法：

有损压缩：以DCT为基础，压缩比较高。
无损压缩：又称预测压缩，以二维DPCM为基础。

本文讨论基于DCT的压缩方法，其基本流程框图如下：（其实这张图也不是特别全面）

我们假设输入图像为f(x,y)，对其编解码过程进行简单描述：

1.预处理

一般将输入信息转为YUV空间进行处理。

将输入图像进行像块分割，对亮度信息分成8*8的像块。

直流电平下移，即直流电平下移2^7=128，提高编码效率。

2.DCT变换

即离散余弦变换，目的是去除空间冗余，是编码过程中唯一产生失真的环节，具体过程可查阅相关资料。

变换后得到F(u,v)系数块(8*8)，其特点为左上角的直流系数很大，往右下越高频系数越小。

3.量化

对F(u,v)，有量化系数Q(u,v)。对亮度和色度有不同的量化系数表，是通过实验和统计后确定的视觉阈值。

利用了人眼对色度信息和高频信息较不敏感的特点，量化系数中高频大于低频，色度大于亮度。
$[F(u,v)]_Q=(int)\frac{F(u,v)}{Q(u,v)}$

在解码端即
$F'(u,v)=[F(u,v)]_Q*Q(u,v)$
即可得到重建的F’(u,v)。

4.之字形扫描

量化后，右下角的高频系数大多为0.为提高游程编码效率用之字形（Zigzag）扫描读取量化后数据，顺序如下图。

5.DC系数DPCM编码

DC系数即系数块左上角的系数，代表该像块的直流部分，数值较大。

因为相邻像块直流系数往往有很大相关性，采用DPCM系数进行编码。

传送当前块和前一个块的DC系数差值。

6.AC系数游程编码

即对像块中除了左上角以外的系数，以之前zigzag扫描确定的顺序进行游程编码。

7.可变长熵编码

对编码为码字后的系数，为了消除其码字中的统计冗余，进行可变长编码。

采用的是Huffman编码。对亮度的DC,AC，色度的DC,AC有不同的Huffman编码表，还有“幅度值”的可变长编码表。具体过程可查阅相关资料。

8.解码

简单来说即编码的逆过程，最后得到重建图像f’(x,y)，和原图像之间有一定的误差e(x,y).

JPEG文件格式简介

JPEG数据语法规则

在JPEG文件中，数据被分成一个个segment，每一个都由一个marker作为开头标记这个字段的内容。

每个marker都有0xFF开头（除了SOI,EOI），后跟1字节的标记标识符和2字节的标识长度（高位在前低位在后），以及该标记对应的payload。

此外，若0xFF后跟0x00，则跳过不予分析。

通用的marker如下：

name	Bytes	payload	内容
SOI(Start of Image)	0xFFD8	—	图像开始
SOF0(Start of Image Baseline DCT)	0xFFC0	可变	说明采用Baseline DCT变换，并指明图像宽，高，采样格式等
SOF2(Start of Image Progressive DCT)	0xFFC2	可变	说明采用Progressive DCT变换，并指明图像宽，高，采样格式等
DHT(Define Huffman Table)	0xFFC4	可变	一个或多个Huffman表
DQT(Define Quantization Table)	0xFFDB	可变	一个或多个量化表
DRI(Define Restart Interval)	0xFFDD	2 bytes	指明RST段之间的间距
SOS(Start of Scan)	0xFFDA	可变	开始对图像的扫描
RSTn(Restart)	0xFFDn	可变	略
APPn(Application Specific)	0xFFEn	可变	略
COM(Comment)	0xFFFE	可变	文本信息
EOI(End of Image)	0xFFD9	—	图像结束

就不在此以一个JPEG文件为例说明了，时间不允许。。。
简而言之，要解码一个JPEG文件，首先要从它的marker入手。

JPEG解码程序

程序运行流程的简单分析

main()

int main(int argc, char *argv[])
{
     
  int output_format = TINYJPEG_FMT_YUV420P;
  char *output_filename, *input_filename;
  clock_t start_time, finish_time;
  unsigned int duration;
  int current_argument;
  int benchmark_mode = 0;
#if TRACE
  p_trace=fopen(TRACEFILE,"w");
  if (p_trace==NULL)
  {
     
	  printf("trace file open error!");
  }
#endif
  if (argc < 3)
    usage();

  current_argument = 1;
  while (1)
   {
     
     if (strcmp(argv[current_argument], "--benchmark")==0)
       benchmark_mode = 1;
     else
       break;
     current_argument++;
   }

  if (argc < current_argument+2)
    usage();

  input_filename = argv[current_argument];
  if (strcmp(argv[current_argument+1],"yuv420p")==0)
    output_format = TINYJPEG_FMT_YUV420P;
  else if (strcmp(argv[current_argument+1],"rgb24")==0)
    output_format = TINYJPEG_FMT_RGB24;
  else if (strcmp(argv[current_argument+1],"bgr24")==0)
    output_format = TINYJPEG_FMT_BGR24;
  else if (strcmp(argv[current_argument+1],"grey")==0)
    output_format = TINYJPEG_FMT_GREY;
  else
    exitmessage("Bad format: need to be one of yuv420p, rgb24, bgr24, grey\n");
  output_filename = argv[current_argument+2];

  start_time = clock();

  if (benchmark_mode)
    load_multiple_times(input_filename, output_filename, output_format);
  else
    convert_one_image(input_filename, output_filename, output_format);

  finish_time = clock();
  duration = finish_time - start_time;
  snprintf(error_string, sizeof(error_string),"Decoding finished in %u ticks\n", duration);
#if TRACE
  fclose(p_trace);
#endif
  return 0;
}

可以看到默认输出格式为YUV420。

对于JPEG解码从两个函数中选择，load_multiple_times()和covert_one_image()。选择哪个由变量benchmark确定。

两个函数大致相同，以下为convert_one_image()的代码：

convert_one_image()


int convert_one_image(const char *infilename, const char *outfilename, int output_format)
{
     
  FILE *fp;
  unsigned int length_of_file;
  unsigned int width, height;
  unsigned char *buf;
  struct jdec_private *jdec;
  unsigned char *components[3];

  /* Load the Jpeg into memory */
  fp = fopen(infilename, "rb");
  if (fp == NULL)
    exitmessage("Cannot open filename\n");
  length_of_file = filesize(fp);
  buf = (unsigned char *)malloc(length_of_file + 4);
  if (buf == NULL)
    exitmessage("Not enough memory for loading file\n");
  fread(buf, length_of_file, 1, fp);
  fclose(fp);

  /* Decompress it */
  jdec = tinyjpeg_init();
  if (jdec == NULL)
    exitmessage("Not enough memory to alloc the structure need for decompressing\n");

  if (tinyjpeg_parse_header(jdec, buf, length_of_file)<0)
    exitmessage(tinyjpeg_get_errorstring(jdec));

  /* Get the size of the image */
  tinyjpeg_get_size(jdec, &width, &height);

  snprintf(error_string, sizeof(error_string),"Decoding JPEG image...\n");
  if (tinyjpeg_decode(jdec, output_format) < 0)
    exitmessage(tinyjpeg_get_errorstring(jdec));

  /* 
   * Get address for each plane (not only max 3 planes is supported), and
   * depending of the output mode, only some components will be filled 
   * RGB: 1 plane, YUV420P: 3 planes, GREY: 1 plane
   */
  tinyjpeg_get_components(jdec, components);

  /* Save it */
  switch (output_format)
   {
     
    case TINYJPEG_FMT_RGB24:
    case TINYJPEG_FMT_BGR24:
      write_tga(outfilename, output_format, width, height, components);
      break;
    case TINYJPEG_FMT_YUV420P:
      write_yuv(outfilename, width, height, components);
      break;
    case TINYJPEG_FMT_GREY:
      write_pgm(outfilename, width, height, components);
      break;
   }

  /* Only called this if the buffers were allocated by tinyjpeg_decode() */
  tinyjpeg_free(jdec);
  /* else called just free(jdec); */

  free(buf);
  return 0;
}

大致流程为：

先将JPEG流输入变量buf中。

然后通过tiny_jpeg_parser()函数解析JPEG流中的头部信息（marker），获取解码需要的信息。

再用tiny_jpeg_decode()函数解码文件，解码流储存在变量jdec。

最后根据参数中的输出格式输出为新文件。

load_multiple_times()总体流程无二，只不过变为解码了1000次（一个for循环）后再输出文件。

再来看marker解析中的部分代码：

tinyjpeg_parse_header()

int tinyjpeg_parse_header(struct jdec_private *priv, const unsigned char *buf, unsigned int size)
{
     
  int ret;

  /* Identify the file */
  if ((buf[0] != 0xFF) || (buf[1] != SOI))
    snprintf(error_string, sizeof(error_string),"Not a JPG file ?\n");

  priv->stream_begin = buf+2;
  priv->stream_length = size-2;
  priv->stream_end = priv->stream_begin + priv->stream_length;

  ret = parse_JFIF(priv, priv->stream_begin);

  return ret;
}

static int parse_JFIF(struct jdec_private *priv, const unsigned char *stream)
{
     
  int chuck_len;
  int marker;
  int sos_marker_found = 0;
  int dht_marker_found = 0;
  const unsigned char *next_chunck;

  /* Parse marker */
  while (!sos_marker_found)
   {
     
     if (*stream++ != 0xff)
       goto bogus_jpeg_format;
     /* Skip any padding ff byte (this is normal) */
     while (*stream == 0xff)
       stream++;

     marker = *stream++;
     chuck_len = be16_to_cpu(stream);
     next_chunck = stream + chuck_len;
     switch (marker)
      {
     
       case SOF:
	 if (parse_SOF(priv, stream) < 0)
	   return -1;
	 break;
       case DQT:
	 if (parse_DQT(priv, stream) < 0)
	   return -1;
	 break;
       case SOS:
	 if (parse_SOS(priv, stream) < 0)
	   return -1;
	 sos_marker_found = 1;
	 break;
       case DHT:
	 if (parse_DHT(priv, stream) < 0)
	   return -1;
	 dht_marker_found = 1;
	 break;
       case DRI:
	 if (parse_DRI(priv, stream) < 0)
	   return -1;
	 break;
       default:
......
  return -1;
}

大致流程为：

检查SOI
检查APP0中的JFIF标识。
对DQT,DHT,SOF0,SOS进行解析，获得量化表内容和序号，Huffman表内容和序号，每个颜色分量的采样格式，使用表的序号等信息，为解码做好准备。（没有Huffman表则使用默认的Huffman表。）

对0xFF的进行忽略。

parse_SOF()

static int parse_SOF(struct jdec_private *priv, const unsigned char *stream)
{
     
  int i, width, height, nr_components, cid, sampling_factor;
  int Q_table;
  struct component *c;
......
  print_SOF(stream);

  height = be16_to_cpu(stream+3);
  width  = be16_to_cpu(stream+5);
  nr_components = stream[7];
......
  stream += 8;
  for (i=0; i<nr_components; i++) {
     
     cid = *stream++;
     sampling_factor = *stream++;
     Q_table = *stream++;
     c = &priv->component_infos[i];
......
     c->Vfactor = sampling_factor&0xf;
     c->Hfactor = sampling_factor>>4;
     c->Q_table = priv->Q_tables[Q_table];
......

  }
  priv->width = width;
  priv->height = height;
......

  return 0;
}

height,width获取当前图像的宽度高度，cid为每个分量的id，Q_table为使用的量化表序号。sampling_factor为水平&垂直采样因子。nr_components为颜色分量数。

parse_DHT()

对DHT的解析：函数parse_DHT()

static int parse_DHT(struct jdec_private *priv, const unsigned char *stream)
{
     
......
while (length>0) {
     
     index = *stream++;

     /* We need to calculate the number of bytes 'vals' will takes */
     huff_bits[0] = 0;
     count = 0;
     for (i=1; i<17; i++) {
     
	huff_bits[i] = *stream++;
	count += huff_bits[i];
     }
......
if (index & 0xf0 )
       build_huffman_table(huff_bits, stream, &priv->HTAC[index&0xf]);
     else
       build_huffman_table(huff_bits, stream, &priv->HTDC[index&0xf]);

     length -= 1;
     length -= 16;
     length -= count;
     stream += count;
  }
......

不同长度 Huffman 的码字数量：固定为 16 个字节，每个字节代表从长度为 1 到长度为 16 的码字的个数，以表中的分析，这 16 个字节之后的字节对应的就是每个符字对应的权值，这些权值的含义即为 DC 系数经 DPCM 编码后幅度值的位长。

首先将流中HuffmanTable有关数据输入数组huff_bits，使用**build_huffman_table()**建立Huffman表。

其中index & 0xf0即为Huffman表的序号，0为DC，1为AC。

parse_DQT()

static int parse_DQT(struct jdec_private *priv, const unsigned char *stream)
{
     
  int qi;
  float *table;
  const unsigned char *dqt_block_end;
......
  dqt_block_end = stream + be16_to_cpu(stream);
  stream += 2;	/* Skip length */

  while (stream < dqt_block_end)
   {
     
     qi = *stream++;
......
  table = priv->Q_tables[qi];
  build_quantization_table(table, stream);
  stream += 64;
  return 0;
}

qi存储量化表的ID。一般来说量化表ID取值为0-3，分为亮度的DC,AC量化，色度的DC,AC量化。

调用build_quantization_table()函数建立量化表。(每个表各调用一次)

parse_SOS()

unsigned int i, cid, table;
unsigned int nr_components = stream[2];
stream += 3;
for (i=0;i<nr_components;i++) {
     
    cid = *stream++;
    table = *stream++;
    fprintf(p_trace,"ComponentId:%d  tableAC:%d tableDC:%d\n", cid, table&0xf, table>>4);
	fflush(p_trace);
}

得到各分量分别使用的Huffman表，即cid和table。

解码:tiny_jpeg_decode()

获得必要的信息后即可开始解码。

int tinyjpeg_decode(struct jdec_private *priv, int pixfmt)
{
     
  unsigned int x, y, xstride_by_mcu, ystride_by_mcu;
  unsigned int bytes_per_blocklines[3], bytes_per_mcu[3];
  decode_MCU_fct decode_MCU;
  const decode_MCU_fct *decode_mcu_table;
  const convert_colorspace_fct *colorspace_array_conv;
  convert_colorspace_fct convert_to_pixfmt;

  if (setjmp(priv->jump_state))
    return -1;

  /* To keep gcc happy initialize some array */
  bytes_per_mcu[1] = 0;
  bytes_per_mcu[2] = 0;
  bytes_per_blocklines[1] = 0;
  bytes_per_blocklines[2] = 0;

  decode_mcu_table = decode_mcu_3comp_table;
  switch (pixfmt) {
     
     case TINYJPEG_FMT_YUV420P:
       colorspace_array_conv = convert_colorspace_yuv420p;
       if (priv->components[0] == NULL)
	 priv->components[0] = (uint8_t *)malloc(priv->width * priv->height);
       if (priv->components[1] == NULL)
	 priv->components[1] = (uint8_t *)malloc(priv->width * priv->height/4);
       if (priv->components[2] == NULL)
	 priv->components[2] = (uint8_t *)malloc(priv->width * priv->height/4);
       bytes_per_blocklines[0] = priv->width;
       bytes_per_blocklines[1] = priv->width/4;
       bytes_per_blocklines[2] = priv->width/4;
       bytes_per_mcu[0] = 8;
       bytes_per_mcu[1] = 4;
       bytes_per_mcu[2] = 4;
       break;

     case TINYJPEG_FMT_RGB24:
       colorspace_array_conv = convert_colorspace_rgb24;
       if (priv->components[0] == NULL)
	 priv->components[0] = (uint8_t *)malloc(priv->width * priv->height * 3);
       bytes_per_blocklines[0] = priv->width * 3;
       bytes_per_mcu[0] = 3*8;
       break;

     case TINYJPEG_FMT_BGR24:
       colorspace_array_conv = convert_colorspace_bgr24;
       if (priv->components[0] == NULL)
	 priv->components[0] = (uint8_t *)malloc(priv->width * priv->height * 3);
       bytes_per_blocklines[0] = priv->width * 3;
       bytes_per_mcu[0] = 3*8;
       break;

     case TINYJPEG_FMT_GREY:
       decode_mcu_table = decode_mcu_1comp_table;
       colorspace_array_conv = convert_colorspace_grey;
       if (priv->components[0] == NULL)
	 priv->components[0] = (uint8_t *)malloc(priv->width * priv->height);
       bytes_per_blocklines[0] = priv->width;
       bytes_per_mcu[0] = 8;
       break;

     default:
#if TRACE
		 fprintf(p_trace,"Bad pixel format\n");
		 fflush(p_trace);
#endif
       return -1;
  }

  xstride_by_mcu = ystride_by_mcu = 8;
  if ((priv->component_infos[cY].Hfactor | priv->component_infos[cY].Vfactor) == 1) {
     
     decode_MCU = decode_mcu_table[0];
     convert_to_pixfmt = colorspace_array_conv[0];
#if TRACE
     fprintf(p_trace,"Use decode 1x1 sampling\n");
	 fflush(p_trace);
#endif
  } else if (priv->component_infos[cY].Hfactor == 1) {
     
     decode_MCU = decode_mcu_table[1];
     convert_to_pixfmt = colorspace_array_conv[1];
     ystride_by_mcu = 16;
#if TRACE
     fprintf(p_trace,"Use decode 1x2 sampling (not supported)\n");
	 fflush(p_trace);
#endif
  } else if (priv->component_infos[cY].Vfactor == 2) {
     
     decode_MCU = decode_mcu_table[3];
     convert_to_pixfmt = colorspace_array_conv[3];
     xstride_by_mcu = 16;
     ystride_by_mcu = 16;
#if TRACE 
	 fprintf(p_trace,"Use decode 2x2 sampling\n");
	 fflush(p_trace);
#endif
  } else {
     
     decode_MCU = decode_mcu_table[2];
     convert_to_pixfmt = colorspace_array_conv[2];
     xstride_by_mcu = 16;
#if TRACE
     fprintf(p_trace,"Use decode 2x1 sampling\n");
	 fflush(p_trace);
#endif
  }

  resync(priv);

  /* Don't forget that block can be either 8 or 16 lines */
  bytes_per_blocklines[0] *= ystride_by_mcu;
  bytes_per_blocklines[1] *= ystride_by_mcu;
  bytes_per_blocklines[2] *= ystride_by_mcu;

  bytes_per_mcu[0] *= xstride_by_mcu/8;
  bytes_per_mcu[1] *= xstride_by_mcu/8;
  bytes_per_mcu[2] *= xstride_by_mcu/8;

  /* Just the decode the image by macroblock (size is 8x8, 8x16, or 16x16) */
  for (y=0; y < priv->height/ystride_by_mcu; y++)
   {
     
     //trace("Decoding row %d\n", y);
     priv->plane[0] = priv->components[0] + (y * bytes_per_blocklines[0]);
     priv->plane[1] = priv->components[1] + (y * bytes_per_blocklines[1]);
     priv->plane[2] = priv->components[2] + (y * bytes_per_blocklines[2]);
     for (x=0; x < priv->width; x+=xstride_by_mcu)
      {
     
	decode_MCU(priv);
	convert_to_pixfmt(priv);
	priv->plane[0] += bytes_per_mcu[0];
	priv->plane[1] += bytes_per_mcu[1];
	priv->plane[2] += bytes_per_mcu[2];
	if (priv->restarts_to_go>0)
	 {
     
	   priv->restarts_to_go--;
	   if (priv->restarts_to_go == 0)
	    {
     
	      priv->stream -= (priv->nbits_in_reservoir/8);
	      resync(priv);
	      if (find_next_rst_marker(priv) < 0)
		return -1;
	    }
	 }
      }
   }
......

  return 0;
}

首先通过垂直/水平采样因子确定MCU（minimum coding unit）的大小和输入图像的格式，得到每个MCU中8*8的宏块数量。

调用decode_MCU()进行解码，不同的MCU（不同的采样频率）有不同的算法，调用不同的函数。

比如：

decode_MCU_2x2_3planes对应的是4:2:0的采样格式

decode_MCU_2x1_3planes对应的是4:2:2的采样格式

decode_MCU_1x1_3planes对应的是4:4:4的采样格式

以decode_MCU_2x2_3planes为例：

static void decode_MCU_2x2_3planes(struct jdec_private *priv)
{
     
  // Y
  process_Huffman_data_unit(priv, cY);
  IDCT(&priv->component_infos[cY], priv->Y, 16);
  process_Huffman_data_unit(priv, cY);
  IDCT(&priv->component_infos[cY], priv->Y+8, 16);
  process_Huffman_data_unit(priv, cY);
  IDCT(&priv->component_infos[cY], priv->Y+64*2, 16);
  process_Huffman_data_unit(priv, cY);
  IDCT(&priv->component_infos[cY], priv->Y+64*2+8, 16);

  // Cb
  process_Huffman_data_unit(priv, cCb);
  IDCT(&priv->component_infos[cCb], priv->Cb, 8);

  // Cr
  process_Huffman_data_unit(priv, cCr);
  IDCT(&priv->component_infos[cCr], priv->Cr, 8);
}

大概过程为:

调用**process_Huffman_data_unit()得到DCT系数，调用IDCT()**函数得到YUV。这部分都在decode_MCU()中。

每次遇到RSTn时要清空之前的DCT系数。

具体代码（实在太长啦）不在此罗列。

最后得到YUV分量后，转换为特定的色彩空间存进priv，解完所有MCU后解码完成，输出特定格式得文件。

zigzag排序

在解码过程中需要用到zigzag排序。程序用这种方法解决。

static const unsigned char zigzag[64] =  
{
      
    0,  1,  5,  6, 14, 15, 27, 28,   
    2,  4,  7, 13, 16, 26, 29, 42,    
    3,  8, 12, 17, 25, 30, 41, 43,    
    9, 11, 18, 24, 31, 40, 44, 53,   
    10, 19, 23, 32, 39, 45, 52, 54,   
    20, 22, 33, 38, 46, 51, 55, 60,   
    21, 34, 37, 47, 50, 56, 59, 61,   
    35, 36, 48, 49, 57, 58, 62, 63 
};

即存储每个宏块中各块zigzag排序后的序号。

程序中定义的三个结构体

程序中定义的三个结构体优化了程序算法。三个结构体定义代码在tinyjpeg-internal.h中。

huffman_table

struct huffman_table
{
     
  /* Fast look up table, using HUFFMAN_HASH_NBITS bits we can have directly the symbol,
   * if the symbol is <0, then we need to look into the tree table */
  short int lookup[HUFFMAN_HASH_SIZE];
  /* code size: give the number of bits of a symbol is encoded */
  unsigned char code_size[HUFFMAN_HASH_SIZE];
  /* some place to store value that is not encoded in the lookup table 
   * FIXME: Calculate if 256 value is enough to store all values
   */
  uint16_t slowtable[16-HUFFMAN_HASH_NBITS][256];
};

Huffman表结构体。其中lookup[]为快速查表。code_size为码长。

component

struct component 
{
     
  unsigned int Hfactor;
  unsigned int Vfactor;
  float *Q_table;		/* Pointer to the quantisation table to use */
  struct huffman_table *AC_table;
  struct huffman_table *DC_table;
  short int previous_DC;	/* Previous DC coefficient */
  short int DCT[64];		/* DCT coef */
#if SANITY_CHECK
  unsigned int cid;
#endif
};

宏块结构体。Hfactor，Vfactor为水平，垂直采样。定义了两个Huffman_table成员分别对应AC表和DC表。

previous_DC为前一个宏块得DC系数，用于DC系数的DPC编码。

DCT[64]即存储了该宏块中8*8得DCT系数数值。

jdec_private

struct jdec_private
{
     
  /* Public variables */
  uint8_t *components[COMPONENTS];
  unsigned int width, height;	/* Size of the image */
  unsigned int flags;

  /* Private variables */
  const unsigned char *stream_begin, *stream_end;
  unsigned int stream_length;

  const unsigned char *stream;	/* Pointer to the current stream */
  unsigned int reservoir, nbits_in_reservoir;

  struct component component_infos[COMPONENTS];
  float Q_tables[COMPONENTS][64];		/* quantization tables */
  struct huffman_table HTDC[HUFFMAN_TABLES];	/* DC huffman tables   */
  struct huffman_table HTAC[HUFFMAN_TABLES];	/* AC huffman tables   */
  int default_huffman_table_initialized;
  int restart_interval;
  int restarts_to_go;				/* MCUs left in this restart interval */
  int last_rst_marker_seen;			/* Rst marker is incremented each time */

  /* Temp space used after the IDCT to store each components */
  uint8_t Y[64*4], Cr[64], Cb[64];

  jmp_buf jump_state;
  /* Internal Pointer use for colorspace conversion, do not modify it !!! */
  uint8_t *plane[COMPONENTS];

};

JPEG流结构体，在主程序中用此结构体存储解码后得到的JPEG流。

数据成员有图像的宽高信息，流长度信息，量化表和Huffman表信息等。

可以看到三个结构体可以看成三个层，层与层之间由嵌套关系。这种结构体的定义方法应该可以带来不小启发。

命令行参数

程序的命令行参数由以下几部分组成：

--benchmark(可无) 输入文件名（带后缀） 输出格式 输出文件名（不带后缀）

其中第一个可以不写。有这个即代表benchMode，解码1000次后才输出。

实验任务完成情况

任务1

逐步调试JPEG解码器程序。将输入的JPG文件进行解码，将输出文件保存为可供YUVViewer观看的YUV文件.

输入实验提供的test.jpg(1024*1024)。

源代码中没有输出为YUV文件的代码，只有输出为Y,U,V分量三个文件的代码：

static void write_yuv(const char *filename, int width, int height, unsigned char **components)
{
     
  FILE *F;
  char temp[1024];
  snprintf(temp, 1024, "%s.Y", filename);
  F = fopen(temp, "wb");
  fwrite(components[0], width, height, F);
  fclose(F);
  snprintf(temp, 1024, "%s.U", filename);
  F = fopen(temp, "wb");
  fwrite(components[1], width*height/4, 1, F);
  fclose(F);
  snprintf(temp, 1024, "%s.V", filename);
  F = fopen(temp, "wb");
  fwrite(components[2], width*height/4, 1, F);
  fclose(F);
}

要输出YUV文件，加上直接输出YUV文件的代码：

//tinyjpeg.h中
enum tinyjpeg_fmt {
     
   TINYJPEG_FMT_GREY = 1,
   TINYJPEG_FMT_BGR24,
   TINYJPEG_FMT_RGB24,
   TINYJPEG_FMT_YUV420P,
   TINYJPEG_FMT_YUV,//newly added
};
......
//main函数中
input_filename = argv[current_argument];
  if (strcmp(argv[current_argument+1],"yuv420p")==0)
    output_format = TINYJPEG_FMT_YUV420P;
  else if (strcmp(argv[current_argument+1],"rgb24")==0)
    output_format = TINYJPEG_FMT_RGB24;
  else if (strcmp(argv[current_argument+1],"bgr24")==0)
    output_format = TINYJPEG_FMT_BGR24;
  else if (strcmp(argv[current_argument+1],"grey")==0)
    output_format = TINYJPEG_FMT_GREY;
  else if (strcmp(argv[current_argument+1],"yuv")==0)
    output_format = TINYJPEG_FMT_YUV;//newly added
  else
    exitmessage("Bad format: need to be one of yuv420p, rgb24, bgr24, grey\n");
  output_filename = argv[current_argument+2];
 ......
 //convert_one_image()中
   switch (output_format)
   {
     
    case TINYJPEG_FMT_RGB24:
    case TINYJPEG_FMT_BGR24:
      write_tga(outfilename, output_format, width, height, components);
      break;
    case TINYJPEG_FMT_YUV420P:
      write_yuv(outfilename, width, height, components);
      break;
    case TINYJPEG_FMT_GREY:
      write_pgm(outfilename, width, height, components);
	case TINYJPEG_FMT_YUV:
      write_yuv_single(outfilename, width, height, components);//newly added
    break;
   }
......
//load_multiple_times()中
switch (output_format)
   {
     
    case TINYJPEG_FMT_RGB24:
    case TINYJPEG_FMT_BGR24:
      write_tga(outfilename, output_format, width, height, components);
      break;
    case TINYJPEG_FMT_YUV420P:
      write_yuv(outfilename, width, height, components);
      break;
    case TINYJPEG_FMT_GREY:
      write_pgm(outfilename, width, height, components);
	case TINYJPEG_FMT_YUV:
      write_yuv_single(outfilename, width, height, components);//newly added
      break;
   }
......
static void usage(void)
{
     
    fprintf(stderr, "Usage: loadjpeg [options]   \n");
    fprintf(stderr, "options:\n");
    fprintf(stderr, "  --benchmark - Convert 1000 times the same image\n");
    fprintf(stderr, "format:\n");
    fprintf(stderr, "  yuv420p - output 3 files .Y,.U,.V\n");
    fprintf(stderr, "  rgb24   - output a .tga image\n");
    fprintf(stderr, "  bgr24   - output a .tga image\n");
    fprintf(stderr, "  gray    - output a .pgm image\n");
	fprintf(stderr, "  yuv    - output a .yuv image\n");//newly added
    exit(1);
}
......
tinyjpeg_decode()
decode_mcu_table = decode_mcu_3comp_table;
  switch (pixfmt) {
     
	 case TINYJPEG_FMT_YUV:
     case TINYJPEG_FMT_YUV420P:
       colorspace_array_conv = convert_colorspace_yuv420p;
       if (priv->components[0] == NULL)
	 priv->components[0] = (uint8_t *)malloc(priv->width * priv->height);
       if (priv->components[1] == NULL)
	 priv->components[1] = (uint8_t *)malloc(priv->width * priv->height/4);
       if (priv->components[2] == NULL)
	 priv->components[2] = (uint8_t *)malloc(priv->width * priv->height/4);
       bytes_per_blocklines[0] = priv->width;
       bytes_per_blocklines[1] = priv->width/4;
       bytes_per_blocklines[2] = priv->width/4;
       bytes_per_mcu[0] = 8;
       bytes_per_mcu[1] = 4;
       bytes_per_mcu[2] = 4;
       break;
......
/**
 * Save a buffer in yuv file
 * newly added
 */
static void write_yuv_single(const char *filename, int width, int height, unsigned char **components)
{
     
  FILE *F;
  char temp[1024];

  snprintf(temp, 1024, "%s.yuv", filename);
  F = fopen(temp, "wb");
  fwrite(components[0], width, height, F);
  fwrite(components[1], width*height/4, 1, F);
  fwrite(components[2], width*height/4, 1, F);
  fclose(F);
}

我们为tiny_jpeg_fmt添加了TINYJPEG_FMT_YUV的类型，输入命令行参数为".yuv"时即可调用新添加的write_yuv_single()函数，输出4：2：0的YUV文件。

为此设置命令行参数为：

test.jpg yuv test

不调用1000次解压的函数，否则程序会跑的比较慢。

最后输出结果如下：

任务2

1.代码理解

对代码和结构体的理解已经在上面部分陈述过。

2.程序中的TRACE功能

在程序的几乎每个部分。都有如下的预处理命令块：

#if TRACE
...
#endif

这里的trace即在程序运行过程中记录下重要的信息，如解析DHT，解析DQT，采用的采样频率等等。

在main()中我们能找到如下语句：

#if TRACE
  p_trace=fopen(TRACEFILE,"w");
  if (p_trace==NULL)
  {
     
	  printf("trace file open error!");
  }
#endif
......
#if TRACE
  fclose(p_trace);
#endif

说明各种信息都记录在了TRACEFILE中。

tinyjpeg.h中的

#define  TRACEFILE "trace_jpeg.txt

决定了TRACEFILE的文件名。

如下图所示：

可以看到对marker解析的记录，Huffman表的内容等。

要关闭TRACE功能，在tinyjpeg.h中的#define TRACE 1改为：

#define TRACE 0

这样在编译过程中凡是碰到TRACE都会变成0，即不会执行TRACE的代码块。

改变后，工程中所有的TRACE代码块都会变成灰色，提醒你这部分不会运行。

TRACE在程序测试过程中寻找错误，获得过程信息等都有很大作用。

任务3

以txt文件输出所有的量化矩阵和所有的HUFFMAN码表。

显然，已有专门储存它们的变量，只要添加输出Huffman表和量化表的函数即可。

为了保证程序的流畅性，此部分代码添加在新的check_table代码块中。

添加代码：

//tinyjpeg.h中添加
#define check_table 1
FILE *Q_table;//add by nxn
FILE *H_table;//add by nxn
#define QTABLEFILE "qtable_jpeg.txt"//added
#define HTABLEFILE "htable_jpeg.txt"//added
......
//main()中添加
#if check_table
  Q_table=fopen(QTABLEFILE,"w");
  if (Q_table==NULL)
  {
     
	  printf("Q_table file open error!");
  }
  H_table=fopen(HTABLEFILE,"w");
  if (H_table==NULL)
  {
     
	  printf("H_table file open error!");
  }
#endif
......
#if check_table
  fclose(Q_table);
  fclose(H_table);
#endif
......
//build_quantization_table()中添加
for (i=0; i<8; i++) {
     
     for (j=0; j<8; j++) {
     
        #if check_table
	    fprintf(Q_table, "%d\t", ref_table[*zz]);//added 输出表的内容
        fflush(Q_table);
        if (j == 7)
        {
     
           fprintf(Q_table,"\n");
           fflush(Q_table);
        }
		#endif
       *qtable++ = ref_table[*zz++] * aanscalefactor[i] * aanscalefactor[j];
     }
   }
......
//parse_DQT()的循环中添加
#if check_table
     fprintf(Q_table, "Quantization_table [%d]:\n", qi);//added 输出量化表id
     fflush(Q_table);
#endif
......
//parse_DHT()中添加
#if check_table
	 fprintf(H_table,"Huffman table %s[%d] length=%d\n", (index&0xf0)?"AC":"DC", index&0xf, count);//added 输出huffman表类型和id
	 fflush(H_table);
#endif
......
//build_huffman_table中添加
 #if check_table
     fprintf(H_table,"val=%2.2x code=%8.8x codesize=%2.2d\n", val, code, code_size);//added 输出Huffman表内容
	 fflush(H_table);
#endif

将量化表和Huffman表分别输出到qtable_jpeg.txt和htable_jpeg.txt中

输出结果如下：

任务4，5

输出DC图像并统计其概率分布。输出某一个AC值图像并统计其概率分布。

首先在tinyjpeg.h中定义：

FILE *DCFILE;//added
FILE *ACFILE;//added
#define ACDC_output 1//added
#define DCoutputFILE "dc_jpeg.yuv"//added
#define ACoutputFILE "ac_jpeg.yuv"//added

main()函数中添加文件的打开和关闭代码

#if ACDC_output
  DCFILE=fopen(DCoutputFILE,"w");
  if (DCFILE==NULL)
  {
     
	  printf("DC output file open error!");
  }
  ACFILE=fopen(ACoutputFILE,"w");
  if (ACFILE==NULL)
  {
     
	  printf("AC output file open error!");
  }
#endif
......
#if ACDC_output
  fclose(DCFILE);
  fclose(ACFILE);
#endif

涉及到输出的部分，直接在tinyjpeg_decode()中添加输出语句即可。在得到的DCT数组中，DCT[0]即DC分量，DCT[1],DCT[2]。。。。。。即为AC分量。我们在这里取DCT[1]。

此外DC取值范围为-512-512，先抬高512在/4变为0-255.

因为AC的值往往较小，抬高128后便于观察。

由于原图为1024x1024，取每个8x8像块的一个系数，输出图像为128x128。

你可能感兴趣的:(Experiment)

面试题叫我小小飞
importnumpyasnpimportpandasaspdimportmatplotlib.pyplotasplt%matplotlibinlinedf=pd.read_csv('./2019_1117_MaRTy_Negin_Experiment.csv',skip_blank_lines=True,skiprows=[0,1,3,4],dtype={'Latitude_A':np.floa
nnUNet V2代码——生成dataset_fingerprint.json w1ndfly 阅读nnUNet V2代码人工智能计算机视觉深度学习机器学习卷积神经网络 nnU-Net V2 nnunet
前文请见nnUNetv2_plan_and_preprocess命令阅读nnUNet\nnunetv2\experiment_planning\dataset_fingerprint\fingerprint_extractor.py文件内只有一个DatasetFingerprintExtractor类，阅读它在DatasetFingerprintExtractor类内涉及的其他函数都在文章后半部分
Python训练营打卡Day45(2025.6.5） 2301_80505456 python 算法机器学习
知识点回顾：tensorboard的发展历史和原理tensorboard的常见操作tensorboard在cifar上的实战：MLP和CNN模型效果展示如下，很适合拿去组会汇报撑页数log_dir='runs/cifar10_mlp_experiment'ifos.path.exists(log_dir):i=1whileos.path.exists(f"{log_dir}_{i}"):i+=1l
使用numpy读取数据集编程小白煎堆 numpy
在python中，读取数据集最常用的就是pandas，但是作者现在要使用numpy读取数据，为什么呢？因为老师框定了可以调包的范围，只有numpy和matplotlib。#使用NumPy的loadtxt函数读取CSV文件train_data=np.loadtxt("experiment_02_training_set.csv",delimiter=',',skiprows=1,dtype=str)
解决Tensorflow找不到GPU的问题小猪皮蛋粥 tensorflow 人工智能 python
Tensorflow找不到GPU问题发现问题解决当我用以下代码查看GPU数量时，gpus返回的是一个空列表，说明tensorflow没有找到GPU。importtensorflowastf#查看gpu和cpu的数量gpus=tf.config.experimental.list_physical_devices(device_type='GPU')cpus=tf.config.experiment
【编译原理】一篇就够了——学习笔记与课程实验超详细整理一棵___大树编译原理学习笔记学习算法
⭐⭐⭐⭐⭐⭐Github主页https://github.com/A-BigTree更多学习笔记链接https://github.com/A-BigTree/college_assignment编译原理实验https://github.com/A-BigTree/college_assignment/compiler_Experiment如果可以，麻烦各位看官顺手点个star~如果文章对你有所帮助
Benchmarking PIM-attention: A Puncture Experiment on a Real Processing-in-Memory Architecture 简vae 软硬件结合 near data processing PIM for AI transformer
大语言模型（LLM）的高吞吐量服务需要一次批处理足够多的请求。然而，现有的推理系统面临着巨大的挑战。一方面，每个请求的键值缓存（KVcache）占用大量的内存，而且会动态增长和收缩，显存容量不足限制了批处理的大小；另一方面，attention算法中大量使用访存密集型的GEMV算子，显存带宽成为了系统瓶颈。为了解决这个问题，我们提出了PIM-attention。PIM提供了更大的内存容量和bank级
@FieldNameConstants（自动生成字段名称常量） c103363 java 后端 spring boot
背景：根据类属性生成字符串常量，当注解中要使用时就很方便了1.@FieldNameConstants是什么@FieldNameConstants是Lombok库中的一个注解，用于自动生成字段名称常量。当你在类中使用@FieldNameConstants注解时，Lombok会扫描类的所有字段，并为每个字段生成一个对应的常量。例如，如果你有一个类定义如下：importlombok.experiment
眸思MouSi：“听见世界” — 用多模态大模型点亮盲人生活猛码Memmat prompt 生活人工智能多模态人文
文章目录1.Introduction1.1APP细节展示2.Demo2.1论文链接2.2联系方式3.Experiment3.1多专家的结合是否有效？3.2如何更好的将多专家整合在一起？Reference让盲人听见世界，复旦眸思大模型打破视觉界限，用科技点亮新生活1.Introduction在这个世界上，视力是探索万物之美、与有灵万物互动的重要感官。而在中国，约有1700多万视力障碍者，相当于每10
重复暴（1）逃逸者F312
https://www.chime-frb.ca/repeatershttps://chime-experiment.ca/enCHIMEPublicationsDetectionofCosmological21cmEmissionwiththeCanadianHydrogenIntensityMappingExperimentCHIMECollaboration(arXiv:2202.01242
Prompt高级技巧：Few-Shots、COT、SC、TOT、Step-Back lichunericli ChatGPT 人工智能 chatgpt prompt
CRISPE框架如图所示。所谓CRISPE框架，指的是：CR：CapacityandRole（能力与角色）。你希望ChatGPT扮演怎样的角色。I：Insight（洞察），背景信息和上下文。S:（陈述），你希望ChatGPT做什么。P：Personality（个性），你希望ChatGPT以什么风格或方式回答你。E：Experiment（实验），要求ChatGPT为你提供多个答案。如果我们要定义一个
NeRF详解木盏三维重建 AI数学 NeRF 三维重建 NeRF 神经辐射场计算机视觉人工智能
论文标题：《NeRF:RepresentingScenesasNeuralRadianceFieldsforViewSynthesis》论文地址：https://arxiv.org/abs/2003.08934推荐代码：https://github.com/leviome/NeRF_experiment(由本人整理，代码不解处也欢迎留言讨论，如有帮助请给star～)文章目录前言隐式表达NeRF的训
C Language Experiment：统计数字字符和空格 Surgeon｀ c语言
**(题目源于PTA)**本题要求编写程序，输入一行字符，统计其中数字字符、空格和其他字符的个数。建议使用switch语句编写。输入格式:输入在一行中给出若干字符，最后一个回车表示输入结束，不算在内。输出格式:在一行内按照blank=空格个数,digit=数字字符个数,other=其他字符个数的格式输出。请注意，等号的左右各有一个空格，逗号后有一个空格。输入样例:在这里给出一组输入。例如：Reol
CCNP课程实验-05-Comprehensive_Experiment 烈火蜓蜻网络 CCNP课程 OSPF BGP EIGRP IPv6
目录实验条件网络拓朴基础配置实现IGP需求：1.根据拓扑所示，配置OSPF和EIGRP2.在R3上增加一个网段：33.33.33.0/24(用Loopback1模拟)宣告进EIGRP，并在R3上将EIGRP重分布进OSPF。要求重分布进OSPF后的路由Tag值设置为666，且Cost值能沿传递路径累加。但OSPF区域不能出现33.33.33.0/24这条路由。3.在R1上看到34.1.1.0/24
Level 6 Unit 3 Part 3 Listening Prison Experiment 1 那菲尔
Level6Unit3Part3ListeningPrisonExperiment1监狱实验In1971psychologistscreatedoneofthemostimportantexperimentsinthehistoryofpsychology.psychology英[saɪˈkɒlədʒi]美[saɪˈkɑ:lədʒi]n.心理学;心理状态;心理特点;心理影响Theexperimen
特辑｜疫情之下学到的英语 Brochure Broker 冷萃选手小刘
大家好呀！大家现在最关心的，一定是新冠病毒肺炎的疫情了，想想还在一线奋战的医护人员，我们不得不为他们点赞加油祝福！做这次特辑BrochureBroker的另一个原因是因为有同学私信我说想了解和这一方面的词汇和表达，于是乎，今天我来啦！最近新闻播报了许多疫情相关的数据和专业名词，今天小刘给大家整理一下，学习一些相关术语的表达，这样更好地将英语学习与最近事件和国内外要闻相结合。Experiment因为
英语流利说懂你英语 Level6 Unit3 Part3 Listening - Prison Experiment 2 wxl_dl
Thoughtheexperimentwasdesignedtolastforfourteendays,ithadtobestoppedafterjustsixdays.Ithadtobestoppedbecauseofwhatwashappeningtotheparticipants.Theinteractionsbetweentheprisonersandguardshadbecomehost
Flutter Dart Extension-methods使用 JohnsonZzzz
Dart2.7之后，支持对已有类型进行扩展如：voidtest(){boolisMobileNumber="电话号码".isMobileNumber;}即对String类扩展了isMobileNumber方法。如何实现呢？步骤一在项目根目录中创建analysis_options.yaml文件，把以下内容贴进去analyzer:enable-experiment:-extension-methods
OSDI 文章分享，论文（Theseus: an Experiment in Operating System Structure and State Management）的结构化文摘结构化文摘十分钟看懂一篇OSDI论文操作系统内核 rust 安全编译器
Authors:KevinBoos,RiceUniversity;NamithaLiyanage,YaleUniversity;RamlaIjaz,RiceUniversity;LinZhong,YaleUniversityAbstract:Thispaperdescribesanoperatingsystem(OS)calledTheseus.Theseusistheresultofmulti-
生物信息学之玩转Linux---学习笔记（一)---生信技能树 LiuYueRR
Linux系统是进行生物信息学分析的基石，许多生物信息学软件都是基于Linux系统开发的。所以学习Linux对于生物信息学分析尤为重要。学习链接：https://research.biomart.cn/experiment/course_detail.htm?id=25&from=wechat_20190713Linux系统具有很多优势：去可视化：使用命令行模式、节省计算资源文件和目录结构管理安全
PP-YOLOE: An evolved version of YOLO（2022.12）怎么全是重名 #YOLO 论文笔记 YOLO 目标检测深度学习
文章目录Abstract1.Introduction2.Method2.1.ABriefReviewofPP-YOLOv22.2.ImprovementofPP-YOLOEAnchor-freeBackboneandNeckTaskAlignmentLearning(TAL)EfficientTask-alignedHead(ET-head)3.Experiment4.Conclusion原文链接
信息检索与数据挖掘 | 【实验】检索评价指标MAP、MRR、NDCG 啦啦右一 #信息检索与数据挖掘大数据与数据分析数据挖掘算法人工智能
文章目录实验内容知识梳理实验步骤前情提要MAP评价指标函数MRR评价指标函数NDCG评价指标函数调试结果实验内容实现以下指标评价，并对Experiment2的检索结果进行评价MeanAveragePrecision(MAP)MeanReciprocalRank(MRR)NormalizedDiscountedCumulativeGain(NDCG)知识梳理MAP（MeanAveragePrecis
nodejs 异步架构平沙落雁子前端 javascript vue.js
nodejs的核心之一就是非阻塞的异步IO，于是想知道它是怎么实现的，挖了下nodejs源码，找到些答案，在此跟大家分享下。首先，我用了一段js代码test-fs-read.js做测试，代码如下：varpath=require('path'),fs=require('fs'),filepath=path.join(__dirname,'experiment.log'),fd=fs.openSync
Level6 Unit3 Part3.2 Listening - Prison Experiment 2 蘑菇尕熊
Thoughtheexperimentwasdesignedtolastfor14days,ithadtobestoppedafterjustsixdays.Ithadtobestoppedbecauseofwhatwashappeningtotheparticipants.Theinteractionsbetweentheprisonersandguardshadbecomehostileand
语义分割准确率、精确率、召回率、F1值计算代码小绵羊在努力语义分割精度指标计算深度学习
语义分割准确率、精确率、召回率、F1值计算使用提示：需要opencv库只需将预测结果文件路径与标签路径改一下只针对二分类哦（多分类可稍作修改）代码里正类的像素值为255，可做修改！1.精度指标TP正类判定为正类FP负类判定为正类FN正类判定为负类TN负类判定为负类importcv2importnumpyasnpimportos#预测结果路径pred_path=r'D:\experiment\u-n
seurat对象处理找锚点生信小博士 seurat r
在找锚点合并之前，需要把每个seurat对象的细胞名改变成唯一getwd()#改名字#教程地址#https://cloud.tencent.com/developer/article/1697249#https://bioconductor.org/packages/release/data/experiment/vignettes/scRNAseq/inst/doc/scRNAseq.html#
《商务与经济统计》第12版学习4 坚持做自己
第4章概率概率（probability）是对某一特定事件发生的可能性的数值度量。4.1试验、计数法则和概率分配在概率论中，我们把可以产生明确结果的过程定义为试验（experiment）。样本空间：试验所有可能结果组成的一个集合。任何一个特定的试验结果被称为样本点（samplepoint），它是样本空间中的一个元素。如抛硬币样本点只有两种：正面或反面。4.1.1计数法则和组合、排列多步骤试验的技术法
阅读笔记5：（SBERT）Sentence-BERT:Sentence Embeddings using Siamese BERT-Networks tuhaha
目录-Motivation：论文想要解决的问题-Methodology：本文提出的方法-experiment：实验结果Motivation-Bert直接生成的sentencerepresentation（SR）不能很好的表达句子的语义。（相似的句子距离更近）-所以设计网络来finetunebert，使得可以获取nice的SRMethodology-SBERTarchitecturewithclas
【如何写论文】硕博学位论文的结构框架、过程与大纲分析中杯可乐多加冰文本生成图像 text-to-image 笔记科技人工智能计算机视觉论文写作论文笔记
硕士论文可以说是毕业前最重要的一部分，也可以说是展示和检验你3年研究生学习的成果的一个考试。硕士论文答辩和检验合格，才能够顺利拿到毕业生和学位证，可见其重要性。目录一、基础框架1.1、摘要（Abstract）1.2、绪论（Introduction）1.3、文献综述（Literaturereview）1.4、方法（Method）1.5、实验（Experiment）1.6、结论与展望（Conclusi
KG2E 论文笔记懒狗的救赎知识图谱论文自然语言处理知识图谱人工智能深度学习机器学习
LearningtoRepresentKnowledgeGraphswithGaussianEmbedding-预备知识-Abstract-background-Algorithm-Experiment-ConclusionShizhuHe,KangLiu,JunZhao.ACM(2015).-预备知识多元高斯分布https://www.cnblogs.com/bingjianing/p/9117
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23