QKKKKathy

【数据压缩】第五次作业——LZW编码

LAW编码

文章目录

LAW编码
- 编码原理
- 解码原理
- 代码分析
- - 词典树
  - 初始化词典树
  - 当前字符是否在词典中
  - 添加新字符
  - 编码
  - 解码
  - - `DecodeString`
- 实验结果
- - 编解码测试
  - - 词典输出
    - 编码
    - 解码
  - 不同类型的文件
  - - 原文件
    - 编码后的文件
    - 各个文件的编码词典总数
    - 解码恢复后的文件
    - 统计分析
  - LZW编码的特点和应用
- 程序代码
- 实验总结

LZW的编码思想是不断从字符流中提取新的“词条”，然后用码字来表示这个“词条”，LZW编码是围绕“词典”转换表完成的。LZW编码器通过管理这个词典完成输入和输出之间的转换，输入是字符流，输出是n位表示的码字流。解码端输入码字流，边解码边建立词典，得到输出字符流。

编码原理

Step 1：将词典初始化为包含所有可能的单字符，当前前缀P初始化为空
Step 2：当前字符C=字符流中的下一个字符
Step 3：判断P+C是否在词典中
- 如果“是”，则用C扩展P，即让P=P+C，返回Step 2
- 如果“否”，则输出与当前前缀P相对应的码字W，将P+C添加到词典中，令P=C，返回Step 2

LZW编码算法首先初始化词典，然后顺序从待压缩文件中读入字符并按照上述算法执行编码，最后将编得的码字流输出至文件中。

解码原理

Step 1：在开始译码时词典包含所有可能的前缀根
Step 2：令CW：=码字流中的第一个码字。
Step 3：输出当前缀-字符串string.CW到码字流。
Step 4：先前码字PW：=当前码字CW。
Step 5：当前码字CW：=码字流的下一个码字。
Step 6：判断当前缀-字符串string.CW 是否在词典中。
- 如果”是”，则把当前缀-字符串string.CW输出到字符流。当前前缀P：=先前缀-字符串string.PW，当前字符C：=当前前缀-字符串string.CW的第一个字符。把缀-符串P+C添加到词典。
- 如果”否”，则当前前缀P：=先前缀-字符串string.PW。当前字符C：=当前缀-字符串string.CW的第一个字符。输出缀-符串P+C到字符流,然后把它添加到词典中。
Step 7：判断码字流中是否还有码字要译。
- 如果”是”，就返回步骤4。
- 如果”否”，结束。

LZW解码算法首先初始化词典，然后顺序从压缩文件中读入码字，并按照上述算法执行解码，最后将解得的字符串输出至文件中

代码分析

词典树

#define MAX_CODE 65535     //词典中最多的词典数目
struct {   //词典树
	int suffix;    //当前字符的尾缀字符
	int parent, firstchild, nextsibling;  //分别表示当前节点对应的母节点、第一个孩子节点、下一个兄弟节点
} dictionary[MAX_CODE+1];
int next_code;
int d_stack[MAX_CODE]; // stack for decoding a phrase，用来存储解码后的短语

这部分代码用来定义词典树

suffix：当前字符的尾缀字符

parent：当前节点的母节点

firstchild：当前节点的第一个孩子节点

nextsibling：当前节点的下一个兄弟（右边）节点

next_code：记录下一个词条的位置

初始化词典树

void InitDictionary( void){    //初始化词典
	int i;

	for( i=0; i<256; i++){    //单个字符写入词典，也就是词典树的第一层
		dictionary[i].suffix = i;   //尾缀字符
		dictionary[i].parent = -1;   //母节点
		dictionary[i].firstchild = -1;   //第一个孩子节点
		dictionary[i].nextsibling = i+1;   //下一个（右边的）兄弟节点
	}
	dictionary[255].nextsibling = -1;   //第一层最后一个词的兄弟节点
	next_code = 256;   //下一个词条的编码
}

这一部分代码用来初始化词典，词典中默认包含ascii码对应的256个字符，如果想要写入新的词条，则需要从第256个位置开始

当前字符是否在词典中

int InDictionary( int character, int string_code){   //判断词典中是否有当前字符character（尾缀），string_code是旧词条（前缀）
	int sibling;    //表示字符在词典中的位置
	if( 0>string_code) return character;    //如果string_code=-1，说明当前字符是单个字符，已经存在词典中了，因此直接返回当前字符即可
	sibling = dictionary[string_code].firstchild;   //找string_code的第一个孩子，如果此时string_code没有第一个孩子则sibling=-1
	while( -1<sibling){   //sibling>-1，表示string_code已经有孩子了，也就是已经有尾缀了
		if( character == dictionary[sibling].suffix) return sibling;   //如果当前字符与string_code的某一个尾缀相同，那么返回这个尾缀
		sibling = dictionary[sibling].nextsibling;  //每次循环后都让sibling的值等于它的下一个兄弟节点
	}
	return -1;    //如果没有找到就返回-1
}

如果输入的是单个字符，那么直接返回这个字符

如果不是，就找到它的第一个孩子节点，也就是第一个尾缀，判断是否与当前新字符相同，如果不同就找这个孩子节点的兄弟节点，直到所有孩子节点都找完。在这个过程中，如果有某一个孩子节点与当前的新字符相同，那么函数返回此时的sibling，如果找不到就返回-1

添加新字符

在词典树中的添加新字符

首先添加新字符的上下和右向关系，新字符的前缀是string_code，孩子节点和右边的兄弟节点都是-1。

再补充新字符的左向关系，通过找新字符前缀的第一个孩子节点，并不断向右，找到这个前缀的最后一个孩子节点后，将最后一个孩子节点的右边兄弟节点更新为当前新字符。

void AddToDictionary( int character, int string_code){  //读入的新字符character（尾缀）和旧词条string_code（前缀）
	int firstsibling, nextsibling;
	if( 0>string_code) return;   //如果string_code<0说明是一个单字符，返回即可
	//描述上下和右向的关系
	dictionary[next_code].suffix = character;   //下一个词条的尾缀为当前新字符
	dictionary[next_code].parent = string_code;  //这个尾缀character的母节点就是它的前缀是string_code
	dictionary[next_code].nextsibling = -1;    //这个尾缀的兄弟节点是-1
	dictionary[next_code].firstchild = -1;     //这个尾缀的第一个孩子节点是-1
	//描述左向的关系
	firstsibling = dictionary[string_code].firstchild;   //找前缀的第一个孩子，也是当前字符的第一个兄弟（最左边的）
	if( -1<firstsibling){	// the parent has child   前缀有孩子
		nextsibling = firstsibling;   //先让下一个兄弟节点为第一个孩子
		while( -1<dictionary[nextsibling].nextsibling )   //循环找兄弟节点的下一个兄弟节点，如果>-1说明还有兄弟节点
			nextsibling = dictionary[nextsibling].nextsibling;  //更新兄弟节点为右边的兄弟节点
		dictionary[nextsibling].nextsibling = next_code;    //直到兄弟节点的右边没有兄弟节点的时候，将新字符作为这个兄弟节点的兄弟节点
															//此时新字符成为了当前前缀为string_code的最后一个孩子（在最右边）
	}else{// no child before, modify it to be the first   前缀没有孩子的时候，当前新字符就是这个前缀的第一个孩子
		dictionary[string_code].firstchild = next_code;   //设置当前字符为前缀的第一个孩子
	}
	next_code ++;    //每添加一个字符，next_code++
}

编码

先利用fseek函数确定读入的需要编码的文件长度
利用InitDictionary函数为词典初始化
循环运行，每次从文件中读取一个字符，直到读不出字符为止，每次读入的字符就是之前说过的C
利用InDictionary函数判断读入的字符是否在词典树中
将InDictionary函数的返回值赋给index变量
如果index>=0说明词典树中有当前字符和旧词条组成的字符串，就将index的值赋给string_code，也就是P<-P+C
如果index<0，就说明词典树中没有当前字符和旧词条组成的字符串，因此利用AddToDictionary函数在词典树中添加新字符

void LZWEncode( FILE *fp, BITFILE *bf){
	int character;    //新字符
	int string_code;    //已编码字符，旧词条
	int index;      //索引
	unsigned long file_length;    //文件长度

	fseek( fp, 0, SEEK_END);   //文件指针置文件尾
	file_length = ftell( fp);  //获取文件长度
	fseek( fp, 0, SEEK_SET);   //文件指针置文件头
	BitsOutput( bf, file_length, 4*8);   //调用BitsOutput函数
	InitDictionary();    //初始化词典
	string_code = -1;    //初始值赋值为-1，方便在第一次判断的时候判断读取是否为单个字符
	while( EOF!=(character=fgetc( fp))){  //fgetc是从文件中读取一个字符，EOF是文件结束的标志，从文件中读取字符，直到读到结束标志
        //fgetc是从文件指针stream指向的文件中读取一个字符，读取一个字节后，光标位置后移一个字节。格式：int fgetc(FILE *stream);。
		index = InDictionary( character, string_code);    //判断当前字符是否在词典中，返回字符在词典中的index，如果不在则返回-1
		if( 0<=index){	// string+character in dictionary    index>=0说明旧字符+当前新字已经在词典中了
			string_code = index;  //更新当前的旧词条为先前的旧词条+当前的新字符 P<-P+C
		}else{	// string+character not in dictionary    如果index返回-1，说明当前字符不在词典中
			output( bf, string_code);   //定义的输出，向编码后的文件中输出旧词条
			if( MAX_CODE > next_code){	// free space in dictionary   如果词典中还有空间
				// add string+character to dictionary 
				AddToDictionary( character, string_code);    //将新字符串添加到词典中
			} 
			string_code = character;   //当前字符变为了旧字符，P<-C
		}
	}
	output( bf, string_code);  //循环读完文件后输出最后一个旧字符
}

解码

解码端也需要先初始化词典，并读取出解码文件的长度
之后进入while循环，每一次循环都是一次解码的过程
- 如果CW>=next_code，那么就说明当前码字已经不在词典中了。这是因为编码和解码过程实际上是有时差的，编码的时候当输入第二个字符且第一个字符与第二个字符的组合未出现在词典中时，才会把第一个字符对应的码字输出，新的字符写入词典，但是对于解码端来说，只要收到码字就会开始解码。因此，如果在编码端词条刚写入词典就被使用了，这个时候解码端就会因为时差而无法在词典中找到新输入的码字对应的字符。又因为只有在编码端出现形似ababa的字符流时才会产生这样的情况，因此解码端只要收到不在词典中的码字的时候，只需要把上一个码字对应的字符的第一位放到当前码字对应的字符的最后一位即可得到码字的解码字符。所以这个时候令d_stack[0] = character即可，这里character=上一个码字的第一位，而d_stack[0]=当前码字的最后一位，并将上一个码字last_code对应的字符串也写入d_stack。
- 如果CW，就说明码字已经在词典中了，可以直接根据词典解码出对应的字符或字符串，因此直接将new_code对应的字符串写入d_stack即可

 
   利用DecodeString函数计算每次解码字符串的长度，返回后令character = d_stack[phrase_length - 1]，也就是当前解码字符串的第一个字符 
   之后的while循环中就是将倒序存入d_stack的字符串输出到文件中 
   如果词典中还有空间，就将上一个字符串与当前解码字符串的第一个字符写入词典，同时将当前码字赋值给上一个码字，并进入下一次循环，直到整个文件都解码完为止

 
  void LZWDecode( BITFILE *bf, FILE *fp){
	int character;    //字符
	int new_code, last_code;   //new_code就是CW，表示码流中的下一个码字，last_code就是PW，表示上次解码的码字
	int phrase_length;    //每一个短语的长度，其实是每一次解码字符串的长度
	unsigned long file_length;    //文件长度

	file_length = BitsInput(bf, 4 * 8);   //编码后压缩文件的大小
	if (-1 == file_length) file_length = 0;
	InitDictionary();    //解码端也需要初始化词典
	last_code = -1;   //先设置前一个码字为-1，因为在第一个码字之前是空值

	while (0 < file_length) {   //当文件长度>0的时候进入循环，也就是仍有未解码的码字时进入循环
		new_code = input(bf);    //定义的输入，从压缩后的文件中读入码字
		if (new_code >= next_code) {   //this is the case CSCSC( not in dict)，除了第一次以外，每次都要判断新的字符是否在词典中
									   //如果新的码字比当前词典中最后一个码字要大，就说明新的码字已经不在词典中了
			d_stack[0] = character;    //先将character给d_stack[0]，如果新的码字不在词典中，那么新的码字对应的最后一个字符就是上一个码字的第一个字符
			phrase_length = DecodeString(1, last_code);  //此时d_stack要从1开始向后存储上一个码字的字符及其向上对应的母节点，得到解码字符串存入d_stack并返回字符串长度
		}
		else {   //如果新的码字小于等于当前的最后一个码字，说明新码字在词典中
			phrase_length = DecodeString(0, new_code);  //此时d_stack从0开始向后存储新码字的字符及其向上对应的母节点，得到解码字符串存入d_stack并返回字符串长度
		}
		character = d_stack[phrase_length - 1];   //解码后的最后一个字符，其实是当前码字对应的字符流中的第一个字符
		while (0 < phrase_length) {   //解码存储符号时d_stack是从最后一个子节点倒序存储到最开始的母节点
			phrase_length--;   //因此d_stack是倒序存储的，通过phrase_length来决定此次将多少字符解压缩到文件中
			fputc(d_stack[phrase_length], fp);  //将d_stack中存储的字符写入文件
            //函数功能： 将字符c写到文件指针fp所指向的文件的当前写指针的位置。函数格式：int fputc (int c, FILE *fp)。
			file_length--;  //压缩文件剩余的未解压缩的量
		}
		if (MAX_CODE > next_code) {   //如果此时词典还不满的话
			AddToDictionary(character, last_code);    //将上一个字符（last_code）和当前码字对应字符流中的第一个字符（character）写入词典
		}
		last_code = new_code;   //CW->PW
	}
}
 
  DecodeString 
  该函数返回每次解码时解码字符串的长度 
  count用来记录当前码字的解码字符流的长度，d_stack存储解码字符流，每次解压缩的字符串都会倒序存入d_stack，因此向文件中写入的时候需要倒序将里面的内容取出。 
  start代表从d_stack[0]开始存储还是d_stack[1]开始存储，code表示最后一个子节点对应的码字，通过它来找到子节点的字符并且找到它的母节点对应的码字，循环直到找到最开始的码字。 
  int DecodeString( int start, int code){
	int count;   //记录当前解码字符流的长度
	count = start;   //从0/1开始
	while (code >= 0) {  //如果还没有找到最开始的母节点
		d_stack[count] = dictionary[code].suffix;   //d_stack中存储解码时对应的字符
		code = dictionary[code].parent;				//是倒序存储的，0存储最后一个子节点，之后不断往上找它的母节点依次向后存入d_stack
		count++;     //每存储一个字符，字符流长度+1
	}
	return count;   //返回字符流长度
}
 
  实验结果 
  编解码测试 
  调试LZW的编码程序，以一个文本文件作为输入，得到输出的LZW编码文件。 
  词典输出 
  可以输出根据LZW规则建立的词典 
  void PrintDictionary( void){   //输出256之后的词典
	int n;    
	int count;    //字符串长度
	for( n=256; n<next_code; n++){
		count = DecodeString( 0, n);    //从0开始记录到n的长度
		printf( "%4d->", n);     //输出这是第n个词条
		while( 0<count--) printf("%c", (char)(d_stack[count]));   //输出每一个词条对应的字符串
		printf( "\n");   //换行
	}
}
 
  编码 
   
   设置工作目录和命令参数 
   
   
   
   查看test.txt文件中的内容 
   
   
   
    main函数中运行编码部分的指令
 	if( 'E' == argv[1][0]){ // do encoding    argv[1][0]如果是E的话就进行编码
		fp = fopen( argv[2], "rb");    //打开输入文件，编码前的文件
		bf = OpenBitFileOutput( argv[3]);    //打开输出文件，编码后的文件
		if( NULL!=fp && NULL!=bf){      //如果两个文件均不为空
			LZWEncode( fp, bf);     //对输入文件fp编码生成输出文件bf，bf也就是压缩后的文件
			fclose( fp);     //关闭输入文件
			CloseBitFileOutput( bf);    //关闭输出文件
			fprintf( stdout, "encoding done\n");     //输出编码成功
		}
  
    查看压缩后的test_dat.dat文件
  
   
   
   
    输出词典
 			printf("encode dictionary:\n");
			PrintDictionary();
  
   
  
  .dat并不是一种标准文件。许多文件都使用这个扩展名，但文件含义不同。许多数据分析软件也用这个扩展名保存数据。所以这要看具体的软件情况来定。DAT文件，可以按照扩展名来看就是DATA的意思，即数据文件，这类文件并没有进行绝对化的定义，文件格式其实是不确定的 
  解码 
   
   设置解码命令行参数 
   
   
   
    main函数中运行解码部分的指令
 else if( 'D' == argv[1][0]){	// do decoding   argv[1][0]如果是D的话就进行解码
		bf = OpenBitFileInput( argv[2]);    //打开输入文件，是压缩后的文件
		fp = fopen( argv[3], "wb");    //以写的方式打开输出文件，是解压缩后的文件
		if( NULL!=fp && NULL!=bf){    //如果两个文件不为空
			LZWDecode( bf, fp);   //对输入文件bf解码生成输出文件fp，fp就是解码后的文件
			fclose( fp);    //关闭输出文件
			CloseBitFileInput( bf);    //关闭输入文件
			fprintf( stdout, "decoding done\n");    //输出解码成功
		}
	}
  
    查看解码后的文件
  
   
  
 解码成功！ 
   
    输出解码词典
 		printf("decode dictionary:\n");
		PrintDictionary();
  
   
   
   
   对比编解码文件大小 
   
  
 发现压缩后的文件大小比原文件还要大，这可能是因为原文件字符重复率比较低而导致 
   
   更换一个字符重复率较高的文件 
   
   
   
   查看编码后的文件 
   
   
   
   对比编码后和解码后文件大小 
   
  
 观察到这个文件的压缩效果就很好 
  不同类型的文件 
  选择至少十种不同格式类型的文件，使用LZW编码器进行压缩得到输出的压缩比特流文件。对各种不同格式的文件进行压缩效率的分析。 
  原文件 
   
  编码后的文件 
   
  各个文件的编码词典总数 
   
    1.py：2418 
  
    2.jpeg：36735 
  
    3.pdf：65534 
  
    4.mp4：65534 
  
    5.docx：9990 
  
    6.yuv：65534 
  
    7.xlsx：7329 
  
    8.md：4582 
  
    9.wav：65534 
  
    10.pptx：43944 
  
   
  解码恢复后的文件 
   
  经检查，解码恢复后的文件内容与压缩前的文件内容相同 
  统计分析 
   
  观察到不同文件的压缩率差别非常的大，并且有很多文件在利用词典编码之后反而比原文件大了，猜测可能是因为文件中重复字符的概率较低而导致 
  LZW编码的特点和应用 
   
   优点：LZW只需要一遍扫描，具有自适应的特点；算法简单，便于快速实现（利用数字查找树/建树） 
   缺点：字符串重复概率低时，影响压缩效率，这是由输入字符流的统计特性决定的，很难解决；词典中的字符串不再出现的时候，会影响压缩效率；从词典中查找词条是算法中最费时的工作 
   LZW编码的应用 
     
     通用文件压缩：WinZip 
     动画图像压缩：GIF，TIFF 
     电子邮件压缩 
     PDF文档压缩 
     雷达数据压缩 
     等等 
    
  
   
  程序代码 
  bitio.h 
  /*
 * Declaration for bitwise IO
 *
 * vim: ts=4 sw=4 cindent
 */
#ifndef __BITIO__
#define __BITIO__

#include 
#pragma warning(disable:4703) 
#pragma warning(disable:4996);    //使得fopen在编译时可以通过

typedef struct{
	FILE *fp;
	unsigned char mask;
	int rack;
}BITFILE;

BITFILE *OpenBitFileInput( char *filename);
BITFILE *OpenBitFileOutput( char *filename);
void CloseBitFileInput( BITFILE *bf);
void CloseBitFileOutput( BITFILE *bf);
int BitInput( BITFILE *bf);
unsigned long BitsInput( BITFILE *bf, int count);
void BitOutput( BITFILE *bf, int bit);
void BitsOutput( BITFILE *bf, unsigned long code, int count);
#endif	// __BITIO__
 
  bitio.cpp 
  /*
 * Definitions for bitwise IO
 *
 * vim: ts=4 sw=4 cindent
 */

#include 
#include 
#include "bitio.h"
BITFILE *OpenBitFileInput( char *filename){  //打开需要编码的二进制文件
	BITFILE *bf;
	bf = (BITFILE *)malloc( sizeof(BITFILE));
	if( NULL == bf) return NULL;
	if( NULL == filename)	bf->fp = stdin;
	else bf->fp = fopen( filename, "rb");
	if( NULL == bf->fp) return NULL;
	bf->mask = 0x80;
	bf->rack = 0;
	return bf;
}

BITFILE *OpenBitFileOutput( char *filename){  //创建并打开需要写入的文件
	BITFILE *bf;
	bf = (BITFILE *)malloc( sizeof(BITFILE));
	if( NULL == bf) return NULL;
	if( NULL == filename)	bf->fp = stdout;
	else bf->fp = fopen( filename, "wb");
	if( NULL == bf->fp) return NULL;
	bf->mask = 0x80;
	bf->rack = 0;
	return bf;
}

void CloseBitFileInput( BITFILE *bf){  //关闭读入文件比特流
	fclose( bf->fp);
	free( bf);
}

void CloseBitFileOutput( BITFILE *bf){  //输出剩余数据后关闭文件
	// Output the remaining bits
	if( 0x80 != bf->mask) fputc( bf->rack, bf->fp);
	fclose( bf->fp);
	free( bf);
}

int BitInput( BITFILE *bf){  //读取输入比特流中的字符
	int value;

	if( 0x80 == bf->mask){
		bf->rack = fgetc( bf->fp);
		if( EOF == bf->rack){
			fprintf(stderr, "Read after the end of file reached\n");
			exit( -1);
		}
	}
	value = bf->mask & bf->rack;
	bf->mask >>= 1;
	if( 0==bf->mask) bf->mask = 0x80;
	return( (0==value)?0:1);
}

unsigned long BitsInput( BITFILE *bf, int count){
	unsigned long mask;
	unsigned long value;
	mask = 1L << (count-1);
	value = 0L;
	while( 0!=mask){
		if( 1 == BitInput( bf))
			value |= mask;
		mask >>= 1;
	}
	return value;
}

void BitOutput( BITFILE *bf, int bit){  //向输出流中写字符
	if( 0 != bit) bf->rack |= bf->mask;
	bf->mask >>= 1;
	if( 0 == bf->mask){	// eight bits in rack
		fputc( bf->rack, bf->fp);
		bf->rack = 0;
		bf->mask = 0x80;
	}
}

void BitsOutput( BITFILE *bf, unsigned long code, int count){
	unsigned long mask;

	mask = 1L << (count-1);
	while( 0 != mask){
		BitOutput( bf, (int)(0==(code&mask)?0:1));
		mask >>= 1;
	}
}
#if 0
int main( int argc, char **argv){
	BITFILE *bfi, *bfo;
	int bit;
	int count = 0;

	if( 1<argc){
		if( NULL==OpenBitFileInput( bfi, argv[1])){
			fprintf( stderr, "fail open the file\n");
			return -1;
		}
	}else{
		if( NULL==OpenBitFileInput( bfi, NULL)){
			fprintf( stderr, "fail open stdin\n");
			return -2;
		}
	}
	if( 2<argc){
		if( NULL==OpenBitFileOutput( bfo, argv[2])){
			fprintf( stderr, "fail open file for output\n");
			return -3;
		}
	}else{
		if( NULL==OpenBitFileOutput( bfo, NULL)){
			fprintf( stderr, "fail open stdout\n");
			return -4;
		}
	}
	while( 1){
		bit = BitInput( bfi);
		fprintf( stderr, "%d", bit);
		count ++;
		if( 0==(count&7))fprintf( stderr, " ");
		BitOutput( bfo, bit);
	}
	return 0;
}
#endif
 
  lzw.cpp 
  /*
 * Definition for LZW coding 
 *
 * vim: ts=4 sw=4 cindent nowrap
 */
#include 
#include 
#include "bitio.h"
#define MAX_CODE 65535     //词典中最多的词典数目

struct {   //词典树
	int suffix;    //当前字符的尾缀字符
	int parent, firstchild, nextsibling;  //分别表示当前节点对应的母节点、第一个孩子节点、下一个兄弟节点
} dictionary[MAX_CODE+1];
int next_code;
int d_stack[MAX_CODE]; // stack for decoding a phrase，用来存储解码后的短语

#define input(f) ((int)BitsInput( f, 16))
#define output(f, x) BitsOutput( f, (unsigned long)(x), 16)    //定义输入输出

int DecodeString( int start, int code);
void InitDictionary( void);

void PrintDictionary( void){   //输出256之后的词典
	int n;    
	int count;    //字符串长度
	for( n=256; n<next_code; n++){
		count = DecodeString( 0, n);    //从0开始记录到n的长度
		printf( "%4d->", n);     //输出这是第n个词条
		while( 0<count--) printf("%c", (char)(d_stack[count]));   //输出每一个词条对应的字符串
		printf( "\n");   //换行
	}
}

int DecodeString( int start, int code){
	int count;   //记录当前解码字符流的长度
	count = start;   //从0/1开始
	while (code >= 0) {  //如果还没有找到最开始的母节点
		d_stack[count] = dictionary[code].suffix;   //d_stack中存储解码时对应的字符
		code = dictionary[code].parent;				//是倒序存储的，0存储最后一个子节点，之后不断往上找它的母节点依次向后存入d_stack
		count++;     //每存储一个字符，字符流长度+1
	}
	return count;   //返回字符流长度
}

void InitDictionary( void){    //初始化词典
	int i;

	for( i=0; i<256; i++){    //单个字符写入词典，也就是词典树的第一层
		dictionary[i].suffix = i;   //尾缀字符
		dictionary[i].parent = -1;   //母节点
		dictionary[i].firstchild = -1;   //第一个孩子节点
		dictionary[i].nextsibling = i+1;   //下一个（右边的）兄弟节点
	}
	dictionary[255].nextsibling = -1;   //第一层最后一个词典的兄弟节点
	next_code = 256;   //下一个词条的编码
}
/*
 * Input: string represented by string_code in dictionary,
 * Output: the index of character+string in the dictionary
 * 		index = -1 if not found
 */
int InDictionary( int character, int string_code){   //判断词典中是否有当前字符character（尾缀），string_code是旧词条（前缀）
	int sibling;    //表示字符在词典中的位置
	if( 0>string_code) return character;    //如果string_code=-1，说明当前字符是单个字符，已经存在词典中了，因此直接返回当前字符即可
	sibling = dictionary[string_code].firstchild;   //找string_code的第一个孩子，如果此时string_code没有第一个孩子则sibling=-1
	while( -1<sibling){   //sibling>-1，表示string_code已经有孩子了，也就是已经有尾缀了
		if( character == dictionary[sibling].suffix) return sibling;   //如果当前字符与string_code的某一个尾缀相同，那么返回这个尾缀
		sibling = dictionary[sibling].nextsibling;  //每次循环后都让sibling的值等于它的下一个兄弟节点
	}
	return -1;    //如果没有找到就返回-1
}

void AddToDictionary( int character, int string_code){  //读入的新字符character（尾缀）和旧词条string_code（前缀）
	int firstsibling, nextsibling;
	if( 0>string_code) return;   //如果string_code<0说明是一个单字符，返回即可
	//描述上下和右向的关系
	dictionary[next_code].suffix = character;   //下一个词条的尾缀为当前新字符
	dictionary[next_code].parent = string_code;  //这个尾缀character的母节点就是它的前缀是string_code
	dictionary[next_code].nextsibling = -1;    //这个尾缀的兄弟节点是-1
	dictionary[next_code].firstchild = -1;     //这个尾缀的第一个孩子节点是-1
	//描述左向的关系
	firstsibling = dictionary[string_code].firstchild;   //找前缀的第一个孩子，也是当前字符的第一个兄弟（最左边的）
	if( -1<firstsibling){	// the parent has child   前缀有孩子
		nextsibling = firstsibling;   //先让下一个兄弟节点为第一个孩子
		while( -1<dictionary[nextsibling].nextsibling )   //循环找兄弟节点的下一个兄弟节点，如果>-1说明还有兄弟节点
			nextsibling = dictionary[nextsibling].nextsibling;  //更新兄弟节点为右边的兄弟节点
		dictionary[nextsibling].nextsibling = next_code;    //直到兄弟节点的右边没有兄弟节点的时候，将新字符作为这个兄弟节点的兄弟节点
															//此时新字符成为了当前前缀为string_code的最后一个孩子（在最右边）
	}else{// no child before, modify it to be the first   前缀没有孩子的时候，当前新字符就是这个前缀的第一个孩子
		dictionary[string_code].firstchild = next_code;   //设置当前字符为前缀的第一个孩子
	}
	next_code ++;    //每添加一个字符，next_code++
}

void LZWEncode( FILE *fp, BITFILE *bf){
	int character;    //新字符
	int string_code;    //已编码字符，旧词条
	int index;      //索引
	unsigned long file_length;    //文件长度

	fseek( fp, 0, SEEK_END);   //文件指针置文件尾
	file_length = ftell( fp);  //获取文件长度
	fseek( fp, 0, SEEK_SET);   //文件指针置文件头
	BitsOutput( bf, file_length, 4*8);   //调用BitsOutput函数
	InitDictionary();    //初始化词典
	string_code = -1;    //初始值赋值为-1，方便在第一次判断的时候判断读取是否为单个字符
	while( EOF!=(character=fgetc( fp))){  //fgetc是从文件中读取一个字符，EOF是文件结束的标志，从文件中读取字符，直到读到结束标志
										 //fgetc是从文件指针stream指向的文件中读取一个字符，读取一个字节后，光标位置后移一个字节。格式：int fgetc(FILE *stream);。
		index = InDictionary( character, string_code);    //判断当前字符是否在词典中，返回字符在词典中的index，如果不在则返回-1
		if( 0<=index){	// string+character in dictionary    index>=0说明旧字符+当前新字已经在词典中了
			string_code = index;  //更新当前的旧词条为先前的旧词条+当前的新字符 P<-P+C
		}else{	// string+character not in dictionary    如果index返回-1，说明当前字符不在词典中
			output( bf, string_code);   //重定义的输出，向编码后的文件中输出旧词条
			if( MAX_CODE > next_code){	// free space in dictionary   如果词典中还有空间
				// add string+character to dictionary 
				AddToDictionary( character, string_code);    //将新字符串添加到词典中
			} 
			string_code = character;   //当前字符变为了旧字符，P<-C
		}
	}
	output( bf, string_code);  //循环读完文件后输出最后一个旧字符
}

void LZWDecode( BITFILE *bf, FILE *fp){
	int character;    //字符
	int new_code, last_code;   //new_code就是CW，表示码流中的下一个码字，last_code就是PW，表示上次解码的码字
	int phrase_length;    //每一个短语的长度，其实是每一次解码字符串的长度
	unsigned long file_length;    //文件长度

	file_length = BitsInput(bf, 4 * 8);   //编码后压缩文件的大小
	if (-1 == file_length) file_length = 0;
	InitDictionary();    //解码端也需要初始化词典
	last_code = -1;   //先设置前一个码字为-1，因为在第一个码字之前是空值

	while (0 < file_length) {   //当文件长度>0的时候进入循环，也就是仍有未解码的码字时进入循环
		new_code = input(bf);    //重定义的输入，从压缩后的文件中读入码字
		if (new_code >= next_code) {   //this is the case CSCSC( not in dict)，除了第一次以外，每次都要判断新的字符是否在词典中
									   //如果新的码字比当前词典中最后一个码字要大，就说明新的码字已经不在词典中了
			d_stack[0] = character;    //先将character给d_stack[0]，如果新的码字不在词典中，那么新的码字对应的最后一个字符就是上一个码字的第一个字符
			phrase_length = DecodeString(1, last_code);   //此时d_stack要从1开始向后存储上一个码字的字符及其向上对应的母节点，得到解码字符串存入d_stack并返回字符串长度
		}
		else {   //如果新的码字小于等于当前的最后一个码字，说明新码字在词典中
			phrase_length = DecodeString(0, new_code);  //此时d_stack从0开始向后存储新码字的字符及其向上对应的母节点，得到解码字符串存入d_stack并返回字符串长度
		}
		character = d_stack[phrase_length - 1];   //解码后的最后一个字符，其实是当前码字对应的字符流中的第一个字符
		while (0 < phrase_length) {   //解码存储符号时d_stack是从最后一个子节点倒序存储到最开始的母节点
			phrase_length--;   //因此d_stack是倒序存储的，通过phrase_length来决定此次将多少字符解压缩到文件中
			fputc(d_stack[phrase_length], fp);  //将d_stack中存储的字符写入文件
												//函数功能： 将字符c写到文件指针fp所指向的文件的当前写指针的位置。函数格式：int fputc (int c, FILE *fp)。
			file_length--;  //压缩文件剩余的未解压缩的量
		}
		if (MAX_CODE > next_code) {   //如果此时词典还不满的话
			AddToDictionary(character, last_code);    //将上一个字符（last_code）和当前码字对应字符流中的第一个字符（character）写入词典
		}
		last_code = new_code;   //CW->PW
	}
}



int main( int argc, char **argv){
	FILE *fp;    
	BITFILE *bf;

	//测试需要四个参数，argv[1]：'E'/'D'（选择E编码或是D解码），argv[2]：输入文件，argv[3]：输出文件
	if( 4>argc){   //参数不满四个的时候输出提示
		fprintf( stdout, "usage: \n%s   \n", argv[0]);
		fprintf( stdout, "\t: E or D reffers encode or decode\n");
		fprintf( stdout, "\t: input file name\n");
		fprintf( stdout, "\t: output file name\n");
		return -1;
	}
	if( 'E' == argv[1][0]){ // do encoding    argv[1][0]如果是E的话就进行编码
		fp = fopen( argv[2], "rb");    //打开输入文件，编码前的文件
		bf = OpenBitFileOutput( argv[3]);    //打开输出文件，编码后的文件
		if( NULL!=fp && NULL!=bf){      //如果两个文件均不为空
			LZWEncode( fp, bf);     //对输入文件fp编码生成输出文件bf，bf也就是压缩后的文件
			fclose( fp);     //关闭输入文件
			CloseBitFileOutput( bf);    //关闭输出文件
			fprintf( stdout, "encoding done\n");     //输出编码成功

			printf("encode dictionary:\n");
			PrintDictionary();
		}
	}else if( 'D' == argv[1][0]){	// do decoding   argv[1][0]如果是D的话就进行解码
		bf = OpenBitFileInput( argv[2]);    //打开输入文件，是压缩后的文件
		fp = fopen( argv[3], "wb");    //以写的方式打开输出文件，是解压缩后的文件
		if( NULL!=fp && NULL!=bf){    //如果两个文件不为空
			LZWDecode( bf, fp);   //对输入文件bf解码生成输出文件fp，fp就是解码后的文件
			fclose( fp);    //关闭输出文件
			CloseBitFileInput( bf);    //关闭输入文件
			fprintf( stdout, "decoding done\n");    //输出解码成功
		}

		printf("decode dictionary:\n");
		PrintDictionary();

	}else{	// otherwise
		fprintf( stderr, "not supported operation\n");
	}
	return 0;
}

 
  实验总结 
  通过本次实验可以看到LZW编码方式虽然简单，但是很多时候编码效率并不是很好，这可能是因为对于数据流中连续重复出现的字节和字串，LZW压缩技术具有很高的压缩比，但事实上很多文件中并没有足够多的重复字符，因此无法体现出LZW编码的优势。

[python]windows上安装talib最简单方法TA-Lib安装步骤萌萌哒240 python python windows 开发语言
要通过.whl文件安装TA-Lib（即talib，一个广泛使用的技术分析库），你需要先下载与你的Python版本和操作系统架构（32位或64位）相匹配的.whl文件。以下是通过.whl文件安装TA-Lib的详细步骤：一、下载TA-Lib的.whl文件访问https://gitee.com/FIRC/pythonlibs_whl_mirror或其他可靠的源，查找与你的Python版本和操作系统架构相
2024年03月质量管理体系基础答案及解析喵呜CCAA CCAA国家注册审核员算法大数据
一、单选题1、提高绩效的活动称为（）。A、创新B、改进C、持续改进D、纠正措施解析：【喵呜刷题小喵解析】：提高绩效的活动通常指的是对现有工作流程、方法或结果进行改进，以提高效率、效果或满足更高的需求。因此，选项B“改进”最符合题意。其他选项如“创新”虽然可能涉及提高绩效，但通常更侧重于引入全新的方法或流程；选项“持续改进”虽然也涉及改进，但通常更强调持续、长期的过程；选项“纠正措施”则更侧重于纠正
Solana链，什么是sol跟单机器人、pump跟单机器人、sol狙击机器人、sol夹子机器人、sol聪明钱筛选白马区块Crypto100 区块链智能合约 web3
SolanaSol跟单机器人SOL跟单机器人（CopyTradingBot）是一种自动化交易工具，允许用户复制其他成功交易者的交易行为。这种机器人通常用于加密货币市场、外汇市场等金融市场。以下是SOL跟单机器人的一些关键特性和功能：1.自动化交易：SOL跟单机器人自动复制选定交易者的交易行为，无需用户手动执行每笔交易。2.实时同步：机器人能够实时跟踪和复制选定交易者的交易，以确保交易及时性和同步性
Git基本操作宠物与不尤编程 git
Git是一个分布式版本控制系统，它可以追踪文件的变化，并记录文件的历史版本。以下是Git的基本概念和使用方式：仓库（Repository）：Git仓库是存储代码和文件的地方，可以是本地仓库或远程仓库。本地仓库存储在本地计算机上，而远程仓库存储在远程服务器上。分支（Branch）：分支是Git中的重要概念。在创建仓库时，会自动创建一个默认的主分支（通常是master）。除了主分支外，可以创建其他分支
Spread.NET 18.0 支持.NET9.0 Crack sdk大全 Spread.NET Spread.NET
Spread.NET全球销量第一的C#.NET电子表格，包含500多个Excel函数在C#.NET中提供真正类似Excel的电子表格体验，且不依赖Excel。创建财务、预算/预测、科学、工程、医疗保健、保险、教育、制造和许多其他类似的业务应用程序。使用全面的API创建企业电子表格、高级网格、仪表板、报告和数据输入表单递送类似Excel的电子表格经验，快速利用强大的高速计算引擎完成最复杂的计算导入和
大模型prompt提示工程案例数研妙手 AI技术实践 prompt 人工智能
一、明确目标和任务在设计Prompt之前，首先要明确你的目标是什么，是文本生成、信息提取、问答、翻译，还是其他任务。例如，如果是文本生成任务，要确定生成的文本类型，如故事、新闻报道、产品描述等。二、Prompt的基本结构指令部分：清晰明确地说明你希望大模型执行的任务。输入部分：提供必要的输入信息，以便大模型理解上下文。约束部分（可选）：为大模型的输出设定限制，如字数、格式、语言等。三、设计原则清晰
自学记录鸿蒙API 13：PreviewKit从文件预览到应用开发 harmonyos-next
学习了一些API13之后，我决定研究一下PreviewKit（文件预览服务）。这个模块可以快速预览多种文件类型，包括文本、图片、视频、音频和PDF等，为文件管理类应用提供了系统级支持。这次学习不仅是技术上的积累，更是个人能力的全面提升。我会从实际开发的角度，带大家了解PreviewKit的功能和实现，并分享如何利用它开发出一款实用的文件预览助手应用。通过我的实践经验，希望能为其他开发者提供灵感与帮
uniapp 微信小程序，底部安全距离适配，针对安卓iPhone不同型号手机沐雨MUYU_ uni-app 微信小程序 android
1、全局定义底部安全距离//前提：项目中安装了vuex或其他状态管理工具//文件位置src/store/index.tsimport{createStore}from'vuex';exportdefaultcreateStore({state(){return{safeBottom:''//底部安全距离};},mutations:{...},actions:{...},getters:{safeB
C语言魔法秀：代码中的“隐藏技能”大揭秘！从位运算到联合体的奇幻之旅 firdawn c语言算法开发语言
掌握一些有创意和想法的编程技巧对于提升编程能力和写出高效、优雅的代码至关重要。以下是一些我分享的C语言编程技巧，它们不仅深入而且能够增加编程效率。1.利用位运算优化性能C语言中的位运算是一种非常强大的工具，可以用于高效地处理整数数据。通过位运算，我们可以实现快速的数值计算、状态标记和数据压缩。例如，使用位与(&)和位或(|)运算可以高效地合并和分离标志位，使用位移(>)运算可以快速地进行数值的乘除
集团公司L1-L5级流程框架方法论：（1）L1级流程：为业务价值链，是业务流程的主干；（2）L2级流程：为运作模式层面的业务子流程，因场景不同而差异化；（3）L3级流程：为实现运营模式所需的业公众号：优享智库数字化转型数据治理主数据数据仓库大数据
集团公司L1-L5级流程框架方法论集团公司L1-L5级流程框架方法论L1级流程：业务价值链定义与作用构成要素与其他流程关系案例分析L2级流程：运作模式层面业务子流程场景差异化原因子流程分类与特点跨场景协同策略案例分析L3级流程：业务能力与业务活动业务能力定义及要求业务活动类型与目的与IT系统关系澄清案例分析L4级流程：业务与IT系统交互过程/工作流交互过程描述方法工作流设计原则常见问题与解决方案案
PyInstaller 构建的 Windows EXE 因多处理而失败潮易 windows
PyInstaller构建的WindowsEXE因多处理而失败PyInstaller是Python一个用于将Python脚本打包成可执行的exe文件的工具，但是它并不支持所有Python库，尤其是那些依赖于C扩展或使用PythonCAPI的库。如果你的程序在使用某些不支持的库时失败了，那么你可能需要寻找其他的解决方案，如使用其他的打包工具或者修改你的代码以适应这些库。以下是一个详细的步骤，说明如何
给Wordpress添加评分功能到评论表单鱼仰泳 WordPress开发手记 WordPress PHP css 前端网站开发
今天要给你的Wordpress添加评分功能到评论表单吗？评分功能效果图什么类型的网站需要评分？资源站教程站其他，我也没想到。。。但我这个网站，因为是电影类的网站，好像还是有点需要的，所以，我就给它加上。修改后台代码(functions.php)添加评分代码首先，你需要将下面代码复制到functions.php中：//添加打分脚本到评论表单//codebyyangjiyongVX：uu0216fun
低空经济市场竞争激烈，无人机研发公司如何突破困境? 无人机技术圈无人机技术无人机
低空经济是指以民用有人驾驶和无人驾驶航空器为主，以载人、载货及其他作业等多场景低空飞行活动为牵引，辐射带动相关领域融合发展的综合性经济形态。从应用场景来看，低空经济涉及军用、政用、商用、民用全方位场景；从产品角度来看，主要包含低空内飞行的无人机、私人飞机、eVTOL等航空器；从产业构成来看，主要包括低空制造、低空飞行、低空保障、低空基础设施和综合服务等产业。在低空经济市场竞争激烈的背景下，无人机研
无人机技术架构剖析！云卓SKYDROID 无人机云卓科技科普人工智能无人机架构
一、飞机平台系统飞机平台系统是无人机飞行的主体平台，主要提供飞行能力和装载功能。它由机体结构、动力装置、电气设备等组成。机体结构：无人机的机身是其核心结构，承载着其他各个组件并提供稳定性。常见的机身材料包括碳纤维、铝合金、塑料等轻量化材质，以保证无人机在飞行中的轻便性和耐用性。机身设计通常需要考虑空气动力学特性，以减少空气阻力，提高续航时间和飞行稳定性。动力装置：无人机的动力系统决定了其飞行能力，
ET199加密狗复制方法步骤详解 +Greer82 网络服务器运维
ET199加密狗作为一种常见的硬件加密设备，被广泛应用于各类软件中，用于保护软件不被非法复制和使用。然而，在某些特定情况下，我们可能需要复制ET199加密狗，以便在多台计算机上共享软件许可证或进行其他用途。本文将详细介绍ET199加密狗的复制方法，但请注意，复制加密狗可能涉及知识产权和合法授权问题，请务必在合法和授权的前提下进行操作。ET199加密狗复制一、ET199加密狗概述ET199加密狗是一
【JavaScript】事件监听：触摸事件神明木佑 javascript microsoft 开发语言
JavaScript触摸事件是通过浏览器提供的TouchAPI来实现的。当用户在触摸屏设备上进行交互时，浏览器会捕捉到触摸事件，并将其传递给相应的JavaScript事件处理器。需要注意的是，触摸事件在不同的设备和浏览器上可能有差异，因此在使用触摸事件时应该进行兼容性测试，并根据需要进行适当的兼容性处理。此外，触摸事件通常与其他事件（如点击事件、滚动事件等）结合使用，以实现更复杂的交互效果。一、t
Python图形用户界面（GUI）库 Botiway FlaskWeb python
Python图形用户界面（GUI）库是用于创建图形用户界面的工具集，它们允许开发者使用Python语言来构建具有图形元素的用户界面。以下是一些常用的PythonGUI库：1.Tkinter•简介：Tkinter是Python的标准GUI库，它提供了创建窗口、按钮、文本框和其他GUI组件的工具。由于它是Python安装包的一部分，因此无需额外安装。•特点：简单易用，适合初学者和快速原型开发。虽然功能
TOGAF中的企业架构：让业务架构与数据、应用、技术架构形成闭环的魔法之旅火山说数数字化企业架构架构微服务云原生
前言你是否曾经有过这样一种感觉：企业在进行数字化转型时，架构之间常常感觉像是一盘散沙？业务部门、IT部门、数据分析师各自为政，技术团队则像一群“救火队员”随时准备扑灭各种系统bug。好消息是，TOGAF（TheOpenGroupArchitectureFramework）可以帮助企业打破这种局面，让业务架构（BusinessArchitecture）和其他“三A”架构——数据架构（DataArch
青少年编程与数学 02-007 PostgreSQL数据库应用 06课题、数据库操作明月看潮生编程与数学第02阶段数据库青少年编程 postgresql 编程与数学
青少年编程与数学02-007PostgreSQL数据库应用06课题、数据库操作一、数据库的文件组成二、系统数据库三、创建数据库使用psql命令行工具使用CREATEDATABASE的选项使用PostgreSQL的图形界面工具四、数据库配置连接到新数据库设置搜索路径修改字符集和校对规则设置默认的事务隔离级别启用或禁用标准协程设置WAL相关参数配置角色和权限设置资源配额配置其他参数使用图形界面工具五、
【Vim Masterclass 笔记16】S07L32 + L33：同步练习09 —— 掌握 Vim 宏操作的六个典型案例（含点评课内容）安冬的码畜日常 Vim Masterclass vim 笔记 vim宏同步练习自学笔记
文章目录S07L32Exercise09-Macros1训练目标2操作指令2.1.打开macros-practice.txt文件2.2.练习1：将旧版Python代码转换为新版写法2.3.练习2：根据列表内容批量创建Shell脚本2.4.练习3：对电话号码作格式化处理2.5.练习4：从日志文件中提取重要数据2.6.练习5：将多行数据压缩为一行2.7.练习6：从HTML中提取数据3退出VimS07L
IoT安全软件：Forescout二次开发_Forescout部署与运维 chenlz2007 物联网物联网运维网络 php 安全 java
Forescout部署与运维1.Forescout架构概述Forescout是一个高度灵活且可扩展的IoT安全平台，旨在帮助组织保护其网络免受各种威胁。Forescout的架构由多个组件组成，包括核心服务器、传感器、代理和客户端。这些组件协同工作，实现对网络中IoT设备的全面监控和管理。1.1核心服务器核心服务器是Forescout平台的中心枢纽，负责管理和协调所有其他组件。它提供了一个集中式的管
详解 RabbitMQ 在 Go 中的实现：一个带重试机制和死信队列的消息消费者田猿笔记 Golang 从零到高级架构 rabbitmq golang ruby
RabbitMQ是一个功能强大的消息队列系统，广泛应用于分布式系统中。本文将详细解析一个使用Go语言编写的RabbitMQ消费者程序。该程序不仅能够消费消息，还实现了消息重试机制和死信队列（DeadLetterQueue,DLQ）功能，确保消息在多次处理失败后不会被丢失。代码结构概述代码的主要功能包括：加载环境变量：从.env文件中加载RabbitMQ的连接信息和其他配置。连接RabbitMQ：建
Go语言之路————func 一颗知足的心 golang 开发语言后端
Go语言之路————func前言1.最基本的方法定义2.方法中参数的传递3.方法中的返回值4.匿名方法5.闭包的概念6.defer关键词前言我是一名多年Java开发人员，因为工作需要现在要学习go语言，Go语言之路是一个系列，记录着我从0开始接触Go，到后面能正常完成工作上的业务开发的过程，如果你也是个小白或者转Go语言的，希望我这篇文章对你有所帮助。有关go其他基础的内容的文章大家可以查看我的主
Go语言之路————条件控制：if、for、switch 一颗知足的心 golang 开发语言
Go语言之路————if、for、switch前言ifforswitchgoto和label前言我是一名多年Java开发人员，因为工作需要现在要学习go语言，Go语言之路是一个系列，记录着我从0开始接触Go，到后面能正常完成工作上的业务开发的过程，如果你也是个小白或者转Go语言的，希望我这篇文章对你有所帮助。有关go其他基础的内容的文章大家可以查看我的主页，接下来主要就是把这个系列更完，更完之后我
centos7安装cuda、dudnn、Nvidia驱动[最详细的教程和报错解决方案] LensonYuan 自然语言处理深度学习自然语言处理数据挖掘机器学习深度学习
现在很多教程都没有覆盖全报错问题，本文几乎把所有问题都描述到位首先说下我电脑的环境：centos7x86-64：uname-r命令显示为3.10.0-1160.el7.x86_64；物理显卡为单卡2080ti；gcc通过yum安装，yuminstallgcc版本为4.8.5,同时会显示安装一些其他包，如glibc版本为2.17；安装准备以下为驱动和官网文件名一致，可到nvidia官网下载，选择历史
解决libc.so.6、libstdc++.so : version `GLIBC_x.x‘、CXXABI_x.x not found LensonYuan 项目发布 linux linux gcc/gdb编译调试
解决libstdc++.so:version`CXXABI_x.x’、GLIBCXX_x.xnotfound方案:查找本机其他位置新版本替代a.执行以下命令，查找编译gcc时生成的最新动态库find/-name“*libstdc++.so*”，选择最高版本，我的是*so.6.0.26b.如果找不到合适版本,可以安装Anconda[自行百度]，安装完再find一定会有新版so;c.找到新版so.6.
管理口令安全和资源（二）远歌已逝数据库安全 oracle 数据库
DBMS_METADATADBMS_METADATA是Oracle数据库中的一个包，它提供了用于管理数据库元数据的工具和过程。元数据是关于数据的数据，它描述了数据库的结构，包括表、视图、索引、存储过程、用户和其他数据库对象的信息。DBMS_METADATA包允许用户获取、修改和重建数据库对象的元数据。DBMS_METADATA包在Oracle9iRelease2（9.2.0.1）中首次引入，并在后
你认为最好的排序算法是什么？ silver687 算法
很难说哪一种排序算法是“最好”的，因为不同的排序算法在不同的场景下各有优势，以下是几种常见的排序算法及其特点：一、快速排序•优点•平均时间复杂度为O(nlogn)，在大多数情况下，它的性能表现都非常优秀。它利用分治法的思想，通过选择一个“基准”值，将数组分为两部分，一部分包含比基准小的元素，另一部分包含比基准大的元素。然后对这两部分递归进行快速排序。•对于大规模数据排序，快速排序的速度通常比其他O
如何找到 niche 出海细分市场的 IDEA 程序员
先说结论就是：看榜单Why：为什么看榜单？大家会问为什么？原因很简单：熟读唐诗三百首，不会作诗也会吟不天天看榜单上相关的优秀同行，你想干啥心法就是下苦功夫坚持，量变引起质变，排行榜天天看竞品思维：看看有什么好的“参考方向“。从发现IDEA->市场分析->到MVP学习思维：看看优秀的产品，不管产品设计还是其他有没有学习的点What：看哪些榜单？我有个习惯，隔几天刷一刷软件产品榜单。这里分享几个我常看
华为数通HCIA(学习笔记) 想做运维大佬华为数通(HCIA)笔记系列华为学习笔记
2024-03-22重启华为数通学习计划由于工作原因，预计将在2024年6月30日之前完成HCIP的学习并通过HCIP的考试-在2025年6月30日前完成HCIE的学习并通过HCIE的考试此为学习笔记，实验笔记和试题笔记会分别更新到其他帖子中一、数据网络通信基础1.1专业名词LAN(LocalAreaNetwork)：局域网Ethrenet：以太网Campus：园区网VLAN(VirtualLAN
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》

【数据压缩】第五次作业——LZW编码

LAW编码

文章目录

编码原理

解码原理

代码分析

词典树

初始化词典树

当前字符是否在词典中

添加新字符

编码

解码

DecodeString

实验结果

编解码测试

词典输出

编码

解码

不同类型的文件

原文件

编码后的文件

各个文件的编码词典总数

解码恢复后的文件

统计分析

LZW编码的特点和应用

程序代码

实验总结

你可能感兴趣的:(数据压缩,其他)

`DecodeString`