spadeK2020

【数据压缩】LZW编解码原理及算法实现

一、LZW简介

LZW压缩（LZW compression）是一种由Abraham Lempel、Jacob Ziv和Terry Welch发明的基于表查寻算法把文件压缩成小文件的无损压缩方法。
LZW算法又叫“串表压缩算法”就是通过建立一个字符串表，用较短的代码来表示较长的字符串来实现压缩。
其基本原理为提取原始文件数据中的不同字符，基于这些字符创建一个编译表，然后用编译表中的字符索引来替代原始文件数据中的相应字符，减少原始数据大小。这里的编译表不是事先创建好的，而是根据原始文件数据动态创建的，解码时还要从已编码的数据中还原出原来的编译表。

二、LZW编解码算法及举例

1、LZW编码算法思想

LZW的编码思想是不断地从字符流中提取新的字符串，通俗地理解为新“词条”，然后用“代号”也就是码字表示这个“词条”。这样一来，对字符流的编码就变成了用码字去替换字符流，生成码字流，从而达到压缩数据的目的。LZW编码是围绕称为词典的转换表来完成的。LZW编码器通过管理这个词典完成输入与输出之间的转换。LZW编码器的输入是字符流，字符流可以是用8位ASCII字符组成的字符串，而输出是用n位(例如12位)表示的码字流。
LZW编码算法的步骤如下：
步骤1：将词典初始化为包含所有可能的单字符（常用ASCII码表），
当前前缀P初始化为空。
步骤2：当前字符C=字符流中的下一个字符。
步骤3：判断P＋C是否在词典中。
（1）如果“是”，则用C扩展P，即让P=P＋C，返回到步骤2。
（2）如果“否”，则
输出与当前前缀P相对应的码字W；
将P＋C添加到词典中；
令P=C，并返回到步骤2。

举例：输入流 a b b a b a b a c

首先，以ASCII码为基础词典

已编码：a b

遇到a，用97表示，编码为97。
遇到b，用98表示，编码为98。
发现ab，加入词典，ab索引为256。

已编码：a b b a b

遇到b，编码为98，发现bb，加入词典，索引为257。
遇到a，发现ba，加入词典，索引为258。
遇到b，ab已存在词典内，编码为256。

已编码：a b b a b a b a c

遇到a，发现aba，加入词典，索引为259。
遇到b，ab已存在词典。
遇到a， aba已存在词典内，编码为259。（这里刚加入词典就用到了）
遇到c，编码为99，发现abac，加入词典，索引为260。
编码结束，编码码流和输入码流对比为：

a  b  b  a  b  a  b  a  c
97 98 98 256     259    99

输入：8bit × 9=72bit
输出：9bit × 6=54bit

2、LZW解码算法思想

LZW解码算法开始时，译码词典和编码词典相同，包含所有可能的前缀根。具体解
码算法如下：
步骤1：在开始译码时词典包含所有可能的前缀根。
步骤2：令CW：=码字流中的第一个码字。
步骤3：输出当前缀-符串string.CW到码字流。
步骤4：先前码字PW：=当前码字CW。
步骤5：当前码字CW：=码字流的下一个码字。
步骤6：判断当前缀-符串string.CW 是否在词典中。
（1）如果”是”，则把当前缀-符串string.CW输出到字符流。
当前前缀P：=先前缀-符串string.PW。
当前字符C：=当前前缀-符串string.CW的第一个字符。
把缀-符串P+C添加到词典。
（2）如果”否”，则当前前缀P：=先前缀-符串string.PW。
当前字符C：=当前缀-符串string.CW的第一个字符。
输出缀-符串P+C到字符流,然后把它添加到词典中。
步骤7：判断码字流中是否还有码字要译。
（1）如果”是”，就返回步骤4。
（2）如果”否”，结束。
解码过程举例：

97 98 98 256 259 99

遇到97，在基础词典，解码为a。
遇到98，在基础词典，解码为b，发现ab，可知256对应ab。
遇到98，在基础词典，解码为b，发现bb，可知257对应bb。
遇到256，解码为ab，发现ba，可知258对应ba。

已编码：a b b a b

遇到259，目前词典没有259，为什么会发生这种情况？
只有当码字刚加入词典就被用于编码时，才会出现这一情况，则下一个字符（这里的第六个字符）与上一个码字构成新加入词典的码字，并与后面字符共同编码为这一码字。故而这一字符，与上一个码字的头个字符相同。
259解码为aba（“ab"+“a”）。
遇到99，在基础词典，解码为c。
解码结束。

已解码：a b b a b a b a c

三、LZW编码算法实现

1、数据结构

struct {//词典节点结构体
	int suffix; //后缀字符
	int parent, firstchild, nextsibling;//母节点、第一个孩子节点、兄弟节点
} dictionary[MAX_CODE+1]; //数组下标为编码

typedef struct{//二进制文件结构体
	FILE *fp;//输出文件指针
	unsigned char mask;//掩码
	int rack;//缓存，每写入8位，写入rack
}BITFILE;

2、编码代码分析

（1）编码总流程

void LZWEncode( FILE *fp, BITFILE *bf){
	int character;//字符
	int string_code;//前缀
	int index;//编码
	unsigned long file_length;//文件大小

	fseek( fp, 0, SEEK_END);//文件指针定位到文件最后
	file_length = ftell( fp);//输入文件大小
	fseek( fp, 0, SEEK_SET);//文件指针定位到文件起始
	BitsOutput( bf, file_length, 4*8);//将输入文件大小写入输出文件。32位表示文件大小
	InitDictionary();//词典初始化
	string_code = -1;//前缀初始化
	while( EOF!=(character=fgetc( fp))){//依次扫描输入文件，取出各字符
		index = InDictionary( character, string_code);//判断码字string+character是否在词典中
		if( 0<=index){	// string+character在词典中
			string_code = index;//将string+character对应编码作为前缀
		}else{	// string+character不在词典中
			output( bf, string_code);//输出前缀
			if( MAX_CODE > next_code){	// 若词典有剩余空间
				// 将string+character加入词典
				AddToDictionary( character, string_code);
			}
			string_code = character;//将新字符作为新的前缀
		}
	}
	output( bf, string_code);//文件扫描完毕，将最后未输出的前缀输出
}

（2）词典初始化

void InitDictionary( void){//词典初始化即将0-255根节点初始化
	int i;

	for( i=0; i<256; i++){//下标为ASCII码值
		dictionary[i].suffix = i;//根的后缀字符为对应ASCII码
		dictionary[i].parent = -1;//没有母节点
		dictionary[i].firstchild = -1;//暂时没有第一个孩子节点
		dictionary[i].nextsibling = i+1;//下一个兄弟节点下标为下一个ASCII码值
	}
	dictionary[255].nextsibling = -1;//最后一个根节点没有下一个兄弟节点
	next_code = 256;//下一个编码为256
}

（3）判断码字是否在词典中

int InDictionary( int character, int string_code){//判断码字string+character是否在词典中 string_code前缀 character后缀 
	int sibling;
	if( 0>string_code) return character;//文件第一个字符，故而编码为character的ASCII码值
	/*自左向右遍历string_code节点的所有孩子（第一个孩子的所有兄弟）*/
	sibling = dictionary[string_code].firstchild;//string_code节点的第一个孩子
	while( -1<sibling){//sibling=-1时说明所有兄弟遍历结束
		if( character == dictionary[sibling].suffix) return sibling;//若找到兄弟节点的后缀是character，则返回此节点的编码即下标sibling
		sibling = dictionary[sibling].nextsibling;//若该兄弟节点后缀不是character，则寻找下一个兄弟节点
	}
	return -1;//若遍历所有兄弟节点的后缀后，都找不到该字符，说明string+character不在字典中，返回-1
}

（4）将码字添加到词典中

void AddToDictionary( int character, int string_code){//码字不在词典，添加进词典中，并编码为next_code
	int firstsibling, nextsibling;
	if( 0>string_code) return;
	dictionary[next_code].suffix = character;//新节点的后缀为该字符
	dictionary[next_code].parent = string_code;//新节点的母亲节点为该前缀
	dictionary[next_code].nextsibling = -1;//新节点下一个兄弟节点暂不存在
	dictionary[next_code].firstchild = -1;//新节点的第一个孩子节点暂不存在
	firstsibling = dictionary[string_code].firstchild;//新节点的母亲节点的第一个孩子
	/*设置新节点的兄弟关系*/
	if( -1<firstsibling){	// 若新节点的母亲节点原本有孩子
		nextsibling = firstsibling;
		while( -1<dictionary[nextsibling].nextsibling ) //循环找到该母亲节点的最后一个孩子即新节点的最后一个兄弟
			nextsibling = dictionary[nextsibling].nextsibling;
		dictionary[nextsibling].nextsibling = next_code;//将新节点设为最后一个兄弟的下一个兄弟
	}else{// 若新节点的母亲节点原本没有孩子
		dictionary[string_code].firstchild = next_code;//则新节点是母亲节点的第一个孩子
	}
	next_code ++;//下一个编码增加1
}

（5）打开二进制文件

BITFILE *OpenBitFileOutput( char *filename){//输出文件名
	BITFILE *bf;
	bf = (BITFILE *)malloc( sizeof(BITFILE));
	if( NULL == bf) return NULL;
	if( NULL == filename)	bf->fp = stdout;//如果参数为NULL，则指向屏幕
	else bf->fp = fopen( filename, "wb");//以二进制只写的方式打开文件
	if( NULL == bf->fp) return NULL;
	bf->mask = 0x80;//掩码为10000000
	bf->rack = 0;//缓存为0
	return bf;
}

（6）按位输出数据到输出文件

void BitsOutput( BITFILE *bf, unsigned long code, int count){
	unsigned long mask;
	/*计算掩码值，位数为count的数值且最高位为1，例如若count为16，则mask=1000 0000 0000 0000*/
	mask = 1L << (count-1);
	while( 0 != mask){//mask为0时，说明code的count位数字输出完毕，注意：LZW是等长码
		BitOutput( bf, (int)(0==(code&mask)?0:1));//按位输出code
		mask >>= 1;//掩码向右移位
	}
}

void BitOutput( BITFILE *bf, int bit){
	/*若bite=1，则本code输出结束，此时mask为1，rack为0,则缓存rack变为1
	若bit=0，则尚未输出结束，此时mask向右移位，为0，rack不变*/
	if( 0 != bit) bf->rack |= bf->mask;
	bf->mask >>= 1;//mask向右移1位
	/*若mask溢出为0，则表示成功累计写入8位，则直接输出rack，
	并将rack初始化为0，mask初始化为1000 0000*/
	if( 0 == bf->mask){	// eight bits in rack
		fputc( bf->rack, bf->fp);
		bf->rack = 0;
		bf->mask = 0x80;
	}
}

（7）关闭二进制输出文件

void CloseBitFileOutput( BITFILE *bf){
	// 输出剩余的二进制数
	if( 0x80 != bf->mask) fputc( bf->rack, bf->fp);
	fclose( bf->fp);//关闭二进制输出文件
	free( bf);//释放内存
}

3、以文本文件为输入，得到输出的LZW编码文件

调试LZW的编码程序，以一个文本文件作为输入，得到输出的LZW编码文件。
这里输入文本文件text1内容为英文文章，得到输出文件text2。

四、LZW解码算法实现

1、解码代码编写与分析

（1）得到输入文件数据

以count位为单位得到输入文件中的数据

unsigned long BitsInput( BITFILE *bf, int count){
	unsigned long mask;//掩码
	unsigned long value;//
	/*计算掩码值，位数为count的数值且最高位为1，例如若count为16，则mask=1000 0000 0000 0000*/
	mask = 1L << (count-1);
	value = 0L;//初始化value为0
	/*mask由1000 0000 0000 0000向右移位至溢出为0时循环结束，取得16位的等长码*/
	while( 0!=mask){
		/*输出文件下一位为1时，value相应位变为1，为0时不作变化，遍历下一位*/
		if( 1 == BitInput( bf))
			value |= mask;//value在mask对应位置的二进制数字变为1
		mask >>= 1;//mask向右移动一位
	}
	return value;
}

逐位得到输出文件中的二进制数字（从右向左）

int BitInput( BITFILE *bf){
	int value;

	if( 0x80 == bf->mask){//当mask为1000 0000时，从文件中得到一字节数据
		bf->rack = fgetc( bf->fp);
		if( EOF == bf->rack){//若成功得到数据
			fprintf(stderr, "Read after the end of file reached\n");//输出
			exit( -1);
		}
	}
	value = bf->mask & bf->rack;//取得mask掩码所表示的位置所在处的二进制数字
	bf->mask >>= 1;//mask向右移动一位
	if( 0==bf->mask) bf->mask = 0x80;//若溢出为0，则mask重新初始化为1000 0000
	return( (0==value)?0:1);//value为0则返回0，为其它数字则返回1
}

（2）解码总流程

void LZWDecode( BITFILE *bf, FILE *fp){
	//需填写
	int character;//新/旧编码首字母
	int new_code;//新编码
	int last_code = -1;//起初旧编码空缺，初始化为-1
	int string_length;//输出字符串长度
	unsigned long file_length;//输出文件大小

	file_length = BitsInput(bf, 4*8);//输入文件起始处为输出文件大小，共32位
	if (-1 == file_length) file_length = 0;//若文件无内容，大小为0
	InitDictionary();//词典初始化，设置0-255的根节点
	while (file_length > 0) {//若读取到最后一个编码，结束循环
		new_code = input(bf);//16位读取新编码
		if (new_code >= next_code) {//若字典中没有新编码
			d_stack[0] = character;//character为旧编码last_code的首字母，将其放置在数组d_stack[0]首位
			/*遍历旧编码last_code所在树，将last_code对应字符串放入d_stack，前缀在栈底，后缀在d_stack[1]。返回字符串长度*/
			string_length = DecodeString(1, last_code);
		}
		else {//若字典中已有新编码
			/*遍历新编码new_code所在树，将new_code对应字符串放入d_stack，前缀在栈底，后缀在d_stack[0]。返回字符串长度*/
			string_length = DecodeString(0, new_code);
		}
		/*若新读取的编码不存在于词典中，character为旧编码last_code的首字母
		若新读取的编码存在于词典中，character为新编码new_code的首字母*/
		character = d_stack[string_length - 1];
		/*若新读取的编码不存在于词典中，输出旧编码last_code对应字符串+last_code的首字母
		若新读取的编码存在于词典中，输出新编码new_code对应字符串*/
		while (string_length > 0) {
			string_length--;
			fputc(d_stack[string_length], fp);
			file_length--;
		}
		/*若新读取的编码不存在于词典中，将last_code对应字符串+last_code的首字母添加到词典
		若新读取的编码存在于词典中，将last_code对应字符串+new_code的首字母添加到词典*/
		if (MAX_CODE > next_code) {
			AddToDictionary(character, last_code);
		}
		last_code = new_code;//新编码变为旧编码
	}
}

（3）将字符串放入d_stack，得到解码后字符串长度

int DecodeString( int start, int code){
	//需填充
	int count = start;//d_stack下标
	while (code >= 0) {//code=-1时到达根节点循环结束
		d_stack[count] = dictionary[code].suffix;//下标为code的节点中的后缀字母放置数组对应位置，这里是d_stack[0/1]
		code = dictionary[code].parent;//节点上移至母节点
		count++;//字符数增加1
	}
	return count;//返回字符串长度
}

（4）当前码字在词典中不存在时应如何处理

当前码字在词典中不存在时，该码字对应字符串=旧编码对应字符串+旧编码的首字符，此时则直接输出旧编码对应字符串+旧编码的首字符，并将其加入词典。
原因在实例中进行了说明，在编码时，上一个新的词条刚被编码，下一个词组就使用到了它。由于解码端的解码会比编码晚一步，我们没有得到最新的词条就使用了。此时下一个词组的首字符与上一个词条首字符相同。故而下一个编码字符串为旧编码对应字符串+旧编码的首字符。

2、以之前得到的LZW编码文件作为输入，得到输出的解码文件

以之前得到的LZW编码文件text2作为输入，得到输出的解码文件text1_decode。

打开文件可以发现，text1_decode与text1内容相同，解码成功。

五、LZW压缩效率

选择至少十种不同格式类型的文件，使用LZW编码器进行压缩得到输出的压缩比特
流文件。对各种不同格式的文件进行压缩效率的分析。
原文件如下图所示。

使用LZW编码器进行压缩后文件如下图。

压缩比如下图所示。

可以发现，此实验中除txt文本文件、html文本文件、wav音频文件和yuv视频文件的压缩比小于1外，其它10种文件压缩比均大于1。LZW的编码思想是不断从字符流中提取新的字符串，只有重复字符串越多，才能使词典越小，压缩效率越大。在应用中可能因为文件中重复字符串过少，导致压缩后文件大小不降反升。

附件：完整代码

1、lzw.c

#include 
#include 
#include "bitio.h"
#define MAX_CODE 65535

struct {//词典节点结构体
	int suffix; //后缀字符
	int parent, firstchild, nextsibling;//母节点、第一个孩子节点、兄弟节点
} dictionary[MAX_CODE+1]; //数组下标为编码
int next_code;
int d_stack[MAX_CODE]; // 解码时每一个字符串可存放在d_stack

#define input(f) ((int)BitsInput( f, 16))//16位写入
#define output(f, x) BitsOutput( f, (unsigned long)(x), 16)//16位输出

int DecodeString( int start, int code);
void InitDictionary( void);
void PrintDictionary( void){//输出词典
	int n;
	int count;
	for( n=256; n<next_code; n++){
		count = DecodeString( 0, n);
		printf( "%4d->", n);
		while( 0<count--) printf("%c", (char)(d_stack[count]));
		printf( "\n");
	}
}

int DecodeString( int start, int code){
	//需填充
	int count = start;//d_stack下标
	while (code >= 0) {//code=-1时到达根节点循环结束
		d_stack[count] = dictionary[code].suffix;//下标为code的节点中的后缀字母放置数组对应位置，这里是d_stack[0/1]
		code = dictionary[code].parent;//节点上移至母节点
		count++;//字符数增加1
	}
	return count;//返回字符串长度
}
void InitDictionary( void){//词典初始化即将0-255根节点初始化
	int i;

	for( i=0; i<256; i++){//下标为ASCII码值
		dictionary[i].suffix = i;//根的后缀字符为对应ASCII码
		dictionary[i].parent = -1;//没有母节点
		dictionary[i].firstchild = -1;//暂时没有第一个孩子节点
		dictionary[i].nextsibling = i+1;//下一个兄弟节点下标为下一个ASCII码值
	}
	dictionary[255].nextsibling = -1;//最后一个根节点没有下一个兄弟节点
	next_code = 256;//下一个编码为256
}
/*
 * Input: string represented by string_code in dictionary,
 * Output: the index of character+string in the dictionary
 * 		index = -1 if not found
 */
int InDictionary( int character, int string_code){//判断码字string+character是否在词典中 string_code前缀 character后缀 
	int sibling;
	if( 0>string_code) return character;//文件第一个字符，故而编码为character的ASCII码值
	/*自左向右遍历string_code节点的所有孩子（第一个孩子的所有兄弟）*/
	sibling = dictionary[string_code].firstchild;//string_code节点的第一个孩子
	while( -1<sibling){//sibling=-1时说明所有兄弟遍历结束
		if( character == dictionary[sibling].suffix) return sibling;//若找到兄弟节点的后缀是character，则返回此节点的编码即下标sibling
		sibling = dictionary[sibling].nextsibling;//若该兄弟节点后缀不是character，则寻找下一个兄弟节点
	}
	return -1;//若遍历所有兄弟节点的后缀后，都找不到该字符，说明string+character不在字典中，返回-1
}

void AddToDictionary( int character, int string_code){//码字不在词典，添加进词典中，并编码为next_code
	int firstsibling, nextsibling;
	if( 0>string_code) return;
	dictionary[next_code].suffix = character;//新节点的后缀为该字符
	dictionary[next_code].parent = string_code;//新节点的母亲节点为该前缀
	dictionary[next_code].nextsibling = -1;//新节点下一个兄弟节点暂不存在
	dictionary[next_code].firstchild = -1;//新节点的第一个孩子节点暂不存在
	firstsibling = dictionary[string_code].firstchild;//新节点的母亲节点的第一个孩子
	/*设置新节点的兄弟关系*/
	if( -1<firstsibling){	// 若新节点的母亲节点原本有孩子
		nextsibling = firstsibling;
		while( -1<dictionary[nextsibling].nextsibling ) //循环找到该母亲节点的最后一个孩子即新节点的最后一个兄弟
			nextsibling = dictionary[nextsibling].nextsibling;
		dictionary[nextsibling].nextsibling = next_code;//将新节点设为最后一个兄弟的下一个兄弟
	}else{// 若新节点的母亲节点原本没有孩子
		dictionary[string_code].firstchild = next_code;//则新节点是母亲节点的第一个孩子
	}
	next_code ++;//下一个编码增加1
}

void LZWEncode( FILE *fp, BITFILE *bf){
	int character;//字符
	int string_code;//前缀
	int index;//编码
	unsigned long file_length;//文件大小

	fseek( fp, 0, SEEK_END);//文件指针定位到文件最后
	file_length = ftell( fp);//输入文件大小
	fseek( fp, 0, SEEK_SET);//文件指针定位到文件起始
	BitsOutput( bf, file_length, 4*8);//将输入文件大小写入输出文件。32位表示文件大小
	InitDictionary();//词典初始化
	string_code = -1;//前缀初始化
	while( EOF!=(character=fgetc( fp))){//依次扫描输入文件，取出各字符
		index = InDictionary( character, string_code);//判断码字string+character是否在词典中
		if( 0<=index){	// string+character在词典中
			string_code = index;//将string+character对应编码作为前缀
		}else{	// string+character不在词典中
			output( bf, string_code);//输出前缀
			if( MAX_CODE > next_code){	// 若词典有剩余空间
				// 将string+character加入词典
				AddToDictionary( character, string_code);
			}
			string_code = character;//将新字符作为新的前缀
		}
	}
	output( bf, string_code);//文件扫描完毕，将最后未输出的前缀输出

}

void LZWDecode( BITFILE *bf, FILE *fp){
	//需填写
	int character;//新/旧编码首字母
	int new_code;//新编码
	int last_code = -1;//起初旧编码空缺，初始化为-1
	int string_length;//输出字符串长度
	unsigned long file_length;//输出文件大小

	file_length = BitsInput(bf, 4*8);//输入文件起始处为输出文件大小，共32位
	if (-1 == file_length) file_length = 0;//若文件无内容，大小为0
	InitDictionary();//词典初始化，设置0-255的根节点
	while (file_length > 0) {//若读取到最后一个编码，结束循环
		new_code = input(bf);//16位读取新编码
		if (new_code >= next_code) {//若字典中没有新编码
			d_stack[0] = character;//character为旧编码last_code的首字母，将其放置在数组d_stack[0]首位
			/*遍历旧编码last_code所在树，将last_code对应字符串放入d_stack，前缀在栈底，后缀在d_stack[1]。返回字符串长度*/
			string_length = DecodeString(1, last_code);
		}
		else {//若字典中已有新编码
			/*遍历新编码new_code所在树，将new_code对应字符串放入d_stack，前缀在栈底，后缀在d_stack[0]。返回字符串长度*/
			string_length = DecodeString(0, new_code);
		}
		/*若新读取的编码不存在于词典中，character为旧编码last_code的首字母
		若新读取的编码存在于词典中，character为新编码new_code的首字母*/
		character = d_stack[string_length - 1];
		/*若新读取的编码不存在于词典中，输出旧编码last_code对应字符串+last_code的首字母
		若新读取的编码存在于词典中，输出新编码new_code对应字符串*/
		while (string_length > 0) {
			string_length--;
			fputc(d_stack[string_length], fp);
			file_length--;
		}
		/*若新读取的编码不存在于词典中，将last_code对应字符串+last_code的首字母添加到词典
		若新读取的编码存在于词典中，将last_code对应字符串+new_code的首字母添加到词典*/
		if (MAX_CODE > next_code) {
			AddToDictionary(character, last_code);
		}
		last_code = new_code;//新编码变为旧编码
	}
}

int main( int argc, char **argv){
	FILE *fp;
	BITFILE *bf;

	if( 4>argc){
		fprintf( stdout, "usage: \n%s   \n", argv[0]);
		fprintf( stdout, "\t: E or D reffers encode or decode\n");
		fprintf( stdout, "\t: input file name\n");
		fprintf( stdout, "\t: output file name\n");
		return -1;
	}
	if( 'E' == argv[1][0]){ // LZW编码
		fp = fopen( argv[2], "rb");//输入文件名
		bf = OpenBitFileOutput( argv[3]);//输出文件名
		if( NULL!=fp && NULL!=bf){
			LZWEncode( fp, bf);
			fclose( fp);
			CloseBitFileOutput( bf);
			fprintf( stdout, "encoding done\n");
		}
	}else if( 'D' == argv[1][0]){	// LZW解码
		bf = OpenBitFileInput( argv[2]);//输入文件名
		fp = fopen( argv[3], "wb");//输出文件名
		if( NULL!=fp && NULL!=bf){
			LZWDecode( bf, fp);
			fclose( fp);
			CloseBitFileInput( bf);
			fprintf( stdout, "decoding done\n");
		}
	}else{	
		fprintf( stderr, "not supported operation\n");
	}
	return 0;
}

2、bitio.h

#ifndef __BITIO__
#define __BITIO__

#include 

typedef struct{//二进制文件结构体
	FILE *fp;//输出文件指针
	unsigned char mask;//掩码
	int rack;//缓存，每写入8位，写入rack
}BITFILE;

BITFILE *OpenBitFileInput( char *filename);
BITFILE *OpenBitFileOutput( char *filename);
void CloseBitFileInput( BITFILE *bf);
void CloseBitFileOutput( BITFILE *bf);
int BitInput( BITFILE *bf);
unsigned long BitsInput( BITFILE *bf, int count);
void BitOutput( BITFILE *bf, int bit);
void BitsOutput( BITFILE *bf, unsigned long code, int count);
#endif	// __BITIO__

3、bitio.c

#include 
#include 
#include "bitio.h"
BITFILE *OpenBitFileInput( char *filename){
	BITFILE *bf;
	bf = (BITFILE *)malloc( sizeof(BITFILE));
	if( NULL == bf) return NULL;
	if( NULL == filename)	bf->fp = stdin;
	else bf->fp = fopen( filename, "rb");
	if( NULL == bf->fp) return NULL;
	bf->mask = 0x80;
	bf->rack = 0;
	return bf;
}

BITFILE *OpenBitFileOutput( char *filename){//输出文件名
	BITFILE *bf;
	bf = (BITFILE *)malloc( sizeof(BITFILE));
	if( NULL == bf) return NULL;
	if( NULL == filename)	bf->fp = stdout;//如果参数为NULL，则指向屏幕
	else bf->fp = fopen( filename, "wb");//以二进制只写的方式打开文件
	if( NULL == bf->fp) return NULL;
	bf->mask = 0x80;//掩码为10000000
	bf->rack = 0;//缓存为0
	return bf;
}

void CloseBitFileInput( BITFILE *bf){
	fclose( bf->fp);
	free( bf);
}

void CloseBitFileOutput( BITFILE *bf){
	// 输出剩余的二进制数
	if( 0x80 != bf->mask) fputc( bf->rack, bf->fp);
	fclose( bf->fp);//关闭二进制输出文件
	free( bf);//释放内存
}

int BitInput( BITFILE *bf){
	int value;

	if( 0x80 == bf->mask){//当mask为1000 0000时，从文件中得到一字节数据
		bf->rack = fgetc( bf->fp);
		if( EOF == bf->rack){//若成功得到数据
			fprintf(stderr, "Read after the end of file reached\n");//输出
			exit( -1);//非正常运行导致退出程序
		}
	}
	value = bf->mask & bf->rack;//取得mask掩码所表示的位置所在处的二进制数字
	bf->mask >>= 1;//mask向右移动一位
	if( 0==bf->mask) bf->mask = 0x80;//若溢出为0，则mask重新初始化为1000 0000
	return( (0==value)?0:1);//value为0则返回0，为其它数字则返回1
}

unsigned long BitsInput( BITFILE *bf, int count){
	unsigned long mask;//掩码
	unsigned long value;//
	/*计算掩码值，位数为count的数值且最高位为1，例如若count为16，则mask=1000 0000 0000 0000*/
	mask = 1L << (count-1);
	value = 0L;//初始化value为0
	/*mask由1000 0000 0000 0000向右移位至溢出为0时循环结束，取得16位的等长码*/
	while( 0!=mask){
		/*输出文件下一位为1时，value相应位变为1，为0时不作变化，遍历下一位*/
		if( 1 == BitInput( bf))
			value |= mask;//value在mask对应位置的二进制数字变为1
		mask >>= 1;//mask向右移动一位
	}
	return value;
}

void BitOutput( BITFILE *bf, int bit){
	/*若bite=1，则本code输出结束，此时mask为1，rack为0,则缓存rack变为1
	若bit=0，则尚未输出结束，此时mask向右移位，为0，rack不变*/
	if( 0 != bit) bf->rack |= bf->mask;
	bf->mask >>= 1;//mask向右移1位
	/*若mask溢出为0，则表示成功累计写入8位，则直接输出rack，
	并将rack初始化为0，mask初始化为1000 0000*/
	if( 0 == bf->mask){	// eight bits in rack
		fputc( bf->rack, bf->fp);
		bf->rack = 0;
		bf->mask = 0x80;
	}
}

void BitsOutput( BITFILE *bf, unsigned long code, int count){
	unsigned long mask;
	/*计算掩码值，位数为count的数值且最高位为1，例如若count为16，则mask=1000 0000 0000 0000*/
	mask = 1L << (count-1);
	while( 0 != mask){//mask为0时，说明code的count位数字输出完毕，注意：LZW是等长码
		BitOutput( bf, (int)(0==(code&mask)?0:1));//按位输出code
		mask >>= 1;//掩码向右移位
	}
}

参考

LZW压缩-百度百科
LZW编解码算法实现与分析_C语言实现

你可能感兴趣的:(数据压缩课程,c语言)

健身房预约小程序开发，开启智能健身时代冠品网络科技小程序开发小程序小程序制作健身房预约小程序健身房预约系统
在移动互联网时代，人们的生活习惯发生了巨大改变，促使行业都在寻求数字化转型，线下健身房也不例外。传统的线下健身房预约方式已经不能满足用户的需求，数字化预约方式能够带来便捷、高效的体验，不仅可以提升用户体验，还可以为健身行业带来新的发展机遇。健身房预约系统带来的优势1、便捷预约用户无需拨打电话或到店咨询，只需通过小程序即可随时随地查看课程安排、教练信息、场馆情况等，并完成预约，提高了场馆的转化率。2
从头开始学C语言第三十二天——函数神阶平天牛魔王 c语言
函数可以定义为完成特定功能的模块，函数程序代码独立，通常要求要有返回值，也就是return，也可以返回空值0主要函数分为三类：主函数也就是main函数库函数，包括用过的scanf，printf，strlen，strcpy等包含在stdio.h，string.h等库中自定义函数，程序员自己定义的函数模块一般形式：(){语句序列；return[()]；}数据类型是整个函数返回值的类型return语句表
腾讯面经，有点难度~ 后端go
今天分享组织内的朋友在腾讯安全的实习面经。内容涵盖了QPS测试方法、SQL聚合查询、Linux进程管理、Redis数据结构与持久化、NAT原理、Docker隔离机制、Go语言GMP调度模型、协程控制、系统调用流程、变量逃逸分析及map操作等等知识点。下面是我整理的面经详解：面经详解一个表，里面有数据列，id，name,class，查学生最喜欢的前10个课程，sql语句实现SELECTclass,C
SQL中体会多对多 PlumCarefree sql 数据库
我们可以根据学生与课程多对多关系的数据库模型，给出实际的表数据以及对应的查询结果示例，会用到JOIN``LEFTJOIN两种连接1.学生表（students）student_idstudent_name1张三2李四3王五2.课程表（courses）course_idcourse_name1数学2英语3物理3.选课表（student_courses）idstudent_idcourse_id1112
C语言关键字之“volatile” 你好，奋斗者！软件学习 c语言嵌入式计算机
目录一、回顾二、寄存器为什么是没有地址的？三、C语言中变量的访问四、volatile关键字（编译器实现的）一、回顾C语言中变量的定义存储类型特征修饰数据类型变量名决定变量的存储位置决定变量的特征属性决定变量的存储空间及数据范围决定变量的引用标识auto、static、extern、registorconst（修饰的变量只能读，不能写，不是常量，还是变量，只是变量的属性改了）、volatilecha
专业课笔记——（第一章：C、C++基础知识）大小胖虎 C/C++基础知识笔记算法 C C++数据类型操作类型笔记
目录一、数据类型二、不同格式输出的含义三、运算符优先级四、计算机基础知识五、零碎基础知识点一、数据类型1、C语言中的最简单的数据类型：整数类型、字符类型、浮点类型（C语言没有逻辑型(bool)它是C++特有的，而c语言它是通过0、1表示实现的）构造类型：枚举型、数组类型、结构体类型、共用体类型、类类型(C++特有)2、计算字符串长度：strlen()：c语言中的函数length()：c++中的函数
C语言如何生成随机数？(过程逐步分析) 祁同伟. #C语言 c语言
先给大家分享一个查阅函数的网站：cplusplus.com-TheC++ResourcesNetwork我们通过一道题讲解：实现1-100的猜数字游戏先将代码大框架罗列出来：voidmenu(){printf("**********1.play***********\n");printf("**********0.eixt***********\n");}voidgame(){}voidtest(
【C语言初学】C语言中表示次方与开根 JAMJAM_NoName C c语言开发语言后端
开根：doublesqrt(doublex)(对x开根)次方：doublepow(doublex,doubley)（计算x^y）上述两个函数都属于math库中使用前要将预处理命令#include包含进源文件中两个例题：1.输入三角形的三边长，求三角形的面积已知三条边长a,b,c三角形面积公式:#include#includeintmain(){doublea,b,c;scanf("%lf%lf%l
1.✨学习系统浅探 *TQK* 自我认知规划（不让别人看）认知提升
不要过于苛求完美，允许自己偶尔放松，保持积极心态。长期坚持比短期高强度更重要，尤其是为三年后的考研做准备，需要持续的努力而不是一时的冲刺。定期复盘，调整计划。如果某天状态不好，可以适当减少任务量，保持弹性。同时，保证足够的睡眠和运动，这对维持多巴胺水平和整体精力很重要。一、系统构建一Deepseek指令我的大一下学期已经开始了，这一学期我又有新的计算机课程。上一学期我学了C语言，基础知识掌握的还可
利用ffmpeg库实现音频AAC编解码 byxdaz 音视频 ffmpeg 音视频 aac
AAC‌（AdvancedAudioCoding）是一种音频编码技术，出现于1997年，基于MPEG-2的音频编码技术。AAC具有高效的数据压缩能力和较高的音质，适用于各种音频应用场景。例如，在智能设备中，AAC技术被广泛应用于提升用户体验，提供高质量的音频体验。一、FFmpeg支持的AAC编码器对比编码器特性适用场景‌aac‌FFmpeg原生实现，2015年后稳定支持‌，支持LC-AAC规格，兼
R语言入门课| 02 R及Rstudio的下载与安装 Biomamba生信基地 r语言开发语言生信
视频教程先上教程视频，B站同步播出：https://www.bilibili.com/video/BV1miNVeWEkw完整视频回放可见：R语言入门课回放来啦"R语言入门课"是我们认为生信小白入门不得不听的一个课程，我们也为这个课程准备了许多干货。在第二节课中，我们给大家详细的介绍了R及Rstudio的安装过程，大家赶紧装起图文内容1、R语言安装R是用于统计分析、绘图的语言和操作环境。R是一款属
字符串作为数组和用指针指向的字符串的区别 kfhj c语言
字符串作为数组和用指针指向的字符串在C语言（以及类似语言如C++）中都有各自的用途和特点。以下是它们之间的主要区别：定义和声明•字符串作为数组：字符串数组是一个字符数组，其中最后一个字符是空字符（’\0’），用于标识字符串的结束。例如：charstr[]=“Hello,World!”;这里，str是一个字符数组，包含了字符串"Hello,World!"和它的结尾空字符。•用指针指向的字符串：字符串
量化交易系统中如何处理机器学习模型的训练和部署？ openwin_top 量化交易系统开发机器学习人工智能量化交易
microPythonPython最小内核源码解析NI-motion运动控制c语言示例代码解析python编程示例系列python编程示例系列二python的Web神器Streamlit如何应聘高薪职位量化交易系统中，机器学习模型的训练和部署需要遵循一套严密的流程，以确保模型的可靠性、性能和安全性。以下是详细描述以及相关的示例：1.数据收集和预处理数据收集在量化交易中，数据是最重要的资产。收集的数
计算机网络课程内容详解-ChatGPT4o作答部分分式计算机网络
计算机网络课程是一门系统讲解网络体系结构、通信协议、网络技术和应用的专业课程，旨在帮助学生理解计算机网络的工作原理、设计思想和实际应用。以下是计算机网络课程内容的详细介绍，涵盖知识结构、主要内容及应用方向。一、课程目标掌握计算机网络的基本概念、结构及运行原理。理解计算机网络分层模型（如OSI七层模型和TCP/IP四层模型）。掌握常见的通信协议及其功能（如HTTP、FTP、DNS等）。学会网络设备（
stc89c51单片机音乐盒系统设计_基于单片机STC89C52的数字音乐盒设计 Fax Caelestis
基于单片机STC89C52的数字音乐盒设计1基于单片机STC89C52的数字音乐盒设计一、引言1.1设计的目的通过课程设计，让学生熟悉单片机微机应用系统开发、研制的过程，软硬件设计的工作方法、工作内容、工作步骤。对学生进行基本技能训练，例如：组成系统、编程、调试、查阅资料、焊接电路板等。使学生理论联系实际，提高动手能力和分析问题、解决问题的能力。1.2设计的基本要求(1)利用I/O口产生一定频率的
通过动态内存管理实现在VS2022中实现变长数组 Dust-Chasing 开发语言 c语言数据结构算法
目录一、malloc函数和free函数二、calloc函数三、realloc函数不知道大家在使用vs2022编译器时有没有遇见过这样一个问题，当我们用一个变量来作为数组的大小时，编译器会报错，要求我们使用常量，这样一来就会使我们的内存空间被大量浪费，使我们非常的头疼，但是如果当我们学到动态内存管理时，我们就有了解决这个问题的办法。一、malloc函数和free函数C语言提供了一个动态内存开辟的函数
深入理解指针（1） Dust-Chasing c语言开发语言
指针，一般是代指针变量，指针是C语言中至关重要的一部分。由于内容较多，且较难，所以我们掰开了揉碎了慢慢讲，今天我们开始先讲解字符指针，指针数组，数组指针。一、字符指针指针与数据类型相同，有多种分类inta=0;int*pd=&a;//取a的地址，并将其存入指针变量pd中doubleb=5.20;double*pb=&b;//取b的地址floatc=13.14;float*pc=&c;//取c的地址
C语言三大程序结构 & 单分支语句要下雨了吗 c语言 c++visual studio
核心概念：程序就像流水线，通过顺序、选择、循环三种结构完成复杂任务一、三大程序结构图解结构类型形象比喻代码示例顺序直行马路→不拐弯printf("A");printf("B");选择岔路口→二选一if...else循环环形跑道→重复绕圈for/while二、选择结构：if语句完全指南1.基础语法（单分支）if(条件表达式){语句1；//条件成立时执行}else{语句2；//条件不成立时执行}2.真
递归实例：登台阶问题:假如有n个台阶，一次只能上1个台阶或2个台阶，请问走到第n个台阶有几种走法？@C语言热心市民小汪 C语言代码练习 c语言算法开发语言
假如有n个台阶，一次只能上1个台阶或2个台阶，请问走到第n个台阶有几种走法？为便于读者理解题意，这里举例说明如下：假如有3个台阶，那么总计就有3种走法：第一种为每次上1个台阶，上3次；第二种为先上2个台阶，再上1个台阶；第三种为先上1个台阶，再上2个台阶。输入为n，输出为走到第n个台阶有几种走法Input3Output如果输入是3，走到第3个台阶的走法总计有3种，1,1,1和1,2和2,1，输出为
某人想将手中的一张面值100元的人民币换成10元、5元、2元和1元面值的票子。要求换正好40张，且每种票子至少一张。问：有几种换法？（C语言）热心市民小汪代码练习 C语言 c语言学习 java
一、首先分析题目有两点1、总和是100元。2、一共分为四十张且每种至少有一张。二、思路分析。10元的为s张，5元的为w张，2元的为e张，1元的为y张。n为有几种换算法首先，每个至少有一张a>=1,b>=1,c>=1,d>=1。#includeintmain(){inttotal;for(ints=1;s<=10;s++){for(intw=1;w<=20;w++){for(inte=1;e<=40
读取一个字符串，字符串可能含有空格，将字符串逆转,原字符串与逆转字符串进行比较@C语言热心市民小汪代码练习 C语言算法学习 c语言开发语言
读取一个字符串，字符串可能含有空格，将字符串逆转原来的字符串与逆转后字符串比较相同，输出0，原字符串小于逆转后字符串输出-1，大于逆转后字符串输出1。例如输入hello，逆转后的字符串为olleh，因为hello小于olleh，所以输出-1SampleInput1helloSampleOutput1-1#include#includeintmain(){charstr[20];charreStr[
网络空间安全专业发展历程及开设院校菜根Sec 安全网络安全网络安全高校网络空间安全信息安全
一、专业发展历程1.早期探索阶段（1990年代末—2000年代初）（1）背景：1990年代互联网进入中国，计算机病毒、黑客攻击等问题逐渐显现，社会对信息安全人才的需求开始萌芽。（2）高校尝试：1997年，西安电子科技大学在密码学领域积累深厚，率先开设与信息安全相关的选修课程和研究方向。1998年，武汉大学依托其计算机学院和数学学科优势，开始探索信息安全方向的本科教育。2.正式设立本科专业（2001
网络空间安全专业培养方案及学习建议菜根Sec 学习网络安全网络空间安全信息安全大学专业
一、网络空间安全专业培养方案（示例）本文以武汉大学网络空间安全专业培养方案为例，列举本科期间学习的课程。详情参见：https://cse.whu.edu.cn/rcpy/lxspy/zyjs/wlkjaqzypyfa.htm1、培养目标网络空间安全学科是综台计算机、通信、电子、数学、物理、生物、管理、法律和教育等学科，并发展演绎而形成的交叉学科。培养的本科生要求掌握网络空间安全学科的基本理论、基本
嵌入式Linux驱动开发：从基础知识到实践精通坚持坚持那些年
本文还有配套的精品资源，点击获取简介：嵌入式Linux由于其稳定性、可定制性和丰富资源，在智能设备领域得到广泛应用。掌握嵌入式Linux驱动程序设计对于开发者至关重要。本课程从基础知识点出发，详细介绍了内核接口理解、设备树编程、I/O操作、字符与块设备驱动、网络驱动、电源管理、调试技巧、硬件抽象层、设备模型和模块化编程等关键技能，并通过实际操作实践来强化学习，帮助开发者成长为嵌入式Linux驱动开
Problem F: C语言习题 a!+b!+c! 菜瓜技术联盟 c语言基础 Problem F:C语言习题 a!b!c!C语言习题 a!b!c!求a!b!c!的值 b
ProblemF:C语言习题a!+b!+c!TimeLimit:1SecMemoryLimit:128MBDescription求a!+b!+c!的值，用一个函数fac(n)求n!。a,b,c的值由主函数输入，最终得到的值在主函数中输出。Inputa,b,c的值Outputa!+b!+c!的值SampleInput123SampleOutput9HINT主函数已给定如下，提交时不需要包含下述主函数
C语言的scanf函数海风有点咸 scanf函数 c语言
scanf函数简介scanf是ScanFormat的缩写，意思是格式化扫描，也就是从键盘获得用户输入。scanf函数称为格式输入函数，即按用户指定的格式从键盘上把数据输入到指定的变量之中。scanf()是C语言中的一个输入函数。与printf函数一样，都被声明在头文件stdio.h里，因此在使用scanf函数时要加上#include。（在有一些实现中，printf函数与scanf函数在使用时可以不
C语言中scanf函数 dcdc999 c语言 c++
scanf包含在几乎每个程序都包含了输入输出，而在C语言函数库中有一批标准输入输出函数，它是以标准的输入输出设备（终端设备）为输入输出为输入输出的对象，而scanf(格式输入)和printf(格式输出)是其中的一组输入输出函数，两者都在头文件中，注意在使用这组函数时应该在源程序的首行写预处理命令。#include//预处理命令scanf函数标准输入设备一般格式为：scanf(格式控制符,地址列表)
C语言_数据结构总结8：链式队列 *.✧屠苏隐遥(ﾉ◕ヮ◕)ﾉ*.✧ C语言—数据结构数据结构 c语言开发语言 visualstudio visual studio 链表
纯C语言实现，不涉及C++链队列队列的链式表示称为链队列，它实际上是一个同时具有队头指针和队尾指针的单链表，头指针指向对头结点，尾指针指向队尾结点。头结点是链式队列中的特殊结点，通常不存储实际的队列元素数据，其主要作用是方便对队列的操作，例如在进行入队、出队操作时，可以统一操作逻辑，无需特殊处理队列为空的情况。它作为队列的头部标识，其next指针指向队列中的第一个真正存储数据的结点。尾结点（注意区
C语言_数据结构总结10：二叉树的递归/非递归遍历 *.✧屠苏隐遥(ﾉ◕ヮ◕)ﾉ*.✧ C语言—数据结构数据结构算法链表 visualstudio visual studio c语言 b树
纯C语言实现，不涉及C++遍历是二叉树各种操作的基础，例如对于一棵给定二叉树求结点的双亲/求结点的孩子/求二叉树的高度/求叶结点个数/判断两棵二叉树是否相等……所有这些操作都是在二叉树遍历的过程中进行的。因此必须掌握二叉树的各种遍历过程，并能灵活用以解决各种问题。常见的遍历次序有：先序，中序，后序->其中“序”是指根结点何时被访问。先序：根结点->左子树->右子树中序:左子树->根结点->右子树后
C语言指针入门(一) 悄悄敲敲敲 c语言开发语言
1.什么是指针？内存会划分为一个个内存单元（一个内存单元大小为1字节）每个内存单元都有一个编号即地址也被称为指针，我们可以理解为指针就是地址。通过指针可以找到其所指向的内存单元。就像我们第一次去一个朋友家时可以通过门牌号找到她的家一样，指针就是所存储数据的“门牌号”但不同的地方是在C语言中不同类型的数据在内存中所占用的字节数和存储方式是不一样的，所以我们在存取数据时不仅要知道位置信息还要知道该数据
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_