amy2020

Huffman 编解码算法实现与压缩效率分析

一、实验原理

1 熵，又称为“信息熵” (Entropy)

1.1 在信息论中，熵是信息的度量单位。信息论的创始人 Shannon 在其著作《通信的数学理论》中提出了建立在概率统计模型上的信息度量。他把信息定义为“用来消除不确定性的东西”。

1.2 一般用符号 H 表示，单位是比特。对于任意一个随机变量 X，它的熵定义如下：

1.3 变量的不确定性越大，熵也就越大。换句话说，了解它所需要的信息量也就越大。

2 Huffman 编码

2.1 Huffman Coding (霍夫曼编码)是一种无失真编码的编码方式，Huffman 编码是可变字长编码(VLC)的一种。

2.2 Huffman 编码基于信源的概率统计模型，它的基本思路是，出现概率大的信源符号编长码，出现概率小的信源符号编短码，从而使平均码长最小。

2.3 在程序实现中常使用一种叫做树的数据结构实现 Huffman 编码，由它编出的码是即时码。

3 Huffman 编码的方法

3.1 统计符号的发生概率；

3.2 把频率按从小到大的顺序排列

3.3 每一次选出最小的两个值，作为二叉树的两个叶子节点，将和作为它们的根节点，这两个叶子节点不再参与比较，新的根节点参与比较；

3.4 重复 3，直到最后得到和为 1 的根节点；

3.5 将形成的二叉树的左节点标 0，右节点标 1，把从最上面的根节点到最下面的叶子节点途中遇到的 0，1 序列串起来，就得到了各个符号的编码。

4.静态链接库的使用

本实验包含两个project，第一个project为huff_code，是实现Huffman编码，会生成一个.lib文件。第二个project为Huff_run。在此，需要配置库目录属性和附加依赖属性。

二、Huffman编解码流程

编码流程：

解码流程：

1.节点数据类型定义

typedef struct huffman_node_tag 
{ 
  unsigned char is Leaf;     /* 是否为叶结点*/ 
  unsigned long count;     /* 信源中出现频数 */ 
  struct huffman_node_tag *parent;     /* 父节点指针 */ 
  union   
  { 
   struct 
   { 
    struct huffman_node_tag *zero, *one;  /*如果不是树叶,则此项为该结点左右孩子的指针*/
    }; 
   unsigned char symbol; /*如果是树叶,为某个信源符号 */ 
  }; 
} huffman_node;

2.码字节点数据类型定义

typedef struct huffman_code_tag 
{ 
  /*  码字的长度(单位:位) */ 
  unsigned long numbits; 
 /*  码字,  
     码字的第 1 位存于 bits[0]的第 1 位,      
     码字的第 2 位存于 bits[0]的第 2 位, 
     码字的第 8 位存于 bits[0]的第 8 位, 
     码字的第 9 位存于 bits[1]的第 1 位  */ 
  unsigned char *bits; 
} huffman_code;

三、Huffman代码分析

1.主函数

int
main(int argc, char** argv)
{
	char memory = 0;
	char compress = 1;
	int opt;
	const char *file_in = NULL, *file_out = NULL;
	//step1:add by yzhang for huffman statistics
	const char *file_out_table = NULL;
	//end by yzhang
	FILE *in = stdin;
	FILE *out = stdout;
	//step1:add by yzhang for huffman statistics
	FILE * outTable = NULL;
	//end by yzhang

	/* Get the command line arguments. */
	while((opt = getopt(argc, argv, "i:o:cdhvmt:")) != -1) //演示如何跳出循环，及查找括号对
	{
		switch(opt)
		{
		case 'i'://输入文件
			file_in = optarg;
			break;
		case 'o'://输出文件
			file_out = optarg;
			break;
		case 'c'://编码
			compress = 1;
			break;
		case 'd'://解码 
			compress = 0;
			break;
		case 'h'://参数用法输出到屏幕 
			usage(stdout);
			return 0;
		case 'v'://版本信息输出到屏幕  
			version(stdout);
			return 0;
		case 'm'://对内存数据进行编码
			memory = 1;
			break;
		// by yzhang for huffman statistics
		case 't'://编码结果输出  
			file_out_table = optarg;			
			break;
		//end by yzhang
		default:
			usage(stderr);
			return 1;
		}
	}

	/* If an input file is given then open it. */
	if(file_in)
	{
		in = fopen(file_in, "rb");
		if(!in)
		{
			fprintf(stderr,
					"Can't open input file '%s': %s\n",
					file_in, strerror(errno));
			return 1;
		}
	}

	/* If an output file is given then create it. */
	if(file_out)
	{
		out = fopen(file_out, "wb");
		if(!out)
		{
			fprintf(stderr,
					"Can't open output file '%s': %s\n",
					file_out, strerror(errno));
			return 1;
		}
	}

	//by yzhang for huffman statistics
	if(file_out_table)
	{
		outTable = fopen(file_out_table, "w");
		if(!outTable)
		{
			fprintf(stderr,
				"Can't open output file '%s': %s\n",
				file_out_table, strerror(errno));
			return 1;
		}
	}
	//end by yzhang

	if(memory)//memeory=1编码,memory!=1解码 
	{
		return compress ?
			memory_encode_file(in, out) : memory_decode_file(in, out);
	}

	if(compress)  //change by yzhang
		huffman_encode_file(in, out,outTable);//step1:changed by yzhang from huffman_encode_file(in, out) to huffman_encode_file(in, out,outTable)
	else
	huffman_decode_file(in, out);

	if(in)
		fclose(in);
	if(out)
		fclose(out);
	if(outTable)
		fclose(outTable);
	return 0;
}

2.编码程序

（1）第一次扫描，统计信源字符发生频率（8 比特，共 256 个信源符号）。

<1>创建一个 256 个元素的指针数组，用以保存 256 个信源符号的频率。其下标对应相应字符的 ASCII 码。

<2>数组中的非空元素为当前待编码文件中实际出现的信源符号。

<3>程序代码如下:

typedef huffman_node* SymbolFrequencies[MAX_SYMBOLS]; 
SymbolFrequencies sf;
static unsigned int get_symbol_frequencies(SymbolFrequencies *pSF, FILE *in)
{
	int c;
	/* 总信源符号数初始化为 0 */ 
	unsigned int total_count = 0;   
	/* 将所有信源符号地址初始化为 NULL(0) */  
	init_frequencies(pSF);    
	/* 第一遍扫描文件 */ 
	while ((c = fgetc(in)) != EOF)  
	{ 
		unsigned char uc = c;   
		/* 如果是一个新符号,则产生该字符的一个新叶节点 */  
		if (!(*pSF)[uc])    
			(*pSF)[uc] = new_leaf_node(uc);   
		/* 当前字符出现的频数+1 */   
		++(*pSF)[uc]->count;   
		/* 总信源符号数 +1 */   
		++total_count; 
	}    
	return total_count;
}

(2)建立 Huffman 树并计算符号对应的 Huffman 码字

<1>按频率从小到大顺序排序并建立 Huffman 树

static SymbolEncoder* calculate_huffman_codes(SymbolFrequencies * pSF) 
{
	unsigned int i = 0; 
	unsigned int n = 0; 
	huffman_node *m1 = NULL, *m2 = NULL; 
	SymbolEncoder *pSE = NULL;
	/* 按信源符号出现频率大小排序.小概率符号在前(pSF 数组中)   * 下标较小   */ 
	qsort((*pSF), MAX_SYMBOLS, sizeof((*pSF)[0]), SFComp);  
	/* 得到当前待编码文件中所出现的信源符号的种类总数 */ 
	for (n = 0; n < MAX_SYMBOLS && (*pSF)[n]; ++n);
	/*   * 建立 huffman 树。需要合并 n-1 次，所以循环 n-1 次。   */
	for (i = 0; i < n - 1; ++i) 
	{  
		/* 将 m1、m2 置为当前频数最小的两个信源符号 */   
		m1 = (*pSF)[0];   m2 = (*pSF)[1];
		/* 将 m1、m2 合并为一个 huffman 结点加入到数组中，
		左右孩子分别置为 m1、m2 的地址，频数为 m1、m2 的频数  
		* 之和。    */   
		(*pSF)[0] = m1->parent = m2->parent = 
			new_nonleaf_node(m1->count + m2->count, m1, m2); 
		(*pSF)[1] = NULL;     
		/* 在 m1、m2 合并后重新排序 */  
		qsort((*pSF), n, sizeof((*pSF)[0]), SFComp);
	}
	/* 由建立的 huffman 树对计算每个符号的码字. */ 
	pSE = (SymbolEncoder*)malloc(sizeof(SymbolEncoder));  
	memset(pSE, 0, sizeof(SymbolEncoder)); 
	build_symbol_encoder((*pSF)[0], pSE);  
	return pSE;
}

<2>递归遍历 Huffman 树，对存在的每个字符计算码字

typedef huffman_code* SymbolEncoder[MAX_SYMBOLS]; 
/* 256 个 huffman_code 的指针，位置上对应于 ASCII 的顺序，用于保存码表 */

void build_symbol_encoder(huffman_node *subtree, SymbolEncoder *pSF) 
{
	if (subtree == NULL) /* 是否已到了 root, 是则说明编码结束，return */ 
		return;    
	if (subtree->isLeaf) /* 是叶结点则产生码字 */   
		(*pSF)[subtree->symbol] = new_code(subtree);  
	else  
	{ 
		build_symbol_encoder(subtree->zero, pSF); 
		/* 递归， 中序遍历 */  
		build_symbol_encoder(subtree->one, pSF); 
	}
}
huffman_code* new_code(const huffman_node* leaf)
{
	/* Build the huffman code by walking up to 
	* the root node and then reversing the bits,   
	* since the Huffman code is calculated by  
	* walking down the tree. */ 
	unsigned long numbits = 0; /* 码长 */  
	unsigned char* bits = NULL; /* 码字首地址 */ 
	huffman_code *p;

	while (leaf && leaf->parent) /* leaf !=0: 当前字符存在，应该编码 */    
		/* leaf->parent !=0: 当前字符的编码仍未完成，即未完成 由叶至根的该字符的编码过程 */ 
	{
		huffman_node *parent = leaf->parent;  
		unsigned char cur_bit = (unsigned char)(numbits % 8); /* 所编位在当前 byte 中的位置 */  
		unsigned long cur_byte = numbits / 8; /* 当前是第几个 byte */
		/* If we need another byte to hold the code,   
		then allocate it. */  
		/* realloc 这里很关键，它与 malloc 不同，它在保持原有的数据不变的情
		况下重新分配新的空间，原有数据存在新空间中的前面部分
		（这里空间的地址可 能有变化） */   
		if (cur_bit == 0)   
		{ 
			size_t newSize = cur_byte + 1; 
			bits = (unsigned char*)realloc(bits, newSize);  
			bits[newSize - 1] = 0; /* 初始化新分配的 8bit 为 0 */
		}
		/* If a one must be added then or it in. If a zero   
		* must be added then do nothing, since the byte   
		* was initialized to zero. */ 
		if (leaf == parent->one)    
			bits[cur_byte] |= 1 << cur_bit; /* 左移 1 至当前 byte 的当前位(待编位) */
		++numbits;  
		leaf = parent;
	}
	if (bits)  
		reverse_bits(bits, numbits); /* 整个码字逆序 */
	p = (huffman_code*)malloc(sizeof(huffman_code));
	p->numbits = numbits; 
	p->bits = bits; /* 整数个字节。与 numbits 配合才可得到真正码字 */ 
	return p;
}

(3)将 Huffman 码表写入文件

for (i = 0; i < MAX_SYMBOLS; ++i)  
{
	huffman_code *p = (*se)[i]; 
	if (p) 
	{
		unsigned int numbytes;  
		/* Write the 1 byte symbol. */ 
		fputc((unsigned char)i, out);   
		/* Write the 1 byte code bit length. */ 
		fputc(p->numbits, out);  
		/* Write the code bytes. */  
		numbytes = numbytes_from_numbits(p->numbits);  
		if (fwrite(p->bits, 1, numbytes, out) != numbytes)  
			return 1; 
	} 
}

(4)第二次扫描文件，对文件查表进行 Huffman 编码，并写入文件

int do_file_encode(FILE* in, FILE* out, SymbolEncoder *se) 
{
	unsigned char curbyte = 0; 
	unsigned char curbit = 0;
	int c;   
	while ((c = fgetc(in)) != EOF) /* 遍历文件的每一个字符(/字节) */  
	{
		unsigned char uc = (unsigned char)c;  
		huffman_code *code = (*se)[uc]; /* 查表 */ 
		unsigned long i;     
		for (i = 0; i < code->numbits; ++i) /* 将码字写入文件 */  
		{   
			/* Add the current bit to curbyte. */  
			curbyte |= get_bit(code->bits, i) << curbit;
		/* If this byte is filled up then write it   
		* out and reset the curbit and curbyte. */   
			if (++curbit == 8)    {
				fputc(curbyte, out);    
				curbyte = 0;    
				curbit = 0;
			}
		}
	}
	/*   * If there is data in curbyte that has not been  
	* output yet, which means that the last encoded  
	* character did not fall on a byte boundary,   
	* then output it.   
	*/  if (curbit > 0)   fputc(curbyte, out);
	return 0;
}

3.解码程序

(1)读取码表并重建据此 Huffman 树

huffman_node* read_code_table(FILE* in, unsigned int *pDataBytes)
{
	huffman_node *root = new_nonleaf_node(0, NULL, NULL);
	unsigned int count;
	if (fread(&count, sizeof(count), 1, in) != 1) // 得到码表中的符号数 
	{
		free_huffman_tree(root);
		return NULL;
	}
	/* Read the number of data bytes this encoding represents. */
	if (fread(pDataBytes, sizeof(*pDataBytes), 1, in) != 1)
	{
		free_huffman_tree(root);   return NULL;
	}
	/* Read the entries. */
	while (count-- > 0)
		/* 检查是否仍有叶节点未建立，每循环一次建立起一条由根
		节点至叶结点（符号）的路径 */
	{
		int c;
		unsigned int curbit;
		unsigned char symbol;
		unsigned char numbits;
		unsigned char numbytes;
		unsigned char *bytes;
		huffman_node *p = root;
		if ((c = fgetc(in)) == EOF)
		{
			free_huffman_tree(root);
			return NULL;
		}
		symbol = (unsigned char)c; // 符号    
		if ((c = fgetc(in)) == EOF)
		{
			free_huffman_tree(root);
			return NULL;
		}
		numbits = (unsigned char)c; // 码长  
		numbytes = (unsigned char)numbytes_from_numbits(numbits);
		bytes = (unsigned char*)malloc(numbytes);
		// 为读取码字分配空间  
		if (fread(bytes, 1, numbytes, in) != numbytes) // 读取码字  
		{
			free(bytes);
			free_huffman_tree(root);
			return NULL;
		}
		/*    * Add the entry to the Huffman tree. The value
		* of the current bit is used switch between
		* zero and one child nodes in the tree. New nodes
		* are added as needed in the tree.    */
		for (curbit = 0; curbit < numbits; ++curbit)
			// 读取当前码字的每一位，并依 据读取的结果逐步建立起由根节点至该符号叶结点的路径   
		{
			if (get_bit(bytes, curbit)) // 当前读取位是否为’1’   
			{ // 当前读取位为’1’   
				if (p->one == NULL)
				{
					p->one = curbit == (unsigned char)(numbits - 1)
						/* 是否是当 前码字的最后一位，是，则新建叶结点；不是，则新建非叶结点。  */
						? new_leaf_node(symbol)
						: new_nonleaf_node(0, NULL, NULL);
					p->one->parent = p; // ‘1’的一枝的父节点指向当前节点   
				}
				p = p->one; // 沿’1’方向下移一级   
			}
			else
			{  // 当前读取位为’0’  
				if (p->zero == NULL)
				{
					p->zero = curbit == (unsigned char)(numbits - 1)
						? new_leaf_node(symbol)
						: new_nonleaf_node(0, NULL, NULL);
					p->zero->parent = p;
				}
				p = p->zero;
			}
		}
		free(bytes);
	}

	return root; // 返回 Huffman 树的根结点
}

(2)读取 Huffman 码字，并解码输出

Int huffman_decode_file(FILE *in, FILE *out)
{
	huffman_node *root, *p;
	int c; 
	unsigned int data_count; 
	/* Read the Huffman code table. */ 
	root = read_code_table(in, &data_count); 
	if (!root)   
		return 1; // Huffman 树建立失败  
	/* Decode the file. */  
	p = root; 
	while (data_count > 0 && (c = fgetc(in)) != EOF) // data_count >0 ：逻辑上仍有 数据；(c = fgetc(in)) != EOF)：文件中仍有数据。 
	{   
		unsigned char byte = (unsigned char)c; 
		// 1byte 的码字   
		unsigned char mask = 1; // mask 用于逐位读出码字
		while(data_count > 0 && mask) // loop9: mask = 0x00000000,跳出循环 
		{   
			p = byte & mask ? p->one : p->zero; // 沿 Huffman 树前进 
			mask <<= 1;  // loop1: byte & 0x00000001   
			// loop2: byte & 0x00000010    
			// ……    
			// loop8: byte & 0x10000000
			if (p->isLeaf) // 至叶结点（解码完毕）   
			{   
				fputc(p->symbol, out);    
				p = root;   
				--data_count;    }   
		} 
	}  
				
	free_huffman_tree(root); // 所有 Huffman 码字均已解码输出，文件解码完毕 
	return 0; 
}

四、实验结果分析

1.，输出编码结果文件（以列表方式显示字符、字符发生的概率、字符对应编码码字长度、字符对应编码码字）。

以doc文件为例：

2.选择十种不同格式类型的文件，使用Huffman编码器进行压缩得到输出的压缩比特流文件：

3.以表格形式表示的实验结果：

文件类型	doc	psd	jpg	pdf	MP4	yuv	xls	ppt	exe	zip
平均码长	7.67	7.12	7.98	8.00	8.00	2.38	4.19	7.66	5.79	8.00
信源熵（bit/symbol）	7.64	7.08	7.96	7.98	7.98	2.29	4.17	7.62	5.74	7.99
原文件大小（kB）	3083	11454	355	1065	2637	732	49	1618	374	3499
压缩后文件大小（kB）	2956	10195	355	1065	2637	219	27	1551	272	3499
压缩比	1.04	1.12	1.00	1.00	1.00	3.34	1.81	1.04	1.38	1.00

4.各样本文件的概率分布图：

5.实验结果的分析。根据3和4的结果，对各种不同类型文件的统计特性和压缩效率进行分析：

a.Huffman的信源熵是平均码长的最下限，共有256种符号，最大信源熵为8bit/symbol；

b.由图分析可知，概率分布越均匀，压缩比越小，反之，概率分布越不均匀，压缩比越大；

计算机集成电板 ppt,史上最全，PCB板和集成电路解析（干货分享）姚脑师计算机集成电板 ppt
原标题：史上最全，PCB板和集成电路解析(干货分享)目前的电路板，主要由以下组成：线路与图面(Pattern)：线路是做为原件之间导通的工具，在设计上会另外设计大铜面作为接地及电源层。线路与图面是同时做出的。介电层(Dielectric)：用来保持线路及各层之间的绝缘性，俗称为基材。孔(Throughhole/via)：导通孔可使两层次以上的线路彼此导通，较大的导通孔则做为零件插件用，另外有非导通
2017安全之势：云、大数据、IoT、人工智能 weixin_34392906 人工智能大数据嵌入式
“新技术让信息系统变成了孙悟空，开始无所不能，但安全仍是它的‘紧箍咒’！怎样解开这个‘紧箍咒’？各路安全厂商各显其能，但似乎路漫漫兮离目标还很遥远。”三未信安董事长张岳公在ZD至顶网《百位意见领袖寄语2017》中说出了这样一句话，我觉着很有道理。安全是一个永恒的话题，如果说它与新的信息技术相生相克也不过分。即便如此，我们更要尽可能的减少安全带来的束缚。2017已经到来，不妨来看看至顶网与业界大咖总
无锁并发环形队列(Java版) 呆呆的蜗牛数据结构和算法队列 java 多线程
环形队列是顺序队列的一种。普通的顺序队列，当队列不满且tail指针移动到数组的最后位置时，就需要将数组中的元素整体向前搬移，而环形队列却不用。这就提高了入队的效率。无锁并发主要基于CAS原理，在java中Unsafe类中提供了底层的CAS操作。但是我们可以不直接操作Unsafe类，JDK提供了一系列的Atomic类来满足一般的无锁需求。importjava.util.concurrent.atom
深入解析 Java Stream API：筛选根节点的优雅实现！！！小丁学Java #Lambda表达式 #Stream java Stream Lambda 表达式 Collectors
深入解析JavaStreamAPI：筛选根节点的优雅实现大家好！今天我们来聊聊Java8中一个非常常见的操作：使用StreamAPI从List中筛选出特定条件的元素。具体来说，我们将深入分析以下代码片段：Listroots=inviteCodes.stream().filter(ic->ic.getCreatedBy()==null).collect(Collectors.toList());这段
python if用法 IT技术土狗 python从入门到入狱 python
pythonif用法流程控制流程控制即控制流程，具体指控制程序的执行流程，而程序的执行流程分为三种结构：顺序结构（之前我们写的代码都是顺序结构）、分支结构（用到if判断）、循环结构（用到while与for）1、分支结构分支结构就是根据条件判断的真假去执行不同分支对应的子代码2、为什么需要分支结构人类某些时候需要根据条件来决定做什么事情，比如：如果今天下雨，就带伞所以程序中必须有相应的机制来控制计算
python与数值有关的问题 cbxjsdg python
1.复数的问题x=123+456j#后面没加j部分为实数，加j部分为虚数print('实数部分',x.real)#表示实数print('虚数部分',x.imag)#表示虚数2.查看数值的类型a=10b=10.0c=1.99E2#表示1.99*10的二次方的意思，这是科学计数法print('数值为',a,'数值类型为',type(a))print('数值为',b,'数值类型为',type(b))pr
【架构设计】前置知识 GIS程序媛—椰子架构设计架构设计
架构设计是软件开发的进阶技能，需要结合理论知识和实践经验。以下是掌握架构设计所需的前置知识及其重要性，以及学习路径建议：一、基础编程能力1.编程语言与核心概念掌握至少一门主流语言（如Java、Python、C#、Go等），理解其语法、特性及生态。核心概念：面向对象（OOP）、函数式编程（FP）、并发/异步、内存管理等。示例：通过Java理解接口、多态、设计模式。通过Go学习并发模型（Gorouti
Python, C ++开发家庭开支 Geeker-2025 python c++
开发一款**家庭开支数字化记录与结算App**是一个非常有意义的项目，旨在帮助家庭用户高效管理开支、记录消费、分析财务状况，并提供结算和预算管理功能。以下是基于**Python**和**C++**的开发方案，结合两者在数据处理、实时通信和系统开发中的优势。---##1.**项目需求分析**家庭开支数字化记录与结算App的核心功能包括：1.**用户管理**：-用户注册、登录，支持家庭成员管理。2.*
乘法阵列器 2401_83299419 计算机组成原理乘法矩阵器
不带符号的原码乘法阵列器m位×n位二进制数的计算过程A表示为a_{m-1}a_{m-2}…a_1a_0，B表示为b_{n-1}…b_1b_0每个a_i与b_j相乘得到一个部分积。最终将这些部分积相加得到结果P，表示为p_{m+n-1}p_{m+n-2}…p_1p_0。例如：带符号的乘法阵列器对二求补电路：补码的计算规则如下：当符号位为0时：如果一个二进制数的符号位（最高位）为0，表示这是一个正数，
编程行业必备！12个热门AI工具帮你写代码~ DevSecOps选型指南人工智能软件供应链安全工具代码安全开发助手 SAST 安全
到今年，AI编程工具的发展已经非常成熟了，它们可以极大地提高开发效率，帮助程序员解决复杂问题，并优化代码质量。拒绝废话，今天给大家推荐12款AI编程工具！1悬镜安全灵脉AI开发安全卫士灵脉AI开发安全卫士是基于多模智能引擎的新一代静态代码安全扫描产品，通过自动化审查流程来定位潜在缺陷、提升审计效率和代码质量，并显著减少手动审查所需的时间和精力。该平台利用人工智能技术，提供逐行的代码反馈，建议改进和
安全工具推荐 | 软件成分分析工具悬镜安全源鉴SCA，业内排名TOP 1的SCA工具 DevSecOps选型指南安全开源软件安全威胁分析
开源软件带来的安全性问题非常多，而SCA在软件成分分析、组件投毒检测、许可证合规风险、漏洞风险、软件代码开源比例检测等方面，都有很好的效果。可以看作SCA软件成分分析是数字供应链安全开源风险治理中最核心的工具，也是数字供应链安全的管理入口。本文结合悬镜安全源鉴SCA工具的深度使用来展开介绍国内排名Top1的SCA工具。发展历程：2016年，悬镜开始了第一代SCA产品技术的研发工作，历经4年，201
Java设计模式——装饰模式爱吃土豆的程序员 Java设计模式 java 装饰器模式设计模式
目录模式动机模式定义模式结构类图代码分析示例：动态添加功能的流组件接口具体组件装饰抽象类具体装饰类客户端模式分析核心思想动态扩展功能组合优于继承优点动态扩展功能组合优于继承代码复用性高符合开闭原则缺点增加系统的复杂性类的膨胀复杂的调试适用环境动态扩展功能避免继承带来的类爆炸性增长高度可定制化的需求模式应用输入输出流GUI组件日志记录模式扩展多层次装饰结合其他设计模式总结模式动机一般有两种方式可以实
HarmonyOS Next 安全机制深度剖析 SameX-4869 harmonyos 华为
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）的安全机制相关技术细节，基于实际开发实践进行总结。主要作为技术分享与交流载体，难免错漏，欢迎各位同仁提出宝贵意见和问题，以便共同进步。本文为原创内容，任何形式的转载必须注明出处及原作者。第一章：安全体系架构一、整体架构介绍HarmonyOSNext的安全体系架构犹如一座坚固的城堡，从多个层面为系统和应用提供全方位的保护。它
Python接口自动化花落同学 Python自动化从入门到放弃 python 自动化
4接口自动化4.1使用python实现接口自动化如果不了解接口测试可参考https://ke.qq.com/course/4092904使用Python的request库实现接口测试：importjsonimportrequests#使用session管理：#1.可以自动关联set-cookie里面的内容#2.可以加快与服务器的连接速度session=requests.session()#auth
LLM 大模型技术知识最佳学习路径图发布！ AGI-杠哥学习人工智能语言模型 agi 自然语言处理
近日，经常有小伙伴私信我，大模型知识太多了，有点懵啊，我该如何学习LLM大模型？今天我们就来剖析下LLM大模型技术知识的学习路径。如果你是一个LLM大模型的“技术小白”，我们建议的学习路径如下：技术交流群前沿技术资讯、算法交流、求职内推、算法竞赛、面试交流(校招、社招、实习)等、与10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企开发者互动交流~我们建了大模型技术与面试交流群
深入理解 Redis SDS：高效字符串存储的秘密沉默的煎蛋 bootstrap 前端 html maven 架构开发语言数据库
目录1.引言1.1Redis中字符串的广泛应用2.SDS结构定义2.1Redis3.2之前的SDS结构2.2Redis3.2及之后的SDS结构3.SDS与传统C字符串的比较3.1获取字符串长度3.2缓冲区溢出问题3.3二进制安全性3.4内存分配次数4.SDS的内存分配策略4.1空间预分配4.2惰性空间释放5.SDS的其他特性5.1兼容C字符串函数5.2类型灵活6.SDS的使用场景6.1键值对存储6
阻止 Mac 在运行任务时进入休眠状态好好学习 666 macos
掌握`Caffeinate`命令：让您的Mac保持清醒以完成关键任务开发人员经常发现自己在Mac上运行持续时间较长的进程。无论是大量文件上传、广泛的数据分析脚本，还是复杂的构建过程，我们最不希望的就是我们的机器在任务中途进入睡眠状态。输入`caffeinate`命令–macOS的内置解决方案，可在您最需要时保持系统唤醒。##睡眠困境MacOS在设计时考虑了电源效率，这对电池寿命非常有用，但在运行时
国内高防加速CDN内容分发服务详细接入教程网友阿贵网站运维 web安全安全性测试安全威胁分析
CDN功能与接入指南CDN（内容分发网络）是一种集安全防护和内容加速于一体的网络解决方案，适用于需要兼顾安全性和访问速度的业务场景。以下是其主要功能与接入步骤：核心功能：免费SSL证书：支持一键申请SSL证书，确保数据传输安全。Web攻击防护：集成WAF防火墙，防御SQL注入、XSS等常见攻击。CC攻击防御：智能识别并拦截恶意请求，保护网站稳定运行。BOT机器人分析：自动识别并管理机器人流量，优化
深度解读 C 语言运算符：编程运算的核心工具烂蜻蜓 C语言 c语言 java 前端
一、引言在C语言的编程世界中，运算符是构建逻辑与运算的基石，它如同一位指挥家，精准地协调着程序中各种数据的操作与处理。C语言丰富多样的运算符涵盖了算术、关系、逻辑、位运算、赋值以及其他杂项运算等多个领域，为开发者提供了强大而灵活的编程手段。深入理解和熟练运用这些运算符，对于编写高效、准确的C语言代码至关重要。接下来，让我们一同走进C语言运算符的精彩世界，探寻其奥秘与应用。二、算术运算符：数值运算的
聚焦热点 | ISC 2022软件供应链安全治理与运营论坛圆满落幕悬镜安全荣誉资质网络安全行业动态安全 DevSecOps 网络安全软件供应链安全积极防御
“软件供应链的开源化使得软件供应链的各个环节都不可避免地受到开源应用的影响。尤其是开源应用的安全性，将直接影响着软件供应链的安全性。除开源应用开发者在开发过程中引入安全缺陷之外，也可能会存在开发者有目的性地预留的安全缺陷，甚至存在攻击者将含有隐藏性恶意功能的异常行为代码上传到上游开源代码托管平台，以便实施定向软件供应链攻击的安全风险。上述开源应用中存在的众多安全问题，都将导致软件供应链安全隐患大大
使用Java爬虫按关键字搜索1688商品小爬虫程序猿 java 爬虫开发语言
在电商领域，获取1688商品信息对于市场分析、选品上架、库存管理和价格策略制定等方面至关重要。1688作为国内领先的B2B电商平台，提供了丰富的商品数据。虽然1688开放平台提供了官方API来获取商品信息，但有时使用爬虫技术来抓取数据也是一种有效的手段。本文将介绍如何利用Java按关键字搜索1688商品，并提供详细的代码示例。一、准备工作1.Java开发环境确保你的Java开发环境已经安装了以下必
基于Linux的多进程并发服务器设计与实现名誉寒冰服务器 linux c++
基于Linux的多进程并发服务器设计与实现简介本项目实现了一个基于Linux的多进程并发服务器框架，采用进程池技术提高服务器并发处理能力，主要用于文件传输服务。该框架利用了Unix域套接字、管道通信、文件描述符传递和epoll机制等技术，实现了高效的任务分发和并发处理。系统架构该服务器采用主-从进程模型（Master-Worker模式）：主进程（Master进程）：负责监听客户端连接请求，并将连接
[从零开始学习JAVA] Stream流 Cools0613 从0开始学Java 学习
前言：本文我们将学习Stream流，他就像流水线一样，可以对我们要处理的对象进行逐步处理，最终达到我们想要的效果，是JAVA中的一大好帮手，值得我们了解和掌握。（通常和lambda匿名内部类方法引用相配合）Stram流：Stream流的核心思想是函数式编程（注意返回值必须是对象本身才能），它倡导将数据处理过程看作是一系列的转换操作。这种思想与传统的命令式编程方式不同，传统的命令式编程方式强调对数据
Q&A：备份产品的存储架构采用集中式和分布式的优劣？云祺vinchin 技术分享架构分布式网络运维大数据
分布式和集中式各有优劣，且这两者下面的存储类型也都不尽相同，从备份与恢复的数据层面来看，这两者存储相结合才是优解。众所周知，备份数据只存一份还只放在一个存储里是不现实的。假设把备份数据访问频率、生命周期等参数分为三个等级（热、温、冷）。很显然，以分布式存储的优点用来存放热备份数据是非常合适的，能满足大规模数据在备份与恢复时的高吞吐需求，同时也能提供并行计算的能力，提供高效的目标端数据压缩和数据重删
新能源汽车驱动电机构造与原理，关键技术大不同物联高科汽车单片机运维嵌入式硬件创业创新人工智能
随着全球能源危机和环境问题的日益严峻，新能源汽车（NEV）正以惊人的速度发展。在新能源汽车的核心部件中，驱动电机扮演着至关重要的角色，它直接决定了车辆的性能、效率和可靠性。一、驱动电机的构造：精巧设计与高效集成与传统内燃机复杂的机械结构相比，驱动电机在构造上显得更为简洁。然而，这种简洁背后蕴含着精密的电气设计和高效的能量转换机制。一般来说，驱动电机主要由以下几个关键部件组成：定子（Stator）：
探索Python中的集成方法：Stacking Echo_Wish Python 笔记 Python 算法 python 开发语言
在机器学习领域，Stacking是一种高级的集成学习方法，它通过将多个基本模型的预测结果作为新的特征输入到一个元模型中，从而提高整体模型的性能和鲁棒性。本文将深入介绍Stacking的原理、实现方式以及如何在Python中应用。什么是Stacking？Stacking，又称为堆叠泛化（StackedGeneralization），是一种模型集成方法，与Bagging和Boosting不同，它并不直
跟着黑马学MySQL基础篇笔记(1)-概述与SQL 小杜不吃糖 mysql 笔记 sql
03.安装与启动启动netstartmysql80netstopmysql80客户端连接mysql[-h127.0.0.1][-P3306]-uroot-p04.mysql数据模型关系型数据库RDBMS05.通用语法及分类DDL：数据定义语言，用来定义数据库对象（数据库，表，字段）DML：数据操作语言，用来对数据库表中的数据进行增删改DQL：数据查询语言，用来查询数据库中表的记录DCL：数据控制语
adb 如何导出手机的文件风继续吹.. 工具类 Uni-App adb 智能手机 uniapp sqlite
目录1.开启USB调试2.连接设备3.启动ADB4.导出文件使用adbpull命令5.可视化工具预览adb（AndroidDebugBridge）是Android开发中常用的一个工具，它允许开发者通过电脑与Android设备进行通信。如果你想通过adb导出手机上的文件，你可以按照以下步骤业务需求:前端通过使用uni-app的sqlite(关系型数据库系统),存储了大量的机密数据在手机上,直接通过代
hadoop3.x--搭建hadoop高可用集群（HA模式）运维小菜 hadoop hadoop hdfs
hadoop高可用集群（HA模式）一、安装前1.集群规划2.安装前配置3.安装jdk与hadoop4.克隆虚拟机与互信配置5.搭建zookeeper集群二、HDFS1.配置hdfs2.初始化启动hdfs集群三、MapReduce与Yarn1.配置MapReduce2.配置yarn3.启动yarn四、验证1.查看java进程2.hdfs与yarn前台页面一、安装前1.集群规划hostnameipNN
直方图梯度提升：大数据时代的极速决策引擎万事可爱^ 大数据机器学习深度学习直方图梯度提升 GBDT 算法
一、为什么需要直方图梯度提升？在Kaggle竞赛的冠军解决方案中，超过70%的获奖方案都使用了梯度提升算法。但当数据量突破百万级时，传统梯度提升树（GBDT）面临三大致命瓶颈：训练耗时剧增：每个特征的分割点计算都需要全量数据排序内存消耗爆炸：存储排序后的特征值需要额外空间处理效率低下：无法有效利用现代CPU的多核特性而梯度提升决策树（GBDT）作为集成学习的代表算法，通过迭代构建决策树实现预测能力
jsonp 常用util方法 hw1287789687 jsonp jsonp常用方法 jsonp callback
jsonp 常用java方法 (1)以jsonp的形式返回:函数名(json字符串) /*** * 用于jsonp调用 * @param map : 用于构造json数据 * @param callback : 回调的javascript方法名 * @param filters : <code>SimpleBeanPropertyFilter theFilt
多线程场景 alafqq 多线程
0 能不能简单描述一下你在java web开发中需要用到多线程编程的场景？0 对多线程有些了解，但是不太清楚具体的应用场景，能简单说一下你遇到的多线程编程的场景吗？ Java多线程 2012年11月23日 15:41 Young9007 Young9007 4 0 0 4 Comment添加评论关注(2) 3个答案按时间排序按投票排序 0 0 最典型的如： 1、
Maven学习——修改Maven的本地仓库路径 Kai_Ge maven
安装Maven后我们会在用户目录下发现.m2 文件夹。默认情况下，该文件夹下放置了Maven本地仓库.m2/repository。所有的Maven构件(artifact)都被存储到该仓库中，以方便重用。但是windows用户的操作系统都安装在C盘，把Maven仓库放到C盘是很危险的，为此我们需要修改Maven的本地仓库路径。
placeholder的浏览器兼容 120153216 placeholder
【前言】自从html5引入placeholder后，问题就来了，不支持html5的浏览器也先有这样的效果，各种兼容，之前考虑，今天测试人员逮住不放，想了个解决办法，看样子还行，记录一下。【原理】不使用placeholder，而是模拟placeholder的效果，大概就是用focus和focusout效果。【代码】 <scrip
debian_用iso文件创建本地apt源 2002wmj Debian
1.将N个debian-506-amd64-DVD-N.iso存放于本地或其他媒介内，本例是放在本机/iso/目录下 2.创建N个挂载点目录如下： debian:~#mkdir –r /media/dvd1 debian:~#mkdir –r /media/dvd2 debian:~#mkdir –r /media/dvd3 …. debian:~#mkdir –r /media
SQLSERVER耗时最长的SQL 357029540 SQL Server
对于DBA来说，经常要知道存储过程的某些信息： 1. 执行了多少次 2. 执行的执行计划如何 3. 执行的平均读写如何 4. 执行平均需要多少时间列名 &
com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 7454103 eclipse
今天eclipse突然报了com/genuitec/eclipse/j2eedt/core/J2EEProjectUtil 错误，并且工程文件打不开了，在网上找了一下资料，然后按照方法操作了一遍，好了，解决方法如下：错误提示信息： An error has occurred.See error log for more details. Reason: com/genuitec/
用正则删除文本中的html标签 adminjun java html 正则表达式去掉html标签
使用文本编辑器录入文章存入数据中的文本是HTML标签格式，由于业务需要对HTML标签进行去除只保留纯净的文本内容，于是乎Java实现自动过滤。如下： public static String Html2Text(String inputString) { String htmlStr = inputString; // 含html标签的字符串 String textSt
嵌入式系统设计中常用总线和接口 aijuans linux 基础
嵌入式系统设计中常用总线和接口任何一个微处理器都要与一定数量的部件和外围设备连接，但如果将各部件和每一种外围设备都分别用一组线路与CPU直接连接，那么连线
Java函数调用方式——按值传递 ayaoxinchao java 按值传递对象基础数据类型
Java使用按值传递的函数调用方式，这往往使我感到迷惑。因为在基础数据类型和对象的传递上，我就会纠结于到底是按值传递，还是按引用传递。其实经过学习，Java在任何地方，都一直发挥着按值传递的本色。首先，让我们看一看基础数据类型是如何按值传递的。 public static void main(String[] args) { int a = 2;
ios音量线性下降 bewithme ios音量
直接上代码吧 //second 几秒内下降为0 - (void)reduceVolume:(int)second { KGVoicePlayer *player = [KGVoicePlayer defaultPlayer]; if (!_flag) { _tempVolume = player.volume;
与其怨它不如爱它 bijian1013 选择理想职业规划
抱怨工作是年轻人的常态，但爱工作才是积极的心态，与其怨它不如爱它。一般来说，在公司干了一两年后，不少年轻人容易产生怨言，除了具体的埋怨公司“扭门”，埋怨上司无能以外，也有许多人是因为根本不爱自已的那份工作，工作完全成了谋生的手段，跟自已的性格、专业、爱好都相差甚远。
一边时间不够用一边浪费时间 bingyingao 工作时间浪费
一方面感觉时间严重不够用，另一方面又在不停的浪费时间。每一个周末，晚上熬夜看电影到凌晨一点，早上起不来一直睡到10点钟，10点钟起床，吃饭后玩手机到下午一点。精神还是很差，下午像一直野鬼在城市里晃荡。为何不尝试晚上10点钟就睡，早上7点就起，时间完全是一样的，把看电影的时间换到早上，精神好，气色好，一天好状态。控制让自己周末早睡早起，你就成功了一半。有多少个工作
【Scala八】Scala核心二：隐式转换 bit1129 scala
Implicits work like this: if you call a method on a Scala object, and the Scala compiler does not see a definition for that method in the class definition for that object, the compiler will try to con
sudoku slover in Haskell (2) bookjovi haskell sudoku
继续精简haskell版的sudoku程序，稍微改了一下，这次用了8行，同时性能也提高了很多，对每个空格的所有解不是通过尝试算出来的，而是直接得出。 board = [0,3,4,1,7,0,5,0,0, 0,6,0,0,0,8,3,0,1, 7,0,0,3,0,0,0,0,6, 5,0,0,6,4,0,8,0,7,
Java-Collections Framework学习与总结-HashSet和LinkedHashSet BrokenDreams linkedhashset
本篇总结一下两个常用的集合类HashSet和LinkedHashSet。它们都实现了相同接口java.util.Set。Set表示一种元素无序且不可重复的集合；之前总结过的java.util.List表示一种元素可重复且有序
读《研磨设计模式》-代码笔记-备忘录模式-Memento bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; /* * 备忘录模式的功能是，在不破坏封装性的前提下，捕获一个对象的内部状态，并在对象之外保存这个状态，为以后的状态恢复作“备忘”
《RAW格式照片处理专业技法》笔记 cherishLC PS
注意，这不是教程！仅记录楼主之前不太了解的一、色彩（空间）管理作者建议采用ProRGB（色域最广），但camera raw中设为ProRGB，而PS中则在ProRGB的基础上，将gamma值设为了1.8（更符合人眼）注意：bridge、camera raw怎么设置显示、输出的颜色都是正确的（会读取文件内的颜色配置文件），但用PS输出jpg文件时，必须先用Edit->conv
使用 Git 下载 Spring 源码编译 for Eclipse crabdave eclipse
使用 Git 下载 Spring 源码编译 for Eclipse 1、安装gradle，下载 http://www.gradle.org/downloads 配置环境变量GRADLE_HOME，配置PATH %GRADLE_HOME%/bin，cmd，gradle -v 2、spring4 用jdk8 下载 https://jdk8.java.
mysql连接拒绝问题 daizj mysql 登录权限
mysql中在其它机器连接mysql服务器时报错问题汇总一、[running][email protected]:~$mysql -uroot -h 192.168.9.108 -p //带-p参数，在下一步进行密码输入 Enter password: //无字符串输入 ERROR 1045 (28000): Access
Google Chrome 为何打压 H.264 dsjt apple html5 chrome Google
Google 今天在 Chromium 官方博客宣布由于 H.264 编解码器并非开放标准，Chrome 将在几个月后正式停止对 H.264 视频解码的支持，全面采用开放的 WebM 和 Theora 格式。 Google 在博客上表示，自从 WebM 视频编解码器推出以后，在性能、厂商支持以及独立性方面已经取得了很大的进步，为了与 Chromium 现有支持的編解码器保持一致，Chrome
yii 获取控制器名和方法名 dcj3sjt126com yii framework
1. 获取控制器名在控制器中获取控制器名: $name = $this->getId(); 在视图中获取控制器名: $name = Yii::app()->controller->id; 2. 获取动作名在控制器beforeAction()回调函数中获取动作名: $name =
Android知识总结（二） come_for_dream android
明天要考试了，速速总结如下 1、Activity的启动模式 standard：每次调用Activity的时候都创建一个（可以有多个相同的实例，也允许多个相同Activity叠加。） singleTop：可以有多个实例，但是不允许多个相同Activity叠加。即，如果Ac
高洛峰收徒第二期：寻找未来的“技术大牛” ——折腾一年，奖励20万元 gcq511120594 工作项目管理
高洛峰，兄弟连IT教育合伙人、猿代码创始人、PHP培训第一人、《细说PHP》作者、软件开发工程师、《IT峰播》主创人、PHP讲师的鼻祖！首期现在的进程刚刚过半，徒弟们真的很棒，人品都没的说，团结互助，学习刻苦，工作认真积极，灵活上进。我几乎会把他们全部留下来，现在已有一多半安排了实际的工作，并取得了很好的成绩。等他们出徒之日，凭他们的能力一定能够拿到高薪，而且我还承诺过一个徒弟，当他拿到大学毕
linux expect heipark expect
1. 创建、编辑文件go.sh #!/usr/bin/expect spawn sudo su admin expect "*password*" { send "13456\r\n" } interact 2. 设置权限 chmod u+x go.sh 3.
Spring4.1新特性——静态资源处理增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
idea ubuntuxia 乱码 liyonghui160com
1.首先需要在windows字体目录下或者其它地方找到simsun.ttf 这个字体文件。 2.在ubuntu 下可以执行下面操作安装该字体： sudo mkdir /usr/share/fonts/truetype/simsun sudo cp simsun.ttf /usr/share/fonts/truetype/simsun fc-cache -f -v
改良程序的11技巧 pda158 技巧
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短永远永远不要把同一个变量用于多个不同的
300个涵盖IT各方面的免费资源（下）——工作与学习篇 shoothao 创业免费资源学习课程远程工作
工作与生产效率: A. 背景声音 Noisli:背景噪音与颜色生成器。 Noizio:环境声均衡器。 Defonic:世界上任何的声响都可混合成美丽的旋律。 Designers.mx:设计者为设计者所准备的播放列表。 Coffitivity:这里的声音就像咖啡馆里放的一样。 B. 避免注意力分散 Self Co
深入浅出RPC uule rpc
深入浅出RPC-浅出篇深入浅出RPC-深入篇 RPC Remote Procedure Call Protocol 远程过程调用协议它是一种通过网络从远程计算机程序上请求服务，而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在，如TCP或UDP，为通信程序之间携带信息数据。在OSI网络通信模型中，RPC跨越了传输层和应用层。RPC使得开发

Huffman 编解码算法实现与压缩效率分析

你可能感兴趣的:(Huffman 编解码算法实现与压缩效率分析)