Xiao__Tian__

Huffman编码之文件的解/压缩

问题描述：

生活中文件压缩技术可谓随处可见，在数据的密集型传输中文件压缩是一项重要的实用性技术。例如：较大文件的下载，传输等。常见的文件压缩工具有winRAR，2345好压，快压（KuaiZip）等，这些工具已经开发的相当牛逼，但是作为入门级的程序员来说，不能只停留在观摩的立场上，扮演使用者的角色。有必要深入了解其底层的基础实现方式，掌握基础的文件压缩原理，所以在此将其视为一个小型项目列出，以供大家交流探讨，相互学习....

★在此之前，先来说说什么是文件压缩，用以抛出一个基础概念。

文件压缩：一个较大的文件经压缩后，产生了另一个较小容量的文件。而这个较小容量的文件，称其是这些较大容量的（可能一个或一个以上的文件）的压缩文件。而压缩此文件的过程称为文件压缩。目前互联网络上大家常用的FTP文件服务器上的文件大多属于压缩文件，文件下载后必须先解压缩才能够使用；另外在使用电子邮件附加文件功能的时候，最好也能事先对附加文件进行压缩处理。

文件压缩的原理：目前压缩技术可分为通用无损数据压缩与有损压缩两大类，但不管是采用何种技术模型，其本质内容都是一样的，即都是通过某种特殊的编码方式将数据信息中存在的重复度、冗余度有效地降低，从而达到数据压缩的目的。比如：“中国”是“中华人民共和国”的简称，但前者的字数是2，后者则是7，但我们都不会对它们俩所要表达的意思产生误解，这是因为前者保留了信息中最“关键点”。同时，作为有思维能力的人类，我们可以根据前后词汇关系和知识积累，就可推断出其原来的全部信息。压缩技术也一样，在不影响文件的基本使用的前提下，只保留原数据中一些“关键点”，去掉了数据中的重复的、冗余的信息，从而达到压缩的目的。这就是文件压缩技术所要遵循的最基本原理。

★在这里运用的是基于Huffman编码的方式实现文件的压缩和解压缩。

Huffman算法：哈夫曼是一种常用的压缩方法，是1952年为文本文件建立的，其基本原理是频繁使用的数据用较短的代码代替，很少使用的数据用较长的代码代替，每个数据的代码各不相同。这些代码都是二进制码，且码的长度是可变的。如: 有一个原始数据序列，ABACCDAA则编码为A(0)，B(10)，C(110),(D111)，压缩后010011011011100。产生霍夫曼编码需要对原始数据扫描两遍，第一遍扫描要精确地统计出原始数据中的每个值出现的频率，第二遍是建立霍夫曼树并进行编码，由于需要建立二叉树并遍历二叉树生成编码，因此数据压缩和还原速度都较慢，但简单有效，因而得到广泛的应用。哈夫曼算法在改变任何符号二进制编码引起少量密集表现方面是最佳的。
　　

※Hufman压缩的特性：1.该算法是依赖于原始数据的，并且Huffman树为每一个节点生成的对应的Huffman编码是唯一的；2.其每个字符的编码长度是根据其出现的频率决定的，也就是说出现频率高的字符其编码短，频率低的字符其编码长。

▲有关于Huffman树的建立，编码等一系列相关过程的基础讲解在此就不做赘述了，后面会陆续更新博文。

主要一共四个模块： 1.建树：创建Huffman树。
2.编码：根据Huffman树实现编码，将编码结果和对应数据建立映射关系。
3.解码：根据Huffman编码逆向获取解码信息。
4.文件操作：文件的打开和关闭。

废话不多说，直接上代码：

1.Huffman树的建立：

/******************************         HuffmanTree.h      *****************************************************         
************     该文件是Huffman树的建立，为了增强其传参时的健壮性，在此使用了C++中的模板用以实现.  ************   
****************************************************************************************************************/

#pragma once  

#include "Heap.h"  
#include  


template
struct HuffmanTreeNode
{
	HuffmanTreeNode* _left;
	HuffmanTreeNode* _right;
	HuffmanTreeNode* _parent;
	T _weight;

	HuffmanTreeNode(const T& x)
		:_weight(x)
		, _left(NULL)
		, _right(NULL)
		, _parent(NULL)
	{}
};

template
class HuffmanTree
{
	typedef HuffmanTreeNode Node;

public:

	HuffmanTree()
		:_root(NULL)
	{}

	~HuffmanTree()
	{
		Destory(_root);
	}

	template 
	struct NodeCompare
	{
		bool operator()(Node *l, Node *r)
		{
			return l->_weight < r->_weight;
		}
	};

public:
	void CreatTree(const T* a, size_t size, const T& invalid)
	{
		assert(a);
		Heap> minHeap;
		for (size_t i = 0; i < size; ++i)
		{
			if (a[i] != invalid)
			{
				Node* node = new Node(a[i]);
				minHeap.Push(node);
			}
		}

		while (minHeap.Size() > 1)
		{
			Node* left = minHeap.Top();
			minHeap.Pop();
			Node* right = minHeap.Top();
			minHeap.Pop();

			Node* parent = new Node(left->_weight + right->_weight);
			parent->_left = left;
			parent->_right = right;
			left->_parent = parent;
			right->_parent = parent;

			minHeap.Push(parent);
		}

		_root = minHeap.Top();
	}


	Node* GetRootNode()
	{
		return _root;
	}


	void Destory(Node* root)
	{
		if (root)
		{
			Destory(root->_left);
			Destory(root->_right);
			delete root;
			root = NULL;
		}
	}

private:
	HuffmanTreeNode* _root;
};

2.建堆及调整：

/******************************         Heap.h         ****************************************************
************     该文件是利用堆的相关特性，因为其数据成员中有数组，size，以及容量（capacity）  ************
************     所以在此直接使用C++中Vector用以实现.                                          ************
***********************************************************************************************************/
#pragma once  
#include   
#include  

// 小堆  
template
struct Less
{
	bool operator() (const T& l, const T& r)
	{
		return l < r;   
	}
};

template
struct Greater
{
	bool operator() (const T& l, const T& r)
	{
		return l > r;   
	}
};

template>
class Heap
{
public:
	Heap()
	{}

	Heap(const T* a, size_t size)
	{
		for (size_t i = 0; i < size; ++i)
		{
			_arrays.push_back(a[i]);
		}

		// 建堆  
		for (int i = (_arrays.size() - 2) / 2; i >= 0; --i)
		{
			AdjustDown(i);
		}
	}

	void Push(const T& x)
	{
		_arrays.push_back(x);
		AdjustUp(_arrays.size() - 1);
	}

	void Pop()
	{
		assert(_arrays.size() > 0);
		swap(_arrays[0], _arrays[_arrays.size() - 1]);
		_arrays.pop_back();

		AdjustDown(0);
	}

	T& Top()
	{
		assert(_arrays.size() > 0);
		return _arrays[0];
	}

	bool Empty()
	{
		return _arrays.empty();
	}

	int Size()
	{
		return _arrays.size();
	}

	void AdjustDown(int root)
	{
		size_t child = root * 2 + 1;
		    
		Compare com;
		while (child < _arrays.size())
		{
			if (child + 1<_arrays.size() &&
				com(_arrays[child + 1], _arrays[child]))
			{
				++child;
			}

			 
			if (com(_arrays[child], _arrays[root]))
			{
				swap(_arrays[child], _arrays[root]);
				root = child;
				child = 2 * root + 1;
			}
			else
			{
				break;
			}
		}
	}

	void AdjustUp(int child)
	{
		int parent = (child - 1) / 2;

		 
		while (child > 0)
		{
			if (Compare()(_arrays[child], _arrays[parent]))
			{
				swap(_arrays[parent], _arrays[child]);
				child = parent;
				parent = (child - 1) / 2;
			}
			else
			{
				break;
			}
		}
	}

	void Print()
	{
		for (size_t i = 0; i < _arrays.size(); ++i)
		{
			cout << _arrays[i] << " ";
		}
		cout << endl;
	}

public:
	/*T* _array;
	size_t _size;
	size_t _capacity;*/

	vector _arrays;
};

3.建立用于文件操作的文件：

/******************************         FileCompress.h      *****************************************************
***********************     该文件是用来实现具体的文件操作，其中有许多需要注意的小点.  **************************
*****************************************************************************************************************/
#pragma once

#include"HuffmanTree.h"
#include
#include
#include
using namespace std;

typedef long long Longtype;//为了扩大其范围，int型能处理的范围已经不能满足，所以定义Long Long型予以表示

struct FileInfo
{
	unsigned char _ch;//这里必须为unsigned，否则会造成截断，所以从-128~127调至0~255.
	Longtype _count;
	string _code;

	FileInfo(unsigned char ch = 0)
		:_ch(ch)
		, _count(0)
	{}

	FileInfo operator+(FileInfo& file)
	{
		FileInfo tmp;
		tmp._count = this->_count + file._count;
		return tmp;
	}

	bool operator < (FileInfo& file)
	{
		return this->_count < file._count;
	}

	bool operator != (const FileInfo& file)const
	{
		return this->_count != file._count;
	}
};


template
class FileCompress
{
public:
	FileCompress()
	{
		for (int i = 0; i < 256; ++i)
		{
			_arr[i]._ch = i;
		}
	}

public:

	bool Compress(const char* filename)
	{
		//1.打开文件，统计文件字符出现的次数  
		long long Charcount = 0;
		assert(filename);
		FILE* fOut = fopen(filename, "rb");//"rb"为以二进制方式读取文件，这里的b就是binary。"wb"为以二进制方式写入文件
		assert(fOut);

		char ch = fgetc(fOut);

		while (ch != EOF)
		{
			_arr[(unsigned char)ch]._count++;
			ch = fgetc(fOut);
			Charcount++;
		}

		//2.生成对应的huffman编码  
		GenerateHuffmanCode();

		//3.文件压缩  
		string compressFile = filename;
		compressFile += ".compress";
		FILE* fwCompress = fopen(compressFile.c_str(), "wb");
		assert(fwCompress);

		fseek(fOut, 0, SEEK_SET);
		ch = fgetc(fOut);
		char inch = 0;
		int index = 0;
		while(!feof(fOut))
		{
			string& code = _arr[(unsigned char)ch]._code;
			for (size_t i = 0; i < code.size(); ++i)
			{
				inch = inch << 1;
				if (code[i] == '1')
				{
					inch |= 1;
				}
				if (++index == 8)//对于形成的长串字符编码的切割，每8个bit为一个字节，便于读取
				{
					fputc(inch, fwCompress);
					inch = 0;
					index = 0;
				}
			}
			ch = fgetc(fOut);
		}

		if (index)//考虑到可能会有切割完，剩余的字符码不够填充8个bit位的情况
		{
			inch = inch << (8 - index);
			fputc(inch, fwCompress);
		}

		//4.配置文件，方便后续的解压缩；在日常的压缩解压时，有时我们会看到有.configure类型的配置文件，就是这个了，其实就是压缩和解压缩的中转站  
		string configFile = filename;
		configFile += ".config";
		FILE *fconfig = fopen(configFile.c_str(), "wb");
		assert(fconfig);

		char CountStr[128];
		_itoa(Charcount >> 32, CountStr, 10);
		fputs(CountStr, fconfig);
		fputc('\n', fconfig);
		_itoa(Charcount & 0xffffffff, CountStr, 10);
		fputs(CountStr, fconfig);
		fputc('\n', fconfig);

		FileInfo invalid;
		for (int i = 0; i < 256; i++)
		{
			if (_arr[i] != invalid)
			{
				fputc(_arr[i]._ch, fconfig);
				fputc(',', fconfig);
				fputc(_arr[i]._count + '0', fconfig);
				fputc('\n', fconfig);
			}
		}

		fclose(fOut);
		fclose(fwCompress);
		fclose(fconfig);

		return true;
	}
        //文件的解压
	bool UnCompresss(const char* filename)
	{
		string configfile = filename;
		configfile += ".config";
		FILE* outConfig = fopen(configfile.c_str(), "rb");
		assert(outConfig);
		char ch;
		long long Charcount = 0;
		string line = ReadLine(outConfig);
		Charcount = atoi(line.c_str());
		Charcount <<= 32;
		line.clear();
		line = ReadLine(outConfig);
		Charcount += atoi(line.c_str());
		line.clear();

		while (feof(outConfig))
//feof()遇到文件结束，函数值为非零值，否则为0。当把数据以二进制的形式进行存放时，可能会有-1值的出现，所以此时无法利用-1值（EOF）做为eof()函数判断二进制文件结束的标志。
		{
			line = ReadLine(outConfig);
			if (!line.empty())
			{
				ch = line[0];
				_arr[(unsigned char)ch]._count = atoi(line.substr(2).c_str());
				line.clear();
			}
			else
			{
				line = '\n';
			}
		}

		HuffmanTree ht;
		FileInfo invalid;
		ht.CreatTree(_arr, 256, invalid);

		HuffmanTreeNode* root = ht.GetRootNode();

		string  UnCompressFile = filename;
		UnCompressFile += ".uncompress";
		FILE* fOut = fopen(UnCompressFile.c_str(), "wb");

		string CompressFile = filename;
		CompressFile += ".compress";
		FILE* fIn = fopen(CompressFile.c_str(), "rb");

		int pos = 8;
		HuffmanTreeNode* cur = root;
		ch = fgetc(fIn);

		while ((unsigned char)ch != EOF)
		{
			--pos;
			if ((unsigned char)ch &(1 << pos))
			{
				cur = cur->_right;
			}
			else
			{
				cur = cur->_left;
			}
			if (cur->_left == NULL && cur->_right == NULL)
			{
				fputc(cur->_weight._ch, fOut);
				cur = root;
				Charcount--;
			}
			if (pos == 0)
			{
				ch = fgetc(fIn);
				pos = 8;
			}
			if (Charcount == 0)
			{
				break;
			}
		}

		fclose(outConfig);
		fclose(fIn);
		fclose(fOut);
		return true;
	}

protected:

	string ReadLine(FILE* fConfig)
	{
		char ch = fgetc(fConfig);
		if (ch == EOF)
		{
			return "";
		}
		string line;
		while (ch != '\n' && ch != EOF)
		{
			line += ch;
			ch = fgetc(fConfig);
		}
		return line;
	}

	void GenerateHuffmanCode()
	{
		HuffmanTree hft;
		FileInfo invalid;
		hft.CreatTree(_arr, 256, invalid);
		_GenerateHuffmanCode(hft.GetRootNode());
	}

	void _GenerateHuffmanCode(HuffmanTreeNode* root)
	{
		if (root == NULL)
		{
			return;
		}

		_GenerateHuffmanCode(root->_left);
		_GenerateHuffmanCode(root->_right);

		if (root->_left == NULL && root->_right == NULL)
		{
			HuffmanTreeNode* cur = root;
			HuffmanTreeNode* parent = cur->_parent;
			string& code = _arr[cur->_weight._ch]._code;

			while (parent)
			{
				if (parent->_left == cur)
				{
					code += '0';
				}
				else if (parent->_right == cur)
				{
					code += '1';
				}
				cur = parent;
				parent = cur->_parent;
			}

			reverse(code.begin(), code.end());
		}
	}

private:
	FileInfo _arr[256];
};

void TestFileCompress()
{

	FileCompress fc;

	int begin1 = GetTickCount();
	fc.Compress("C:\\Users\\Administrator.T47BQSRAR0SRP03\\Desktop\\Compress.txt");//此处路径是我的桌面路径，写成当前工作目录下的路径也可
	int end1 = GetTickCount();//用以测试压缩用时
	cout << end1 - begin1 << endl;

	int begin2 = GetTickCount();
	fc.UnCompresss("C:\\Users\\Administrator.T47BQSRAR0SRP03\\Desktop\\Compress.txt");
	int end2 = GetTickCount();//用以测试解压用时
	cout << end2 - begin2 << endl;

}

4.main文件，作用就不说了：

#define _CRT_SECURE_NO_WARNINGS  

#include   
using namespace std;

#include "FileCompress.h"  

int main()
{
	TestFileCompress();
	return 0;
}

★注意事项：在编写过程中遇到了几点问题，在此叙述一下：

1.对于从解压文件中获取的是一个很长的字符串，如何对该字符串进行合理切割以便后续的解压缩。按固定比特位切割，若存在剩余字符且无法填满一个字节，解压缩时又该如何处理。解决：按1个byte拥有8个bit位进行存储，若最终有未填满一个byte的字符时，将填充后的位置不断偏移。
2.在需要从文件中读取字符的地方，需借用EOF做为判断文件是否结束的标志位，若该文件的类型为非文本文件的二进制文件时，会存在-1值做为有效值的情形出现，此时EOF无法做为该文件的结束标志。解决：此时应使用feof函数做为文件结束标志。

★测试（Release版本下测试，因为VS2013的Debug和Release的速度相差有些大，当然读者也可两个版本都试下）：

测试一：第一个测试文件是创建了一个名称为a，内容为从字母A~Z的文本文档。

▲ 可以看到，其压缩和解压缩的时间都是零，因为此文档太小了，所以几乎是瞬时的。

▲可以看到生成了三个文件，从上往下依次是源文件，解压文件（uncompress），压缩文件（compress），配置文件（configure）。

▲解压文件和源文件的内容相同。

测试二：既然小文件是可以的，那么大一点的文件呢?大文件里面不仅有字母数字，还有各类标点，符号，包括汉字等复杂情况。这里测试的第二个大文件是一个名称为compress，大小为6.35MB的文件。其内容为某大段代码，以及简答题等情况，而代码中就包含了数字、标点、各类符号等情况，简单题也包含了汉字等。

★因为文件内容过多，仅截取这几幅图，能够说明情况即可。

▲可以看到源文件（由几十byte变为几MB），压缩时间和解压缩时间分别为3.4和2.1秒。

▲同样能看到生成的压缩文件、解压文件、配置文件，剩下的任务就是核对源文件和解压文件的内容是否一致。

★关于源文件和解压文件的比较，首先可以逐行检测，不过这工作量确实有点大；其次可以在源文件中随意挑选几行或十几行，然后到解压文件的对应处进行比对，一般说来，一般解压出错的话，在某一行的某处一旦出错，后续的内容都会出错或者有乱码的情况，所以这样检测也不是为一种方法；最后可以利用相应的文本比较软件，这里推荐使用Beyond Compaer3软件，使用既方便，功能又强大。

★经测试TXT类型以及RTF类型的文件都已成功压缩和解压缩，至于影音文件感兴趣的朋友可以自主尝试下。。

★注：这样此小项目就结束了，而代码依然有能够优化的地方，比如说建堆时考虑优先队列的方式，回溯左右孩子的根节点计算权值时，根节点的权值实际上就等于左右子树的节点权值和，这样的话速度可以提升不少。当然还有其他的地方，网站上下载的那些压缩工具，其中加入了其他的算法，压缩时可以极大地降低空间，比如一个几个G的文件，压缩后只有1，2个G大小，所以说这个小项目只是一个雏形，当然再好的工具，其底层的实现都是基于这个原理的，只要懂得了原理，至于加入什么算法，怎么优化以提高性能，就只是一步步去琢磨，坦白来说这些都不是问题了.....

[译]Flutter用WebView插件webview_flutter Web_boom 性能优化 Android framework flutter webview android
本文翻译自pub:webview_flutter|FlutterPackage(flutter-io.cn)译时版本：webview_flutter3.0.0用于Flutter的WebView提供WebView组件的Flutter插件。在iOS上WebView组件基于WKWebView；在Android上WebView组件基于WebView。用法添加webview_flutter依赖到pubspe
使用Qt实现Ribbon效果 ArqLoop qt ribbon 开发语言 QT
Qt是一种跨平台的C++应用程序开发框架，它提供了丰富的工具和库来创建各种类型的应用程序界面。在本文中，我们将探讨如何使用Qt实现Ribbon效果，Ribbon是一种常见的用户界面模式，用于创建具有多个选项卡的功能丰富的应用程序。步骤1：创建Qt应用程序首先，我们需要创建一个Qt应用程序项目。打开QtCreator，选择"新建项目"，然后选择"QtWidgets应用程序"。输入项目名称并选择保存位
盘点50个AI大模型企业和典型产品大模型玩家人工智能语言模型 ai 自然语言处理深度学习大模型
OpenAI：-ChatGPT：是OpenAI推出的非常具有影响力的聊天机器人程序，能够进行自然流畅的对话、文本创作、问题解答等，不断迭代升级，引发了全球对大模型的广泛关注。-GPT-4O：OpenAI的新一代AI模型，在语言理解和生成能力上有进一步提升，能够感知用户的情绪，并针对问题以带有情绪的“嗓音”做出反馈。-Sora：文生视频大模型，可根据文本指令生成复杂且具有一定时长的视频，具有多个镜头
从模型到实际：人工智能项目落地的关键要素 IT猫仔科技人工智能语言模型自然语言处理搜索引擎服务器机器学习
引言近年来，人工智能技术从实验室走向实际应用，其潜力在各行各业得到了初步的验证。然而，AI技术的落地并非一蹴而就，许多企业在尝试部署AI项目时，却发现自己陷入了“模型很好看，应用却难做”的困境。无论是数据准备不足、算法与场景的不匹配，还是缺乏持续优化的机制，这些问题都可能导致项目停滞，甚至功亏一篑。前排提示，文末有大模型AGI-CSDN独家资料包哦！对于企业来说，人工智能的价值不仅在于模型的高精度
滚雪球学Oracle[1.2讲]：Oracle数据库架构基础 bug菌¹ #滚雪球学Oracle oracle 数据库架构数据库
全文目录：前言一、Oracle数据库的物理存储结构详解1.1数据文件的组成与管理数据文件的主要特点：实际操作案例：添加数据文件数据文件管理的优化策略：1.2控制文件的作用与保护策略控制文件的主要作用：控制文件的保护策略：1.3重做日志文件的配置与优化重做日志文件的主要作用：重做日志文件的配置：实际操作案例：查看当前的重做日志组状态二、Oracle数据库的逻辑存储结构详解2.1表空间的类型与管理表空
02-硬件入门学习/嵌入式教程-Type-C使用教程坏柠零基础DIY 学习 c语言开发语言
一、前言今天，我们将一起探索Type-C的基础知识及其在实际应用中的使用。无论你是电子爱好者还是刚刚接触嵌入式系统的朋友都能一定的帮助；。二、Type-C接口简介Type-C是一种新型的USB接口标准，由USBImplementersForum（USBIF）于2014年推出。它以其可逆插的设计、更高的数据传输速度和更强的电力传输能力而著称。Type-C接口不仅适用于智能手机、平板电脑等移动设备，也
在 DevOps 实践中，如何构建自动化的持续集成和持续交付（CI/CD）管道，以提高开发和测试效率？思码逸研发效能 devops 自动化 ci/cd 研发效能人工智能效能度量运维
在DevOps实践中，构建自动化的持续集成和持续交付（CI/CD）流水线可以大大提高开发和测试效率。以下是一些步骤和建议：版本控制：所有的源代码都应该放在版本控制系统中，如Git仓库。这样，每次代码变更都可以被跟踪，同时也方便团队协作，这是做好CI/CD的第一步。建议选用合适的分支管理实践，如主干开发或特性分支开发等，注意要确保小批量工作，代码频繁提交、频繁合并。自动化构建：使用自动化构建工具，实
使用Ollama 在Ubuntu运行deepseek大模型：以deepseek-r1为例 skywalk8163 人工智能 ubuntu linux 人工智能 ollama
deepseek大模型上热搜啦！咱们来亲身感受下DeepSeek模型的魅力吧！整个操作流程非常简单方便，只需要2步，先安装Ollama，然后执行大模型即可。支持的deepseek-r1模型deepseek-r1DeepSeek-R1-Distill-Qwen-1.5Bollamarundeepseek-r1:1.5bDeepSeek-R1-Distill-Qwen-7Bollamarundeeps
QT +MYSQL+PYTHON,完成一个数据库表的增删改查 laocooon523857886 QT Python 数据库 qt mysql
ui_form.py#-*-coding:utf-8-*-##################################################################################FormgeneratedfromreadingUIfile'form.ui'####Createdby:QtUserInterfaceCompilerversion6.8.1#
同时支持ERC721和ERC1155数字资产管理的智能合约架构 fofee2020 智能合约架构区块链
一、全景洞察在NFT市场中，这款基于ERC1967（代理合约）和ERC11822（可升级代理）架构的智能合约产品，宛如一位幕后超级英雄，为各类NFT业务提供坚实的技术支撑与多样化功能保障。简单来说，它是一套部署在区块链上的数字化合约，如同自动执行的智能协议，能依据预设条件自动处理NFT相关的各类操作，从创建、交易到管理，全流程高效运作。二、当前市场痛点剖析1.升级困境：当下许多NFT智能合约缺乏可
电子电气架构---智能计算架构和SOA应用车载诊断技术汽车行业思考架构汽车电子电器架构网络 SOA
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：屏蔽力是信息过载时代一个人的特殊竞争力，任何消耗你的人和事，多看一眼都是你的不对。非必要不费力证明自己，无利益不试图说服别人，是精神上的节能减排。无人问津也好,技不如人也罢,你都要试着安静下来,去做自己该做的事.而不是让内心的烦躁、焦虑、毁掉你本就不多的热情和定力。时间不知不觉中，快
AWTK 骨骼动画控件发布李先静 ZLG开源GUI AWTK AWTK spine
Spine是一款广泛使用的2D骨骼动画工具，专为游戏开发和动态图形设计设计。它通过基于骨骼的动画系统，帮助开发者创建流畅、高效的角色动画。本项目是基于Spine实现的AWTK骨骼动画控件。代码：https://gitee.com/zlgopen/awtk-widget-spine2d准备获取awtk并编译gitclonehttps://github.com/zlgopen/awtk.gitcdaw
AI大模型项目实战：智能校园的秘密——深度剖析AI数字校园架构与解决方案大模型. 人工智能架构开发语言深度学习机器学习产品经理
在这篇文章中，我们将详细解读一幅关于AI数字校园架构的图示，深入剖析其各个功能模块和层级的解决方案，探讨AI技术如何在校园环境中落地实施，以提升教育、管理和决策的智能化水平。文章将逐层分析从用户交互到技术基础设施的架构内容，并针对每个模块给出详细的解决方案，帮助理解该架构如何通过AI技术为师生及管理者提供智能化的服务。一、用户层：多角色智能化交互用户层是AI数字校园的表层，它将直接服务于三类核心用
大模型产品架构全景解读：从应用场景到技术支持的完整路径健忘的派大星架构人工智能语言模型 ai agi LLM AI大模型
前言随着人工智能技术的迅猛发展，大模型逐渐成为推动各行业智能化转型的核心动力之一。大模型不仅可以处理大量数据，进行复杂任务的自动化，还能通过微调、蒸馏等技术在特定场景中表现出色。本文将结合大模型产品架构图，详细解读每一个组成模块，帮助读者理解从应用场景到技术支持的完整路径，洞察大模型如何在实际业务中落地。一、落地场景：赋能业务的智能化解决方案大模型的实际价值首先体现在各个业务场景的落地应用中。在架
如何设计一个合理的vue前端项目架构叫我阿柒啊 vue.js 前端架构
在前端开发中，我学习的是vue的开发路线。在最初的学习中，除了学习理论知识，还有就是看一些开源项目学习如何将vue应用到实际开发中。合理的项目架构设计是项目成功的基础之一。一个好的架构不仅可以提升代码的可读性和可维护性，还能提高开发效率，并降低项目的长期维护成本。所以，本文将以构建项目为起点，探讨如何设计关于vue的前端架构。1.项目初始化1.1创建项目vue不是在IDE中创建项目，而是使用工具在
[VC] 检测AVX系列指令集的支持级别（AVX、AVX2、F16C、FMA、FMA4、XOP） zyl910 #All -所有 SIMD c 汇编 function reference application null
从2011年的SandyBridge微架构处理器开始，现在支持AVX系列指令集的处理器越来越多了。本文探讨如何用VC编写检测AVX系列指令集的程序，并利用了先前的CPUIDFIELD方案。一、AVX系列指令集简介SSE5指令：SSE5是一个纸面上的指令集，并没有最终实现，AMD在2007年8月公布SSE5指令集规范，在2009年5月AMD推出了XOP，FMA4以及CVT16来取代SSE5指令。AV
[C#] 对24位图像进行水平翻转(FlipX)的跨平台SIMD硬件加速向量算法（使用YShuffleX3Kernel） zyl910 VectorTraits c#算法开发语言 SIMD 图像处理
文章目录一、标量算法1.1算法实现1.2基准测试代码二、向量算法2.1算法思路2.1.1难点说明2.1.2解决办法：每次处理3个向量2.1.3用YShuffleX3Kernel对3个向量内的24位像素进行翻转2.2算法实现2.3基准测试代码2.4使用YShuffleX3Kernel_Args来做进一步的优化三、基准测试结果3.1X86架构3.1.1X86架构上`.NET6.0`程序的测试结果3.1
【赵渝强老师】K8s的DaemonSets控制器赵渝强老师 Docker与K8s kubernetes 容器云原生 docker linux
DaemonSet控制器相当于在节点上启动了一个守护进程。通过使用DaemonSet可以确保一个Pod的副本运行在Node节点上。如果有新的Node节点加入集群，DaemonSet也会自动给新加入的节点增加一个Pod的副本；反之，当有Node节点从集群中移除时，DaemonSet也可以保证将这些Pod自动回收。当删除DaemonSet将会删除它创建的所有Pod。下面列举了DaemonSet控制
安卓（Android）平台上的MVVM架构：关键知识点、优劣分析及实践示例洪信智能安卓开发 android 架构
摘要本文旨在探讨安卓平台上广泛应用的Model-View-ViewModel（MVVM）架构模式的核心概念、主要优点与潜在不足，并通过实际示例代码阐明其在实际项目中的应用方式。MVVM作为一款推动关注点分离和提高软件质量的架构方案，在安卓应用开发中起着至关重要的作用。一、安卓MVVM架构核心知识点1.1、架构组成1.1.1、Model层承载业务逻辑与数据实体，独立于UI并与ViewModel进行交
5_建立可比字典对象【“依存句法”之“MD&A分析”】 Zephrus·Coder python
importpandasaspdimportosimportopenpyxlimportre###建立各类型词库#建立“宏观”词库Mac=[]Mac_path="D:/【Pycharm阶段性学习文件】/依存句法/txt_宏观词典.txt"withopen(Mac_path,'r',encoding='utf-8')asMac_file:forlineinMac_file:#去除行尾的换行符或者制表
【上市公司文本分析】Python正则表达式从非结构化文本数据中提取结构化信息——以从上市公司高管简历中提取毕业院校信息为例 Ryo_Yuki #上市公司文本分析 Python python 正则表达式
从CSMAR中可以获取上市公司高管的简历文本信息，虽然是非结构化的，但是隐约可以从中发现一些规律，例如毕业院校很多出现在毕业于、就读于等词语之后，专业很多出现在大学名之后，但这些又不是绝对的，也会有其他一些规则。下方代码是我基于我的300多条示例数据（如果需要练习，可以评论邮箱），经过反复修改正则表达式规则去编制的，能够做到节约85%左右的人工工作量，但无法保证绝对精确。对于其他非结构化但又有规律
android mvvm框架搭建_轻松搭建基于JetPack组件的MVVM框架 weixin_39962285 android mvvm框架搭建 android studio mvvm模板生成 javassm框架项目实例
原文链接：轻松搭建基于JetPack组件的MVVM框架-掘金Brickgithubgitee介绍辅助android开发者搭建基于JetPack组件构建MVVM框架的注解处理框架。通过注解自动生成ViewModel的Factory类、lazy方法等；支持在项目的任意位置注入ROOM的dao层接口与Retrofit库中的api接口。特点android开发者可以将brick理解为一个轻量级的注入框架，使
python中全局变量的使用 weixin_33737774 python
python中在module定义的变量可以认为是全局变量，而对于全局变量的赋值有个地方需要注意。test.py--------------------------------------------------importsysusername="muzizongheng"password="xxxx"defLogin(u,p):username=upassword=pprint("usernam
C++和Python实现SQL Server数据库导出数据到S3并导入Redshift数据仓库 weixin_30777913 c++python 数据库数据仓库 sqlserver
用C++实现高性能数据处理，Python实现操作Redshift导入数据文件。在VisualStudio2022中用C++和ODBCAPI导出SQLServer数据库中张表中的所有表的数据为CSV文件格式的数据流，用逗号作为分隔符，用双引号包裹每个数据，字符串类型的数据去掉前后的空格，数据中如果包含双引号，则将一个双引号替换为两个双引号，创建gzip压缩文件，输出数据流写入到gzip压缩文件包中的
scikit-learn基本功能和示例代码 weixin_30777913 深度学习机器学习 python scikit-learn
scikit-learn（简称sklearn）是一个广泛使用的Python机器学习库，提供了丰富的工具和算法，涵盖了数据预处理、模型训练、评估和优化等多个方面。scikit-learn是一个功能强大的机器学习库，涵盖了数据预处理、分类、回归、聚类、降维、模型选择与评估等多个方面。通过上述代码示例，您可以快速上手并使用scikit-learn进行机器学习任务。以下是对scikit-learn主要功能
从腾讯云数据仓库TCHouse安全地转移数据到AWS Redshift weixin_30777913 数据仓库腾讯云云计算 python aws
实现从AWSDirectConnect连接到腾讯云数据仓库TCHouse-P、TCHouse-C或TCHouse-D，然后使用AWSGlue读取数据并在AWSRedshift中创建对应表并复制数据，需要按照以下步骤进行操作：网络连接设置AWSDirectConnect配置：在AWS管理控制台中，创建一个DirectConnect连接到你的本地网络或腾讯云所在的网络环境。配置虚拟接口（VIF），确保
构建级联下拉列表：AJAX和jQuery实战教程不胖的羊
本文还有配套的精品资源，点击获取简介：级联下拉列表是网页交互中常见的元素，用于根据用户的选择动态更新后续选项。本文通过示例展示如何利用AJAX和jQuery技术实现级联下拉列表，并简单介绍了Prototype框架和jquery.jar文件的可能用途。详细步骤包括HTML结构设置、事件监听、AJAX请求构建、服务器响应处理以及界面更新，同时提供了提高用户体验的额外功能。1.级联下拉列表概念及应用场景
前端开发实战：创建简易HTML计算器不胖的羊
本文还有配套的精品资源，点击获取简介：计算器是执行基本数学运算的应用程序，通常在IT和前端开发领域中通过HTML、CSS和JavaScript实现。HTML定义页面结构和布局，JavaScript赋予计算器动态交互功能，例如监听按钮点击事件、执行计算和更新结果显示。该项目涉及HTML的元素结构、JavaScript的事件处理和DOM操作，是学习Web开发基础的理想练习。1.计算器的基本概念和应用1
Windows平台下使用DirectX实现的飞行射击游戏详解不胖的羊
本文还有配套的精品资源，点击获取简介：本文深入解析了一款在Windows平台上利用DirectX技术实现的飞行射击游戏“打飞机大战”。文章涵盖了Windows编程基础、DirectX技术的应用，以及游戏开发中使用的各种技术细节，如实时3D渲染、事件驱动编程、动画和物理模拟、声音处理以及性能优化等。通过这个项目，展示了Windows编程结合DirectX创造游戏的无限可能。1.Windows编程基础
linux ftp上传命令实例,ftp上传文件命令，Linux中使用ftp命令上传文件不胖的羊 linux ftp上传命令实例
Linux中如何使用ftp命令，包括如何连接ftp服务器，上传or下载文件以及创建文件夹。虽然现在有很多ftp桌面应用(例如：iis7服务器管理工具)，但是在服务器、SSH、远程会话中掌握命令行ftp的使用还是很有必要的。IIS7服务器管理工具可以批量管理、定时上传下载、同步操作、数据备份、到期提醒、自动更新。IIS7服务器管理工具适用于Windows操作系统和liunx操作系统；支持Ftp客户端
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后

Huffman编码之文件的解/压缩

你可能感兴趣的:(Huffman编码之文件的解/压缩)