Xiao__Tian__

[置顶] Huffman编码之文件的解/压缩

问题描述：

生活中文件压缩技术可谓随处可见，在数据的密集型传输中文件压缩是一项重要的实用性技术。例如：较大文件的下载，传输等。常见的文件压缩工具有winRAR，2345好压，快压（KuaiZip）等，这些工具已经开发的相当牛逼，但是作为入门级的程序员来说，不能只停留在观摩的立场上，扮演使用者的角色。有必要深入了解其底层的基础实现方式，掌握基础的文件压缩原理，所以在此将其视为一个小型项目列出，以供大家交流探讨，相互学习....

★在此之前，先来说说什么是文件压缩，用以抛出一个基础概念。

文件压缩：一个较大的文件经压缩后，产生了另一个较小容量的文件。而这个较小容量的文件，称其是这些较大容量的（可能一个或一个以上的文件）的压缩文件。而压缩此文件的过程称为文件压缩。目前互联网络上大家常用的FTP文件服务器上的文件大多属于压缩文件，文件下载后必须先解压缩才能够使用；另外在使用电子邮件附加文件功能的时候，最好也能事先对附加文件进行压缩处理。

文件压缩的原理：目前压缩技术可分为通用无损数据压缩与有损压缩两大类，但不管是采用何种技术模型，其本质内容都是一样的，即都是通过某种特殊的编码方式将数据信息中存在的重复度、冗余度有效地降低，从而达到数据压缩的目的。比如：“中国”是“中华人民共和国”的简称，但前者的字数是2，后者则是7，但我们都不会对它们俩所要表达的意思产生误解，这是因为前者保留了信息中最“关键点”。同时，作为有思维能力的人类，我们可以根据前后词汇关系和知识积累，就可推断出其原来的全部信息。压缩技术也一样，在不影响文件的基本使用的前提下，只保留原数据中一些“关键点”，去掉了数据中的重复的、冗余的信息，从而达到压缩的目的。这就是文件压缩技术所要遵循的最基本原理。

★在这里运用的是基于Huffman编码的方式实现文件的压缩和解压缩。

Huffman算法：哈夫曼是一种常用的压缩方法，是1952年为文本文件建立的，其基本原理是频繁使用的数据用较短的代码代替，很少使用的数据用较长的代码代替，每个数据的代码各不相同。这些代码都是二进制码，且码的长度是可变的。如: 有一个原始数据序列，ABACCDAA则编码为A(0)，B(10)，C(110),(D111)，压缩后010011011011100。产生霍夫曼编码需要对原始数据扫描两遍，第一遍扫描要精确地统计出原始数据中的每个值出现的频率，第二遍是建立霍夫曼树并进行编码，由于需要建立二叉树并遍历二叉树生成编码，因此数据压缩和还原速度都较慢，但简单有效，因而得到广泛的应用。哈夫曼算法在改变任何符号二进制编码引起少量密集表现方面是最佳的。
　　

※Hufman压缩的特性：1.该算法是依赖于原始数据的，并且Huffman树为每一个节点生成的对应的Huffman编码是唯一的；2.其每个字符的编码长度是根据其出现的频率决定的，也就是说出现频率高的字符其编码短，频率低的字符其编码长。

▲有关于Huffman树的建立，编码等一系列相关过程的基础讲解在此就不做赘述了，后面会陆续更新博文。

主要一共四个模块： 1.建树：创建Huffman树。
2.编码：根据Huffman树实现编码，将编码结果和对应数据建立映射关系。
3.解码：根据Huffman编码逆向获取解码信息。
4.文件操作：文件的打开和关闭。

废话不多说，直接上代码：

1.Huffman树的建立：

/******************************         HuffmanTree.h      *****************************************************         
************     该文件是Huffman树的建立，为了增强其传参时的健壮性，在此使用了C++中的模板用以实现.  ************   
****************************************************************************************************************/

#pragma once  

#include "Heap.h"  
#include<assert.h>  


template<class T>
struct HuffmanTreeNode
{
	HuffmanTreeNode<T>* _left;
	HuffmanTreeNode<T>* _right;
	HuffmanTreeNode<T>* _parent;
	T _weight;

	HuffmanTreeNode(const T& x)
		:_weight(x)
		, _left(NULL)
		, _right(NULL)
		, _parent(NULL)
	{}
};

template<class T>
class HuffmanTree
{
	typedef HuffmanTreeNode<T> Node;

public:

	HuffmanTree()
		:_root(NULL)
	{}

	~HuffmanTree()
	{
		Destory(_root);
	}

	template <class T>
	struct NodeCompare
	{
		bool operator()(Node *l, Node *r)
		{
			return l->_weight < r->_weight;
		}
	};

public:
	void CreatTree(const T* a, size_t size, const T& invalid)
	{
		assert(a);
		Heap<Node*, NodeCompare<T>> minHeap;
		for (size_t i = 0; i < size; ++i)
		{
			if (a[i] != invalid)
			{
				Node* node = new Node(a[i]);
				minHeap.Push(node);
			}
		}

		while (minHeap.Size() > 1)
		{
			Node* left = minHeap.Top();
			minHeap.Pop();
			Node* right = minHeap.Top();
			minHeap.Pop();

			Node* parent = new Node(left->_weight + right->_weight);
			parent->_left = left;
			parent->_right = right;
			left->_parent = parent;
			right->_parent = parent;

			minHeap.Push(parent);
		}

		_root = minHeap.Top();
	}


	Node* GetRootNode()
	{
		return _root;
	}


	void Destory(Node* root)
	{
		if (root)
		{
			Destory(root->_left);
			Destory(root->_right);
			delete root;
			root = NULL;
		}
	}

private:
	HuffmanTreeNode<T>* _root;
};

2.建堆及调整：

/******************************         Heap.h         ****************************************************
************     该文件是利用堆的相关特性，因为其数据成员中有数组，size，以及容量（capacity）  ************
************     所以在此直接使用C++中Vector用以实现.                                          ************
***********************************************************************************************************/
#pragma once  
#include <vector>  
#include<assert.h>  

// 小堆  
template<class T>
struct Less
{
	bool operator() (const T& l, const T& r)
	{
		return l < r;   
	}
};

template<class T>
struct Greater
{
	bool operator() (const T& l, const T& r)
	{
		return l > r;   
	}
};

template<class T, class Compare = Less<T>>
class Heap
{
public:
	Heap()
	{}

	Heap(const T* a, size_t size)
	{
		for (size_t i = 0; i < size; ++i)
		{
			_arrays.push_back(a[i]);
		}

		// 建堆  
		for (int i = (_arrays.size() - 2) / 2; i >= 0; --i)
		{
			AdjustDown(i);
		}
	}

	void Push(const T& x)
	{
		_arrays.push_back(x);
		AdjustUp(_arrays.size() - 1);
	}

	void Pop()
	{
		assert(_arrays.size() > 0);
		swap(_arrays[0], _arrays[_arrays.size() - 1]);
		_arrays.pop_back();

		AdjustDown(0);
	}

	T& Top()
	{
		assert(_arrays.size() > 0);
		return _arrays[0];
	}

	bool Empty()
	{
		return _arrays.empty();
	}

	int Size()
	{
		return _arrays.size();
	}

	void AdjustDown(int root)
	{
		size_t child = root * 2 + 1;
		    
		Compare com;
		while (child < _arrays.size())
		{
			if (child + 1<_arrays.size() &&
				com(_arrays[child + 1], _arrays[child]))
			{
				++child;
			}

			 
			if (com(_arrays[child], _arrays[root]))
			{
				swap(_arrays[child], _arrays[root]);
				root = child;
				child = 2 * root + 1;
			}
			else
			{
				break;
			}
		}
	}

	void AdjustUp(int child)
	{
		int parent = (child - 1) / 2;

		 
		while (child > 0)
		{
			if (Compare()(_arrays[child], _arrays[parent]))
			{
				swap(_arrays[parent], _arrays[child]);
				child = parent;
				parent = (child - 1) / 2;
			}
			else
			{
				break;
			}
		}
	}

	void Print()
	{
		for (size_t i = 0; i < _arrays.size(); ++i)
		{
			cout << _arrays[i] << " ";
		}
		cout << endl;
	}

public:
	/*T* _array;
	size_t _size;
	size_t _capacity;*/

	vector<T> _arrays;
};

3.建立用于文件操作的文件：

/******************************         FileCompress.h      *****************************************************
***********************     该文件是用来实现具体的文件操作，其中有许多需要注意的小点.  **************************
*****************************************************************************************************************/
#pragma once

#include"HuffmanTree.h"
#include<algorithm>
#include<windows.h>
#include<string.h>
using namespace std;

typedef long long Longtype;//为了扩大其范围，int型能处理的范围已经不能满足，所以定义Long Long型予以表示

struct FileInfo
{
	unsigned char _ch;//这里必须为unsigned，否则会造成截断，所以从-128~127调至0~255.
	Longtype _count;
	string _code;

	FileInfo(unsigned char ch = 0)
		:_ch(ch)
		, _count(0)
	{}

	FileInfo operator+(FileInfo& file)
	{
		FileInfo tmp;
		tmp._count = this->_count + file._count;
		return tmp;
	}

	bool operator < (FileInfo& file)
	{
		return this->_count < file._count;
	}

	bool operator != (const FileInfo& file)const
	{
		return this->_count != file._count;
	}
};


template<class T>
class FileCompress
{
public:
	FileCompress()
	{
		for (int i = 0; i < 256; ++i)
		{
			_arr[i]._ch = i;
		}
	}

public:

	bool Compress(const char* filename)
	{
		//1.打开文件，统计文件字符出现的次数  
		long long Charcount = 0;
		assert(filename);
		FILE* fOut = fopen(filename, "rb");//"rb"为以二进制方式读取文件，这里的b就是binary。"wb"为以二进制方式写入文件
		assert(fOut);

		char ch = fgetc(fOut);

		while (ch != EOF)
		{
			_arr[(unsigned char)ch]._count++;
			ch = fgetc(fOut);
			Charcount++;
		}

		//2.生成对应的huffman编码  
		GenerateHuffmanCode();

		//3.文件压缩  
		string compressFile = filename;
		compressFile += ".compress";
		FILE* fwCompress = fopen(compressFile.c_str(), "wb");
		assert(fwCompress);

		fseek(fOut, 0, SEEK_SET);
		ch = fgetc(fOut);
		char inch = 0;
		int index = 0;
		while(!feof(fOut))
		{
			string& code = _arr[(unsigned char)ch]._code;
			for (size_t i = 0; i < code.size(); ++i)
			{
				inch = inch << 1;
				if (code[i] == '1')
				{
					inch |= 1;
				}
				if (++index == 8)//对于形成的长串字符编码的切割，每8个bit为一个字节，便于读取
				{
					fputc(inch, fwCompress);
					inch = 0;
					index = 0;
				}
			}
			ch = fgetc(fOut);
		}

		if (index)//考虑到可能会有切割完，剩余的字符码不够填充8个bit位的情况
		{
			inch = inch << (8 - index);
			fputc(inch, fwCompress);
		}

		//4.配置文件，方便后续的解压缩；在日常的压缩解压时，有时我们会看到有.configure类型的配置文件，就是这个了，其实就是压缩和解压缩的中转站  
		string configFile = filename;
		configFile += ".config";
		FILE *fconfig = fopen(configFile.c_str(), "wb");
		assert(fconfig);

		char CountStr[128];
		_itoa(Charcount >> 32, CountStr, 10);
		fputs(CountStr, fconfig);
		fputc('\n', fconfig);
		_itoa(Charcount & 0xffffffff, CountStr, 10);
		fputs(CountStr, fconfig);
		fputc('\n', fconfig);

		FileInfo invalid;
		for (int i = 0; i < 256; i++)
		{
			if (_arr[i] != invalid)
			{
				fputc(_arr[i]._ch, fconfig);
				fputc(',', fconfig);
				fputc(_arr[i]._count + '0', fconfig);
				fputc('\n', fconfig);
			}
		}

		fclose(fOut);
		fclose(fwCompress);
		fclose(fconfig);

		return true;
	}
        //文件的解压
	bool UnCompresss(const char* filename)
	{
		string configfile = filename;
		configfile += ".config";
		FILE* outConfig = fopen(configfile.c_str(), "rb");
		assert(outConfig);
		char ch;
		long long Charcount = 0;
		string line = ReadLine(outConfig);
		Charcount = atoi(line.c_str());
		Charcount <<= 32;
		line.clear();
		line = ReadLine(outConfig);
		Charcount += atoi(line.c_str());
		line.clear();

		while (feof(outConfig))
//feof()遇到文件结束，函数值为非零值，否则为0。当把数据以二进制的形式进行存放时，可能会有-1值的出现，所以此时无法利用-1值（EOF）做为eof()函数判断二进制文件结束的标志。
		{
			line = ReadLine(outConfig);
			if (!line.empty())
			{
				ch = line[0];
				_arr[(unsigned char)ch]._count = atoi(line.substr(2).c_str());
				line.clear();
			}
			else
			{
				line = '\n';
			}
		}

		HuffmanTree<FileInfo> ht;
		FileInfo invalid;
		ht.CreatTree(_arr, 256, invalid);

		HuffmanTreeNode<FileInfo>* root = ht.GetRootNode();

		string  UnCompressFile = filename;
		UnCompressFile += ".uncompress";
		FILE* fOut = fopen(UnCompressFile.c_str(), "wb");

		string CompressFile = filename;
		CompressFile += ".compress";
		FILE* fIn = fopen(CompressFile.c_str(), "rb");

		int pos = 8;
		HuffmanTreeNode<FileInfo>* cur = root;
		ch = fgetc(fIn);

		while ((unsigned char)ch != EOF)
		{
			--pos;
			if ((unsigned char)ch &(1 << pos))
			{
				cur = cur->_right;
			}
			else
			{
				cur = cur->_left;
			}
			if (cur->_left == NULL && cur->_right == NULL)
			{
				fputc(cur->_weight._ch, fOut);
				cur = root;
				Charcount--;
			}
			if (pos == 0)
			{
				ch = fgetc(fIn);
				pos = 8;
			}
			if (Charcount == 0)
			{
				break;
			}
		}

		fclose(outConfig);
		fclose(fIn);
		fclose(fOut);
		return true;
	}

protected:

	string ReadLine(FILE* fConfig)
	{
		char ch = fgetc(fConfig);
		if (ch == EOF)
		{
			return "";
		}
		string line;
		while (ch != '\n' && ch != EOF)
		{
			line += ch;
			ch = fgetc(fConfig);
		}
		return line;
	}

	void GenerateHuffmanCode()
	{
		HuffmanTree<FileInfo> hft;
		FileInfo invalid;
		hft.CreatTree(_arr, 256, invalid);
		_GenerateHuffmanCode(hft.GetRootNode());
	}

	void _GenerateHuffmanCode(HuffmanTreeNode<FileInfo>* root)
	{
		if (root == NULL)
		{
			return;
		}

		_GenerateHuffmanCode(root->_left);
		_GenerateHuffmanCode(root->_right);

		if (root->_left == NULL && root->_right == NULL)
		{
			HuffmanTreeNode<FileInfo>* cur = root;
			HuffmanTreeNode<FileInfo>* parent = cur->_parent;
			string& code = _arr[cur->_weight._ch]._code;

			while (parent)
			{
				if (parent->_left == cur)
				{
					code += '0';
				}
				else if (parent->_right == cur)
				{
					code += '1';
				}
				cur = parent;
				parent = cur->_parent;
			}

			reverse(code.begin(), code.end());
		}
	}

private:
	FileInfo _arr[256];
};

void TestFileCompress()
{

	FileCompress<FileInfo> fc;

	int begin1 = GetTickCount();
	fc.Compress("C:\\Users\\Administrator.T47BQSRAR0SRP03\\Desktop\\Compress.txt");//此处路径是我的桌面路径，写成当前工作目录下的路径也可
	int end1 = GetTickCount();//用以测试压缩用时
	cout << end1 - begin1 << endl;

	int begin2 = GetTickCount();
	fc.UnCompresss("C:\\Users\\Administrator.T47BQSRAR0SRP03\\Desktop\\Compress.txt");
	int end2 = GetTickCount();//用以测试解压用时
	cout << end2 - begin2 << endl;

}

4.main文件，作用就不说了：

#define _CRT_SECURE_NO_WARNINGS  

#include <iostream>  
using namespace std;

#include "FileCompress.h"  

int main()
{
	TestFileCompress();
	return 0;
}

★注意事项：在编写过程中遇到了几点问题，在此叙述一下：

1.对于从解压文件中获取的是一个很长的字符串，如何对该字符串进行合理切割以便后续的解压缩。按固定比特位切割，若存在剩余字符且无法填满一个字节，解压缩时又该如何处理。解决：按1个byte拥有8个bit位进行存储，若最终有未填满一个byte的字符时，将填充后的位置不断偏移。
2.在需要从文件中读取字符的地方，需借用EOF做为判断文件是否结束的标志位，若该文件的类型为非文本文件的二进制文件时，会存在-1值做为有效值的情形出现，此时EOF无法做为该文件的结束标志。解决：此时应使用feof函数做为文件结束标志。

★测试（Release版本下测试，因为VS2013的Debug和Release的速度相差有些大，当然读者也可两个版本都试下）：

测试一：第一个测试文件是创建了一个名称为a，内容为从字母A~Z的文本文档。

▲ 可以看到，其压缩和解压缩的时间都是零，因为此文档太小了，所以几乎是瞬时的。

▲可以看到生成了三个文件，从上往下依次是源文件，解压文件（uncompress），压缩文件（compress），配置文件（configure）。

▲解压文件和源文件的内容相同。

测试二：既然小文件是可以的，那么大一点的文件呢?大文件里面不仅有字母数字，还有各类标点，符号，包括汉字等复杂情况。这里测试的第二个大文件是一个名称为compress，大小为6.35MB的文件。其内容为某大段代码，以及简答题等情况，而代码中就包含了数字、标点、各类符号等情况，简单题也包含了汉字等。

★因为文件内容过多，仅截取这几幅图，能够说明情况即可。

▲可以看到源文件（由几十byte变为几MB），压缩时间和解压缩时间分别为3.4和2.1秒。

▲同样能看到生成的压缩文件、解压文件、配置文件，剩下的任务就是核对源文件和解压文件的内容是否一致。

★关于源文件和解压文件的比较，首先可以逐行检测，不过这工作量确实有点大；其次可以在源文件中随意挑选几行或十几行，然后到解压文件的对应处进行比对，一般说来，一般解压出错的话，在某一行的某处一旦出错，后续的内容都会出错或者有乱码的情况，所以这样检测也不是为一种方法；最后可以利用相应的文本比较软件，这里推荐使用Beyond Compaer3软件，使用既方便，功能又强大。

★经测试TXT类型以及RTF类型的文件都已成功压缩和解压缩，至于影音文件感兴趣的朋友可以自主尝试下。。

★注：这样此小项目就结束了，而代码依然有能够优化的地方，比如说建堆时考虑优先队列的方式，回溯左右孩子的根节点计算权值时，根节点的权值实际上就等于左右子树的节点权值和，这样的话速度可以提升不少。当然还有其他的地方，网站上下载的那些压缩工具，其中加入了其他的算法，压缩时可以极大地降低空间，比如一个几个G的文件，压缩后只有1，2个G大小，所以说这个小项目只是一个雏形，当然再好的工具，其底层的实现都是基于这个原理的，只要懂得了原理，至于加入什么算法，怎么优化以提高性能，就只是一步步去琢磨，坦白来说这些都不是问题了.....

Linux(Centos 7.6)命令详解：iconv 豆是浪个 linux centos 运维
1.命令作用将给定文件的编码从一种编码转换为另一种编码(Convertencodingofgivenfilesfromoneencodingtoanother)2.命令语法Usage:iconv[OPTION...][FILE...]3.参数详解OPTION:输入/输出格式规范:-f,--from-code=NAME，原始文本编码-t,--to-code=NAME，输出文件编码(目标文件编码)信息
OpenDRG/DRG_Datas 项目使用教程咎宁准Karena
OpenDRG/DRG_Datas项目使用教程项目地址:https://gitcode.com/gh_mirrors/dr/DRG_Datas1.项目目录结构及介绍DRG_Datas/├──ICD/│├──ICD诊断、手术操作编码.csv│├──基础数据.csv│├──版本对照关系.csv│└──手术操作类别属性.csv├──Payment/│├──各地DRG病组清单.csv│└──医保支付标准.
MySQL字段约束条件,外键约束条件,表关系 Yietong309 MySQL数据库 mysql 数据库开发语言
目录字符编码与配置文件统一字符编码存储引擎修改存储引擎的方式自定义选项存储引擎不同存储引擎产生的表文件有几个?MERGEInnoDBArchiveBLACKHOLEblackhole与memory存取数据的特征Blackhole：丢弃写操作，读操作会返回空内容Memory：置于内存的表创建表的完整语法字段类型之整型字段类型之浮点型字段类型之字符类型字段类型之枚举与集合字段类型之日期类型约束条件自增
一文学习python中编码和解码科雷learning python编程 python 开发语言
学习目录1什么是编码和解码2编解码基本原理3python的默认编码4什么是10进制/2进制/8进制/16进制？5python的字符串编解码5.1使用str.encode()编码，str.decode()解码5.2解码的乱码问题5.316进制字符串转为普通字符串6python字符串和unicode类型编码转换什么是编码和解码大家都知道计算机是二进制的世界，计算机系统只能识别数字0和1组成的一串串的数
渗透测试之webshell 蚁剑流量分析特性分析抓包分析浩浩测试一下网络安全安全系统安全 web安全安全架构网络攻击模型
目录蚁剑是什么特性简介：蚁剑流量特征两大特征流量分析分析UserAgent数据内容解码分析总结蚁剑是什么蚁剑(AntSword)是一款开源的跨平台WebShell管理工具特性简介：AntSword（蚁剑）是一款开源的网络安全工具，常用于网络渗透测试和攻击。它可以远程连接并控制被攻击计算机，执行命令、上传下载文件等操作。蚁剑与网站进行数据交互的过程中发送的数据是经过编码器编码后再发送支持的编码方式有
旋转编码器驱动-标准库和HAL库末时清单片机 stm32 嵌入式硬件
一、标准库Encoder.c-标准库#include"stm32f10x.h"//Deviceheader#include"Delay.h"int8_tEncoder_Count;/***函数：旋转编码器初始化*参数：无*返回值：无*/voidEncoder_Init(void){/*开启时钟*/RCC_APB2PeriphClockCmd(RCC_APB2Periph_GPIOB,ENABLE)
RV1126+FFMPEG推流项目(9)AI和AENC模块绑定，并且开启线程采集学习嵌入式的小羊~ ffmpeg 音视频
前面两篇已经交代AI和AENC模块的配置，这篇就让这两个模块绑定起来，绑定的原因是，Aenc从Ai模块拿到采集的原始数据进行编码。使用RK_MPI_SYS_Bind把AI节点和AENC进行绑定，其中enModId是模块ID号选择的是RK_ID_AI、s32ChnId是通道号，通道号则从容器AENC容器获取。开启AENC线程采集每一帧视频编码数据并存储到音频队列。绑定的函数是有rv1126通过的，R
RV1126+FFMPEG推流项目(1)总体框架讲解学习嵌入式的小羊~ ffmpeg 音视频
音视频推流项目的讲解项目介绍本项目通过RV1126采集摄像头和麦克风数据，采用H.264/H.265视频编码技术和AAC音频编码技术进行压缩和合成复合流，然后推送到流媒体服务器。项目框图下图展示了整个项目的总体流程图，核心部分包括：暂时无法在飞书文档外展示此内容2.1视频采集与编码使用RV1126的API对CMOS摄像头进行采集，并进行H.264/H.265编码。编码后的视频数据存放到视频编码队列
解锁电商数据的无限可能：探秘京东商品SKU信息API接口前端后端运维数据挖掘api
一、引言在电商运营与开发的广袤领域中，京东作为行业巨头，其丰富的商品资源和庞大的用户群体蕴含着巨大的价值。而京东API接口宛如一座桥梁，连接着开发者与京东平台的海量数据。其中，获取京东商品SKU信息的API接口更是至关重要。SKU（StockKeepingUnit）即库存保有单位，是电商中用于标识不同商品的独特编码。每个SKU对应着特定的商品属性组合，如颜色、尺寸、型号等。通过获取SKU信息，开发
AI赋能：加速产品开发，提升公司竞争力前端
在当今快节奏的商业环境中，产品开发效率直接关系到公司的生存和发展。然而，许多公司面临着产品开发周期长、成本高、市场响应速度慢等诸多挑战。这些挑战不仅延缓了产品上市时间，也增加了市场竞争的风险。因此，提高产品开发效率，成为企业提升核心竞争力的关键。而人工智能技术的应用，为我们提供了解决这些问题的有效途径。加速产品迭代，快速响应市场需求传统的软件开发流程往往冗长复杂，从需求分析、设计、编码到测试和上线
H266/VVC 帧间预测中 AMVR 技术码流怪侠帧间预测 H266 VVC VVenC AMVR 运动搜索视频编解码
自适应运动精度AMVR最早的视频编码标准采用整数像素精度描述运动矢量，因此运动估计只能利用位于整数点位置的像素。但实际上物体的真实运动经常是连续的，采用整像素精度并不能很好的描述运动矢量。H.264和HEVC都对亮度分量的运动矢量采用1/4像素精度、色度分量的运动矢量采用1/8像素精度。在HEVC中，当切片头中的use_integer_mv_flag等于0时，运动矢量差（MVDs，即运动矢量与预测
在线CAD绘制条形码和二维码的方法（VUE集成DWG）
一、条形码绘制1.原理绘制条形码需要根据不同的应用场景选择适当的条形码标准，如常见的codabar、CODE30、CODE128等，每一种条形码标准都有它特定的数据编码规则，调用这些编码规则进行数据编码时会将数据字符按照所选编码规则转换成条和空的组合（一组二进制数据）。不同的条形码标准使用不同的编码规则来表示0到9的数字或26个英文字母。其中，为了确保扫描的准确性，条形码中还包括一个校验字符。这个
多模态视觉语言模型 funNLPer 计算机视觉语言模型人工智能自然语言处理多模态
文章目录1.多模态大模型概述1.1模型范式1.2训练范式2.BLIP3.BLIP24.LLaVa&LLaVA1.55.QwenVL5.1模型结构5.2训练过程6.参考1.多模态大模型概述1.1模型范式1）模态编码器：模态编码器主要是对来自不同模态的输入进行编码，来获得相应的特征，如视觉方面用ViT，CLIPVIT；音频模态用C-Former，Whisper等进行编码；2）输入Projector：输
如何在 deepin文件夹中搜索包含特定内容、关键字的 Word 文档 deepin
在deepin系统中，搜索包含特定内容或关键字的Word文档是一项常见需求。以下是一个详细的步骤指南，帮助你在文件夹中高效地完成这项任务。一、安装依赖工具要搜索Word文档，首先需要安装一些必要的工具。这些工具包括catdoc、docx2txt、iconv和grep。它们分别用于处理不同格式的Word文档、字符编码转换和文本搜索。在终端执行以下命令安装这些工具：sudoaptinstallcatd
基于区块链技术的超级账本(Hyperledger) - 从理论到实战
在多模态模型的架构上，ChatGPT的绘图能力主要依赖以下几个核心组件：跨模态编码器（Cross-ModalEncoder）：跨模态编码器的作用是将文本和图像的特征进行对齐。GPT可以将用户输入的文本描述转换为文本特征表示，然后利用跨模态编码器将这些特征映射到图像特征空间。这种方式确保模型能够理解描述性语言中不同细节是如何与图像特征对应的。
【HarmonyOS NEXT应用开发】案例36：基于Camera Kit，获取相机流数据传递给native，进行压缩编码青少年编程作品集数码相机 harmonyos 华为华为云华为od 缓存
示例场景：ATS侧启动相机，使用摄像头采集视频流数据，获取相机视频流数据传递到native侧，通过buffer模式将视频编码成MP4文件保存到沙箱路径。方案描述：具体实现步骤可分为：Step1：申请权限，启动相机。Step2:启动录制，获取视频流数据，获取一帧图像转成JPG格式保存到沙箱路径。Step3:视频流数据传递到native侧，进行压缩编码，生成文件保存。步骤一:申请权限，启动相机。需要相
Delphi代码编写标准指南好大的牛角
分享一下我老师大神的人工智能教程！零基础，通俗易懂！http://blog.csdn.net/jiangjunshow也欢迎大家转载本篇文章。分享知识，造福人民，实现我们中华民族伟大复兴！·日月光华精华区文章阅读发信人:Delphii(Delphi),信区:VCL标题:Delphi编码规则发信站:日月光华站(FriSep712:03:072001),站内信件Delphi代码编写标准指南■■■■■■
100条Linux命令汇总 Xudde. 笔记笔记 linux 学习运维
本文章为个人成长笔记之一，感谢您的阅览。内容简介文件和目录操作命令(14个)查看文件及内容处理命令(14个)文件压缩及解压缩命令(4个)信息显示命令(11个)用户管理命令(10个)基础网络操作命令(12个)进程管理相关命令(15个)其他常用命令(10个)文件和目录操作命令(14个)ls：列出目录的内容及其内容属性信息。cd：从当前工作目录切换到指定工作目录。cp：复制文件或目录。find：用于查找
华为OD机试 -TLV解码（Java & Python& JS & C++ & C ）算法大师最新华为OD机试 c++java 华为od 华为华为od机试 python javascript
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述TLV编码是按[TagLengthValue]格式进行编码的，一段码流中的信元用Tag标识，Tag在码流中唯一不重复，Length表示信元Value的长度，Value表示信元的值。码流以某信元的Tag开头，Tag固定占一个字节，Length固定占两个字节，字节序为小端序。现给定TLV格式编码的码流，以及需要解码的信元T
SD ComfyUI工作流平面模型房屋3D渲染 Mr数据杨 Stable Diffusion AI绘画 ComfyUI AI绘画
文章目录平面模型房屋3D渲染SD模型Node节点工作流程开发与应用效果展示平面模型房屋3D渲染此工作流是为将平面模型房屋图转换为3D渲染而设计，利用先进的模型和节点处理图像，增加细节和色彩，以及通过超分辨率技术增强最终图像的清晰度。流程从加载图像开始，经过一系列的处理步骤，包括图像缩放、条件编码、模型加载，最终通过高级放大技术提高图像分辨率，以达到高清的视觉效果。SD模型模型名称说明majicMI
C++ XML对象序列化与反序列化 zccmid c++xml 算法 windows visual studio github
一、序列化与反序列化序列化是将一个对象转换为一种特定的格式或字符串表示，以便可以在不同的系统或程序之间进行传输或存储。序列化通常涉及将一个对象的属性值编码为字节流或字符流，并将其写入文件、网络流或其他媒介中。序列化后的数据可以在需要时进行反序列化，以便重新创建原始的对象。反序列化是将序列化后的数据还原回原始对象的过程，即将序列化后的数据重新解码为原始对象的属性值。它通常涉及从文件、网络流或
音视频开发——FFmpeg 实现MP4转FLV文件 C语言实现 Trump. yang 音视频开发音视频 ffmpeg c语言
文章目录转换步骤关键代码完整代码转换步骤初始化FFmpeg库打开输入文件找到输入文件的流信息打开输出文件并设置输出格式创建输出文件的流初始化解码器和编码器读取输入文件的帧并写入输出文件释放资源关键代码1初始化FFmpeg库：av_register_all();打开输入文件：if((ret=avformat_open_input(&input_format_ctx,input_filename,NU
Java开发者的春节之旅：编程与传统文化的交融 egzosn java 开发语言
在这个辞旧迎新的美好时刻，春节不仅仅是一个家庭的团聚、美食的盛宴，更是我们深刻体验和传承中华传统文化的重要契机。作为一名Java开发者，如何在忙碌的编码之余，将这份对技术的热爱融入到传统节日的氛围中呢？今天，就让我们一起探索如何用Java技术为春节增添一份独特的科技色彩。一、春节倒计时——用Java实现春节前的那段日子，最让人期待的就是那不断减少的倒计时数字。我们可以用Java编写一个简单的倒计时
程序员转型：探索代码外的精彩人生 Milk夜雨人生日常 c语言 json 程序人生
程序员是现代科技社会的中坚力量，随着技术的快速发展，许多程序员已经不再满足于单纯的编码工作。随着职业生涯的不断深入，转型成为了越来越多程序员的选择。那么，除了常见的技术管理、产品经理等转型方向，程序员还能向哪些领域或岗位转型？如何在转型过程中充分利用已有的技术背景和经验，实现平滑过渡并取得新的职业突破呢？本文将详细探讨这些问题。一、程序员可转型的领域与岗位数据科学家（DataScientist）工
嵌入式硬件篇---PWM&电机&舵机 Ronin-Lotus 嵌入式硬件篇嵌入式硬件 c语言学习单片机 stm32 51单片机硬件工程
文章目录前言第一部分:电机1.按照工作电源分类直流电机交流电机2.按照结构原理分类同步电机异步电机有刷电机无刷电机3.按照电机的使用目的驱动电机执行电机直驱电机编码器额外小知识:第二部分：PWM1.实质2.面积等效原理3.实例舵机舵机按转动角度分1.小角度舵机（0-90°）2.中角度舵机（0-180°）3.大角度舵机（0-360°）舵机按控制方式分1.数字舵机2.模拟舵机总结前言本文简单介绍了电机
学习笔记078——Java Properties类使用详解上下求索. Java 学习笔记 java
文章目录概述常见方法写入读取遍历概述Properties继承于Hashtable。表示一个持久的属性集，属性列表以key-value的形式存在，key和value都是字符串。Properties类被许多Java类使用。例如，在获取环境变量时它就作为System.getProperties()方法的返回值。我们在很多需要避免硬编码的应用场景下需要使用properties文件来加载程序需要的配置信息，
python str转bytes类型三希 python 开发语言
在Python中，将字符串（str）类型转换为字节（bytes）类型，通常可以使用以下几种方法：方法一：使用encode()方法这是最常用的方法，适用于任何类型的字符串，尤其是包含非ASCII字符的字符串。使用encode()方法时，需要指定编码方式，如utf-8、latin-1等。例如：pythonstring="Hello,World!"encoded_bytes=string.encode(
PYTHON中字符串(str)类型和比特(bytes)类型转换齐柏林fly 艇 python
bytes主要是用于二进制的数据处理的数据类型，在网络编程中，由于服务器和浏览器只能识别bytes类型数据。所以就需要进行数据类型转换例如socket编程中的.send()和.recv()就需要用到str类型和bytes类型转换一、str转bytes:第一种：在str类型前加b，即b"str"第二种：在str后加.encode("utf-8")，即str.encode("utf-8")，编码方式默
【拒绝算法PUA】3065. 超过阈值的最少操作数 I BigDark的笔记 #LEETCODE #每日一题算法
系列文章目录【拒绝算法PUA】0x00-位运算【拒绝算法PUA】0x01-区间比较技巧【拒绝算法PUA】0x02-区间合并技巧【拒绝算法PUA】0x03-LeetCode排序类型刷题【拒绝算法PUA】LeetCode每日一题系列刷题汇总-2025年持续刷新中C++刷题技巧总结：[温习C/C++]0x04刷题基础编码技巧文章目录系列文章目录LeetCode3065.超过阈值的最少操作数I链接题目解题
Python 中模拟键盘输入在线码BUG python 开发语言后端
键盘编码对照表在日常学习编程的过程中，特别是一些自动化处理时，我们需要模拟键盘进行一些输入这是我们就需要代码来模拟我们进行物理键盘输入。在Python中我们要模拟键盘进行一些输入首先我们需要进行导入模块importwin32apiimportwin32con这两个模块可以帮助我们进行模拟物理键盘的输入，接下来我们就要进行代码的编辑：win32api.keybd_event(17,0,0,0)#Ct
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文

[置顶] Huffman编码之文件的解/压缩

你可能感兴趣的:(文件压缩,huffman编码)