ii1245712564

贪心算法之赫夫曼编码

贪心算法之赫夫曼编码
编码基本介绍
- 等长编码
- 变长编码
- 前缀码
赫夫曼编码的构造
- 贪心选择是安全的
- 最优子结构
编码实现
- 编码树节点TreeNode
- 优先队列的实现
- 赫夫曼编码的构建
- maincc和Makefile
- 编译运行

贪心算法之赫夫曼编码

赫夫曼编码(Huffman coding)是一种编码方式，赫夫曼编码是变长编码的一种。可以有效的压缩数据，一般可以节约20%~90%的空间，这一般是由文件的数据特性决定的!

编码基本介绍

一般来说吗，文件可以分为两种：文本文件，二进制文件。这种区分只是逻辑上的一种区分，实际上文件在磁盘里面的存储都是以二进制一位一位存储的。文本文件就是基于字符编码的文件，常见的编码有ASCII码,utf8等等，二进制文件顾名思义就是直接在文件里面存入二进制数，也就全都是’0’和’1’，你可以自定义各个二进制的含义。
假设我们要保存一个文件，文件里面保存的全是ASCII码，那么这个文件里面的数据都是以八位对齐的，因为一个ASCII码占用八位，也就是一个字节。比如该文件里面存有’abcdef’,那么对应的文件里面二进制应该为’01100001·01100010·01100011·01100100·01100101·01100110’，文本编辑器在打开该文件的时候每次读出8位解释成对应的字符，于是我们就可以看到’abcdef’。

等长编码

但是你有没有发现，这样似乎太浪费内存了，ASCII之所以要用8位二进制来表示是因为它要表示128种字符，但是在这里就完全没有必要了，因为我们文件里面就只存储了六种字符，于是我们就新创一种新的编码来表示这六种字符:

字 符 编 码 a 000 b 001 c 010 d 011 e 100 f 101

于是上面的文件我们可以保存为’000·001·010·011·100·101’,在我们打开这个文件的时候就按照我们的编码显示相应的字符就可以啦。但是如果我们用编辑器打开文件的话，发现怎么全是乱码，因为这个编码是你自己创造的，编辑器是不认你的编码的，他们只认ASCII码。那麻烦了，那我们自己岂不是要写一个对应编码的编辑器了？这可不容易啊。。。于是我们想到了在保存的时候我们使用新的较短的编码，在读取的时候，再转换成ASCII码不就行啦，这里我们就实现了一个简单压缩与解压缩功能。

这里我们发现我们的新编码过的文件不是基于任何标准的编码的，而是基于我们自己创造的新的编码解释方式。换句话说，我们新编码的文件就是一个二进制文件。我们在这里建立的’000·001·010·011·100·101’就是这个文件对应的等长编码！在这里我们将文件按照等长编码从每个字符八位转换成每个字符三位，压缩了近乎 38

但是上面的每一个字符在文件中占有的比例是相同的，在现实中，各个字符在文件里面占有的比例一般是不同的。比如现在存在一个有100个字符的ASCII码文件:

字 符 出 现 次 数 编 码 a 45000 b 13001 c 12010 d 16011 e 9100 f 5101

占用的位数为:

(45+13+12+16+9+5)∗3=300

变长编码

正如上面的等长编码的压缩过程，很大程度的压缩了文件，这样是最节省空间的编码方式么？我们采用一种变长编码的形式来重新压缩这个文件，将占有比重大的字符编码变短，将占有比重小的文件编码拉长

字 符 出 现 次 数 编 码 a 450 b 13101 c 12100 d 16111 e 91101 f 51100

占用的位数为:

45∗1+13∗3+12∗3+16∗3+9∗4+5∗4=224 ，相比于上面的等长编码，大约节省了25%的空间

前缀码

这个理所谓的前缀码即没有任何码字是其他码字的前缀。前缀码是变长编码里面的一种，而且前缀码与任何编码相比可以达到最优的数据压缩率。下面我们就来介绍一下前缀码

我们主要将字符文件对应的前缀码按照顺序写入到二进制文件中，比如’abc’转化成对应的前缀码就是’0·101·100’。在我们将这个二进制文件转化为文本文件的过程中，就需要对这些前缀码进行解码，因为没有任何码字是其他码字的前缀，于是我们是可以按照前缀码来还原对应的字符的，比如’0·0·100·111’,解码以后就是’aacd’。我们用二叉树来表示前缀码的解码过程：

我们在二进制文件里面一位一位的读取，遇到’0’我们就转移到左子树，遇到’1’就转移到右子树，就这样不断地读取，直到遇到叶节点，最终的叶节点也就是我们需要的字符。找到字符以后我们再从文件里面读取一位，从根节点开始继续上面的操作直到文件末尾！

给定一棵前缀码的树 T ,我们可以计算编码一个文件需要多少位二进制。对于字母表 C 里面的每一个字符 c ,令属性 c.freq 为字符在文件中出现的频率，令 dt(c) 表示字符 c 在树中的深度， dt(c) 也是字符 c 的编码长度，则编码文件需要

B (T) = \sum c \in C c . f r e q \cdot d t (c)

个二进制位，将

B(T) 定义为树

T 的代价

赫夫曼编码的构造

赫夫曼设计了一个贪心算法来构造最优前缀码，即 B(T) 的代价最小，被称为赫夫曼编码。我们在之前讲过，要设计一个贪心算法，首先要经过三个步骤：

1.将最优化问题简化为这样的形式：最初一个选择以后，只剩下一个子问题需要求解！
2.证明在做出贪心选择以后，原问题总是存在最优解，即贪心选择总是安全的！
3.证明在做出贪心选择以后，剩下的子问题满足性质：其最优解与做出选择的组合在一起得到原问题的最优解，即最优子结构

那我们这里要做出怎么样的贪心选择呢？我们这里的目的是为了保证 B(T) 尽可能的小，那不妨大胆假设将出现次数/频率较低的的编码放在下层，出现次数/频率多的编码放在靠近根节点的位置。即我们做出这样的贪心选择策略：每次选出出现频率最低的两个字符 c1 , c2 ，并新建一个树节点 p ，使得树节点 p 成为字符 c1 , c2 的父节点，父节点对应的出现频率为 p.freq=c1.freq+c2.freq ,将 c1 ， c2 从字符里面删除，并插入新的节点 p ,再次重复上面的动作选出两个频率最小的节点。。。知道只剩下一个节点，那么剩下的这个节点就是Huffman树的根节点！

贪心选择是安全的

下面我们来证明这样做是正确的贪心选择，首先贪心选择总是安全的

贪心选择总是安全的

引理:令 C 为一个字母表，其中每一个字符 c 都有一个对应的频率 c.freq 。令 x 和 y 是 C 中频率最低的两个字符，哪么存在一个最优前缀编码， x 和 y 码字长度相同，且只有最优一个二进制不同

证明:现在假设字符集有一最优前缀编码对应的编码树 T ，节点 a 和 b 是树 T 里面深度最大的两个兄弟叶节点，并满足 a.freq≤b.freq 。节点 x 和 y 是树 T 里面频率最低的两个叶节点，并满足 x.freq≤b.freq 。因为 a ， b 是 T 里面任意频率的两个节点，因此有: x.freq≤a.freq 且 y.freq≤b.freq
- 如果 x.freq=b.freq 那么通过对 x.freq≤a.freq 且 y.freq≤b.freq 进行夹逼，可知 x.freq=y.freq=a.freq=b.freq ，我们将节点 x 和 a 交换，节点 y 和 b 交换，等到一棵新的编码树 T˙ ,因为 xyab 四个节点彼此相等，于是 T=T˙ ，所以 T˙ 也是一棵最优编码树，引理成立！
- 如果 x.freq≠b.freq ,我们交换 x 和 a 得到新编码树 T˙ ， T˙ 中继续交换 y 和 b 得到新的编码树 T¨ ,现在我们需要做的是证明 T¨ 是最优编码树
我们知道树 T 和树 T˙ 的代价之差为:

$B (T) - B (T ˙) = \sum c \in C c . f r e q \cdot d T (c) - \sum c \in C c . f r e q \cdot d T ˙ (c) = x . f r e q * d T (x) + a . f r e q * d T (a) - x . f r e q * d T ˙ (x) - a . f r e q * d T ˙ (a) = x . f r e q * d T (x) + a . f r e q * d T (a) - x . f r e q * d T (a) - a . f r e q * d T (x) = (a . f r e q - x . f r e q) (d T (a) - d T (x)) \geq 0$
类似的，交换 y 和 b 也可以得到 B(T˙)−B(T¨)≥0
但是因为树 T 是最优编码树，不可能存在比 T 更优的编码树，于是 B(T)=B(T˙)=B(T¨) ,所以 T¨ 是最优编码树，引理成立！

因此这个贪心选择是安全的！

最优子结构

下面就需要证明最优子结构了

最优子结构

引理:令 C 为一个给定的字母表，其中每一个字符 c∈C 都有一个给定的频率 c.freq .令 x 和 y 是 C 里面的频率的两个字符，令 C˙ 为 C 去掉 x 和 y ,加入一个新的字符 z 之后得到的字母表，即 C˙=C−{x,y}∪{z} 。类似的，也为 C˙ 定义 freq ,不同之处在于 z.freq=x.freq+y.freq 。令 T˙ 为为字母表 C˙ 的最优前缀编码树。于是我们将节点 z 替换为一个以 x 和 y 为孩子节点内部节点。得到树 T ,那么树 T 是 C 的最优编码树。

证明:首先我们得到树 T 和 T˙ 之间代价的联系：首先我们知道 dT(x)=dT(y)=dT˙(z)+1 ,于是我们有:

$x . f r e q \cdot d T (x) + y . f r e q \cdot d T (y) = (x . f r e q + y . f r e q) (d T ˙ (z) + 1) = z . f r e q \cdot d T ˙ (z) + (x . f r e q + y . f r e q)$
于是我们得到结论：
$B (T) = B (T ˙) + x . f r e q + y . f r e q$
即为
$B (T ˙) = B (T) - x . f r e q - y . f r e q$
我们这里采用反证法来证明：假设存在编码树 T˙ 使得 B(T˙)<B(T) ,于是我们可以得到一棵在去掉节点 x 和 y ，并替换为新的节点 z 的树 T¨ ，既满足 T¨=T˙−x.freq−y.freq ，那么将会得到一棵更优的编码树，与原假设矛盾，所以引理成立！

于是我们有了最优子结构

由上面的贪心选择是安全的和最优子结构知道我们设计的贪心算法是正确的的！下面我们就开始编码来实现如何通过一个文件构造最优前缀码！

编码实现

在编码之前，我们还是先来画一下流程图

Created with Raphaël 2.1.2 开始读取文件建立字符表通过字符表建立最小堆维护堆性质最小堆剩余节点数为1？打印编码树结束解压出最小的两个并插入新的节点 yes no

下面我们来分块实现这些功能:

编码树节点TreeNode

编码树节点TreeNode:


#ifndef TREE_NODE_H


#define TREE_NODE_H


#include <iostream>

class TreeNode
{
public:
   TreeNode(float _percent = 0.0 , char _data = 0):percent(_percent),data(_data)
   {
       leftChild = NULL;
       rightChild = NULL;
   }
   float percent;// 存储百分比
   char data;//存储实际的数据 
   TreeNode * leftChild;//左子树节点
   TreeNode * rightChild;//右子树节点
   bool operator<(const TreeNode & node)
   {
       return this->percent < node.percent;
   }

   bool operator>(const TreeNode & node)
   {
       return this->percent > node.percent;
   }

   bool operator==(const TreeNode & node)
   {
       return this->percent == node.percent;
   }
};


#endif

就是一个二叉树的节点，只是加入一些额外的数据
data存储字符
percent存储百分比

优先队列的实现

优先队列的实现

这里优先队列的主要作用是最快的速度选出队列里面字符出现频率最小的两个字符 x 和 y ，然后再向里面插入一个新的字符 z ， z 保证 z.freq=x.freq+y.freq

优先队列的头文件


#ifndef PRIORITY_QUEUE_H


#define PRIORITY_QUEUE_H


#include "treeNode.h"


#include <vector>


#include <iostream>


#define PARENT(i) ((i)>>1)


#define LEFTCHILD(i) ((i)<<1)


#define RIGHTCHILD(i) (((i)<<1)+1)

class PriorityQueue
{
public:
   /** * 构造函数 * 数组的beginIter和endIter来构造优先队列 */
   PriorityQueue(std::vector<TreeNode>::iterator beginIter , std::vector<TreeNode>::iterator endIter);
   /** 基本操作函数 */
   void insert(const TreeNode & treeNode);
   TreeNode min() const;
   TreeNode extractMin();
   void decreaseKey(unsigned int pos , const TreeNode & newKey);
   int size(){
       return queueNumberCount;
   }
   void print()
   {
       for (int i = 1; i <= queueNumberCount; ++i)
       {
           std::cout<<queueData[i].percent<<"\t";
       }
       std::cout<<std::endl;
   }
private:
   // 定义队列的最大长度
   static const int maxQueueNumber = 30;
   // 用来存放节点数据
   TreeNode queueData[maxQueueNumber+1];
   // 节点元素的计数
   int queueNumberCount;
   // 维护堆的性质
   void minHeapify(const unsigned int pos);
   // 构建最大堆
   void buildMinHeap();
   // 交换两个元素
   void exchange(const unsigned int pos1 , const unsigned int pos2);
};


#endif

这里面实现了优先队列的一些基本的操作，优先对的具体内容请看之前介绍过优先队列的文章《优先队列》

优先队列的源文件


#include "priorityQueue.h"


#include <iostream>


#include <climits>

PriorityQueue::PriorityQueue(std::vector<TreeNode>::iterator beginIter , std::vector<TreeNode>::iterator endIter)
{
   queueNumberCount = 0;
   // copy data to queue data
   while(queueNumberCount != maxQueueNumber &&\
         beginIter != endIter )
   {
       queueData[++queueNumberCount] = *beginIter;
       ++beginIter;
   }
   // 开始建堆
   buildMinHeap();
}

/** * 维护堆的性质 * @param pos 维护的开始节点 */
void PriorityQueue::minHeapify(const unsigned int pos)
{
   if(pos > queueNumberCount)
       return;
   int leftChild = LEFTCHILD(pos);
   int rightChild = RIGHTCHILD(pos);
   int minPos = pos;
   if(leftChild <= queueNumberCount && \
       queueData[leftChild] < queueData[minPos])
       minPos = leftChild;
   if(rightChild <= queueNumberCount &&\
       queueData[rightChild] <queueData[minPos])
       minPos = rightChild;
   if(minPos != pos)
   {
       exchange(minPos , pos);
       minHeapify(minPos);
   }
}

/** * 交换queueData里面的data * @param pos1 位置1 * @param pos2 位置2 */
void PriorityQueue::exchange(const unsigned int pos1 ,\
                            const unsigned int pos2)
{
   if(pos1 > queueNumberCount || pos2 > queueNumberCount)
       return;
   TreeNode temp = queueData[pos1];
   queueData[pos1] = queueData[pos2];
   queueData[pos2] = temp;
   return;
}

/** * 构建最大堆 */
void PriorityQueue::buildMinHeap()
{
   for (int i = queueNumberCount/2; i >=1 ; --i)
   {
       minHeapify(i);
   }
}


TreeNode PriorityQueue::min() const
{
   if(queueNumberCount > 0)
       return queueData[1];
   return TreeNode();
}


TreeNode PriorityQueue::extractMin()
{
   if(queueNumberCount <= 0)
       return TreeNode();
   TreeNode minNode = queueData[1];
   exchange(1,queueNumberCount);
   --queueNumberCount;
   minHeapify(1);
   return minNode;
}

void PriorityQueue::decreaseKey(unsigned int pos , const TreeNode & newKey)
{
   if(pos > queueNumberCount || queueData[pos] < newKey)
       return;
   queueData[pos] = newKey;
   while(pos > 1)
   {
       int parentPos = PARENT(pos);
       if(queueData[parentPos] < queueData[pos])
           break;
       exchange(parentPos , pos);
       pos = parentPos;
   }
}

void PriorityQueue::insert(const TreeNode & node)
{
   if(queueNumberCount >= maxQueueNumber)
       return;
   TreeNode maxNode ;
   maxNode.percent = INT_MAX;
   queueData[++queueNumberCount] = maxNode;
   decreaseKey(queueNumberCount , node); 
}

这里extractMin和insert操作都是以 O(logn) 为时间代价的，速度应该是很快了，比采用一般方法，即采用插入排序的思想，每次都找到合适的插入位置要快的多！

赫夫曼编码的构建

赫夫曼编码的构建

这里才是进入正题了，就是构建赫夫曼编码

赫夫曼编码头文件


#ifndef HUFFMAN_CODE_H


#define HUFFMAN_CODE_H



#include <string>


#include <iostream>


#include "treeNode.h"


void buildHuffmanCode(const std::string & filename);// 构建前缀码
void printHuffmanTree(TreeNode * tree , const std::string & prefix);>


#endif

赫夫曼编码的源文件实现


#include "huffmanCode.h"


#include "priorityQueue.h"


#include "treeNode.h"


#include <iostream>


#include <fstream>


#include <vector>>


void buildHuffmanCode(const std::string & filename)
{
   // 读取文件里面的code，假设文件里面只包含26个小写英语字母
   const int ascDiff = (int)'a';
   const int & letterKind = 26;
   int letterCount[letterKind];
   int sum = 0;
   for (int i = 0; i < letterKind; ++i)
   {
       letterCount[i] = 0;
   }
   // open the file
   std::ifstream infile(filename.c_str() , std::ios::in);
   std::string readLine;
   while(infile >> readLine)
   {
       for(std::string::iterator iter = readLine.begin() ; iter!= readLine.end() ; ++iter)
       {
           if('a'<=*iter && 'z'>= *iter)
           {
               letterCount[(int)*iter - ascDiff]++;
               sum++;
           }
       }
   }
   // create treeNode
   std::vector<TreeNode> recordVec;
   for (int i = 0; i < letterKind; ++i)
   {
       if(letterCount[i] != 0)
       {
           float percent = letterCount[i]/(float)sum;
           TreeNode newNode(percent , (char)(i+'a')) ;
           recordVec.push_back(newNode);
       }
   }
   // 下面开始构建最小堆
   PriorityQueue pQueue(recordVec.begin() , recordVec.end());
   pQueue.print();
   // 下面开始建立编码树
   TreeNode newNode;
   while(pQueue.size() > 1)
   {
       // get the min
       TreeNode minNode1 = pQueue.extractMin();
       TreeNode minNode2 = pQueue.extractMin();
       newNode.percent =  minNode1.percent+minNode2.percent;>

       std::cout<<minNode1.percent<<"+"<<minNode2.percent<<"="<<newNode.percent<<std::endl;
       TreeNode * newTreeNode1 = new  TreeNode(); 
       *newTreeNode1 = minNode1;
       TreeNode * newTreeNode2 = new  TreeNode(); 
       *newTreeNode2 = minNode2;>

       newNode.leftChild = newTreeNode1;
       newNode.rightChild = newTreeNode2;>

       pQueue.insert(newNode);
   }
   // 编码树构建成功
   // 这里的newNode就是我们目标编码树
   std::string str;
   printHuffmanTree(&newNode , str);
}

void printHuffmanTree(TreeNode * tree , const std::string & prefix)
{
   if(tree == NULL)
       return;
   if(tree->leftChild == NULL && tree->rightChild == NULL)
   {
       std::cout<<tree->data<<" ----> "<<prefix<<std::endl;
   }
   printTree(tree->leftChild , prefix+"0");
   printTree(tree->rightChild , prefix+"1");
}

这个文件里里面包含两个函数，一个是buildHuffmanCode,目的是地区一个ACSII码文件，然后构建字符表，构建最小堆，再构建最优前缀编码二叉树,printHufmanCode就是将这棵二叉树上面的对应的huffman编码打印出来

main.cc和Makefile

main.cc


#include "huffmanCode.h"


#include <iostream>


using namespace std;

int main(int argc, char const *argv[])
{
   if(argc!= 2)
   {
       cerr<<"usage: huffman <filename>";
       return -1;
   }
   buildHuffmanCode(argv[1]);
   return 0;
}

输入一个文件名，然后解析这个文件

Makefile

TARGET=huffman

OBJS=priorityQueue.o\
    main.o\
    treeNode.o\
    huffmanCode.o

SRCS=$(OBJS:.o=.cc)

$(TARGET):$(OBJS)
   g++ $^ -o $@>

%.o:%.cc %.h
   g++ -c $< -o $@

编译运行

我们现在有一ASCII文件letterFile
文件中各个字符出现的比例为:

$字符出现次数 a 45 b 13 c 12 d 16 e 9 f 5$
于是我们执行 huffman letterFile得到下面结果：

0.05 0.09 0.12 0.16 0.13 0.45
0.05+0.09=0.14
0.12+0.13=0.25
0.14+0.16=0.3
0.25+0.3=0.55
0.45+0.55=1
a —-> 0
c —-> 100
b —-> 101
f —-> 1100
e —-> 1101
d —-> 111

为了方便大家参考，博主将源文件放在了这里：http://download.csdn.net/detail/ii1245712564/8686775，供大家下载学习

区别Mp3、AAC、WAV 、MWA这些音频文件晓北斗NorSnow 多媒体考试 aac
同学，MP3、AAC、WAV、WMA这些音频文件格式各有其特点和适用场景，下面我来为你详细解释一下它们的区别：MP3特点：MP3是一种广泛使用的音频压缩技术，它能够在音质丢失很小的情况下将音频文件压缩到更小的程度。MP3格式具有广泛的兼容性、网络传输便利性以及多样化的应用场景等特点，是全球范围内最受欢迎和应用最广的音频文件格式之一。音质与文件大小：MP3格式通过压缩音频数据来减小文件大小，同时保持
【2024年华为OD机试】(C卷,100分)- 悄悄话（Java & JS & Python&C/C++）妄北y 算法汇集笔记总结(保姆级)华为od c语言 java python javascript
一、问题描述题目描述给定一个二叉树，每个节点上站一个人，节点数字表示父节点到该节点传递悄悄话需要花费的时间。初始时，根节点所在位置的人有一个悄悄话想要传递给其他人，求二叉树所有节点上的人都接收到悄悄话花费的时间。输入描述给定二叉树的层序遍历序列：0920-1-1157-1-1-1-132注：-1表示空节点。输出描述返回所有节点都接收到悄悄话花费的时间。38用例输入0920-1-1157-1-1-1
【新春不断更】数据结构与算法之美：二叉树 <但凡. 数据结构与算法之美数据结构算法 c++
Hello大家好，我是但凡！很高兴我们又见面啦！眨眼间已经到了2024年的最后一天，在这里我要首先感谢过去一年陪我奋斗的每一位伙伴，是你们给予我不断前行的动力。银蛇携福至，万象启新程。蛇年新春之际，愿你们万事顺遂，岁月皆安，新的一年所想皆如愿，所行皆坦途。好了，给生活添点passion，开始今天的编程之路！我的博客：left=NULL;p->right=NULL;p->x=a;returnp;}1
【Java程序员面试专栏数据结构】五高频面试算法题：二叉树存在morning Java 程序员技术栈 #二叉树 java 面试算法
一轮的算法训练完成后，对相关的题目有了一个初步理解了，接下来进行专题训练，以下这些题目就是二叉树相关汇总的高频题目总的来说，前序遍历是自上而下调整或比较节点，中序遍历用来对节点排序，后序遍历是自下而上的寻找或求最值供上层决策，这里的上下指的是树的层高题目关键字解题思路时间空间二叉树的前序遍历DFS-前序遍历按照根左右的顺序进行递归，补充迭代思路，依赖辅助栈O(n)O(n)二叉树的中序遍历DFS-中
C++: 二叉树进阶面试题酷酷学!!! C++刷题指南 c++开发语言算法 leetcode 数据结构
做每件事之前都心存诚意,就会事半功倍.目录前言1.根据二叉树创建字符串2.二叉树的层序遍历Ⅰ3.二叉树的层序遍历Ⅱ4.二叉树的最近公共祖先5.二叉搜索树与双向链表6.根据一棵树的前序遍历与中序遍历构造二叉树7.根据一棵树的中序遍历与后序遍历构造二叉树8.二叉树的前序遍历，非递归迭代实现9.二叉树中序遍历，非递归迭代实现10.二叉树的后序遍历，非递归迭代实现前言一些面试中可能会遇到的二叉树的进阶题目
C++———STL容器个人理解（vector、queue、stack） Aitee C++学习笔记 c++学习笔记
文章目录什么是容器vector代码讲解及实现声明操作sizeemptyclear迭代器frontbackpush_backpop_backbegin/end代码测试queue代码实现及讲解循环队列queue声明pushpopfrontback初始化结构体定义优先队列priority_queuepushpoptop测试结果stack声明push/back代码实现及讲解什么是容器在数据存储上，有一种对
【数据结构】并查集 + 路径压缩与按秩合并 python 查理零世数据结构 python 算法
目录前言模板朴素实现路径压缩按秩合并按树高为秩按节点数为秩总结前言并查集的基本实现通常使用森林来表示不同的集合，每个集合用一棵树表示，树的每个节点有一个指向其父节点的指针。如果一个节点是它自己的父节点，那么它就是该集合的代表（称为根节点）。模板P3367【模板】并查集https://www.luogu.com.cn/problem/P3367题目描述如题，现在有一个并查集，你需要完成合并和查询操作
python-leetcode-翻转二叉树 Joyner2018 leetcode 算法职场和发展
226.翻转二叉树-力扣（LeetCode）#Definitionforabinarytreenode.#classTreeNode:#def__init__(self,val=0,left=None,right=None):#self.val=val#self.left=left#self.right=rightclassSolution:definvertTree(self,root:Opti
工程化概述 WJP丶前端工程化实战前端工程化概述
工程化的定义和主要解决的问题前端工程化指遵循一定的规范，通过工具提升效率，降低成本的一种手段。前端日常开发遇到的问题想要使用ES6+新特性，但是兼容性有问题想要使用Less/Sass/PostCss增强css编程性，但是运行环境不能直接支持想要使用模块化的方式提高项目的可维护性，但是运行环境不能直接支持部署上线前需要手动压缩代码及资源文件、部署过程需要手动上传代码到服务器多人协作开发，无法硬性同一
【深度学习】Squeeze-and-Excitation (SE) 模块优势解读理想不闪火深度学习入门到精通系列讲解
【深度学习】Squeeze-and-Excitation(SE)模块优势解读文章目录1概念辨析—下采样和上采样2Squeeze-and-Excitation(SE)3压缩（Squeeze）4激励（Excitation）5scale操作6相乘特征融合7SE模块的实现8优势1概念辨析—下采样和上采样概念上
leetcode 124. 二叉树中的最大路径和 fks143 leetcode leetcode
题目：124.二叉树中的最大路径和-力扣（LeetCode）定义一个节点的“最大单向路径和”是single，single有以下几种情况：只有该节点该节点+左儿子的single该节点+右儿子的single设答案是节点node为根节点，有以下几种情况：只有根节点根节点+左儿子的single根节点+右儿子的single根节点+左儿子的single+右儿子的single遍历全部节点，即可找到最大的答案cl
项目优化中文件压缩进击ing小白数据结构与算法文件压缩
需求背景：在停车收费项目中，一些车流量大的车厂日志信息文件增加的很快，虽然采用spdlog根据大小限制了每一份日志的大小，但是往往这种车流量大的车厂是一些大型商场，各种类型车辆收费不同，不同时间往往有不同的优惠，且跟车严重会带来不少各种各样的问题；日志需要保存的时间就更久一些，因此对于日志按照时间尺度进行打包压缩是一个很好的方案；此外对于软件升级工具一般需要对现场数据库数据和原版软件备份，防止升级
图像处理篇---图像压缩格式&编码格式 Ronin-Lotus 图像处理篇图像处理计算机视觉人工智能学习程序人生图像压缩编码格式
文章目录前言图像压缩格式无损压缩（LosslessCompression）1.PNG（PortableNetworkGraphics）2.GIF（GraphicsInterchangeFormat）3.BMP（Bitmap）4.TIFF（TaggedImageFileFormat）有损压缩（LossyCompression）1.JPEG（JointPhotographicExpertsGroup）
set判重与map判重（C++）怼您恏1031 c++开发语言
set判重set可以理解为一个不重复且有序的集合，实现原理红黑二叉树。一般我们对与set的使用集中在以下几种操作：1.声明或创建set集合2.插入操作3.删除操作4。判断集合中是否有元素5.返回集合中元素的个数6.遍历整个集合。具体代码：#includeusingnamespacestd;intn,m;//建立setintset;setstringset;intmain(){strings1="测
数据结构考前一天蒟蒻的贤数据结构
线性表：矩阵，链表（单链表必考）栈和队列：出入判断，括号匹配，中缀转后缀字符串数组：模式匹配next，nextval数组，数组寻址，三角矩阵对应一维数组k，二叉树：二叉链表，求叶子数量，求深度，左右转换，前中后遍历，森林与二叉树转化，哈夫曼树，哈夫曼编码，图：DFS，BFS，邻接矩阵，邻接表（EdgeNode,VertexNode），最小生成树（prime加点，kruskal加边），最短路径（di
二叉树的层次遍历 byg_qlh 算法数据结构算法数据结构
二叉树的层次遍历描述给你一个二叉树，请你返回其按层次遍历得到的节点值（即逐层地，从做到右访问所有节点）代码通过两个数组来交替打印classSolution(object):deflevelOrder(self,root):ifroot==None:return[]stack=[root]secondStack=[]ret=[[root.val]]whilestackorsecondStack:te
The selected directory is not a valid Tomcat home 六件套是我 tomcat java
我这里是Ubuntu安装的tomcat，直接从压缩包解压安装的IDEA在配置TomcatHome的时候，其实路径是对的，我填的是/usr/local/tomcat/apach-tomcat-9.0.98。但是报错TheselecteddirectoryisisnotavalidTomcathome。**解决方法：**只需要给tomcat目录足够的权限就好。sudochmod777./apach-t
Meta Llama 3 使用 Hugging Face 和 PyTorch 优化 CPU 推理 lichunericli 人工智能 pytorch llama
原文地址：meta-llama-3-optimized-cpu-inference-with-hugging-face-and-pytorch了解在CPU上部署Meta*Llama3时如何减少模型延迟2024年4月19日万众期待的Meta第三代Llama发布了，我想确保你知道如何以最佳方式部署这个最先进的（SoTA）LLM。在本文中，我们将重点讨论如何执行只权重量化（WOQ）来压缩8B参数模型并改
数据结构——查找二叉树 xb1132 数据结构算法
二叉搜索树的概念如图所示，二叉搜索树（binarysearchtree）满足以下条件。对于根节点，左子树中所有节点的值num，说明目标节点在cur的左子树中，因此执行cur=cur.left。若cur.val=num，说明找到目标节点，跳出循环并返回该节点。二叉搜索树的查找操作与二分查找算法的工作原理一致，都是每轮排除一半情况。循环次数最多为二叉树的高度，当二叉树平衡时，使用O(log⁡n)时间。
小鹏汇天飞行汽车电机技术（无刷外转子和永磁同步）清风明月自在愁 C++嵌入式硬件 c语言 stm32 总结
小鹏汇天飞行汽车电机技术介绍电机技术特点•分布式动力布局：小鹏汇天的旅航者X2采用分布式动力系统，由4个独立电池组和8台电机组成，电池组与电机在布局上实现物理隔离。这种设计即便单个组件发生故障，其余部件仍能正常运作，大大提高了系统的可靠性和安全性。•800V碳化硅高压平台：飞行体搭载全域800V碳化硅高压平台，飞行电池、电驱、电涵道、压缩机等均为800V，从而实现更低的能耗和更高的充电速度。这种高
完整一周任务进度甘特图PPT模板带你玩遍北海道
本文还有配套的精品资源，点击获取简介：提供下载的压缩文件“一周任务进度PPT甘特图.rar”中包含了用于展示一周内各项任务进度的PPT演示文稿。该PPT使用甘特图形式，通过条形图清晰展现任务起止时间、持续时间及相互关系，对团队协作和任务跟踪具有重要作用。文件包含可编辑的PowerPoint文件“一周任务进度PPT甘特图.pptx”，适用于汇报和会议中展示工作进度，涉及甘特图的设计、编辑和协作分享。
代码随想录算法训练营第十五天| 二叉树3 Rachela_z 算法
110.平衡二叉树（优先掌握递归）再一次涉及到，什么是高度，什么是深度，可以巩固一下。题目链接/文章讲解/视频讲解：代码随想录状态：要辨别新增函数的位置，self的用法二叉树节点的深度：指从根节点到该节点的最长简单路径边的条数，从上往下数二叉树节点的高度：指从该节点到叶子节点的最长简单路径边的条数，从下往上数#Definitionforabinarytreenode.#classTreeNode:
力扣111 二叉树的最小深度想念@思恋 leetcode
#层次遍历classSolution:defminDepth(self,root:TreeNode)->int:ifrootisNone:return0queue=[]layer=[]cur=rootqueue.append(cur)layer.append(1)min_layer=1cur_layer=1whilequeue:cur=queue.pop(0)cur_layer=layer.pop
数据结构——二叉树的最小深度算法 943802606 #数据结构数据结构二叉树 c语言
给定一个二叉树，找出其最小深度。最小深度是从根节点到最近叶子节点的最短路径上的节点数量。说明：叶子节点是指没有子节点的节点。输入：root=[3,9,20,null,null,15,7]输出：2示例2：输入：root=[2,null,3,null,4,null,5,null,6]输出：5提示：树中节点数的范围在[0,105]内-1000lchild不为空且T->rchild为空，返回左子树的高度+
111.二叉树的最小深度 -----力扣每日打卡Day17 爱吃草莓蛋糕的猴算法题二叉树算法 leetcode
目录1.题目2.题目分析3.代码实现1.题目给定一个二叉树，找出其最小深度。最小深度是从根节点到最近叶子节点的最短路径上的节点数量。说明:叶子节点是指没有子节点的节点。示例:给定二叉树[3,9,20,null,null,15,7],3/\920/\157返回它的最小深度2.C语言函数头：/***Definitionforabinarytreenode.*structTreeNode{*intval
如何安装和配置PHP开发环境？ m0_74824661 面试学习路线阿里巴巴 java
要安装和配置PHP开发环境，可以按照以下步骤进行：一、下载和安装PHP1：下载PHP：访问PHP官方网站（PHP:Downloads），选择适合您操作系统的版本进行下载。2：解压并安装PHP：下载完成后，将压缩包解压到指定目录。编辑php.ini文件，确保其中的displayerrors设置为on，以便在开发过程中能够看到错误信息。例如：display_errors=On二、下载和安装Apache
力扣刷题--111、二叉树的最小深度莫等闲，白了少年头 LeetCode 算法 java LeetCode 二叉树的最小深度
题目：二叉树的最小深度题号：111难易程度：简单题面：给定一个二叉树，找出其最小深度。最小深度是从根节点到最近叶子节点的最短路径上的节点数量。说明：叶子节点是指没有子节点的节点。示例1输入：root=[3,9,20,null,null,15,7]输出：2示例二：输入：root=[2,null,3,null,4,null,5,null,6]输出：5题目意思：即题面。题解：题解:1、分成四种情况。第一
在每棵树中找最大值嘻嘻哈哈樱桃算法二叉树算法
目录题目思路代码题目给定一棵二叉树的根节点root，请找出该二叉树中每一层的最大值。示例1：输入:root=[1,3,2,5,3,null,9]输出:[1,3,9]示例2：输入:root=[1,2,3]输出:[1,3]思路同力扣102，层序遍历，取每一层的最大值代码classSolution{publicListlargestValues(TreeNoderoot){Listresult=newA
总结8.. 挽清和 c语言
#include//定义结构体表示二叉树节点，包含左右子节点编号structnode{intl;intr;}tree[100000];//全局变量记录二叉树最大深度，初始为0intans=0;//深度优先搜索函数//pos:当前节点在数组中的位置，deep:当前深度voiddfs(intpos,intdeep){//若为叶子节点if(tree[pos].l==0&&tree[pos].r==0){
intel32/ctor.dll mysql_intelocl32.dll Steven Ban mysql
我该如何安装从金山毒霸下载的DLL文件？一：1、从金山毒霸下载压缩文件。2、将DLL文件解压到电脑上的某个地方。3、把该文件跟要求使用它的程序放在同一路径上。注意32位程序需要使用32位的DLL文件，64位程序需要使用64位的DLL文件。否则会出现0xc000007b报错。二：如果问题仍没有解决，把文件放到你的系统路径。它的替代路径是在：C:\Windows\System(Windows95/98
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数

贪心算法之赫夫曼编码

贪心算法之赫夫曼编码

编码基本介绍

等长编码

变长编码

前缀码

赫夫曼编码的构造

贪心选择是安全的

最优子结构

编码实现

编码树节点TreeNode

优先队列的实现

赫夫曼编码的构建

main.cc和Makefile

编译运行

你可能感兴趣的:(压缩,二叉树,优先队列,赫夫曼编码)