weixin_39881387

python实现信息论哈夫曼编码_哈夫曼压缩原理及python3实现(非面向对象结构)

1 哈夫曼编码综述

在计算机科学和信息论，哈夫曼编码是一种特殊类型的最优前缀码(prefix code)，通常用于无损数据压缩(英文文本，更一般地说 ASCII 码位于 0-255 位的文本)。哈夫曼编码是一种变长编码，相比使用定长的 ASCII 码，哈夫曼编码可以节省很多的空间 (试想如果一篇文章中全为同一种字符，对应的哈夫曼编码为 "0" ，那么原先表达 1 个字符的 1 字节就能用来表示 8 个字符)。

哈夫曼压缩对频数最高的字符赋予较短的编码，实现压缩效率最大化

哈夫曼编码以二叉树为基础实现的，二叉树到每一个叶子节点的路径是唯一的，对应的编码也就唯一。

哈夫曼编码的前缀码唯一，从图 1 中可以看出，各编码的前缀码都是唯一的，这就保证了在字符表确定下，不断搜索一定可以定位到对应的字符。图 1 示例文本长度为 17，占用空间17字节。使用哈夫曼编码进行转码，对应的转码文本为：10110110001000111111111001000000000 ，长度为 35，按照 8 位一字节进行切割后，正文文本就变成了 5 字节 (不足 8 位需要补 0)

对转码文本进行还原时，读取 1 位字符，对其后的字符搜索。如读取 "1" 后接着读取 "0" 变成了 "10" ，编码表中没有 "10"，则继续向后读取 "101"，此时码表中有 "101"项，对文本进行还原得到 "a"，继续向后搜索，直到匹配完全文。图 1 哈夫曼树及编码示例

2 哈夫曼压缩及解压基本原理

哈夫曼压缩基本思想是将二进制代码分配给字符，用于减少编码这些符号的字符串比特数(如上图 1 中，原先表达一个字符 "e"，需要1字节数据 "01100101"，而在哈夫曼编码中，只需要1位数据 "0" 即可表达)。构造过程可以参考图 1 ，简书中较好的资料详细介绍了算法原理(但是代码运行不了，报错...)。

算法的主要过程分为：构造哈夫曼编码表、转码压缩、转码解压。

压缩与解压中，数据根据哈夫曼编码表进行转换，因此写入编码表信息是必须的。此外，字节位数不足 8 位时，需要补充 "0" 达到 8 位，而补 "0" 的情况又对解码信息有影响，还需要在文件中声明补 "0"情况。每一步的大致过程如下所示(在本文第 4 部分结合代码有更详细的示例)：构造哈夫曼编码表

Step1 遍历需要处理的字符串，得到每个字符出现的次数(频数)

Step2 将频数最低的两位字符作为叶子节点，左子树频数大于右子树，构造分支节点，同时将分支节点作为新的字符，频数即为子叶频数之和，进行重新排序(如图 1 中，将 "bd" 作为新字符，进行重新排序)

Step3 重复 Step1 和 Step2，直到所有字符编码完成

Step4 从树的顶端开始编码，左子树编为 0，右子树编为 1，直到树的底端

Step5 根据编码情况构造哈夫曼编码表转码压缩

Step1 根据哈夫曼编码表将正文转换为 0-1 编码

Step2 每 8 位编码进行一次切割，作为 1 个字节数据写入压缩文件

Step3 文末不足 8 位则需要补 "0"，直到刚好达到 8 位编码

Step4 解码时避免补 "0" 干扰，需要将补 0 情况写入压缩文件中

Step5 将码表写入压缩文件转码解压

Step1 根据补 0 情况，删减文本

Step2 读取哈夫曼编码表，作为转码对照表

Step3 读取正文文本，与转码对照表进行比对，还原信息

3 分析及扩展应用

3.1 为什么哈夫曼编码是最优的？

参考：维基百科香农源编码定理https://en.wikipedia.org/wiki/Shannon%27s_source_coding_theoremen.wikipedia.org

(其实也很像运筹学课本上提到的最优带权连接图，但是证明实在是太长了。。。)

也可以这样考虑：对频数最多的字符赋予最少的字符长度，依次类推。

3.2 其他压缩算法的"后端"

哈夫曼压缩作为数据流压缩的“先驱者”，由于哈夫曼编码简单、高速且无数据损失，常常被用于其他压缩算法的“后端”。如DEFLATE和多媒体编码器(如图像的JPEG，音频的MP3)都有自己的压缩算法，但都应用到了这种前缀码的思想。尽管大多数无损压缩算法都使用预定义的可变长度(如 LZW 算法)而不是使用哈夫曼算法，但这写算法也通常被称为 "Huffman codes"。

3.3 层次聚类算法聚类树构造

哈夫曼树构造过程与层次聚类算法思想也极其相似，将权值改为“样本距离”，并重新定义节点权值更新函数，即可得到层次聚类的聚类树构造。下图中展示了笔者使用哈夫曼树实现的层次聚类，并进行可视化的效果。图 2 经典层次聚类(Hierarchical Clustering)算法图 3 使用哈夫曼树构造的聚类树(试验数据为17年国赛建模B题数据，使用欧式距离度量权值)

3.4 数据加密

哈夫曼压缩中，最重要的哈夫曼编码表是能否解读数据关键。在压缩的时候，将码表与文本分离(或者打乱码表的表头、表文顺序，自定义一定规则进行匹配)，可以实现数据加密。同时，若将码表的表头与表文、表文长度进行分别处理，则可以实现多端口数据加密验证。

3.5 流式数据压缩

哈夫曼编码可以认为是基于统计的压缩算法，统计过程是算法的核心，而流式数据随着文本不断扩展，权值可能发生变化，此时使用哈夫曼压缩不一定能取得很好的压缩效果，但在特定场景下，通过预先设定字符编码，也能取得较好的情况。如据统计，在英文小说中，文本使用 "e"、"t"、"a" 等字符的频数较高，则可以对这些字符进行预先编码，再根据各文本差异进行后续编码扩充。当然，其他编码算法如 LZW 编码、RLE 算法也给出了更好的实现方案，这些算法压缩效果好、速度快，但是性能不够好。

3.6 压缩汉字构思

汉字在 GB2312 编码存储占 2 字节，而英文文本、数字占 1 字节，因此可以考虑在 GB2312 编码下构造汉字映射表，实现汉字压缩。(只是构思，写不写的出来就不知道咯~)

4 python3逐步实现哈夫曼压缩(附注 2 提供测试数据及完整源码)

4.1 说明

学习哈夫曼压缩过程中参考了许多资料，其中不少简书、CSDN 博文都给出了很漂亮的代码示例，但是也存在一些问题，如 python2 代码、结构混乱、使用类思想不便于新手理解(python的编程风格不同于JAVA)、没有给出压缩解压细节等。因此，本文以算法思想为蓝本逐步用代码进行实现，并在本文对每个部分的功能进行了详细说明。部分代码语句可能较为啰嗦，结构也不完美，但是可读性较强，便于理解。(完整代码见附注 2)

使用的编程语言：python3.6.4 (Anaconda3)

使用的编辑器：pycharm

使用的模块：os、six、tkinteros 模块：使用了 os 模块的 path.splitext 函数，用于分割文件名与扩展名。如"test.txt"，分割为 ('test', '.txt')，实现重写扩展名功能

six 模块：使用了 six 模块的 int2byte 函数，用于将数字转化为字节存入文件

tkinter 模块：选用，使用了 tkinter 模块的 filedialog.askopenfilenames 函数，用于实现弹窗打开文件的功能 (如图4)图 4 tkinter.filedialog.askopenfilenames 弹窗打开文件

4.2 导入模块

import os

import six

import tkinter

4.3 打开文件

f = open(file_name, 'r') # file_name为文件名

file_data = check_binary(f.read())

f.close()

由于本文实现的是英文文本的压缩，此处仅考虑 ASCII 码在 [0, 255] 范围内的字符。自定义函数 check_binary 进行字符检查替换。check_binary：用于检查文件字符 ASCII 编码是否在 [0, 255] 范围，不在此范围则替换为空格

def check_binary(input_data):

# 检查文件编码，ASCII码超出255的字符替换为空格

output_data = ''

for word_index in range(len(input_data)):

if ord(input_data[word_index]) >= 256:

output_data += ' '

else:

output_data += input_data[word_index]

return output_data

4.4 统计各字符出现的频数

统计各字符出现的频数，并保存在字典 char_freq 中setdefault(word, 0)：创建键为 word,，初始值为 0 的对象，若字典中已存在此键，则不产生影响。

char_freq = {}

for word in file_data:

char_freq.setdefault(word, 0)

char_freq[word] += 1

4.5 编码哈夫曼树

编码哈夫曼树两个重要的过程：更新字符频数排序，更新字符编码，对这两个过程分别自定义函数 sort_tuple 和 get_coding_schedulesort_tuple(dist)：传入一个字典 dist ，按照值大小顺序进行排序，并返回元组

def sort_tuple(dist):

# 传入字典，按照键大小顺序重排序

return sorted(dist.items(), key=lambda x: x[1], reverse=True)get_coding_schedule(end1, end2, sort_list, code_schedule)：传入排序表中频数最低的两位字符的 (键, 值) 元组、剔除传入的 end1, end2 后的字符排序列表、哈夫曼编码表，返回更新后的哈夫曼编码表哈夫曼表构造过程解析传入 end1 作为右子树，end2 作为左子树

分别判断 end1 和 end2 的字符长度，如果长度为 1 说明该字符是叶子节点，否则说明该字符是分支节点如果 end1 是叶子节点，则设置编码值为 "1"，如果 end2 是叶子节点，则设置编码值为 "0"

如果 end1 是分支节点，则根据分支节点的字符串进行遍历，为每一个子叶编码值都添加前缀字符 "1"，如果 end2 是分支节点，则根据分支节点的字符串进行遍历，为每一个子叶编码值都添加前缀字符 "0"

在 sort_list 中添加由 end1 和 end2 构成的分支节点信息，结点信息包含所有子叶字符，所有子叶累计频数

def get_coding_schedule(end1, end2, sort_list, code_schedule):

# 传入末端2位字符组频数序列列表(剔除末端字符) 哈夫曼编码表

if len(end1[0]) == 1:

code_schedule.setdefault(end1[0], '1')

else:

for k in end1[0]:

code_schedule[k] = '1' + code_schedule[k]

if len(end2[0]) == 1:

code_schedule.setdefault(end2[0], '0')

else:

for k in end2[0]:

code_schedule[k] = '0' + code_schedule[k]

sort_list.append((end2[0] + end1[0], end1[1] + end2[1]))

return code_schedule

通过调用上面两个函数，完成哈夫曼编码的构造

# 初始字符--频数列表

sort_list = sort_tuple(char_freq)

# 初始化哈夫曼编码表

code_schedule = {}

# 不断重排序，更新哈夫曼编码表及节点信息

for i in range(len(sort_list) - 1):

sort_list = sort_tuple(dict(sort_list))

code_schedule = get_coding_schedule(sort_list.pop(), sort_list.pop(), sort_list, code_schedule)图 5 哈夫曼压缩及编码示例

以图 5 为例，展示哈夫曼树及哈夫曼编码的构造过程：初次排序：[('e', 9), ('c', 4), ('a', 2), ('b', 2), ('d', 1)]

传入 end1 = ('d', 1), end2 = ('b', 2), sort_list = [('e', 9), ('c', 4), ('a', 2)], code_schedule = {}

end1 和 end2 的字符长度都为 1 ，分别设置编码 "1", "0"

得到 sort_list = [('e', 9), ('c', 4), ('a', 2), ('bd', 3)], code_schedule = {'d': '1', 'b': '0'}

第二次排序：[('e', 9), ('c', 4), ('bd', 3), ('a', 2)]

传入 end1 = ('a', 2), end2 = ('bd', 3), sort_list = [('e', 9), ('c', 4)], code_schedule = {'d': '1', 'b': '0'}

end1 字符长度为 1，设置编码 "1"；end2 字符长度为 2 ，取 end2 的字符 "bd" ，对子叶的字符编码分别加上前缀字符 "0"

得到 sort_list = [('e', 9), ('c', 4), ('bda', 5)], code_schedule = {'d': '01', 'b': '00', 'a': '1'}

第三次排序：[('e', 9), ('bda', 5), ('c', 4)]

传入 end1 = ('c', 4), end2 = ('bda', 5), sort_list = [('e', 9)], code_schedule = {'d': '01', 'b': '00', 'a': '1'}

end1 字符长度为 1，设置编码 "1"；end2 字符长度为 3，取 end2 的字符 "bda"，对子叶的字符编码分别加上前缀字符 "0"

得到 sort_list = [('e', 9), ('bdac', 9)], code_schedule = {'d': '001', 'b': '000', 'a': '01', 'c': '1'}

第四次排序：[('e', 9), ('bdac', 9)]

传入 end1 = ('bdac', 9), end2 = ('e', 9), sort_list = [], code_schedule = {'d': '001', 'b': '000', 'a': '01', 'c': '1'}

end1 字符长度为 4，取 end1 的字符 "bdac"，对子叶的字符编码分别加上前缀字符 "1"；end2 字符长度为 1，设置编码 "0"

得到 sort_list = [('ebdac', 18)]，code_schedule = {'d': '1001', 'b': '1000', 'a': '101', 'c': '11', 'e': '0'}

通过上面四次重复过程即完成了哈夫曼树及哈夫曼编码的构造

4.6 文本信息转哈夫曼编码

在 4.5 中构造了哈夫曼编码表，接下来要做的工作就是对照哈夫曼编码表，将文本信息转码并保存。要写入作为正文的信息有哈夫曼编码表、正文编码、补 0 。其中哈夫曼编码表只需要写入表文信息，正文部分需要进行转码处理，补 0 根据哈夫曼编码表表文信息+正文编码信息长度确定。如图 5 案例中，哈夫曼编码表表文长度 14，正文转码长度35，需要补 7 个 0 。正文信息存储结构如图 6 所示：图 6 待写入的文本信息

# 文本信息转哈夫曼码

# 哈夫曼 0-1 编码转码 + 正文文本

code = ''.join(list(code_schedule.values()))

for word in file_data:

code += code_schedule[word]

# 不足 8 位补 0，记录在 code_sup 中

code_sup = 8 - len(code) % 8

code += code_sup * '0'

4.7 创建压缩文件并写入信息

python 默认的存储数据以字符串形式存入，若要进行字节文件写入，需要使用二进制文件格式打开，还需要使用 six 模块下的 int2byte 函数对信息进行转码。

依次将：补 0 情况，码表总长度，每一个字符的表文长度，表头字符写入文件，作为文件头，用于声明信息。随后再将 4.6 中正文文本信息写入文件。图 6 待写入文件头信息

# 1.创建压缩文件

f = open(os.path.splitext(file_name)[0] + '.qlh', 'wb')

# 2.写入补 0 情况

f.write(six.int2byte(code_sup))

# 3.写入哈夫曼编码表(总长度+每一个编码长度+每一个编码对应的字符+转码信息)

# 3.1 码表总长度(字符个数，与指针读取定位有关，分割码表与正文)

f.write(six.int2byte(len(code_schedule)))

# 3.2 储存每一个哈夫曼编码的位长

for v in code_schedule.values():

f.write(six.int2byte(len(v)))

# 3.3 储存每一个哈夫曼编码配对字符字符 ==> ASCII 码

for k in code_schedule.keys():

f.write(six.int2byte(ord(k)))

# 3.4 以 8 为长度单位，将 0-1 字符转为对应的十进制数，映射为 ASCII 符号，写入正文文本

for i in range(len(code) // 8):

f.write(six.int2byte(int(code[8 * i:8 + 8 * i], 2)))

# 4.关闭文件

f.flush()

f.close()

print('压缩完成', file_name, '>>', os.path.splitext(file_name)[0] + '.qlh')

4.8 实验示例

本次使用英文 txt 文件 5 部作品进行实验测试：图 7 实验原文件，作品分别为：《哈利波特》4-6，《共产党宣言》，《一千零一夜》

压缩效果：图 8 压缩效果对比

可以看到，压缩效果显著。

4.9 解压的实现

解压是压缩的逆过程，怎么写入的就怎么读取。按照写入的过程分别读取以下信息：补 0 情况，用于删除正文信息中末尾补充的 "0"

码表总长度(设为

)

码表表文长度：表文长度以 1 字节形式存储在文件中，根据码表总长度向后截取

个字节即得到所有码表表文长度

码表表头：码表表文长度之后就是码表表文(编码对应的原字符)，也是向后继续截取

个字节，每一个字节对应的 ASCII 码都对应着一个字符，将其转译作为哈夫曼编码表的表头信息

码表表文：根据表文长度，在码表表头之后不断搜索截取表文长度指示的位数，获取到每个表头对应的表文，写入哈夫曼编码表。

正文信息：所有表文读取结束后即复原了哈夫曼编码表，根据补 0 情况删除末尾的字符，剩余的文本即为原始文本信息。对于原始文本信息，每次对编码向后搜索、拼接，并与哈夫曼编码表进行匹配，若编码存在哈夫曼编码表表文中，则使用自定义函数 get_keys 进行转译得到对应的表头

def get_keys(dict, value):

# 传入字典，值，获取对应的键

for k, v in dict.items():

if v == value:

return k

解码过程不涉及太多技术性问题，此处直接给出所有的代码及简要注释，按照写入方式逆向操作就能还原文本。

import os

# 1.打开文件

f = open(file_name, 'rb')

# 2.读取信息

file_data = f.read()

f.close()

# 3.分割信息

# 3.1 获取补 0 位数

code_sup = file_data[0]

# 3.2 获取码表长度

code_schedule_length = file_data[1]

# 3.3 指针跳过补0+码长+码符

pointer = 2 * code_schedule_length + 2

# 3.4 获取码表中每一个编码的长度

code_word_len = [file_data[2 + i] for i in range(code_schedule_length)]

# 3.5 编码表中字符长度总和，用于切割码表与正文

sum_code_word_len = sum(code_word_len) // 8 + 1 if sum(code_word_len) % 8 != 0 else sum(code_word_len) // 8

# 4.还原码表

# 4.1 码表转译

code_schedule_msg = ''

for i in range(sum_code_word_len):

code_schedule_msg += '0' * (10 - len(bin(file_data[pointer + i]))) + bin(file_data[pointer + i])[2:]

# 4.2 初始化指针

pointer = 0

# 4.3 创建码表

code_schedule = {}

for i in range(code_schedule_length):

code_word = chr(file_data[code_schedule_length + 2 + i]) # 码符

code_schedule[code_word] = code_schedule_msg[pointer:pointer + code_word_len[i]] # 码符码文匹配，还原码表

pointer += code_word_len[i]

# 5.提取正文

code = code_schedule_msg[pointer:]

pointer = 2 * code_schedule_length + 2 + sum_code_word_len

for number in file_data[pointer:]:

code += '0' * (10 - len(bin(number))) + bin(number)[2:]

# 删去补0

code = code[:-code_sup]

# 6.文本转译

pointer = 0 # 指针归零

# 初始化文本

letter = ''

# 限制最大搜索长度，提高效率

max_length = max([len(list(code_schedule.values())[i]) for i in range(len(code_schedule.values()))])

while pointer != len(code):

for i in range(max_length):

if code[pointer:pointer + i + 1] in code_schedule.values():

letter += get_keys(code_schedule, code[pointer:pointer + i + 1])

pointer += i + 1

break

# 7.创建解压文件

f = open(os.path.splitext(file_name)[0] + '.txt', 'w+')

f.write(letter)

print('解压完成', file_name, '>>', os.path.splitext(file_name)[0] + '.txt')

将上文中的压缩函数命名为 compress，解压函数命名为 decompress，并引入 tkinter 模块中的 filedialog.askopenfilenames 函数，即可实现弹窗点击文件并压缩、解压的功能。此外，通过自定义函数 compress_all、decompress_all、get_request 函数，进一步实现批量文件压缩解压功能。

def compress_all(file_names):

# 批量压缩文件

for file_name in file_names:

compress(file_name)

def decompress_all(file_names):

# 批量解压文件

for file_name in file_names:

decompress(file_name)

class Inputerror(Exception):

# 自定义异常

def __init__(self, messages):

super().__init__(messages)

def get_request():

file_name = tkinter.filedialog.askopenfilenames()

ask = input('Compress or Decompress ? (C/D)').lower()

if ask == 'd':

decompress_all(file_name) # 解压文件

elif ask == 'c':

compress_all(file_name) # 压缩文件

else:

raise Inputerror("accept unknown command ,routine haven't started doing anything, please run it again")

写在运行当前文件中执行的部分

if __name__ == '__main__':

import tkinter.filedialog

get_request()

while input('Continue ? (Y/N)').lower() == 'y':

get_request()

4.10 实验示例

继续对 4.8 中的文件进行解压。先前提到，本文中的程序是对 ASCII 范围在 [0,255] 的字符进行压缩，并对超过范围的字符进行空格替换处理，因此文件中出现的少量数据损失属于正常现象。(哈利波特 5 文件中没有超过范围的字符，因此实现了完整的数据还原)图 9 压缩前与解压后文件对比

5 附注 1：罗塞塔代码提供的哈夫曼编码树构造

from heapq import heappush, heappop, heapify

from collections import defaultdict

def encode(symb2freq):

"""Huffman encode the given dict mapping symbols to weights"""

heap = [[wt, [sym, ""]] for sym, wt in symb2freq.items()]

heapify(heap)

while len(heap) > 1:

lo = heappop(heap)

hi = heappop(heap)

for pair in lo[1:]:

pair[1] = '0' + pair[1]

for pair in hi[1:]:

pair[1] = '1' + pair[1]

heappush(heap, [lo[0] + hi[0]] + lo[1:] + hi[1:])

return sorted(heappop(heap)[1:], key=lambda p: (len(p[-1]), p))

txt = "this is an example for huffman encoding"

symb2freq = defaultdict(int)

for ch in txt:

symb2freq[ch] += 1

huff = encode(symb2freq)

print ("Symbol\tWeight\tHuffman Code")

for p in huff:

print("%s\t%s\t%s" % (p[0], symb2freq[p[0]], p[1]))

测试文本：this is an example for huffman encoding

输出结果：

6 附注 2：实验数据及程序

附件为百度网盘链接。其中，对 "data/实验数据" 中的文件进行压缩可以得到 "data/压缩文件" 中的文件，对 "data/压缩文件" 中的文件进行解压可以得到 "data/解压效果" 中的文件https://pan.baidu.com/s/1dgIAnIS-hW4QNFUWlo6YJQpan.baidu.com

7 附注 3：LZW 算法简单实现

LZW 对流式数据具有较好的压缩性能，基本思想为进一步对连续字符进行压缩替换(如 "abcd832abcd841abcd818" ，若用 "e" 代替 "abcd8" ，则原文本可以转化为 "e32e41e18"，从而实现压缩)，下面是压缩算法代码的简单实现。在上述测试数据中压缩效果表现不理想(重复文本过少)，删去 write_file 部分(即不初始化码表)则性能极优，但是只能输出配对字符。这里产生的问题可能是我对 LZW 的存储机制理解有误，也可能是写入码表的方式赘余太严重。以后有时间改改再回来填坑~

def get_keys(dict, value):

# 传入字典，值，获取对应的键

for k, v in dict.items():

if v == value:

return k

def check_binary(input_data):

# 检查文件编码，ASCII码超出255的字符替换为空格

output_data = ''

for word_index in range(len(input_data)):

if ord(input_data[word_index]) >= 256:

output_data += ' '

else:

output_data += input_data[word_index]

return output_data

def write_file(f,code_schedule,code):

import six

# 声明码表长度

code_schedule_len = '0' * (18 - len(bin(len(code_schedule)))) + bin(len(code_schedule))[2:]

f.write(six.int2byte(int(code_schedule_len[:8], 2))) # 声明码表长度 1

f.write(six.int2byte(int(code_schedule_len[8:], 2))) # 声明码表长度 2

# 声明符长(1 字节)，以 1 字节储存字符，前255位不需要声明字符 ==> ASCII 码

# 文本转码 2 字节

for letter in code:

letter_code = '0' * (18 - len(bin(letter))) + bin(letter)[2:]

f.write(six.int2byte(int(letter_code[:8], 2))) # 文本长度 1

f.write(six.int2byte(int(letter_code[8:], 2))) # 文本长度 2

# 使用 -1 作为分隔符

f.write(six.int2byte(ord('-')))

f.write(six.int2byte(ord('1')))

def compress(file_name):

import os

# 1.打开文件

f = open(file_name, 'r')

# 2.读取信息

file_data = check_binary(f.read())

f.close()

# 3.创建压缩文件

f = open(os.path.splitext(file_name)[0] + '.qlh', 'wb')

# 创建初始码表，储存 0-255 ASCII 码表信息

code_schedule = dict([[chr(i), i] for i in range(256)])

code_size = 255

code = []

prefix = '' # 前缀词

for postfix in file_data:

vocabulary = prefix + postfix # 前缀+后缀构成匹配词组

if vocabulary in code_schedule.keys():

prefix = vocabulary

else:

if len(code_schedule) <= 65535:

code.append(code_schedule[prefix])

code_size += 1

code_schedule[vocabulary] = code_size

prefix = postfix

else:

write_file(f, code_schedule, code)

# 初始化

code_schedule = dict([[chr(i), i] for i in range(256)])

code_size = 255

code = []

prefix = ''

if code != []:

write_file(f, code_schedule, code)

# 关闭文件

f.flush()

f.close()

print('压缩完成', file_name, '>>', os.path.splitext(file_name)[0] + '.qlh')

本人第 1 篇技术博客，仅是分享个人学习心得及相关代码。在算法实现上，如果有更好的优化方式，欢迎同我联系探讨。

作者：张柳彬

如有疑问，请联系QQ：965579168

转载请声明出处

你可能感兴趣的:(python实现信息论哈夫曼编码_哈夫曼压缩原理及python3实现(非面向对象结构))

C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
发票合并工具小朋的软件园前端 javascript java html 服务器
"发票合并工具"是一款专为高效整理票据设计的实用工具，支持将来自不同渠道的发票文件（如PDF文档、各类图片格式）快速整合为排版规范的PDF文件，尤其适用于财务报销场景下的批量票据处理需求。核心功能亮点多格式兼容：无缝导入PDF文件及常见图片格式（.png/.jpg/.jpeg/.bmp），适配多来源发票整合需求。智能布局配置：提供灵活的页面布局选项（每页2/3/4张发票），其中"2合1"模式针对报
Guava LoadingCache sqyaa. java并发编程 Java知识 jvm 缓存 guava
LoadingCache是GoogleGuava库提供的一个高级缓存实现，它通过自动加载机制简化了缓存使用模式。核心特性自动加载机制当缓存未命中时，自动调用指定的CacheLoader加载数据线程安全：并发请求下，相同key只会加载一次灵活的过期策略支持基于写入时间(expireAfterWrite)和访问时间(expireAfterAccess)的过期可设置最大缓存大小，基于LRU策略淘汰丰富的
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
LeetCode 148. 排序链表：归并排序的细节解析进击的小白菜 2025 Top100 详解 leetcode 链表算法
文章目录题目描述一、方法思路：归并排序的核心步骤二、关键实现细节：快慢指针分割链表1.快慢指针的初始化问题2.为什么选择`fast=head.next`？示例1：链表长度为偶数（`1->2->3->4`）三、完整代码实现四、复杂度分析五、总结题目描述LeetCode148题要求对链表进行排序，时间复杂度需为O(nlogn)，且空间复杂度为O(logn)。由于链表的特殊结构（无法随机访问），归并排序
前端项目架构设计要领
1.架构设计的核心目标在设计前端项目架构时，核心目标是模块化、可维护、可扩展、可测试，以及开发效率的最大化。这些目标可以通过以下几个方面来实现：组件化：将UI功能封装为可复用的组件。模块化：将业务逻辑分解为独立的模块或服务。自动化构建与部署：实现自动化构建、测试和部署流程，减少人为操作的错误。代码规范化与检查：确保团队协作时，代码风格和质量一致。2.项目目录结构设计一个清晰合理的目录结构对大型项目
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
嵌入式系统LCD显示模块编程实践
本文还有配套的精品资源，点击获取简介：本文档提供了一个具有800x480分辨率的3.5英寸液晶显示模块LW350AC9001的驱动程序代码，以及嵌入式系统中使用C/C++语言进行硬件编程的实践指南。该模块的2mm厚度使其适用于空间受限的便携式设备。内容包括驱动程序源代码、硬件控制接口使用方法，以及如何在嵌入式系统中进行图形处理、电源管理与性能优化。1.嵌入式系统原理1.1嵌入式系统概念嵌入式系统是
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
ARM嵌入式可编程控制器技术开发拉勾科研工作室 arm开发
PLC自动化设计|毕业设计指导|工业自动化解决方案✨专业领域：PLC程序设计与调试工业自动化控制系统HMI人机界面开发工业传感器应用电气控制系统设计工业网络通信擅长工具：西门子S7系列PLC编程三菱/欧姆龙PLC应用触摸屏界面设计电气CAD制图工业现场总线技术自动化设备调试主要内容：PLC控制系统设计工业自动化方案规划电气原理图绘制控制程序编写与调试毕业论文指导毕业设计题目与程序设计✅具体问题可以
理解TCP连接中的进程阻塞与CPU调度机制 109702008 编程 #C语言网络 tcp/ip 网络人工智能
引言在计算机网络通信中，TCP连接的建立是一个经典的三次握手过程。当用户调用connect()函数发起连接时，内核会发送SYN报文并等待对方的SYN-ACK响应。此时，调用进程通常会进入阻塞状态，暂停执行直至连接成功或超时。这一机制看似简单，但其背后的内核实现却涉及进程调度、等待队列管理和CPU资源分配等复杂操作。本文将深入探讨阻塞状态的实现原理，并解析CPU在进程阻塞期间的行为。一、进程阻塞的实
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
基于架构的软件设计（Architecture-Based Software Design，ABSD）是一种以架构为核心的软件开发方法
ABSD方法与生命周期基于架构的软件设计（Architecture-BasedSoftwareDesign，ABSD）是一种以架构为核心的软件开发方法，强调在开发的各个阶段都要以架构为中心，确保系统的整体结构和质量属性得到有效管理。ABSD方法是一个自顶向下、递归细化的过程，软件系统的架构通过该方法得到细化，直到能产生软件构件和类。ABSD方法的三个基础功能的分解：使用基于模块的内聚和耦合技术，将
Leetcode 3604. Minimum Time to Reach Destination in Directed Graph Espresso Macchiato leetcode笔记 leetcode 3604 leetcode medium leetcode双周赛160 BFS 广度优先遍历最优路径
Leetcode3604.MinimumTimetoReachDestinationinDirectedGraph1.解题思路2.代码实现题目链接：3604.MinimumTimetoReachDestinationinDirectedGraph1.解题思路这一题思路上就是一个广度优先遍历，我们不断考察当前时间点以及位置的情况下，下一个点可行的位置，然后考察最近的时间点能够到达的位置，遍历全部可能
vue keep-alive标签的运用
keep-alive，想必大家都不会很陌生，在一些选项卡中会使用到。其实，它的作用大概就是把组件的数据给缓存起来。比如果我有一个选项卡，标签一，标签二，标签三。现在，我需要实现，当我在标签一的表单中输入内容后，点击标签二，再回到标签一，表单的内容依然存在。如果按以往的做法，不使用keep-alive，那是不能实现的。然而，我们只需要在选项卡的内容最外层包一个keep-alive标签即可。但这儿有一
Redis Sentinel（哨兵）和 Redis Cluster（集群） G丶AEOM 八股普通学习区 Redis redis 数据库缓存
哨兵机制和集群有什么区别Redis集群主要有两种，一种是RedisSentinel哨兵集群，一种是RedisCluster。主从集群，包括一个Master和多个Slave节点，Master负责数据的读写，Slave负责数据的读取，Master上收到的数据变更会同步到Slave节点上实现数据同步，但不提供容错和恢复，在Master宕机时不会选出新的Master，导致后续客户端所有写请求直接失败。所以
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
kube-scheduler 抢占机制分享放大价值 kubernetes源码分析 kubernetes kube-scheduler 抢占
当pod调度失败后，会在PostFilter扩展点执行抢占流程，下面分析相关的代码实现抢占接口//PodNominatorabstractsoperationstomaintainnominatedPods.typePodNominatorinterface{//将pod加入抢占成功的node中AddNominatedPod(pod*PodInfo,nodeNamestring)//将pod从no
Shader面试题100道之（81-100）还是大剑师兰特 #Shader 综合教程100+大剑师 shader面试题 shader教程
Shader面试题（第81-100题）以下是第81到第100道Shader相关的面试题及答案：81.Unity中如何实现屏幕空间的热扭曲效果（HeatDistortion）？热扭曲效果可以通过GrabPass抓取当前屏幕图像，然后在片段着色器中使用噪声或动态UV偏移模拟空气扰动，再结合一个透明通道控制扭曲强度来实现。82.Shader中如何实现物体轮廓高亮（OutlineHighlight）？轮廓
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d