吴师兄大模型

从零开始掌握哈夫曼树：数据压缩与Python实现详解

系列文章目录

01-从零开始掌握Python数据结构：提升代码效率的必备技能！
02-算法复杂度全解析：时间与空间复杂度优化秘籍
03-线性数据结构解密：数组的定义、操作与实际应用
04-深入浅出链表：Python实现与应用全面解析
05-栈数据结构详解：Python实现与经典应用场景
06-深入理解队列数据结构：从定义到Python实现与应用场景
07-双端队列（Deque）详解：Python实现与滑动窗口应用全面解析
08-如何利用栈和队列实现高效的计算器与任务管理系统
09-树形数据结构的全面解析：从基础概念到高级应用
10-深入解析二叉树遍历算法：前序、中序、后序与层序实现
11-二叉搜索树全解析：基础原理、操作实现与自平衡优化策略
12-【深度解析】Python实现AVL树：旋转操作与平衡因子全解密
13-堆数据结构全解析：Python实现高效的优先级队列与堆排序
14-从零开始掌握哈夫曼树：数据压缩与Python实现详解

文章目录

系列文章目录
前言
一、哈夫曼树的定义与构造
- 1.1 哈夫曼树的定义
- - 1.1.1 哈夫曼树的构造原则
  - 1.1.2 哈夫曼树的性质
- 1.2 哈夫曼树的构造过程详解
- - 1.2.1 构造步骤
  - 1.2.2 构建结果
二、哈夫曼编码的应用
- 2.1 数据压缩中的应用
- - 2.1.1 压缩原理
  - 2.1.2 应用场景
- 2.2 数据传输中的应用
- - 2.2.1 传输优化
  - 2.2.2 无损压缩的优势
三、哈夫曼树的Python实现
- 3.1 基本实现思路
- - 3.1.1 定义节点类
  - 3.1.2 构建哈夫曼树
  - 3.1.3 生成哈夫曼编码
- 3.2 完整示例代码
- - 3.2.1 示例输出
四、总结

前言

随着信息技术的飞速发展和数据量的激增，如何高效地存储和传输数据成为了一个至关重要的问题。在这其中，哈夫曼编码作为一种经典的无损数据压缩技术，已经广泛应用于各种领域，从文件压缩到图像、视频压缩再到互联网数据传输，哈夫曼编码的价值无可估量。

哈夫曼树的构造和哈夫曼编码的生成，正是数据压缩中至关重要的一步。通过对频繁出现的数据赋予短的编码，哈夫曼算法能够显著减少数据的占用空间，进而实现高效的压缩效果。本文将深入讲解哈夫曼树的定义、构建过程以及如何在Python中实现这一算法，帮助你理解并掌握这一强大的技术。无论你是数据科学的初学者，还是想提高代码性能的开发者，本篇文章都会为你提供实用的知识和技能。

一、哈夫曼树的定义与构造

1.1 哈夫曼树的定义

哈夫曼树是一种带权路径长度最短的二叉树，广泛应用于数据压缩领域。其基本思想是，通过给出现频率较高的字符分配较短的编码，给频率较低的字符分配较长的编码，从而实现压缩效果。哈夫曼树的节点代表字符，而每个节点的权值表示该字符的频率。根节点的深度表示编码的长度，路径越短的节点，其编码就越短，反之则越长。

1.1.1 哈夫曼树的构造原则

哈夫曼树的构建依赖于贪心算法，其构建过程如下：

初始化：首先将每个字符和其对应的频率作为一个单独的节点放入优先队列中。优先队列可以使用最小堆来实现，堆中每个元素表示一个节点，节点按照频率排序。
合并节点：每次从优先队列中取出两个频率最小的节点，将它们合并成一个新节点，且新节点的权值为两个子节点的权值之和。新节点的左子树指向第一个取出的节点，右子树指向第二个取出的节点。
重复合并：将新节点放回优先队列，继续重复上述步骤，直到堆中只剩下一个节点，即为哈夫曼树的根节点。

1.1.2 哈夫曼树的性质

最优性：哈夫曼树能够保证生成的编码总长度最短，因此被广泛应用于数据压缩。
无歧义性：哈夫曼树生成的编码是前缀编码，即没有任何一个编码是另一个编码的前缀，确保了编码的唯一性。

1.2 哈夫曼树的构造过程详解

哈夫曼树的构造过程可以通过具体示例来理解。假设我们有如下字符及其频率：

字符	频率
A	5
B	9
C	12
D	13
E	16
F	45

1.2.1 构造步骤

初始化：将所有字符及其频率放入一个最小堆中。

import heapq

# 构建初始节点
frequencies = {'A': 5, 'B': 9, 'C': 12, 'D': 13, 'E': 16, 'F': 45}
heap = [Node(char, freq) for char, freq in frequencies.items()]
heapq.heapify(heap)

合并节点：
- 取出 A 和 B，创建新节点 AB，频率为 14。
- 继续取出最小的节点进行合并，直到堆中只剩下一个节点。

1.2.2 构建结果

最终得到的哈夫曼树如下所示：

        [100]
       /     \
    [45]     [55]
            /    \
         [30]    [25]
        /   \   /    \
     [16] [14][12]   [13]
           /  \
         [5]  [9]

哈夫曼树的构建完成后，路径从根节点到每个字符的编码即为哈夫曼编码。

二、哈夫曼编码的应用

2.1 数据压缩中的应用

哈夫曼编码最重要的应用之一是数据压缩。它通过优化编码方案，使得频率高的字符占用较少的空间，从而达到压缩数据的效果。常见的压缩算法（如ZIP、JPEG等）都使用了哈夫曼编码。

2.1.1 压缩原理

哈夫曼编码通过以下步骤实现数据压缩：

统计字符频率：扫描待压缩的数据，统计每个字符出现的频率。
构建哈夫曼树：根据字符频率构建哈夫曼树，生成哈夫曼编码。
压缩数据：使用哈夫曼编码替换原始数据中的字符，从而减少数据的总量。

例如，假设我们需要压缩如下字符串：“AABBBCCCCC”，则通过统计字符频率，我们得到了字符A的频率为2，字符B的频率为3，字符C的频率为5。通过哈夫曼编码，我们将字符A、B、C分配不同长度的编码，最终压缩数据。

2.1.2 应用场景

文件压缩：哈夫曼编码被广泛用于文件压缩中，压缩后的文件占用更少的存储空间。
图像压缩：在JPEG图像压缩中，哈夫曼编码用于压缩图像的像素数据，从而减小图像文件的大小。
视频压缩：在视频编码中，如H.264等视频压缩标准，也使用哈夫曼编码压缩视频数据，减少带宽和存储需求。

2.2 数据传输中的应用

哈夫曼编码在数据传输中也有着重要应用。由于哈夫曼编码能够有效减少冗余数据，因此，它可以显著提高数据传输的效率，尤其是在传输大量重复数据的场景中。

2.2.1 传输优化

在网络传输中，使用哈夫曼编码能够减少传输的数据量，进而提高传输效率。在传输数据时，使用哈夫曼编码可以减少带宽的消耗，尤其适用于文本数据或重复数据较多的场景。

2.2.2 无损压缩的优势

哈夫曼编码是一种无损的压缩方法，这意味着经过哈夫曼编码压缩的数据可以完美还原，不丢失任何信息。因此，哈夫曼编码特别适合用于要求高数据完整性的应用场景，如文档传输、软件更新包的传输等。

三、哈夫曼树的Python实现

3.1 基本实现思路

在Python中实现哈夫曼树主要包括以下几个步骤：

定义一个节点类，该类用来表示哈夫曼树的每个节点。每个节点包含字符、频率、左右子节点等信息。
使用优先队列（最小堆）来构建哈夫曼树。通过反复合并最小的节点来生成树。
从构建好的哈夫曼树生成哈夫曼编码。通过深度优先遍历树，记录从根节点到叶节点的路径，生成每个字符的编码。
使用生成的编码进行数据压缩，即用哈夫曼编码替代原始数据中的字符。

3.1.1 定义节点类

首先，我们定义一个Node类来表示树的节点。每个节点包含字符、频率、左右子节点，并且我们需要重载节点的比较方法，以便在优先队列中使用。

class Node:
    def __init__(self, char, freq):
        self.char = char  # 字符
        self.freq = freq  # 字符频率
        self.left = None  # 左子树
        self.right = None  # 右子树

    def __lt__(self, other):
        return self.freq < other.freq  # 按照频率进行比较

3.1.2 构建哈夫曼树

构建哈夫曼树的过程实际上是利用优先队列（最小堆）来不断合并最小频率的节点。通过反复合并直到队列中只剩下一个节点，这个节点即为哈夫曼树的根节点。

import heapq

def build_huffman_tree(frequencies):
    # 创建节点列表
    heap = [Node(char, freq) for char, freq in frequencies.items()]
    heapq.heapify(heap)  # 使用heapq来构建最小堆

    # 合并节点
    while len(heap) > 1:
        # 取出频率最小的两个节点
        left = heapq.heappop(heap)
        right = heapq.heappop(heap)
        # 创建新节点并合并
        merged = Node(None, left.freq + right.freq)
        merged.left = left
        merged.right = right
        # 将新节点加入堆中
        heapq.heappush(heap, merged)

    # 最终堆中剩下的唯一节点即为哈夫曼树的根节点
    return heap[0]

3.1.3 生成哈夫曼编码

构建哈夫曼树后，我们可以通过深度优先遍历来生成哈夫曼编码。具体地，从根节点出发，左边子树为“0”，右边子树为“1”，并依此递归地生成编码。

def generate_huffman_codes(root, current_code="", codes={}):
    # 如果当前节点为空，返回
    if root is None:
        return codes
    # 如果是叶子节点，记录字符和编码
    if root.char is not None:
        codes[root.char] = current_code
    # 遍历左右子树
    generate_huffman_codes(root.left, current_code + "0", codes)
    generate_huffman_codes(root.right, current_code + "1", codes)
    return codes

3.2 完整示例代码

以下是一个完整的示例，展示了如何使用Python实现哈夫曼树的构建以及生成哈夫曼编码。

import heapq

class Node:
    def __init__(self, char, freq):
        self.char = char
        self.freq = freq
        self.left = None
        self.right = None

    def __lt__(self, other):
        return self.freq < other.freq

def build_huffman_tree(frequencies):
    heap = [Node(char, freq) for char, freq in frequencies.items()]
    heapq.heapify(heap)

    while len(heap) > 1:
        left = heapq.heappop(heap)
        right = heapq.heappop(heap)
        merged = Node(None, left.freq + right.freq)
        merged.left = left
        merged.right = right
        heapq.heappush(heap, merged)

    return heap[0]

def generate_huffman_codes(root, current_code="", codes={}):
    if root is None:
        return codes
    if root.char is not None:
        codes[root.char] = current_code
    generate_huffman_codes(root.left, current_code + "0", codes)
    generate_huffman_codes(root.right, current_code + "1", codes)
    return codes

# 示例输入字符及频率
frequencies = {'A': 5, 'B': 9, 'C': 12, 'D': 13, 'E': 16, 'F': 45}

# 构建哈夫曼树
root = build_huffman_tree(frequencies)

# 生成哈夫曼编码
codes = generate_huffman_codes(root)
print("哈夫曼编码:", codes)

3.2.1 示例输出

假设我们输入的字符频率表是 {'A': 5, 'B': 9, 'C': 12, 'D': 13, 'E': 16, 'F': 45}，运行上述代码时，输出的哈夫曼编码可能是：

哈夫曼编码: {'F': '0', 'E': '10', 'D': '11', 'C': '011', 'B': '010', 'A': '001'}

在这个输出中，每个字符对应一个哈夫曼编码，例如字符 F 被编码为 "0"，而字符 A 被编码为 "001"。这种编码方法确保了频率较高的字符使用较短的编码，从而优化了存储和传输效率。

四、总结

本文主要介绍了哈夫曼树及哈夫曼编码的相关内容，帮助读者从基础到实践深入理解这一经典的编码方法。总结如下：

哈夫曼树的定义与构造
- 哈夫曼树是一种带权路径长度最短的二叉树，通过贪心算法实现最优编码。每个字符根据其频率生成对应的编码，频率较高的字符编码较短，频率较低的字符编码较长。
- 构建哈夫曼树的步骤包括：统计字符频率、构建最小堆、逐步合并节点，最终形成树结构。
哈夫曼编码的应用
- 哈夫曼编码广泛应用于数据压缩，尤其是在文件压缩、图像压缩和视频压缩等领域，通过减少冗余数据提高存储和传输效率。
- 哈夫曼编码作为一种无损压缩方法，能够确保压缩后的数据完美还原，广泛应用于网络传输和数据存储中。
哈夫曼树的Python实现
- 在Python中，我们通过定义一个Node类来表示哈夫曼树的节点，并使用优先队列（最小堆）来构建哈夫曼树。
- 通过深度优先遍历哈夫曼树生成对应的哈夫曼编码，并展示了完整的Python代码实现。

哈夫曼编码不仅是一种经典的算法，更是数据压缩领域中的基础知识之一。掌握了哈夫曼树的构建与哈夫曼编码的生成，你将能更好地理解压缩算法的核心原理，并在实际应用中利用它来提升数据存储和传输效率。

Python从入门到弃坑学习笔记——第一章 Python入门 youweilong033 Python学习学习笔记 python pycharm
笔主趁着假期闲的蛋疼，打算开始学习一下Python，主要是之前就有很多朋友问我Python问题，甚至还有新闻学专业的，但我Python从没学过，还挺尴尬的。打算从现在开坑写一系列的Python学习笔记（flag立下了，乐。毕竟是从零开始学，在我的系列文章中，你将会看到包括但不限于：根据自己的想法命名东西，各种概念胡言乱语，shi一样的排版，某网课上的内容拿来主义。希望大佬们海涵，批评指正，有问题可
代码随想录算法训练营总结篇 m0_74934708 算法
第一次接触卡哥的课程是在大二上，当时做N皇后的题目看到卡哥的视频觉得大受裨益，就想着有时间能够刷完卡哥录制的整期课程，后面有算法训练营的监督让我很幸运地坚持了六十天，学到了很多东西，像贪心算法、动态规划、单调栈以及在二叉树里使用BFS和DFS，都是一些很美妙的思路。这次一刷leetcode后面要去学学前端了，等到暑假有时间希望可以跟着卡哥二刷leetcode。学会算法后再去做题有些痛苦，但做出来的
图论篇--代码随想录算法训练营第五十九天打卡|Bellman_ford 算法精讲，SPFA算法，Bellman ford之判断负权回路，Bellman ford之单源有限最短路無量空所 leetcode 算法图论 c++
本系列算法用来解决有负权边的情况Bellman_ford算法精讲题目链接：94.城市间货物运输I题目描述：某国为促进城市间经济交流，决定对货物运输提供补贴。共有n个编号为1到n的城市，通过道路网络连接，网络中的道路仅允许从某个城市单向通行到另一个城市，不能反向通行。网络中的道路都有各自的运输成本和政府补贴，道路的权值计算方式为：运输成本-政府补贴。权值为正表示扣除了政府补贴后运输货物仍需支付的费用
【前端vue3面试题】2024最新面试实录vue3(2)，最新前端大厂高频面试题
*watch与watchEffect*provide与inject重构虚拟DOM,diff算法生命周期更名beforeDestroy改名为beforeUnmountdestroyed改名为unmounted//Vue3.0也提供了CompositionAPI形式的生命周期钩子，与Vue2.x中钩子对应关系如下：beforeCreate===>setup()created===>setup()bef
MATLAB 基于图像处理的杂草识别技术鱼弦 matlab 图像处理计算机视觉
MATLAB基于图像处理的杂草识别技术1.系统介绍杂草识别是精准农业中的重要环节，基于图像处理的杂草识别技术利用计算机视觉和机器学习算法，自动识别田间杂草，为精准施药提供决策支持。本系统基于MATLAB实现杂草图像处理，包括图像预处理、特征提取、分类识别等模块。2.应用场景精准农业:自动识别田间杂草，实现精准施药，减少农药使用量。生态监测:监测农田杂草种类和分布，评估生态环境。植物保护:识别有害杂
如何在PyCharm中删除虚拟环境小白的程序空间 Python学习 pycharm ide python
1、进入PythonInterpreters具体方法：Settings-->Project:自己命名的项目-->PythonInterpreters-PythonInterpreter下拉栏-->showall，具体步骤见下图。2、选择需要删除的python环境，具体下图所示。选择需要删除的环境-->点击‘-’号-->ok
维基框架发布 1.0.11 至中央仓，深化国产化 DevOps 生态整合维基框架维基框架 spring boot spring cloud mybatis 架构
一、核心事件：维基框架1.0.11正式入驻中央仓库维基框架（Wiki-Framework）作为国产全场景Java企业级开发框架，于7月9日正式发布v1.0.11版本至中央软件仓库（MavenCentral），标志着其正式纳入全球主流开发工具生态。本次发布聚焦安全增强与云原生适配：安全升级：集成OAuth2.1协议，修复CVE-2025-0113等5项高危漏洞，支持国密算法SM4加密通信。云原生支持
Python 机器学习：NumPy 实现朴素贝叶斯分类器 Python编程之道 Python编程之道 python 机器学习 numpy ai
Python机器学习：NumPy实现朴素贝叶斯分类器关键词：朴素贝叶斯分类器、NumPy、机器学习、概率模型、条件概率、拉普拉斯平滑、向量化计算摘要：本文系统讲解朴素贝叶斯分类器的核心原理，基于NumPy实现高效的算法框架，涵盖从概率理论到工程实现的完整流程。通过数学公式推导、代码实现和鸢尾花数据集实战，展示如何利用向量化计算优化概率估计，解决特征独立性假设下的分类问题。同时分析算法优缺点及实际应
代码随想录算法训练营第二十二天天天开心(∩_∩) 算法深度优先
LeetCode.77组合题目链接组合题解classSolution{List>result=newArrayListpath=newLinkedList>combine(intn,intk){dfs(n,k,1);returnresult;}publicvoiddfs(intn,intk,intcount){if(path.size()==k){result.add(newArrayList>r
代码随想录算法训练营第二十三天天天开心(∩_∩) 算法
LeetCode.39组合总和题目链接组合总和题解classSolution{List>resList=newArrayList>();Listres=newArrayList>combinationSum(int[]candidates,inttarget){if(candidates==null||candidates.length==0){returnresList;}Arrays.sort
代码随想录算法训练营第二十四天天天开心(∩_∩) 算法深度优先
LeetCode.93复原IP地址题目链接复原IP地址题解classSolution{ListresList=newArrayList();Listres=newArrayList();publicListrestoreIpAddresses(Strings){if(s.length()==0)returnresList;dfs(s,0);returnresList;}publicvoiddfs(
代码随想录算法训练营第十七天天天开心(∩_∩) 算法数据结构
目录LeetCode.654最大二叉树题目链接最大二叉树题解解题思路LeetCode.617合并二叉树题目链接合并二叉树题解解题思路LeetCode.700二叉搜索树中的搜索题目链接二叉搜索树中的搜索题解解题思路解题思路LeetCode.98验证二叉搜索树题目链接验证二叉搜索树题解解题思路解题思路总结与收获LeetCode.654最大二叉树题目链接最大二叉树题解classSolution{publ
MATLAB实现基于多目标粒子群优化算法（MOPSO）进行无人机三维路径规划的详细项目实例 nantangyuxi MATLAB matlab 算法无人机人工智能深度学习机器学习数据挖掘
目录MATLAB实她基她她目标粒子群优化算法（MOPSO）进行无人机三维路径规划她详细项目实例1项目背景介绍...1项目目标她意义...2优化无人机飞行路径她安全她...2提升路径规划她她目标协调能力...2实她三维环境下她动态路径规划...2降低计算复杂度，实她高效路径规划...2提供具有工程实践价值她路径规划工具...3丰富她目标优化算法她应用案例...3促进无人机智能自主飞行技术进步...3
Python 全局解释器锁 (Global Interpreter Lock - GIL) Learning_By Doing python并发编程 python 开发语言并发编程 GIL
GIL是什么？全局解释器锁(GIL)是CPython解释器（官方、最常用的Python解释器）中的一个互斥锁(mutex)。它的核心作用是：在任意时刻，只允许一个线程执行Python字节码。这意味着，即使你的计算机有多个CPU核心，一个CPython进程中的多个线程也无法真正地并行执行Python代码。它们可以并发执行（即交替执行），但不能在同一瞬间并行运行。GIL为什么存在？GIL的存在主要是为
运维技术干货 — 不仅是 Linux 运维最佳实践 python算法小白 Linux
附Java/C/C++/机器学习/算法与数据结构/前端/安卓/Python/程序员必读书籍书单大全：书单导航页（点击右侧极客侠栈即可打开个人博客）：极客侠栈①【Java】学习之路吐血整理技术书从入门到进阶最全50+本（珍藏版)②【算法数据结构+acm】从入门到进阶吐血整理书单50+本（珍藏版)③【数据库】从入门到进阶必读18本技术书籍网盘吐血整理网盘(珍藏版)④【Web前端】从HTML到JS到AJ
NOIP2013提高组复赛数据详细分析与应用指南欧学东
本文还有配套的精品资源，点击获取简介：2013年的NOIP提高组复赛数据，涉及C++编程、算法设计、数据结构、问题分析、时间空间复杂度优化、调试测试、比赛策略、历年试题分析等多个知识点。这些数据对于参赛者、教练和信息技术教育研究者具有重要参考价值，有助于提升信息技术能力和竞赛准备的有效性。1.NOIP竞赛概览全国青少年信息学奥林匹克竞赛（NationalOlympiadinInformaticsi
基于深度学习的和平精英（吃鸡）内置锁头训练摆烂仙君深度学习人工智能
前言本教程以和平精英为例，主要讲解如何构建深度学习模型对游戏中角色进行头部标注，并控制鼠标对其进行锁定射击，同时围绕其游戏防作弊系统进行算法攻防讲解，该方案对于csgo,cf等游戏也同样适用。请注意，该教程仅供娱乐教学，若本教程评论超过100，将会开源相关代码并对实际的代码部署进行进一步分析。一、和平精英伤害机制分析在《刺激战场》（现为《和平精英》）中，击中头部的伤害远高于身体其他部位，这是由游戏
基于蜣螂算法优化多头注意力机制的卷积神经网络结合双向长短记忆神经网络实现温度预测DBO-CNN-biLSTM-Multihead-Attention附matlab代码 matlab科研助手神经网络算法 cnn
✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，代码获取、论文复现及科研仿真合作可私信。个人主页：Matlab科研工作室个人信条：格物致知。更多Matlab完整代码及仿真定制内容点击智能优化算法神经网络预测雷达通信无线传感器电力系统信号处理图像处理路径规划元胞自动机无人机物理应用机器学习内容介绍温度预测在气象学、农业、能源等领域具有重要的应用价值。随着大数据和人工智能技术的快速发
39、设计模式的实现与示例：模板方法模式 mac99 C#3.0设计模式：从入门到精通设计模式模板方法模式 C#
设计模式的实现与示例：模板方法模式1.模板方法模式概述模板方法模式是一种行为型设计模式，它定义了一个算法的骨架，将某些步骤延迟到子类中实现。这样，子类可以在不改变算法结构的情况下重定义算法的某些步骤。这种模式非常适合那些有固定流程但某些步骤需要灵活调整的场景。1.1模板方法模式的特点固定的算法框架：模板方法模式定义了一个算法的框架，但在某些关键步骤上保持了灵活性。延迟实现：某些步骤被延迟到子类中实
Python Gradio：快速搭建人脸识别应用 Python编程之道 Python人工智能与大数据 Python编程之道 python 开发语言 ai
PythonGradio：快速搭建人脸识别应用关键词：Python,Gradio,人脸识别,深度学习,计算机视觉,交互式应用,模型部署摘要：本文详细介绍了如何使用Python的Gradio库快速搭建一个交互式的人脸识别应用。我们将从基础概念出发，逐步讲解人脸识别的核心算法原理、Gradio的界面设计方法，并通过完整的项目实战演示如何将深度学习模型部署为可交互的Web应用。文章包含详细的代码实现、数
算法提升之字符串练习-03（KMP）亮亮爱刷题算法数据结构
今天给大家带来的仍是关于字符串类型的算法题目，关于这类题目，大家需要多做练习进行巩固，题型相对固定，但是比较具有思路，希望大家可以好好理解相关部分。关于KMP算法，通常有两部分组成，第一部分是通过get_next()数组求解next数组，第二部分则是通过KMP求解字符重复。第一道题：问题描述wzy给了你一个字符串，请你计算一下这个字符串最多是由多少个相同子串拼成的。注意：原串abcdabcd，则a
深入理解设计模式之模板模式：优雅地定义算法骨架 vvilkin的学习备忘设计模式设计模式
在软件开发中，我们经常会遇到这样的情况：多个类执行相似的操作流程，但每个类在流程的某些步骤上有自己特定的实现。如果为每个类都完整地编写整个流程，会导致大量重复代码，且难以维护。这时候，模板模式（TemplateMethodPattern）就派上用场了。一、模板模式概述1.1什么是模板模式模板模式是一种行为型设计模式，它定义了一个操作中的算法骨架，而将一些步骤延迟到子类中实现。模板方法使得子类可以不
【面试必背】RAG技术全面解析：从原理到实践中的20个关键问题大F的智能小课人工智能语言模型 python
大家好，我是大F，深耕AI算法十余年，互联网大厂核心技术岗。知行合一，不写水文，喜欢可关注，分享AI算法干货、技术心得。【专栏介绍】：欢迎关注《大模型理论和实战》、《DeepSeek技术解析和实战》，一起探索技术的无限可能！【大模型篇】更多阅读：【大模型篇】万字长文从OpenAI到DeepSeek：大模型发展趋势及原理解读【大模型篇】目前主流AI大模型体系全解析：架构、特点与应用【大模型篇】Gro
Python基础-day8：迭代器和生成器的区别及其各自实现方式和使用场景
1.迭代器迭代器提供了一种惰性（lazyevaluation）获取数据的方法，使得我们能够逐步访问序列中的元素，而无需一次性加载所有数据。其主要优点包括节省内存、提高性能、支持自定义遍历逻辑等。1.1实现协议__iter__()：返回自身。__next__()：返回下一个元素；如果没有更多元素，则抛出StopIteration异常。注意：可迭代对象（Iterable）与迭代器不同：可迭代对象实现_
【day1】Python基础知识-pycharm版 m0_56051615 pycharm python ide
内容：IDLE介绍使用、建立python源文件、python程序格式（缩进和注释）、海龟绘图、对象的组成、栈内存和堆内存、标识符、变量安装PyCharm和AnacondaAnaconda是可以便捷获取包且对包能够进行管理，同时对环境可以统一管理的发行版本。包含了conda、Python在内的超过180个科学包及其依赖项。其包含的科学包包括：numpy,pandas,ipythonnotebook等
嵌入式学习-PyTorch（8）-day24 LGGGGGQ 学习 pytorch 深度学习
torch.optim优化器torch.optim是PyTorch中用于优化神经网络参数的模块，里面实现了一系列常用的优化算法，比如SGD、Adam、RMSprop等，主要负责根据梯度更新模型的参数。️核心组成1.常用优化器优化器作用典型参数torch.optim.SGD标准随机梯度下降，支持momentumlr,momentum,weight_decaytorch.optim.Adam自适应学习
嵌入式学习-PyTorch（3）-day20 LGGGGGQ 学习 pytorch 人工智能
transforms结构及用法transforms.yp是一个工具箱就是将一个特定格式的图片经过这个工具的到想要的变换Tensor数据类型一、transforms的使用（Python）fromPILimportImagefromtorch.utils.tensorboardimportSummaryWriterfromtorchvisionimporttransformswriter=Summar
人类的具身智能与机器的具身智能人机与认知实验室
人类具身智能与机器具身智能的根本区别在于其基础机制和本质属性。人类具身智能是基于生物体的生理结构和神经系统的复杂交互，通过身体与环境的直接感知和体验，形成具有情感、意识和主观性的认知与行为能力。这种智能是动态的、适应性强的，并且深受个体经验、文化背景和社会互动的影响。而机器具身智能则是通过传感器、算法和数理模型来模拟与物理世界的交互，依赖于预设的规则和数据驱动的模式识别，缺乏人类的主观体验、情感和
基于单片机宠物喂食器/智能宠物窝/智能饲养
传送门其他作品题目速选一览表其他作品题目功能速览概述深夜加班时，你是否担心家中宠物饿肚子？出差旅途中，是否焦虑宠物无人照看？这些养宠族的共同痛点，正被一枚小小的单片机悄然化解。作为智慧宠物家居的核心设备，智能喂食器已从“定时撒粮”的机械玩具，进化成融合嵌入式控制、物联网通信、健康管理的科技终端。本文将深入拆解基于单片机的喂食器设计：从STM32主控芯片的选型，到0.5g精度的闭环投喂算法；从ESP
Python初识-day3：复合类型里的序列类型、映射类型和集合类型梌 python 开发语言
目录1.复合类型初识1.1列表类型（list）1.1.1列表的创建1.1.2列表的运算1.1.3列表的访问1.1.4列表的具体示例1.1.5列表的常见API1.2元组类型（tuple）1.2.1元组的创建1.2.2元组的运算1.2.3元组不可变1.2.4元组的具体示例1.2.5元组的常见API1.3字典类型（dict）1.3.1字典的创建1.3.2字典的运算1.3.3字典的访问1.3.4字典的特性
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓