sandwu

Python数据结构和算法(六)：哈希算法(hash)的六大应用以及哈希一致性的介绍和实现

文章目录

前文
哈希算法定义和特征
哈希算法应用

安全加密
散列函数
唯一标识
数据校验
负载均衡
数据分片

统计关键词次数
快速找出图片是否存在图库

哈希一致性

哈希一致性的定义和使用
哈希一致性来定义分布式存储MySQL表
哈希一致性的实现

总结

前文

说到哈希算法大家应该都不陌生，但系数它的应用范围，大多数人只能答出少部分，比如用于加密，比如用于散列表，比如MySQL的哈希索引，但再多可能就不清楚了。实际上总结起来有以下7点：加密、唯一标识、数据校验、散列函数、负载均衡、数据分片、哈希一致性的分布式存储。前面6个会简单地讲过，重点记录下第七点，而哈希一致性也是面试时最容易考察的知识点。
本文是总结极客时间的《数据结构和算法之美》，若要更具体的内容，可以去订阅来看。

哈希算法定义和特征

定义：将一段任意的二进制串映射成固定长度的二进制串。
特征：

不可逆：即加密后无法逆转回来
对数据敏感：即使改1个字符，生成的串也完全不同
散列冲突小：无法避免散列冲突，根据“鸽巢原理”，假如10个鸽巢要放入11个鸽子，则必然有巢要放置两个。因为哈希算法是映射成固定长度的二进制串，比如MD5是映射成128位，即2¹²⁸，那只要放入的value多如2¹²⁸+1，那就必然出现散列冲突
执行效率要高效：表示这个映射过程要尽可能的快

哈希算法应用

安全加密

由于不可逆的特点，哈希算法非常适合用于数据加密，常用加密算法：MD5（MD5 Message-Digest Algorithm，MD5 消息摘要算法）和 SHA（Secure Hash Algorithm，安全散列算法）。因为这些算法的不可逆，所以用于安全加密是非常合适的。比如MD5是加密成128bit的二进制串，比如SHA256是加密成256bit的二进制串，而根据鸽巢原理，加密长度越长的二进制串，则越不容易被破解，但同时执行效率就越低。所以速度与安全二者不可兼得，当然后续可能能发明二者兼具的加密算法。
为了防止加密算法被破解，在开发web平台的时候常常会加入salt(盐，一串随机的二进制数)来配合加密算法来加密。

散列函数

散列函数是散列表的重要依赖，比如Python的字典，就通过__hash__这个魔法方法来构建散列函数将值转为key。所以哈希算法在散列函数里更看重的是散列冲突小、执行效率高效这两个特点，而对于是否可逆，则相对不重要。

唯一标识

常常用hash来构建唯一标识，比如一组规模很大图片里如何快速查找到1张图片？可以通过将每张图片通过hash构建成1个hash值作为key，取其文件路径作为value，然后存储到散列表里。因为每张图片都是一个二进制串，所以可取前后各100位bit通过hash作为key。
所以当要查找某张图片的时候，先构建其hash的key，然后在散列表里查找即可。

数据校验

这点则是利用到哈希算法的数据敏感这个特点，也就是用于校验数据是否被修改，因为只要小小的修改，那么哈希出来的数据也是完全不同的！所以常常可以用来校验文件的是否改变，比如文件在传输过程中如果丢失数据包或者被篡改，通过hash值就可以很容易对比得到结果。
在linux里就有md5sum这么一个函数，可以查看任意文件的MD5值，所以如果在linux传输时，可以比对前后两个md5的值是否一致来确认文件是否有被改动。

负载均衡

通过哈希可以实现一个会话粘滞(session sticky)的负载均衡算法，即客户端和服务端即使是多对多的情况下，仍保证同一个客户端仅对应同一台服务器。
可以利用哈希算法将客户端的ip哈希成一个数值，然后对服务器大小进行取模运算，得到的结果就是要发往的位置，这样就能保证发往的服务端永远都是同一台机器。所以在nginx上我们可以指定ip_hash来实现：

upstream bakend {  
    ip_hash;  
    server 192.168.0.1:88;  
    server 192.168.0.2:80;  
}

数据分片

数据分片的做法和负载均衡差不多，不过概念不同罢了。两个例子说明。

统计关键词次数

要统计一份1TB的文件里用户关键词的次数，在单台机上又无法计算(内存不够，再者太耗时)，那此时就要将文件进行分片，到n台机上分别进行统计，最后汇整同样的关键词数目。那该如何操作呢？很简单，将每台机计算的关键词进行哈希运算，然后对n台机取模，发往对应的机器即可。这样相同关键词的都会只发往一台机子上。

快速找出图片是否存在图库

如果有1亿张图片该如何存储？而又如何快速判断需要的图片是否存在呢？如果用散列表构建，那得需要多大的内存才能存的下，很明显也不切实际。所以这里利用数据分片，将1亿张图片分开存储到多台机器上。那具体如何操作？
可以根据上述的唯一标识，通过取前后各100位来构造散列表的key，文件路径为散列表的val，然后在将key对n台服务器进行取模，然后分配到对应的服务器上构造对应的散列表。同理，如果要查找一张图片是否存在图库，那就对这张图片先hash，然后取模后去对应的服务器再通过散列表就能快速的确定图片是否存在。
那如何确认n的值呢？假设我们通过 MD5 来计算哈希值，那长度就是 128 比特，也就是 16 字节。文件路径长度的上限是 256 字节，我们可以假设平均长度是 128 字节。如果我们用链表法来解决冲突，那还需要存储指针，指针只占用 8 字节。所以，散列表中每个数据单元就占用 152 字节（这里只是估算，并不准确）。假设一台机器的内存大小为 2GB，散列表的装载因子为 0.75，那一台机器可以给大约 1000 万（2GB*0.75/152）张图片构建散列表。所以，如果要对 1 亿张图片构建索引，需要大约十几台机器。

哈希一致性

哈希一致性的定义和使用

哈希一致性是哈希算法里最容易被考到的用法，因为在分布式存储里应用广泛。并且其解决了数据分片、负载均衡的一大难题：那就是这两个都依赖于对服务器列表大小n取模来判断key的归属，但是如果n变化，则原来key的存放位置就全部都变更。比如我们再数据库MySQL来进行分布式存储，如果用4个实例存放1亿条数据，根据每条数据的主键来hash得到其要分配的机器，那么当4个实例挂了1个实例，此时要基于3个实例来分配，那该如何处理才能使1亿条数据不需要重新分配key的取模运算？当数据增加过多，4个实例需要增加1个实例到5个实例，又该如何处理？
哈希一致性就是为了解决这样的分布式缓存而存在，其概念本质是：定义数据的哈希值范围[0,MAX]，然后基于这个范围将数据分为m个小空间，然后将k台机器放置于上面(m远大于k)，这样每台机器负责m/k个空间的数据(也可以理解为将数据存放在哈希值范围区间，然后每个机器管理两台机器之间的数据)，当有机器上线或者下线，那么就改变其相邻的数据存储即可，而不用迁移整个数据！
为了解释一次性哈希，所以引入了哈希环，这里借用下小灰的图，参考链接：https://mp.weixin.qq.com/s/yimfkNYF_tIJJqUIzV7TFA，在如下的图中，整个环可以看成是哈希值范围[0,MAX]，而环上的每一个点用于存放数据，这个点可大到环只能存放60个数据，也能小到能存放2³² 个数据，由我们自定义。下图的node即是机器，所以4个node间的区域就是其所存放的数据，更准确的说从环顺时针开始遍历，从1个机器到下一个机器之间的数据都是属于下一个机器。

了解了定义后，来分析上下线机器造成的影响。如果node2和node3之间上线node5(如下)，那么原属于node3的key3要迁移到node5，也就是只造成属于node3的部分key要进行迁移；如果不上线node5，同时下线node3，那就是把原属于node3的key3迁移到node4即可。这就能通过简单地迁移部分机器的数据实现快速的分布式管理！

要注意的是，如果哈希后的数据全部存放到一个区域，而导致这个区域的数据全部归属于一台机器，那就会完全退化成单机器部署，利用不到分布式缓存。为了解决这个问题，引入了虚拟节点这个概念。也就是将环中的每个节点都转换成多个虚拟节点，这里的多个由用户自定义，比如如果机器较少的话，那虚拟节点就可以多点；机器多的话，虚拟节点就能少点。假设定义成4个虚拟节点，那原本只有4个node的分布式缓存就变成了16个。而这个虚拟节点的得到完全可以通过hash算法来得到，命名可以标记为node1#1，node1#2，node1#3，node1#4这样。由此便能分散存储key。

哈希一致性来定义分布式存储MySQL表

所以此时回到开头的那个问题，1亿条数据存放分布式MySQL，该如何存储才不会因为机器的上下线导致要重新迁移数据。那通过哈希一致性就能很简单地解决这个问题，我们先定义4个实例用于存储，将4个实例所在的ip通过设置3个虚拟节点分散成12个节点存于环中，然后将1亿条数据的主键值(可以自定义uuid)依次hash后存放到环中。

查找：每次将要查找的数据hash后然后查看环中离他最近的节点(在代码实现时，即有序数组中离它最近并比它大的那个数)
删除：先hash查找到，然后删除所在的key，删除对应机器上MySQL的值
增加：hash后存放，然后找到对应的机器，再到其上MySQL增加
改值：先hash查找到，然后更改对应机器上MySQL的值。

哈希一致性的实现

哈希一致性的实现借鉴这篇：https://techspot.zzzeek.org/2012/07/07/the-absolutely-simplest-consistent-hashing-example/。利用有序数组来二分法快速找到对应的key，利用散列表来存储nodename和node的对应关系，从而快速找到对应的值所存储的区域！代码如下：



import hashlib
import bisect


class ConsistentHashRing:
    def __init__(self,virtual_nums=4):
        self._virtual_nums = virtual_nums #默认为4个虚拟节点
        self._nodes = {}  #_nodes存放所有节点，key为虚拟节点的hash值，val为真实ip
        self._keys = []  #存放所有虚拟节点的hash值，为有序数组，用于快速查找hash的key

    def _hash(self,key): #用md5来实现hash值
        md5_str = hashlib.md5(key.encode("utf8")).hexdigest()
        return int(md5_str,16) #返回2进制数

    def _repl_iterator(self, nodename):
        """根据编号和nodename，给每个虚拟节点取名后赋值hash"""

        return (self._hash("%s:%s" % (nodename, i)) for i in range(self._virtual_nums))

    def __setitem__(self, nodename, node): #nodename为自定义标识名字，比如node1, node:192.168.4.1
        for hash_ in self._repl_iterator(nodename):
            if hash_ in self._nodes:
                raise ValueError("Node name %r is "
                            "already present" % nodename)
            self._nodes[hash_] = node
            bisect.insort(self._keys,hash_) #二分法插入

    def __delitem__(self, nodename): #删除要同时删除_nodes和_keys的值
        for hash_ in self._repl_iterator(nodename):
            del self._nodes[hash_]
            index = bisect.bisect_left(self._keys,hash_)
            del self._keys[index]

    def __getitem__(self, key): #通过二分法快速查找
        hash_ = self._hash(key)
        start = bisect.bisect(self._keys,hash_) #返回这个key应该插入的位置，如果是最右边，则属于第0个节点
        if start == len(self._keys)-1:
            start = 0
        return self._nodes[self._keys[start]]

consistent_hash_ring = ConsistentHashRing()
consistent_hash_ring["node1"] = "192.168.4.1"
consistent_hash_ring["node2"] = "192.168.4.2"
val1 = consistent_hash_ring["10_hash"] #加入key取名为主键+_hash，那第10个主键的key就是 10_hash
val2 = consistent_hash_ring["20_hash"]
print("哈希环存放的键值对为：",consistent_hash_ring._nodes)
print("哈希环当前所有的虚拟节点集合为：",consistent_hash_ring._keys)
print("10_hash存放的机器位于：",val1)
print("20_hash存放的机器位于：",val2)

结果为：

哈希环存放的键值对为： {127097526815233298582794356773614554855: '192.168.4.1', 82085472036366309913032597666696857451: '192.168.4.1', 339427956960730678991081772292544573879: '192.168.4.1', 297393281242721132585495680199299683151: '192.168.4.1', 234270789901673706184978332503042424895: '192.168.4.2', 30800198962622170283128992779263460808: '192.168.4.2', 285952547974116111993108643362078034539: '192.168.4.2', 152869870438375595209842928583682618037: '192.168.4.2'}
哈希环当前所有的虚拟节点集合为： [30800198962622170283128992779263460808, 82085472036366309913032597666696857451, 127097526815233298582794356773614554855, 152869870438375595209842928583682618037, 234270789901673706184978332503042424895, 285952547974116111993108643362078034539, 297393281242721132585495680199299683151, 339427956960730678991081772292544573879]
10_hash存放的机器位于： 192.168.4.1
20_hash存放的机器位于： 192.168.4.2

总结

哈希一致性的实现也是颇为简单，甚至可以通过红黑树、跳表这种数据结构来代替有序数组，致使效率更快。这次就总结到这~

Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
HashMap的Get(),Put()源码解析 Ttang23 哈希算法散列表算法
1、什么是HashMap？HashMap是Java中用于存储键值对（Key-Value）的集合类，它实现了Map接口。其核心特点是：无序性：不保证元素的存储顺序，也不保证顺序恒定不变。唯一性：键（Key）不能重复，若插入重复键会覆盖原有值。允许null：允许一个null键和任意数量的null值。非线程安全：相比HashTable，HashMap不支持同步，性能更高。2.核心数据结构：哈希表（Has
C++STL-queue s15335 C++STL c++开发语言
一.基本概念和数据结构里面的队列一样，只支持先进先出，队尾插，队头删。二.基本用法1.queue对象创建1.默认构造函数queueq1;2.拷贝构造函数queueq2(q1);2.queue赋值操作queueq1;queueq2;q2=q1;3.queue入队queueq;q.push(5);//5q.push(4);//54q.push(3);//543q.push(2);//5432q.pus
zookeeper etcd区别 sun007700 zookeeper etcd 分布式
ZooKeeper与etcd的核心区别体现在设计理念、数据模型、一致性协议及适用场景等方面。‌ZooKeeper基于ZAB协议实现分布式协调，采用树形数据结构和临时节点特性，适合传统分布式系统；而etcd基于Raft协议，以高性能键值对存储为核心，专为云原生场景优化，是Kubernetes等容器编排系统的默认存储组件。‌‌1‌‌2‌架构与设计目标差异‌‌ZooKeeper‌。‌设计定位‌:专注于分
数据结构：导论梁辰兴数据结构学习笔记数据结构导论算法时间复杂度空间复杂度
目录一，数据结构的研究内容二，基本概念与术语（一）数据、数据元素、数据项与数据对象（二）数据结构（三）数据类型与抽象数据类型️三，抽象数据类型的表示与实现⚙️四，算法与算法分析⚖️（一）算法的定义及特性（二）评价算法优劣的基本标准⏱️（三）算法的时间复杂度（四）算法的空间复杂度章结一，数据结构的研究内容数据结构是计算机科学的核心基础，其研究内容可概括为三大维度：数据组织形式：探索如何将现实世界中的
redis中什么是bigkey？会有什么影响？ Vic2334 redis
什么是bigkey？会有什么影响？bigkey是指key对应的value所占的内存空间比较大，例如一个字符串类型的value可以最大存到512MB，一个列表类型的value最多可以存储23-1个元素。如果按照数据结构来细分的话，一般分为字符串类型bigkey和非字符串类型bigkey。字符串类型：体现在单个value值很大，一般认为超过10KB就是bigkey，但这个值和具体的OPS相关。非字符串
项目开发日记
框架整理学习UIMgr：一、数据结构与算法1.1关键数据结构成员变量类型说明m_CtrlsList当前正在显示的所有UI页面m_CachesList已打开过、但现在不显示的页面（缓存池）1.2算法逻辑查找缓存页面：从m_Caches中倒序查找是否已有对应ePageType页面，找到则重用。页面加载：从资源管理器ResMgr加载prefab并绑定控制器/视图组件。页面关闭：从m_Ctrls移除，添加
上位机知识篇---常见的文件系统
文件系统是操作系统用于管理和组织存储设备上文件的机制，它决定了文件的存储方式、命名规则、访问权限、数据结构等。以下是常见的文件系统及其应用场景、优势和劣势的详细介绍：一、Windows常用文件系统1.FAT32（FileAllocationTable32）基本特点：采用32位文件分配表，是FAT系列的升级版，支持最大单文件4GB，最大分区容量理论上为8TB（实际常用2TB以内）。应用场景：U盘、存
《C++性能优化指南》 linux版代码及原理解读第一章 v俊逸 C++性能优化指南性能优化 C++性能优化性能优化
概述：目录概述：性能优化的必要性：C++代码优化策略总结用好的编译器并用好编译器使用更好的算法使用更好的库减少内存分配和复制移除计算使用更好的数据结构提高并发性优化内存管理性能优化的必要性：按照当今的CPU运行速度来说，执行一条指令所需要的时间是10的-9次方的时间单位，如此快速的执行速度是否就没有性能优化的必要了呢？其实不然，性能优化与CPU的执行速度并无非常大的关系，试想一下，一段代码，如果用
pandas销售数据分析
pandas销售数据分析数据保存在data目录消费者数据：customers.csv商品数据：products.csv交易数据：transactions.csvcustomers.csv数据结构：字段描述customer_id客户IDgender性别age年龄region地区membership_date会员日期products.csv数据结构：字段描述product_id产品IDcategory
Go 语言 map 高级应用：优化技巧与复杂结构处理
Go语言map高级玩法全解析引言在Go语言的编程世界中，map是一种极为重要且强大的数据结构。它能够高效地存储和检索键值对，在众多场景中发挥着关键作用。对于初涉Go语言的开发者而言，掌握map的基本使用方法，如声明、初始化、插入、删除和查找元素等，是迈向编程之路的重要一步。然而，仅仅停留在基础层面，远远无法挖掘出map的全部潜力。在实际的工程项目里，面对复杂多变的业务需求和日益增长的数据量，深入理
四. go 常见数据结构实现原理之 map 苹果香蕉西红柿 #二.Go 常见数据结构实现原理数据结构 golang 哈希算法
目录一.基础hash的基本方案二.map初始化创建map的底层结构hmapbucket桶桶的细节总结minTopHash与是否迁移extra一些重要的常量标志初始化三.插入数据存储数据时key的定位策略四.查询数据五.删除六.扩容扩容策略与扩容大小扩容与数据迁移源码七.总结map底层结构相关问题总结初始化底层总结插入数据底层总结查询数据底层总结扩容底层总结常见问题一.基础在go基础入门十一map集
Golang map m0_67393686 java golang java 数据结构后端 apache
前言哈希表是一种巧妙并且实用的数据结构。它是一个无序的key/value对的集合，其中所有的key都是不同的，然后通过给定的key可以在常数时间复杂度内检索、更新或删除对应的value。在Go语言中，一个map就是一个哈希表的引用，map类型可以写为map[K]V，其中K和V分别对应key和value。map中所有的key都有相同的类型，所有的value也有着相同的类型，但是key和value之间
【go基础】4.基本数据结构之map 喝醉的小喵 go语言原理 golang 数据结构哈希算法后端
目录哈希表map-主要思想-特点-哈希函数-数据结构-map初始化-mapvalue为什么不能寻址-map为什么是无序的-map为什么是o(1)的-开发时应注意的哈希表map理解Golang哈希表Map的原理|Go语言设计与实现彻底理解GolangMap-知乎-主要思想1、桶map的底层存储结构式hmap,里面有一个桶数组，所有kv都是存在这些桶里的，每个桶的结构是bmap每个桶中最多可以存8个k
C#基础-区分数组与集合 yi碗汤园 C#开发语言 c#前端
目录区分数组与集合1.定义1）数组2）集合2.大小1）数组2）集合3.访问速度1）数组2）集合4.内存管理1）数组2）集合5.使用场景1）数组2）集合总结本篇文章来学习一下C#的数组（Array）与集合（Collection），数组和集合是两种常用的数据结构，均为引用类型，下面通过定义、大小、访问速度等方面比较数组和集合的不同，来进一步加深对它们的理解。区分数组与集合1.定义1）数组①数组是固定大
map数据结构在Golang中是无序的，并且键值对的查找效率较高的原因
map，map在Go语言中是无序的，是因为在Go语言中，map基于哈希表实现，它的遍历顺序依赖于哈希表内部存储状态，对并发编程的潜在影响包括可能引发数据一致性问题，也就是并发度写实易导致读到不一样的数据或遍历出错；还会导致结果可重复性的问题，即每次运行程序得到的依赖遍历顺序的计算结果可能不同。map的键值对查找效率高是由于：（1）哈希表的时间复杂度，哈希表的平均复杂度为O（1），最欢情况下为O（n
C#集合：从基础到进阶的全面解析阿蒙Armon C#继续学习 c#windows linux
C#集合：从基础到进阶的全面解析在C#编程中，集合是处理数据集合的核心工具。无论是存储一组对象、实现缓存机制，还是处理复杂的数据结构，都离不开集合的灵活运用。本文将全面深入地探讨C#集合体系，从基础概念到高级技巧，帮助开发者掌握集合的精髓，写出更高效、更优雅的代码。一、集合概述与分类C#集合框架是.NET类库的重要组成部分，它提供了一系列用于存储和操作数据的类和接口。与数组相比，集合具有动态扩容、
基于 Python 的图书管理系统（源码）
摘要：本论文详细阐述了利用Python语言开发一个简易图书管理系统的过程。该系统具备图书信息录入、删除、修改、查询以及借阅管理等核心功能，可有效提升图书管理的效率与便捷性。通过阐述系统的需求分析、设计思路、代码实现及测试过程，展示了Python在小型管理系统开发中的应用潜力，为相关领域的软件开发提供了有益参考。关键词：Python编程；图书管理系统；数据结构；代码实现一、引言（一）研究背景随着数字
SQL 索引与日志知识点详解及练习题
索引和日志在数据库的高效运行和数据安全中扮演着重要角色。下面我们详细梳理索引和日志的相关知识，并通过练习题加深理解。一、知识点梳理（一）索引基本概念：索引是为了加速查询的数据结构，其数据结构为B+树。B代表Balance（平衡），数据保存在叶子结点中。分类主键索引：唯一标识一行，不允许为空，一张表只能有一个主键。唯一索引：标识一行，允许为空，一张表可以有多个唯一索引。普通索引：允许重复和空值。联合
数据结构顺序表(2)---顺序表的实现
1.顺序表的实现为了能够实现顺序表这一个数据结构，小编是分别分为三个文件编写完成的。分别是一个头文件（.h），一个实现文件(.c)，一个测试文件(.c)。以下对这三个模块（头文件、顺序表实现文件、测试文件）的代码，按功能模块、函数逻辑等进行详细解释，帮助理解动态顺序表的完整实现：1.1头文件（SeqList.h）头文件（SeqList.h)——接口定义与类型声明:#include#include#
二叉搜索树（BST）海绵宝宝的好伙伴数据结构算法 c++
二叉搜索树（BinarySearchTree,BST），也称为二叉排序树，是一种重要的数据结构。它将树形结构的灵活性与有序性结合起来，使得查找、插入和删除等操作的平均时间复杂度都能达到O(logN)。二分搜索算法，其底层逻辑恰好对应在一棵隐形的二叉搜索树上的查找过程。例如，对有序数组[0,5,24,34,41,58,62,64,67,69,78]进行二分搜索，其过程完全可以可视化为在一棵以58（中
字典树前缀匹配 hi error.cn 经验分享
字典树前缀匹配什么是字典树（Trie）字典树（Trie），又称单词查找树或键树，是一种有序树结构的数据结构，常用于字符串关联查找的应用场景中。其主要特点是每个节点代表一个字符，并且从根到子节点的路径上的字符连起来构成所有在字典中的前缀。由于这种特性，字典树特别适合进行前缀匹配和自动补全等操作。字典树的基本结构字典树由节点（Node）和边（Edge）组成。每个节点表示一个字符或为空终结符，而边则代表
初阶数据结构之栈的实现 CodePracticer 数据结构数据结构开发语言笔记
前言：实现栈之前，先来了解一下什么是栈。1.栈的概念栈是一种特殊的线性表，只允许在固定一端插入和删除操作，进行数据插入和删除操作的一端称为栈顶，另一端称为栈底。栈中的数据元素遵守先进后出，后进先出LIFO（LastInFirstOut）的原则。压栈：栈的插入操作叫做进栈（压栈，入栈），入数据在栈顶。出栈：栈的删除操作叫做出栈，出数据也在栈顶。2.栈的底层结构如何选择现在我们已经了解了栈的结构特性了
STL之无序关联式容器&针对于自定义类型的操作宛西南浪漫戈命 STL c++算法数据结构 stl
关联式容器包括：unordered_set、unordered_multiset、unordered_map、unordered_multimap四种。它们的底层使用的数据结构都是哈希表。要学习它们的使用，也可以从：初始化、遍历、查找、插入、删除、针对自定义类型等方面进行学习。但是首先需要学习关于哈希表的几个概念：哈希函数、哈希冲突、解决哈希冲突的方法、装载因子(装填因子、负载因子)哈希相关概念哈
Pydantic 保姆级教程：Python 数据验证与设置管理的终极指南 JJJ@666 基础知识(Python)python Pydantic 数据验证设置管理库
Pydantic是一个强大的Python库，主要用于数据验证和设置管理。它通过Python类型注解来定义数据结构，并自动提供数据验证、序列化和文档生成功能。本教程将带你从基础到高级全面掌握Pydantic。核心概念Pydantic的核心是模型(Model)，它类似于Python的数据类(dataclass)，但提供了更多功能：类型验证：自动验证输入数据的类型数据转换：自动将输入数据转换为正确的类型
【Zephyr开发实践系列】06_存储块设备驱动开发（Nand Flash） jz-炸芯片的zero Zephyr实践开发驱动开发单片机嵌入式硬件 linux iot mcu 物联网
文章目录前言一、Flash驱动模型介绍1.1核心基础应用API（必须）1.2高级功能应用API（可选）1.3设置数据结构1.4硬件初始化1.5设备实例化二、数据结构定义2.1获取Flash块与页大小三、核心API函数实现3.1擦除函数3.2读取函数3.3写入函数4.4layout函数4.5坏区检测函数总结前言在嵌入式系统中，常见的Flash存储模块根据接口类型和用途可分为NOR、NAND、EMMC
升本计算机知识点多怎么记笔记,2017人大计算机帮助提升考研答题技巧的经验... Joanne zz 升本计算机知识点多怎么记笔记
2017人大计算机帮助提升考研答题技巧的经验很多同学对于计算机考研不清楚怎么复习，在这里凯程老师系统介绍一下高效率复习，供同学们参考。计算机专业的专业课都是统考408-计算机学科专业基础综合，包含计算机组成原理、数据结构、操作系统、计算机网络。凯程老师从每年的试题来看，风格都完全不一样，不深入理解计算机系统是很难考出好成绩的。所以凯程老师建议大家需要尽早复习计算机的专业课。每年的真题都非常灵活，所
2025秋招优秀项目推荐微凉的衣柜人工智能深度学习算法 gpt
01.多个优异的数据结构与算法项目推荐良心推荐hello-algo包含多个通用的代码框架，一个框架完成多道题目，更详细请查阅labuladong02.大模型岗位面试总结：共24家，9个offer大模型岗位面试总结：共24家，9个offer03.视觉检测分割一切源码及在线DemoGrounded-Segment-Anything项目源码
【Java核心计算基础知识（第9版）】第4章对象与类 weixin_30872337 java 数据结构与算法
本章要点-面向对象程序设计-使用预定义类-用户自定义类-静态域与静态方法-方法参数-对象构造-包-类路径-文档注释-类设计技巧4.1面向对象程序设计概述面向对象的程序是由对象组成的，每个对象包含对用户公开的特定功能部分和隐藏的实现部分。面向过程：算法+数据结构=程序面向对象：数据结构+算法=程序4.1.1类类（class）是构造对象的模板或蓝图。由类构造（construct）对象的过程称为创建类的
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option